Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




                      LGE

   ESPACIO CURRICULAR
METODOLOGÍA Y ESTADÍSTICA
 APLICADA A LA EDUCACIÓN



               Autores: 
  Dra. Marta Graciela del Valle Pece 
 Mg. Ing. Margarita Juárez de Galíndez 
  Mg. Lic. María Mercedes Simonetti




                                                                                  1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




          PROGRAMA DE ESPACIO CURRICULAR
UNIDAD I: Estadística
Concepto. Etapas en el trabajo estadístico. Estadística Descriptiva e
Inferencial. Variable: concepto. Clasificación de variables. Series
simples. Agrupamiento de datos en series de frecuencias. Frecuencias
absolutas. Frecuencias relativas. Porcentajes. Frecuencias acumuladas,
frecuencias relativas acumuladas y porcentajes acumulados. Tasas de
uso común: de escolarización, de analfabetismo, de desgranamiento, de
retención.

UNIDAD II: Presentación de dat os est adísticos.
Partes funcionales y construcción de tablas estadísticas. Elementos
estructurales de las tablas. Tablas simples, cruzadas. Análisis de tablas
estadísticas. Técnicas de representaciones gráficas. Reglas de
construcción. Gráficos según los distintos tipos de variables.

UNIDAD III: Medidas de resumen.
Medidas de tendencia central. Media aritmética, mediana y moda.
Comparación de media, mediana y moda. Distribuciones simétricas y
asimétricas. Medidas de dispersión. Rango, variancia y desviación
estándar y desviación mediana. Coeficiente de variación. Medidas de
localización. Percentiles y rango percentil. Aplicaciones.

UNIDAD IV: Nociones element ales de probabilidad. Inferencia
estadística.
Experimentos aleatorios: conceptos básicos. Probabilidad clásica,
frecuencial y axiomática. Teorema de la suma y del producto de
probabilidades.
Tabla de contingencia. Cálculo de probabilidades.
Distribución de probabilidades de variables aleatorias discretas:
Uniforme y Binomial.
Cálculo de probabilidad en variables aleatorias continuas: distribución
normal y distribución normal estándar.
Población. Definición de muestra aleatoria. Diseños de muestreo.
Muestreo al azar simple. Muestreo sistemático. Muestreo por estratos.
Muestreo por conglomerados. Concepto.
Estimación puntual y por Intervalos de confianza para muestras
grandes en el Muestreo al Azar Simple.




                                                                                                 2 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




                              UN I DADES I  y I I

                                                                           INTRODUCCIÓN

      La palabra Estadística proviene del latín status (estado).
Precisamente la primera aplicación de la estadística consistió en la
recopilación de datos y la construcción de gráficos para describir el estado
de un país. Con el correr del tiempo esta herramienta fue evolucionando
hasta que en la actualidad podríamos decir que no hay aspectos de la vida
cotidiana donde no se aplique la Estadística. Hogares, gobiernos y
negocios se apoyan en datos estadísticos para dirigir sus acciones.

     El objetivo que se persigue con este módulo es proporcionar al
docente herramientas y técnicas para obtener datos, procesarlos para
obtener información    que sirva para la interpretación correcta de
fenómenos que se producen en su ámbito de trabajo.



                                                        ESTADÍSTICA. CONCEPTOS.

      La Estadíst ica es una colección de métodos para planear
experimentos, obtener datos, y después organizar, resumir, presentar,
analizar, interpretar y llegar a conclusiones basadas en ellos (Triola, 2004).

   Otra definición considera a la       Estadística como una disciplina
perteneciente a la Matemática Aplicada que se dedica al estudio
cuantitativo de fenómenos colectivos. Proporciona los métodos para:

·   La recolección de datos
·   Su ordenamiento, resumen y presentación,
·   Su análisis e interpretación y
·   Posterior enunciado de conclusiones.

   Los cuatro pasos que se han enumerado constituyen las etapas del
trabajo estadístico.

   La primera etapa tiene como objetivo recolectar datos proveniente de
medición, conteo u observación efectuado sobre el material objeto de
estudio en base a un plan formulado según los principios del diseño
experimental y las técnicas de muestreo.




                                                                                                 3 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   La segunda etapa consiste en ordenar los datos en tablas estadísticas,
presentarlos mediante gráficos y diagramas y resumirlos a través del
cálculo de promedios, porcentajes e índices.

   En la tercera etapa se analizan los resultados obtenidos en la etapa
anterior, y comienzan a distinguirse las características del fenómeno, lo
que permite utilizar diferentes métodos para analizarlos e interpretarlos.

   En la última etapa se debe concluir acerca del estudio realizado.

      Si las conclusiones, se refieren exclusivamente a los datos de los que
se dispone (una parte de la población que se desea estudiar), se dice que
la Esta dísti ca es Descriptiva .

      Si por el contrario, las conclusiones van más allá de los datos que se
dispone y se refieren a un conjunto mayor (población), del cual se
extrajeron, se dice que la Esta dí stica es Inf erencial ; las conclusiones
van de lo particular (muestra) a lo general (la población).Esta se basa en el
estudio de la teoría de probabilidades que nos permite medir el error de
nuestras afirmaciones.

      Las est adísticas (en plural) se obtienen como resultado del trabajo
estadístico y están constituidas por porcentajes, promedios, tablas,
gráficos y otros elementos que describen un fenómeno y ayudan a su
comprensión (Ej.: estadísticas demográficas, estadísticas del fútbol,
estadísticas de accidentes de tránsito, estadísticas universitarias, etc.).

      Es necesario definir algunos conceptos importantes: por ejemplo

      Población. Se define población como el conjunto de individuos u
                 objetos que comparten una característica común, en la
                 que el investigador está interesado.

      Muestra.      Es un subconjunto de la población. Debe ser
                  representativa, es decir se deben mantener las mismas
                  características de la población en estudio.

      Una población puede ser finita o infinita.

      Población finita       Una población finita es aquella que puede ser
                             físicamente listada

      Población infinita. Una población es infinita, cuando en la práctica
                          no puede ser físicamente listada


                                                                                                    4 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




      Ejempl o. Una población puede ser definida como los alumnos de la
      escuela San Francisco. Los alumnos pueden ser listados e
      individualizados a través de los registros áulicos. Es un ejemplo de
      pobl a ción f inita .

            Personas portadoras de SIDA en Santiago                                del    Estero,
      constituyen un ejemplo de pobl a ción i nfinita .


      Unidad de observación: es aquélla sobre la cual se efectúan las
                  mediciones    u   observaciones.  La   unidad    de
                  observación puede ser una persona, una familia, una
                  planta, una parcela, etc.


      Dat o: es el valor que se obtiene de la medición, observación o conteo
                      efectuada en la unidad de observación o unidad de
                      muestreo.

            Por ejemplo si el objetivo de una investigación es el rendimiento
      de los alumnos, la unidad de observación es el alumno.

              El número de materias rendidas contadas en un alumno es el
      dato.

            El conjunto de datos obtenidos de cada unidad de observación
      constituirá la base para el análisis estadístico del rendimiento de los
      alumnos de la escuela San Francisco.


Va ri a bles. Concepto y ti pos.

      Variable. Una variable es cualquier característica que varía de una
                   unidad de muestreo a otra en la población o en la
                   muestra

      Ejempl o 1: Supóngase que interesa conocer la salud de los alumnos,
entonces la variable a observa r en cada alumno será el esta do de sa l ud,
el que podrá asumir dos valores: sano o enfermo.

      Ejempl o 2: Si interesa saber el número de herma nos que posee
ca da a lumno, se tendrá valores que van desde 0(ningún hermano), 1, 2...,n
y se deberá contar cuantos hermanos posee cada alumno.


                                                                                                     5 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




      Ejempl o 3: Si el objetivo de un estudio fuera la ta lla alcanzada por
alumnos, se debe medir la variable altura la que, expresada en metros
podrá tener valores mayores a 1 metro.

      En los tres ejemplos anteriores, el nombre de la variable y la forma
de obtener sus valores está resaltado en negrita. En el primer ejemplo, los
valores que puede asumir la variable son calidades, por lo que se dice que
la variable es cualitat iva. Las calidades o categorías pueden ser naturales
como al definir la variable sexo, o arbitrarias como la clasificación de
alturas en bajas, medianas y altas.

      Por el contrario, en los otros dos ejemplos los valores que asumen
las variables pueden expresarse mediante números, por lo que las dos
últimas variables son cuant it ativas. En el caso de número de hermanos,
la variable toma sólo determinados valores en el intervalo que va de cero a
n por lo que se la denomina variable cuantitat iva discreta o
discontinua; cuando la variable toma los infinitos valores dentro del
intervalo se dice que la variable es cuantitat iv a continua

      Otra forma de clasificación de las variables es mediante el empleo de
cuatro niveles de medición: nominal, ordinal, de intervalo y de razón.
Cuando se manejan datos reales el nivel de medición es importante ya que
orienta sobre el procedimiento estadístico a utilizar.

      Un nivel de medición es nominal cuando los valores de variables
son nombres, etiquetas o categorías y no se puede establecer un orden
entre ellos.

Ejempl o: colores de ojos, estado de salud, lugar de nacimiento de un
alumno. Aunque las ciudades pueden ser ordenadas según su tamaño,
densidad poblacional, grado de contaminación del aire, etc., en general, la
variable “lugar de nacimiento” no tiene un orden establecido

       Con estos datos no es posible realizar cálculos. A veces se asignan
números a las diferentes categorías; a la variable salud que posee dos
valores sano y enfermo, podemos codificarlas numéricamente de la
siguiente manera 1= sano, 2= enfermo pero esto no es nada más que una
codificación y tales números no tienen significado computacional.

      Un nivel de medición es ordinal cuando se puede establecer un
orden entre las categorías de la variable. Ejemplo: máximo nivel de
instrucción alcanzado por los padres de los alumnos: analfabeto, primario,
secundario, terciario, universitario.


                                                                                                    6 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




     Lo único que podemos decir es que el nivel de instrucción
secundario es mayor que el primario y que el universitario es mayor que el
primario, secundario o terciario, pero no podemos decir cuanto mayor es
una categoría de la variable respecto a la otra.


      Supongamos que se codifican dichos niveles con 1, 2, 3, 4 y 5.

      Si bien se podría hacer la diferencia entre 2­1=1 y 4­3=1, este
resultado 1 no significa que entre el primario y el analfabeto hay la misma
cantidad de conocimiento que entre el universitario y el nivel terciario.

      Otro niv el de medición es el de int erv alo. En este nivel la
diferencia entre dos valores de datos tiene un significado. En este nivel no
hay un cero natural, donde nada de la cantidad esté presente. El valor del
cero es convencional

Ejempl o: La variable Temperatura está medida en escala de intervalo. Un
termómetro por ejemplo, mide la temperatura en grados que son del mismo
tamaño en cualquier punto de la escala. Aquí no existe un punto de partida
natural, el valor 0° es arbitrario y no representa la ausencia total de calor.
La diferencia entre 20ºC y 21ºC es la misma que entre 12ºC y 13ºC Se
pueden realizar operaciones de suma y resta pero no cociente entre valores.

       Por último el nivel de medición de razón o cociente aunque se
parece al nivel de medición de intervalo tiene un punto de partida o cero
inherente (donde cero indica que nada de la cantidad está presente). Para
los valores en este nivel tanto las diferencias como los cocientes tienen
significado. En este nivel se pueden realizar todas las operaciones.
Ejemplo: Los precios de los libros de texto (0$ representa ningún costo y
un precio de $60 es dos veces más costoso que uno de $30).




                                                                                                    7 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                             Datos



                        Variable                                Variable 
                      Categórica o                             numérica o 
                       cualitativa                             cuantitativa 




           Escala                 Escala              Escala de             Escala de 
           nominal                ordinal             intervalo             razón 
                                                      minal 




Seri es de datos. Series si mples

      El conjunto de valores de una variable constituye una serie de datos.
Se presentan a continuación series de datos referidas a los tres ejemplos
que se dieron para ilustrar tipos de variables:

     Ejemplo 1: En el año 2004, se examinan 30 alumnos de un Curso
de EGB1 de la escuela San Francisco y se anota su estado de salud
(S=Sano, E=Enfermo).

      Generalmente las variables se designan con las últimas letras del
abecedario en mayúscula por ej. X y los valores que toma la variable con x
minúscula; incluso se coloca x i donde el subíndice i indica el número de
individuo observado; de éste modo las 30 observaciones son:

x i : S, S, E, E, E, S, S, E, S, S, S, S, S, E, S, S, S, S, E, S, S, S, S, S, S, S,
S, S, S, S.

El subíndice “ i “ varía de 1 a 30. Así, x1 = S; x7 = S; X14 = E; . . . x30 =S.

Ejempl o 2: Un maestro de la Escuela San Martín interroga a sus 30
alumnos de primer grado de EGB1 sobre el número de hermanos que
poseen.
Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0. 



                                                                                                        8 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




      El subíndice “i“ va desde 1 a 30 y entonces x1 = 4; x5 = 0; x12 = 5; . .;
x30 =0.

      Ejemplo 3: Un maestro mide la talla de sus 25 alumnos de Sección
Maternal de la Escuela San Francisco la que expresada en cm es la
siguiente:

xi(cm):
70,75,74,87,92,89,72,83,84,79,98,99,95,87,84,85,79,78,95,99,97,84,86,78,
74.

      Ahora “i” va desde 1 a 25, entonces x1 = 70; x2 = 75; . . .;
      x25 =74.

      Los datos en brut o, t al cual fueron obt enidos, sin agrupar
const it uyen una serie simple.




Tablas y gráficos

Orga ni za ci ón de datos ca tegóricos o cua litativos.

      Cuando la masa de datos obtenidos es muy grande y éstos están
desordenados, no dan información alguna; conviene por lo tanto
ordenarlos y tabularlos, haciendo uso de tablas estadísticas, que deben
confeccionarse de tal modo que los datos resulten fáciles de ser leídos e
interpretados. Con los datos del ejemplo 1 se puede construir una tabla de
frecuencias.

Tabla de frecuencias. Una tabla de frecuencias para variable cualitativa,
           es una tabla que asocia cada categoría de la variable con el
           número de veces que se repite la categoría.

Tabla 1. Alumnos de un curso EGB1, de la Escuela San Francisco, según
estado de salud. Año 2004.

       i           Categorías:xi             Frecuencias: fi
                 (Estado de salud)           (nº de alumnos)
       1               Sano                         24
       2             Enfermo                         6
                       Total                        30
                                           Fuente: Datos ficticios



                                                                                                    9 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Frecuencia absoluta: Es el nº de veces que se repite cada categoría de la
          variable. Se la simboliza con fi.

La suma de las frecuencias absolutas, es igual al nº total de observaciones,

                                       2 

                                      å  f i 
en éste caso 30 ( = 1 =30). Nótese que “ i “ ahora se refiere a las
                                      i 

categorías, x1 = Sano, f1 = 24; x2 = Enfermo, f2= 6.

       La tabla de frecuencias, es la más sencilla de las tablas y es una
tabla de simple entrada pues los individuos se clasifican según una única
variable, estado de salud en el ejemplo
.
      Los datos organizados en tabla de simple entrada para variable
cualit ativa, pueden presentarse mediante gráficos, que tiene la finalidad
de que la información entre por los ojos. El gráfico que puede usarse en
éste caso es el gráfico de barras.

Gráfico 1a. Alumnos de un curso EGB1, de la Escuela San Francisco,
según estado de salud. Año 2004. 


                                30 
                                25 
               Nº de alumnos 




                                20 

                                15 
                                10 
                                 5 
                                 0 
                                                Sanos                    Enfermos 
                                                      Estado de salud 

                                                            Fuente: Datos ficticios
.
      Para su construcción se utiliza el sistema de coordenadas
ortogonales. Sobre el eje horizontal se colocan las distintas categorías de la
variable en estudio (estado de salud) y sobre el eje vertical con una escala
adecuada, se representan las frecuencias. Se dibujan barras de ancho



                                                                                                             1 0 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




constante, una para cada valor de la variable, con una altura que
representa el valor de la frecuencia que corresponde a cada categoría. Es
conveniente que la separación entre las barras sea menor que el ancho de
las mismas.

      El ancho de las barras debe elegirse teniendo en cuenta el espacio
disponible, el número de categorías de la variable a representar y la altura
que les corresponde, con el objeto de obtener un gráfico proporcionado.
Las barras pueden dibujarse en sentido vertical u horizontal.

Gráfico 1b. Alumnos de un curso EGB1, de la Escuela. San Francisco,
según estado de salud. Año 2004
               Estado de salud 




                                  Enfermos 



                                     Sanos 


                                                0        5     10         15    20      25      30 
                                                                   Nº de alumnos


                                                     Fuente: Datos ficticios



      En algunos trabajos es necesario calcular frecuencias relativas.

Frecuencia relativa de una categoría es la proporción de veces que ocurre
     dicha categoría.

Se obtiene dividiendo la frecuencia absoluta de cada categoría entre la
suma de las frecuencias de todas las categorías. La suma en éste caso es
f1 + f2 = 24 + 6 = 30, y se expresa literalmente mediante el signo                                     å      que
se denomina sumatoria, así 
             i  = 2 

            å 
            i  = 1
                                   fi  =      f  1  +    f  2  =    24      + 6  =      30 




                                                                                                               1 1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




a la frecuencia relativa de la clase i­ésima se la simboliza con fri                       y se la
calcula de la siguiente manera: 

                                        f i 
                              fr  =
                                i 
                                       å f i
       La suma de las frecuencias relativas es siempre igual a 1.

                               n 

                              å fri   = 1 
                              i 
                               =1 


Si se multiplica las frecuencias relativas por 100 se obtienen porcent ajes.
En éste ejemplo sería:

Tabla 2. Alumnos de un curso EGB1, de la Escuela. San Francisco, según
estado de salud. Año 2004.

   i             xi                      fi                  f ri            Porcentajes:
          (Estado de salud)                                                       %
   1            Sano                    24            24/30=0,80                     80

   2          Enfermo                    6            6/30=0,20                      20

           Total                        30                 1.00                   100
                                                           Fuente: Datos ficticios

      Se pueden representar los datos de la tabla 2 mediante un gráfico de
barras, sólo que en el eje vertical van los porcentajes.

Gráfico 2. Alumnos de un curso EGB1, de la Escuela San Francisco,
según estado de salud. Año 2004.

              % 100 
                   80 
                   60 
                   40 
                   20 
                    0 
                                    sanos            enfermos 
                                        Estado de salud 

                                        Fuente: Datos ficticios 



                                                                                                 1 2 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




      Otro gráfico adecuado para representar series de frecuencias de
variable cualitativa es el gráfico de sectores circulares, llamado gráfico
de tortas o pie charts .

Tabla 3. Alumnos de un curso EGB1, de la Escuela San Francisco, según
sexo. Año 2004

           Sexo               fi                      f ri               360ºxf ri
                            (nº de
                          alumnos)
         Varones              15                     0,38                  137º
         Mujeres              25                     0,62                  223º
          Total               40                     1,00                  360º
                                                              Fuente: Datos ficticios

Se elige un radio por ej 3cm (el valor del radio se elige según el espacio que
se disponga para el gráfico) y se grafica un círculo. La superficie de dicho
círculo representa el total de alumnos (40), en consecuencia, le
corresponde un ángulo de 360°. Se puede discriminar mediante sectores
circulares la porción que corresponde a las mujeres y a los varones. Los
grados correspondientes a los sectores se obtienen multiplicando la
frecuencia relativa por 360º.

Gráfico 3. Alumnos de un curso EGB1, de la Escuela. San Francisco,
según sexo. Año 2004

                                                                    Varones 
                                                                    Mujeres




                                                     38% 




                  62% 




                                     Fuente: Datos ficticios 




                                                                                                 1 3 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Va ri a bles cua ntitativa s.
Ejemplo: Nº de hermanos que tienen los alumnos de primer grado de
EGB1 de la escuela San Martín
Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0

      Para el caso de v ariables cuantitat ivas discretas, la tabla de
frecuencias se construye de la siguiente manera: se ubica el valor mayor y
el menor valor de la variable (en el ejemplo 2 del n° de hermanos por
alumno, el menor valor es cero y el valor mayor 6), se colocan todos los
valores correspondientes en la primera columna de la tabla, y luego se
cuentan las veces que se presentan dichos valores. La tabla resultante es:

Tabla 5. Alumnos de primer grado de EGB1 de la escuela San Martín
según Nº de hermanos

                    Xi             fi           Fi            fr           %
                     0             5             5          0,17           17
                     1             5            10          0,17           17
                     2             6            16          0,20           20
                     3             3            19          0,10           10
                     4             4            23          0,13           13
                     5             3            26          0,10           10
                     6             4            30          0,13           13
                   Total          30                        1,0           100
                                     Fuente: Datos ficticios

      La diferencia que existe entre cada clase es constante e igual a 1.

      Además de las frecuencias relativas (cuyo cálculo se                           explicó en
párrafos anteriores) aquí se puede calcular también las                             frecuencias
acumuladas Fi. La frecuencia acumulada de una clase                                 se obtiene
sumándole a la frecuencia de la clase, la frecuencia de                              las clases
anteriores.

      F (0)=5
      F (1)=5+5=10
      F (2)=5+5+6=16 = Fi (1)+6


      La tabla de frecuencias para variables cuantitativas discretas se
representa mediante un gráfico de bastones. En la abscisa se colocan los
valores de la variable y se levanta para cada uno de ellos una línea de
altura igual a su frecuencia.



                                                                                                1 4 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




     Gráfico 4. Alumnos de primer grado de EGB1 de la escuela San
Martín según Nº de hermanos 
                                6 


                                5 


                                4 
                  frecuencia 




                                3 


                                2 


                                1 


                                0 
                                     0       1     2     3     4    5    6 
                                             Número de hermanos 


                                          Fuente: Datos ficticios

Int erpretación:
El número 6 en la columna de fi significa que 6 alumnos tienen 2
hermanos
El número 19 en la columna Fi significa que 19 alumnos tienen 3
hermanos o menos
El número 20 en la columna de porcentajes significa que el 20% de los
alumnos tienen 2 hermanos


       Para el caso de variables cuantit ativas continuas como los datos
del ejemplo 3 (altura en cm. de 25 alumnos de una sección maternal de la
Escuela San Francisco) que fueron obtenidos por medición, se recomienda
construir intervalos de clase, cuya amplitud depende de la cantidad de
intervalos que se deseen construir y la cantidad de datos que posee la serie
simple. Es recomendable que los intervalos de clases sean iguales, es decir
que la amplitud de los mismos (a) sea constante. La técnica a emplear para
el agrupamiento de una serie simple de variable cuantitativa continua es
sencilla.




                                                                                               1 5 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




xi (cm): 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85, 79,
78, 95, 99, 97, 84, 86, 78, 74

1. ­Se ubica el valor mayor que toma la variable (99 cm) y el valor menor
(70 cm).

2. ­ Se obtiene la diferencia, la que se denomina Rango o amplitud de
variación y se designa con la letra R. 

                        R = x  - x  = 99 - 70 = 29 
                              max    min 
3.– El número de intervalos aproximado se puede calcular con la siguiente
fórmula: 
                                             log(n + 1) 
                         n   de intervalos =
                           °
                                               log(2) 
dónde n: n° de valores de la serie o tamaño de la muestra
          log: logaritmo decimal 

                                       log(  + 1 
                                           25  ) 
                   n °de int erv  =
                                .                 = 4 7004 » 5 int ervalos 
                                                     . 
                                         log(  ) 
                                             2 

Cuando en la variable que se estudia existen intervalos predeterminados,
el número de clases o intervalos dependerá de la amplitud que se usa
habitualmente.

4. ­ El rango se divide entre el nº de clases o intervalos de clases, 5 para
éste ejemplo, (se recomienda que el número de intervalos no sea menor
que 5, ni mayor de 15, pues en el primer casos se reduce demasiado la
información y en el segundo no se cumple con el objetivo del
agrupamiento) obteniéndose una idea aproximada de la longitud o
amplitud del intervalo de clase. 

                                Rango          29 
                   a =                       =     = 5 8 @ 6 
                                                      . 
                          n º de int ervalos  5 

      Éste valor de amplitud es orientativo, por lo que se decide tomar una
amplitud de intervalo 5 cm para facilitar el agrupamiento.


5.­ Se delimitan las clases buscando preferentemente valores enteros para
sus límites. Se debe elegir el límite inferior del 1er intervalo de tal manera
que contenga al menor valor de la serie (70 cm). La elección recae en el 70.
El límite superior del 1er intervalo, se obtiene sumando al Li la amplitud.



                                                                                               1 6 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Li del 1er intervalo = 70
Ls del 1er intervalo = Li + a= 70 + 5 = 75

      El límite inferior del 2do intervalo debe coincidir con el límite superior
del primer intervalo.

Li del 2do intervalo = 75
Ls del 2do intervalo Li + a= 75+ 5 = 80

       El límite inferior del 3er intervalo debe coincidir con el límite
superior del 2do intervalo, y así sucesivamente, hasta que el límite superior
del último intervalo, contenga el valor observado más alto de la variable.

6.­ Una vez formadas las clases se procede al conteo, que consiste en
determinar el nº de observaciones (frecuencias) de cada clase. Una manera
sencilla de hacerlo es leyendo la serie simple y ubicando mediante marcas
cada valor de la variable en su clase correspondiente. De ésta manera
cuando se termine de pasar lista a la serie simple, el agrupamiento ha
sido efectuado.

Tabla 6. Alumnos de Sección maternal de la escuela San Francisco según
su altura.
              Intervalo de clase               xi                   fi       fri
                (altura en cm)          (marca de clase)
                70    a     75               72.5                  4        0.16
                75    a     80               77.5                  5        0.20
                80    a     85               82.5                  4        0.16
                85    a     90               87.5                  5        0.20
                90    a     95               92.5                  1        0.04
               95     a    100               97.5                  6        0.24
                     Total                                         25       1.00
                                      Fuente: Datos ficticios

       Un problema que se puede presentar es el siguiente: si un valor de la
variable coincide con uno de los límites del intervalo, por ejemplo la altura
95 cm ¿dónde se lo ubica? ¿en el quinto o en el sexto intervalo de clase?
La respuesta es: puede ubicarlo en cualquiera de los intervalos, pero si se
elige un criterio se lo debe respetar hasta el final del agrupamiento. En
éste ejemplo al nº 95 se lo ubica en el 6° intervalo, de la misma manera,
cuando aparezca por ejemplo un valor 85, debe ser anotado como
perteneciente al intervalo en el que el nº 85 se encuentra como límite
inferior. El intervalo de clase es cerrado en el límite inferior y abierto en el
superior. Esto se indica de la siguiente forma [75 80  los valores del
                                                          ;  ) 
intervalo van desde 75 a 79,9999.


                                                                                                1 7 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




7.­ Se agrega una tercera columna, titulada “marca de clase” o “punto
medio de clase” que se designa con xi que contiene los valores
correspondientes a los puntos medios de cada uno de los intervalos y se
calcula así: 

              Li  + Ls 
                1     1  70 + 75 
      x1 = 
                           =      = 72 5 
                                      , 
                2           2 
            Li  + Ls 2  75 + 80 
      x 2 =  2         =           = 77 5 
                                       , 
                2            2 

      También se puede calcular de la siguiente manera 

      x 2 =  x  + a  = 72 5 + 5 = 77 5 
              1          ,          , 




       Al efectuar el agrupamiento, se pierde detalle de la información ya
que, por ejemplo, de los valores que resultaron ubicados en la primera
clase, sólo se sabe ahora que se encuentran entre 70 y 75. Por eso, en caso
de ser necesario asignar un valor a cada uno de ellos, como es en el
cálculo de la media aritmética a partir de la tabla de frecuencias, se opta
por pensar que todos tienen igual valor, que es el correspondiente al punto
medio de clase.

        Un gráfico adecuado para representar una serie de frecuencias de
variable cuantitativa continua es el hist ograma (gráfico nº 5). Su
construcción es fácil. Se utiliza el sistema de coordenadas cartesianas
ortogonales. En el eje de las ordenadas (vertical) se marcan las frecuencias
(fi) y en el de las abscisas (horizontal), la variable según la cual se efectuó
la clasificación (altura). Consiste en rectángulos adyacentes (uno por cada
clase) con bases materializadas por la amplitud de clases (5 cm). La altura
está dada por la frecuencia correspondiente a la clase. Cuando las clases
son iguales, el área del histograma es proporcional a la frecuencia total.




                                                                                                        1 8 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Gráfico 5.Alumnos de Sección maternal de la escuela San Francisco según
su altura

                7 
                6 
                5 
                4 
     Nº alum.




                3 
                2 
                1 
                0 
                     70          75          80           85          90          95         100 

                                               Altura (cm) 

                                                                Fuente: Datos ficticios

      Otro gráfico adecuado para representar la serie de frecuencias de
variable cuantitativa continua es el polígono de frecuencias (gráfico 6).
Se emplea para su realización el sistema de coordenadas cartesianas
ortogonales. Se coloca la variable clasificadora en el eje horizontal y las
frecuencias en el vertical.

      La construcción es sencilla, se marcan tantos puntos como pares de
valores (xi,fi) o sea marcas de clase, frecuencias haya en la tabla. En la
tabla Nº 6 vemos que hay 6 pares de valores; el primer par tiene abscisa
72,5 y ordenada 4 y así sucesivamente hasta marcar el sexto par. Luego se
unen los puntos mediante trazos rectos. Algunos autores, en su afán de
mantener la proporcionalidad entre la superficie y la frecuencia aconsejan
cerrar el polígono de frecuencias uniendo el primer punto con la marca de
clase inmediata anterior y el último punto con la inmediata superior; en
éstos dos casos la unión de los puntos se realiza con trazos cortados.

      La principal ventaja de los polígonos de frecuencias consiste en que
ellos permiten dibujar en el mismo sistema de eje dos o más polígonos
correspondientes a series diferentes que tengan similar posición sobre el
eje de las x, así se puede compararlos, lo cual resulta engorroso efectuar
con los histogramas a causa de la superposición de las superficies de los
rectángulos. 



                                                                                                   1 9 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




Gráfico 6.Alumnos de Sección maternal de la escuela San Francisco según
su altura


                                   7 

                                   6 
                 Nº de alum nos 




                                   5 

                                   4 

                                   3 

                                   2 

                                   1 

                                   0 
                                     65       70      75         80          85      90       95    100    105 
                                                                       Altura(cm) 


                                                                                          Fuente: Datos ficticios


      Como cada miembro de una población presenta diversas
características, se puede necesitar clasificarlos de acuerdo a dos de ellas.
Cuando el número de individuos medidos es pequeño, se enumeran todos
los pares de observaciones, si alguno de ellos aparece dos veces, se lo
repite y la presentación suele hacerse de modo que una de las dos
variables esté ordenada.

Tabla 9. Alumnos de una escuela según su peso y altura.
 Peso     39                        40          41          42          43         43        44      45       50      52
 (kg)
Alt (m)   1,27                     1,30        1,30     1,31           1,34        1,35     1,37    1,39    1,45    1,49
                                                                                                      Fuente: Datos ficticios

       Para representar estos datos que corresponden a dos variables
cuantitativas continuas se utilizan los g ráf icos de dispersión o scatter
plot , que se construye de la siguiente manera: se coloca una de las
variables en las abscisas o eje horizontal, por ejemplo la altura y la otra
variable, el peso, en el eje vertical, con sus escalas correspondientes, luego
se marcan tantos puntos como pares de valores (xi, yi) se tengan.




                                                                                                                           2 0 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




      Gráfico 7. Alumnos de una escuela según su peso y altura
                       1,55 

                        1,5 

                       1,45 
        Al tura (m) 




                        1,4 

                       1,35 

                        1,3 

                       1,25 
                            35             40             45              50             55 
                                                      Peso (kg) 
                                                                             Fuente: Datos ficticios

      Éste gráfico sirve para mostrar la relación entre las dos variables y
se usa cuando para el mismo valor de xi se tiene diferentes valores de yi. Si
esto no ocurre puede utilizarse el gráfico lineal, que se construye de igual
manera que el anterior, con la única diferencia que se unen los puntos.
Éste gráfico, se suele emplear, especialmente, en los casos donde la
variable que se representa en el eje horizontal es el tiempo. De éste modo
se puede ver la evolución de la otra variable en el período considerado.
Pueden representar simultáneamente en el mismo gráfico dos o más
variables, como se observará al representar gráficamente los datos de la
tabla Nº 10

Tabla 10. Inasistencias mensuales de alumnos de Segundo grado A de
EGB1 de la Escuela San Martín según sexo

                                          Meses          N° de inasist.
                                                     Mujeres       Varones
                                          Marzo          3             4
                                          Abril          5             7
                                          Mayo           2             4
                                          Junio          6             5
                                          Julio          8             8
                                         Agosto          4             5
                                          Sept.          3             4
                                         Octubre         4             3
                                         Noviem.         5             2
                                         Diciem.         1             6
                                                 Fuente: Datos ficticios



                                                                                                                2 1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




Gráfico 8. Inasistencias mensuales de alumnos de Segundo grado A de
EGB1 de la Escuela San Martín según sexo

                                          9 
                                                                                                          Mujeres 
                                          8                                                               Varones 

                                          7 
                Nº de inas is tenc ias 




                                          6 

                                          5 

                                          4 

                                          3 

                                          2 

                                          1 

                                          0 
                                                  M     A      M     J     J    A      S     O     N      D 
                                                                           Meses 


                                                        Fuente: Datos ficticios

     Cuando los pares de valores son muy numerosos, las tablas se
presentan según lo muestra la tabla 11; en éste caso se dice que las tablas
son de doble entrada pues son dos las variables de clasificación.


Tabla 11. Alumnos de la escuela Nº 42 según ocupación de la madre y
lugar de residencia.

            Ocupación                                                 Barrios                     Total
               de la
              Madre                                       A                 B           C
            A. de casa                                   400               500        200         1100
            Profesional                                  200               200         50          450
            Empleada                                     300               400        100          800
               Total                                     900              1100        350         2350
                                                                            Fuente: Datos ficticios

   En este ejemplo cada alumno se caracteriza según la variable
Ocupación de la madre (variable cualitativa nominal) y Barrio de
residencia (variable cualitativa nominal).




                                                                                                                        2 2 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   Los valores que se encuentran en la celda son frecuencias, es decir
representan la cantidad de alumnos que comparten las dos características.

Las partes de una tabla son:

La ma triz , formada por la primera fila, lleva los encabezamientos de las
columnas y / o la primera columna que titula a las filas.

El cuerpo constituido por celdas.

   La información proporcionada por los valores de las celdas se completa
con la suministrada por los encabezamientos de las filas y columnas; en
las celdas se encuentra la frecuencia, es decir la cantidad de elementos o
individuos que poseen las dos características.

  Por ejemplo el 100 de la última celda significa que en esa escuela hay
100 alumnos que viven en el Barrio C y cuyas madres son empleadas.

      El gráfico que se utiliza para representar éste tipo de tablas es el
   gráf ico de barra s compuesta s (gráfico 9)   y el gráfi co de barra s
   a grupa da s (gráfico 10).


Gráfi co de barra s compuesta s

       La construcción del gráfico de barras compuestas es sencilla. Se
comienza dibujando las barras como si fueran simples es decir con las
alturas correspondientes a los totales y luego se yuxtaponen los valores
parciales hasta alcanzar el de su suma. En el ejemplo, Barrio A, se procede
de la siguiente manera: se marca una barra de altura 900, en ella se indica
la subdivisión que corresponde a alumnos cuyas madres son amas de casa
con el valor 400; para marcar el nº de alumnos que es 200, se marca
400+200=600 en el eje vertical lo que queda corresponde nº de alumnos
cuyas madres son empleadas. De igual manera se procede con los barrios
B y C.




                                                                                               2 3 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Gráfico 9. Alumnos de la escuela Nº 42 según ocupación de la madre y
lugar de residencia 
                                  1200 
                                                                                Empleada 
                                                                                Profesional 
                                  1000 
                 Nº de alumnos                                                  A. de casa 

                                   800 


                                   600 


                                   400 


                                   200 


                                     0 
                                          A                 B                  C 

                                                Lu gar  de  r e sid en cia 

                                                 Fuente: Datos ficticios
Gráfi co de barra s a grupa da s

      Sirven para representar fenómenos similares a los que originan
barras compuestas. La diferencia con éstas estriba en que, para cada valor
de la variable independiente “x” en éste ejemplo lugar de residencia, se
dibujan grupo de barras . El número de barras en cada grupo es el del
número de categorías de la segunda variable, en este ejemplo ocupación de
las madres.

Gráfico 10. Alumnos de la escuela Nº 42 según ocupación de la madre y
lugar de residencia 
                                  600 
                                                                               A. de casa 
                                                                               Prof esional 
                                  500 
                                                                               Empleada 
                 Nº de alumnos 




                                  400 


                                  300 


                                  200 


                                  100 


                                    0 
                                          A                 B                  C 

                                               Lu gar  de  r e sid en cia 



                                                                      Fuente: Datos fict ic ios




                                                                                                     2 4 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




       Otro tipo de gráficos son los gráficos de figuras o pictogramas. Son
los más indicados para publicaciones de divulgación popular , por su fácil e
inmediata interpretación. Consisten en dibujos esquemáticos y
relacionados con el fenómeno a representar. Cada figura es equivalente a
una cantidad determinada, preferentemente entera, de unidades de la
variable dependiente y el número de unidades no su tamaño, es
proporcional a la magnitud a representar.

       Cart ogramas: Se emplean cuando es importante señalar la
distribución geográfica de un determinado acontecimiento, razón por la
cual se construyen sobre planos o mapas.

       Cart ogramas de señalización (Gráfico 11): Sirven para indicar la
distribución de una variable cualitativa sobre una base geográfica.
Mediante figuras, colores o diferentes rayados se señala que hay en
lugares determinados.

      Gráfico 11. Qué es lo que caracteriza a cada provincia argentina.




      Fuente: Pensando en Plural. División de educación tributaria. AFIP. Mayo 2005.
ISBN Nº987­9101­26­X




                                                                                                 2 5 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




      En este mapa, se observa lo que caracteriza a cada provincia
argentina. Por ejemplo en Santiago del Estero las aguas termales; en La
Pampa la producción de trigo, etc...

      Cart ogramas de densidad: además de indicar que hay y dónde, de
ellos se puede obtener la información de cuánto hay. Mediante diferente
rayado o colores y también utilizando barras sobre la base geográfica, se
puede expresar la cuantía del fenómeno como así también su ubicación.
Suelen utilizarse pictogramas, gráficos de líneas, en general cualquiera de
los descriptos, sobre el mapa o plano.

      Resumiendo: los datos se ordenan, clasifican y presentan en formas
de tablas. Las tablas pueden de ser de simple entrada(cuando los
individuos se clasifican según una variable), de doble entrada(cuando los
individuos se clasifican según dos características) y de triple o más
entradas (cuando se clasifican los datos según tres o más variables).Las
tablas se complican a medida que se agregan más variables, por lo tanto
es preferible varias tablas sencillas a una complicada.

     Toda tabla debe llevar título, el cuál debe responder a las preguntas
¿Según?, ¿Qué?, ¿Cuándo? y ¿Dónde?.

      No se debe olvidar la fuente de datos que indica de donde proviene la
información.

     Se debe incluir los totales.

      En caso de expresar los datos en porcentajes, deben indicarse los
totales de los cuales provienen.

       Con respecto a los gráficos, éstos constituyen una de las formas más
útiles de presentación de datos estadísticos. Su importancia reside en las
múltiples formas que pueden adoptar, lo que permite su aplicación a una
amplia gama de finalidades: didácticas, de investigación, etc. Sirven para
mostrar la relación entre una o más variables. La variedad de tipo de
representaciones gráficas exige una cautelosa elección de acuerdo a su
finalidad. La selección de la presentación gráfica debe, por lo tanto tener
los siguientes aspectos:

     Tipo de análisis estadístico, características y número de los
fenómenos o variables a representar y público al que va dirigido.




                                                                                              2 6 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




     Recomendaciones para la construcción correcta de un gráfico.

            Una vez elegido el tipo de gráfico adecuado, es conveniente no
descuidar las siguientes consideraciones:

        ·   Decidir cuál de las variables es la independiente “x” y cuál la
            dependiente “y”.
        ·   La representación gráfica debe ser sencilla, simple y explicarse
            por sí misma.
        ·   Título se coloca encabezando el gráfico y debe responder a las
            preguntas; qué, según, cuándo, dónde?.
        ·   Fuente de datos. Se coloca al pie del gráfico.
        ·   Escalas se elige de tal modo que no alteren la objetividad de la
            representación, hecho éste muy utilizado para fines publicitarios
            donde es común ver escalas construidas con el propósito de
            alterar el fenómeno exagerando ventajas y enmascarando la
            realidad, o lo que es peor aún eliminando la graduación de los
            ejes, evitando de ésta forma todo patrón de comparación. Las
            escalas deben construirse buscando obtener como resultado un
            dibujo armónico y proporcionado.
        ·   Debe nominarse los ejes de modo tal que no quede duda alguna
            acerca de las variables que en ellos se representan.
        ·   No olvidar el corte de ejes en caso de ser necesario. Éste debe
            efectuarse entre el 0 y el valor mínimo a representar.
        ·   Aclaración de las unidades de representación.
        ·   Las referencias serán colocadas al pie o al costado del gráfico.
        ·   En caso de usarse abreviaturas, éstas serán aclaradas con la
            debida extensión, en el renglón siguiente al correspondiente a
            las fuentes.
        ·   En lo posible acompañar los gráficos con las tablas estadísticas
            que lo originen.
        ·   Si el tra ba jo lo requiere y es necesario expresar al gunos
            va l ores en %, deben consignarse la s cifra s de la s cual es
            provienen éstos porcenta jes.




                                                                                               2 7 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




ÍNDICES

      El Índice es un indicador útil tanto para fijar situaciones como para
hacer un diagnóstico. Cuando interesa comparar los valores de una
característica de la educación (matrícula, asistencia de alumnos, número
de profesores, etc...) en el tiempo o en el espacio, ya sea comparando dos
valores entre sí o todos con uno de ellos se puede realizar un cociente cuyo
resultado se denomina Índice simple.

Ejemplo: Se desea comparar la matrícula escolar de una escuela en el año
2004 con la matrícula en el año 1994. Si la primera es de 4000 alumnos y
la de 1994 es de 2000, el Indice será:

                                                    4000
                                   I2004/1994=            = 2 
                                                    2000 
      Lo que indica que la matrícula en el año 2004 es el doble que la
matrícula de 10 años atrás, en esa escuela.

      El valor que va en el denominador se llama ba se .

      El Indice del año base es 1:
                                                 2000
                                   I1994/1994= 2000  = 1 

      Con frecuencia se multiplica por 100 los índices con lo que entonces
los índices son los porcentajes correspondientes siendo 100 el porcentaje
del índice base.


Los Índices más comunes utiliz ados en educación son:

·   Razón de alumnos mat riculados en las escuelas con respecto a la
    población en edad escolar.



                         N °alumnos  matriculad os 
                  I= 
                         Población en edad  escolar 




                                                                                               2 8 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Ejemplo: En el año 2001, en la localidad de La Banda según el INDEC, la
población en edad escolar fue de 88735 y los alumnos matriculados fue de
32613. La razón de alumnos matriculados es entonces en ese año de:

                                  32613
                            I=           = 0 37 
                                            . 
                                  88735 

Es decir que solo el 37% del total de la población en edad escolar asiste a
la escuela.

·   Alumnos por maestro en las escuelas primarias.


                  N ° 
                     alumnos 
            I=
                  N °maestros 

Ejemplo: Si el total de alumnos de una escuela es de 1000 y el plantel
docente informa que hay 40 maestros( Datos ficticios), la razón alumnos
por maestro es:

                         1000
                    I=        = 25 
                          40 


      Es decir que en esa escuela hay 25 alumnos por cada maestro.

·   Porcentaje de población analfabeta de 15 años y más.

                   N ° 
                      analfabeto  .de 15 
                                s       años  y  más 
            I=                                       * 
                                                      100 
                     Población de 15  años  y  más 

Ejemplo: En la provincia de Santiago del Estero según el INDEC, en el año
2001 el total de población de 15 años y más fue de 571546 personas. De
ellas, 31625 no tenían ninguna instrucción.

      El Porcentaje de población analfabeta para la provincia es entonces,


                    31625
            I=            * 
                           100 = 5 53 
                                  .  % 
                   571546 




                                                                                                 2 9 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   · Tasa de ausentismo de docent es
Es el porcentaje de ausentismo de docentes en un período de tiempo
determinado.

                  N º de días de ausencia de todos  los docentes  un período 
                                                                 en 
       Ta=                                                                   * 100 
                  N º de días de clase de todos los docentes en ese período 


Ejemplo: Si en una escuela hay una planta docente de 115 personas y el
total de inasistencias de los docentes(por diversas causas) en el año es de
3101días, la Tasa de ausentismo se calcula como sigue(considere que los
días de clase en el año son 180):
                                                        3101
                                                Ta=              * 100 = 14 98 
                                                                           .  % 
                                                      115 * 180 


· Tasa de desgranamiento
Es la proporción de alumnos ingresados al primer grado (o curso) que no
lograron culminar todos los grados (o cursos) correspondientes al nivel, en
el período establecido. 


              N º de alumnos que no cul  aron sus estudios en el  período establecid 
                                       min                                          o 
       Td =                                                                            * 100 
                         N º de alumnos matriculad  al inicio del  período 
                                                  os 

Ejemplo: Si en el estudio de la cohorte 1974­1980 el número de alumnos
matriculados en la Argentina en la escuela primaria al inicio del período es
de 729048 y los que no culminaron sus estudios es de 337292 (Fuente:
Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. Troquil­Bs.As.­
1996­Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura:
Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE.
Año 1999)

la Tasa de desgranamiento es:                         337292
                                                Td= 729048  = 0 46 
                                                               . 



Es decir que en ese período hay un desgranamiento del 46%.
El 46% de los alumnos matriculados al inicio del período no culminaron
sus estudios al final del mismo. 




                                                                                                    3 0 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




· Tasa de retención de la cohort e
Es la proporción de alumnos ingresados al primer grado (o curso) que
lograron culminar todos los grados (o cursos) correspondientes al nivel, en
el período establecido. 

       N º de alumnos que cul  aron sus estudios en el  período establecid 
                              min                                         o 
Tr =                                                                         * 
                                                                              100 
                 N º  de alumnos matriculad  al inicio del  período 
                                           os 

Ejemplo: Si en el mismo período considerado en el ejercicio anterior
terminan el 7ª grado 391756 alumnos de los 729048 matriculados, la Tasa
de retención será:

                          391756
                                  = 0 5374 
                                     . 
                      Tr= 729048 

      Es decir que la Tasa de retención es aproximadamente del 54%.
      El 54% de los alumnos matriculados al inicio del período culminaron
sus estudios al final del mismo.

· Tasa de escolarización
Proporción de la población en edad escolar que está efectivamente
escolarizada 

                              N º de alumnos matriculad 
                                                       os 
                       Ez =                               * 
                                                           100 
                              Población en edad  escolar 

Ejemplo: La población de 5 años y más para Sgo. del Estero en el 2001
según el INDEC es de 706794 habitantes. De ellos asisten a la escuela
237708.

La Tasa de escolarización es:
                                            237708
                                       I=          * 
                                                    100 = 33 63 
                                                            .  % 
                                            706794 
Es decir que el 33.63% de la población en edad escolar asiste a la escuela. 




                                                                                                   3 1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                                        GUÍA DE EJERCITACIÓN
Actividad 1
Clasifique en base al siguiente listado las variables socio educativas, en
cualitativas nominales u ordinales y cuantitativas discretas o continuas

                    Variable                                             Tipo
 1­   Religión

 2­   Nº de alumnos promocionados por
      curso

 3­   Barrios

 4­   Nivel de educación alcanzado por el
      tutor

 5­   Edad de los alumnos

 6­   Sexo

 7­   Nº de inasistencias mensuales

 8­   Altura de los alumnos

 9­   Lugar de nacimiento

10­ Peso de los alumnos

11­ Horas de estudio diario

12­ Nº de materias que cursan

13­ Nº de hermanos          que    tiene     cada
    alumno

14­ Grado    de     satisfacción       por      la
    asignatura

 15   Superficie construída por escuela

 16   Nº de escuelas por Departamento

 17   Categorías de escuela




                                                                                                3 2 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Actividad 2

     Los siguientes datos corresponden a Nº de inasistencias de los
alumnos de un curso correspondientes al primer cuatrimestre

      xi :             8    5   3    4    2    5      4   4    10     6
                       6    7   5    5    3    9      7   2     6     4
                       9    4   5    0    8    6      5   1     1     4
                       5    7   2    7    6    4      9   4     5     3


   a) ¿Que indica el subíndice i?
   b) ¿Cuál es la variable que se estudia?. Clasifíquela.
   c) Ud. debe presentar un cuadro de inasistencias de los alumnos.
      ¿Cómo construye el mismo?
   d) Incluya en la tabla: frecuencias acumuladas, frecuencias relativas,
      porcentaje y porcentaje acumulado correspondiente a cada valor de
      la variable.
   e) Presente los resultados con el gráfico apropiado.



Actividad 3
      En un curso de 50 alumnos de un establecimiento de la Capital del a
Pcia. De Sgo. Del Estero, se empleó la técnica de profundización de temas
por grupo en el desarrollo de contenidos teóricos. Se distribuyó un
cuestionario con la finalidad de determinar la actitud de los mismos ante
esta modalidad de estudio. Una de las preguntas estaba referida al grado
de conformidad sobre el desarrollo de los contenidos teóricos.

Los resultados obtenidos fueron los siguientes:
xi :
             MC   MD        C    I        C      MC        D     D        MC      MC
              I   MC        I   MC       D       MC       MD      C       D        C
             MC    D       MC    D       MC      D        MD      I        C       C
              C   MD       MC    I        C      MC       MC     D         C      MC
              C   MC       D    MD       MC       I        D     MC        I      MC

Donde:
MC: muy conforme
C: conforme
I: indiferente
D: disconforme
MD: Muy disconforme




                                                                                                3 3 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   a) Indique el tamaño de la muestra
   b) Ud. debe representar al establecimiento en una reunión de
      profesores en la que participan distintos Colegios de la Capital.
      ¿Como presentaría la opinión del alumnado?
   c) Que título colocaría a la presentación?
   d) Incluya en la misma frecuencias relativas y porcentajes
      correspondiente a cada valor de la variable.
   e) Presente esos mismos resultados con un gráfico de barras simples.
   f) Indique si corresponde calcular frecuencia acumulada. En el caso de
      respuesta afirmativa obtenga dicha frecuencia.
   g) Analice los resultados obtenidos

Actividad 4
En un estudio realizado en el Instituto Santo Tomás de Aquino para
determinar la zona de influencia del mismo según el lugar de residencia de
los alumnos, los resultados obtenidos fueron los siguientes:

Alumnos del Instituto Santo Tomás de Aquino según el barrio en el que
residen.

            Barrios                               Número de alumnos
            Barrio Belgrano                       300
            Barrio Cabildo                        150
            Barrio Contreras                      30
            Barrio Ejército Argentino             20
            Total                                 500
            Fuente: Datos ficticios

   a) ¿Que representa el número 500?
   b) ¿Cuál es la variable de clasificación? Indique de que tipo de variable
      se trata.
   c) Obtenga frecuencias relativas y los porcentajes correspondientes.
   d) Determine si corresponde calcular frecuencias acumulada.
   e) Realice gráfico de tortas.
   f) ¿Qué otro gráfico puede emplear para representar estos datos?




                                                                                                3 4 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Actividad 5
Los siguientes datos corresponden a la edad de los tutores de alumnos que
concurren al EGB de un establecimiento escolar
            xi :
                   44   30   45    48    31     45    33    35    54    44
                   45   47   38    56    29     43    43    62    60    30
                   52   36   45    31    31     32    34    32    54    55
                   55   46   61    39    43     38    47    45    38    37
                   63   49   34    48    34     64    44    47    36    60
                   50   52   37    41    29     37    49    37    39    56
                   39   46   46    31    60     29    53    40    41    58

Presentar los datos :
   a) En una tabla con un número aproximado de intervalos de clase.
   b) En una tabla con 5 intervalos
   c) ¿Que gráficos utilizaría para representar los datos contenidos en
      estas tablas?
   d) Con la tabla presentada en el item b, realice un histograma.
   e) Con la tabla presentada en el item a, realice un polígono de
      frecuencias.




Actividad 6
Los siguientes datos corresponden a alumnos analfabetos por
Departamento en la Pcia. de Santiago del Estero, discriminados por sexo.
Año 2001
             Departamento      Total     Sexo
                                        Varones      Mujeres
                Capital        4587      2299         2288
                 Banda         4752      2461         2291
               Río Hondo       3473      1960         1513
                 Robles        2116      1166         950

FUENTE: INDEC. Censo Nacional de Población, Hogares y Viviendas. 2001.

En base a los datos proporcionados en la tabla anterior realice:
  a) Gráfico de barras simples que muestre el número total de alumnos
      analfabetos por Departamento. ¿Que otro tipo de gráfico podría
      utilizar en la representación?
  b) Gráfico de tortas que muestre el número de alumnos analfabetos
      discriminados por sexo para el Departamento Robles.
  c) Realice un gráfico de barras agrupadas por Departamento



                                                                                                 3 5 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   d)   Realice un gráfico de barras porcentuales por Departamento
        discriminando dentro de cada una de ellas los porcentajes de
        varones y mujeres analfabetos.




Actividad 7

Utilice un gráfico lineal para mostrar la evolución de egresados del
Polimodal
Año       Nº de
        egresados
1980       233
1985       278
1990       321
1995       375
2000       391
FUENTE: Datos ficticios




Actividad 8
En base a los datos de la siguiente tabla:

Población en edad escolar, Nº de alumnos matriculados y Nº de maestros
correspondiente a cuatro lugares de la República Argentina.

    Lugar         Población en          Nº de        Nº de                         Nº de
                  edad escolar        alumnos     alumnos no                      maestros
                                     matriculados matriculados
        A            300000           248.000                                       7.000
        B            150000           106.000                                       4.000
        C             25000            24.000                                       1.200
        D            160000           142.000                                       4.750
Fuente: Datos Ficticios

Calcular para cada lugar:
   a) Proporción de alumnos matriculados
   b) Nº de alumnos por maestro
   c) Tasa de escolarización
   d) Número de alumnos No matriculados
   e) Porcentaje de alumnos No matriculados


                                                                                                  3 6 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Actividad 9
Dada la siguiente tabla, calcule la retención y el desgranamiento de cada
cohorte y en base a los resultados realice el análisis correspondiente

Retención y Desgranamiento de la Escuela Primaria. Su evolución en 3
ciclos escolares del período 1964­1980

Ciclo Escolar      Alumnos matriculados
                   1er Grado         7º Grado
1964 ­ 1970        723.264           321.940
1969 ­ 1975        751.049           375.723
1974 ­ 1980        729.048           391.756

Fuente: Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. Troquil­
Bs.As.­1996­Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura:
Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE.
Año

   a) Calcule la tasa de desgranamiento
   b) Calcule la tasa de retención
   c) Interprete los resultados obtenidos


Actividad 10
La siguiente tabla fue extraída del Censo Nacional de Población, Hogares y
Vivienda . 2001.

Población de 10 años y más de departamentos de Santiago del Estero, por
condición de alfabetismo y sexo. Año 2001.

Provincia    Población                           Condición de alfabetismo
            de 10 años                    Alfabetos                        Analfabetos
               y más         Total        Varones      Mujeres       Total   Varones Mujeres
  Total       607.782       571.067       284.309      286.758      36.715   19.030    17.685
 Capital      191.311       186.724        87.894       98.830      4.587     2.299    2.288
 Banda        97.689        92.937         45.066       47.871      4.752     2.461    2.291
   Río        38.435        34.962         17.361       17.601      3.473     1.960    1.513
 Hondo
  Copo        19.241         17.264         9.156         8.108        1.977       948       1.029


a) Calcular la tasa de analfabetismo de los distintos Departamentos que se
muestran en la Tabla.
b) ¿Cuál es el porcentaje de población de más de 10 años sabiendo que la
población total de Santiago del Estero, según el Censo del año 2001 es de
804.457 ?



                                                                                                      3 7 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




c) ¿Cuál es la tasa de analfabetismo de las mujeres en los distintos
departamentos?
d) Calcule la tasa de analfabetismo correspondiente a los varones de los
distintos departamentos.




                                                                                              3 8 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




                                  UN I DA D I I I

                                   MEDIDAS DE POSICIÓN Y DISPERSIÓN

INTRODUCCIÓN

      En todo trabajo estadístico luego de recolectar los datos, ordenarlos,
agruparlos en tablas y presentarlos gráficamente, es preciso extraer alguna
información que caracterice a la población de la cual se los extrajo.

      Por ello, el objetivo de éste capítulo es interiorizarlos acerca de las
medidas de posición y variación más utilizadas para caracterizar a la
población en estudio, y en que caso se emplea cada una de ellas,
interpretando los resultados a través del pensamiento crítico.

       Los métodos de éste capítulo suelen denominarse métodos de
estadística descriptiva, porque su objetivo es resumir o describir las
características importantes de un conjunto de datos. Éstas características
se refieren al centro, variación, distribución, datos distantes y cambios a
través del tiempo.


   1. Medida s de posición

      Supongamos que una directora está preocupada por las notas
obtenidas en las pruebas de Matemáticas. Lo primero que se le ocurrirá es
tener una idea de si las notas de una muestra de alumnos se ubican cerca
de la calificación cinco o cerca de la calificación nueve. Necesita resumir
los datos y calcular alguna medida que sirva para que, con un único valor
sencillo y representativo pueda establecer si los alumnos se posicionan
cerca de una calificación de 5 puntos o si por el contrario se posicionan
cerca de la calificación de nueve puntos; a estas medidas se las denominan
Medidas de Posición, y si además indican el centro de ése conjunto de
valores, se denominan Medidas de posición y tendencia central.

       Se conocen varias formas de determinar el centro de un conjunto de
datos. A continuación, se indicarán tres que son las más comúnmente
utilizadas: media, mediana y modo.




                                                                                                3 9 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




1.1. Media aritmét ica

La media (aritmética) es la medida de posición y tendencia central más
empleada para describir los datos; constituye lo que la mayoría de la gente
denomina promedio. Es quizás la más conocida y usada.

La media aritmética en una serie simple de datos, se la obtiene al dividir la
suma de todos los valores de la variable entre la cantidad de valores
sumados. A la media aritmética se la representa con  x :

a)Cálculo de las media aritmética en series simples

   Ø Ejempl o 1
Se registró los días de inasistencias en un año, de una muestra de cinco
alumnos del primer ciclo del EGB y se desea averiguar cuál es el promedio
de inasistencias de esa muestra. La variable en estudios es:

X = nº de inasistencias de los alumnos
Los valores de la variable son:
xi : 0; 16; 12; 5; 7 
                                                           5 


       0 + 16 + 12 + 5 + 7  x  + x 2  + x  + x  + x 
                                                          å x i 
                                                          i 
 x  =                      = 1           3    4    5 
                                                      =    =1 

                5                       5                   5  ,
y su fórmula de cálculo es la siguiente 
                                 n 

                                å x i
                                i 
                                =1 
                         x = 
                                  n                                                2.1


En la fórmula se utiliza la letra griega å (sigma mayúscula) que indica
que los valores de la variable deben sumarse.
El símbolo n denota el tamaño de la muestra, que es el número de
alumnos observados.

Cuando los datos provienen de una muestra el símbolo de la media
aritmética es  x (se denomina “x barra”); si se calcula la media aritmética
con los datos de toda la población se simboliza con 
                                 N

                                å x i
                                i 
                                 =1
                         m = 
                                      N                                            2.2




                                                                                                     4 0 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




å     denota la sumatoria del conjunto de valores.
xi    expresan los diferentes valores que toma la variable.
n     tamaño de la muestra, cantidad de valores observados
N     tamaño de la población

     Como nuestros datos constituyen una muestra para calcular la
media utilizamos la fórmula 2.1 

                      5 

                     å x i 
                     i   
                      =1          0 + 16 + 12 + 5 + 7  40 
               x =            =                       =    = 8 
                       5                   5            5 


Int erpretación: Los alumnos tienen en promedio 8 inasistencias por año.


Algunas propiedades de la media aritmética

1­La media aritmética es reproductora del total.

2­ Si llamamos desvío a la diferencia entre un valor y la media aritmética

      å (d i ) = å (x i  - x ) = 0
                                          x i        d i = x  - x 
                                                            i 
                                          0          0 – 8 =­8
                                          5          5 ­ 8 =­3
                                          7          7 ­ 8 =­1
                                         12          12 – 8 = 4
                                         16          16 – 8 = 8
                                        Total             0

Una desventaja de la media es su sensibilidad a valores extremos, de modo
que un valor excepcional puede afectarla de una manera drástica, en este
caso no representa en forma adecuada al centro de dicho conjunto y tiende
a dirigirse a ese valor extremo.

Si por equivocación al pasar los datos en el ejemplo de las inasistencias de
los 5 alumnos colocamos 66 en vez de 16:

     Ø Ejempl o 2
X = inasistencias de alumnos
xi : 0; 66; 12; 5; 7



                                                                                                        4 1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




      La inasistencia promedio toma el valor 18, alejándose el promedio
hacia al valor extremo 66. 

                           5 

                          å x i 
                          i   
                           =1          0 + 66 + 12 + 5 + 7  90 
                  x  ==            =                       =    = 18 
                            5                   5            5 

      La media aritmética no representa el centro del conjunto de datos.
Este problema o desventaja se resuelve utilizando otra medida de resumen
de datos que se denomina: mediana.

       La medi a aritmética se puede cal cula r cua ndo los val ores de
la s varia bles son cua ntitativos ta nto conti nuos como discretos.


1. 2 Mediana.

      La mediana (de un conjunto de datos):es una medida de tendencia
central que divide a la serie ordenada de datos en dos partes iguales, de tal
forma que el 50% de los datos son menores o iguales a la mediana y el otro
50% mayores o iguales a ella. La mediana se designa con Me.

a) Cálculo de la mediana en series simples

   Ø Ejempl o 3
   Ø Se va n a consi derar dos ca sos: cua ndo el ta ma ño de la
      muestra es i mpar y cua ndo n es par
    Ø
Se desea determinar el valor mediano de las inasistencias de los alumnos
del ejemplo 2,
 El tamaño de la muestra, “n” es impar.

X: inasistencias de alumnos
xi : 0; 66; 12; 5; 7

     Para su cálculo debemos ordenar primero los datos en forma
ascendente o descendente.

      Si el número de observaciones es impar, la mediana es el valor de la
variable que se localiza exactamente en la mitad de la lista.

      En caso de que el número de observaciones fuera par, el valor de la



                                                                                               4 2 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




mediana se obtiene promediando los dos valores centrales.

      Esos valores centrales se posicionan en el lugar 
                               n + 1
                                 2 

Solución. Primero se ordenan los datos

                           0; 5; 7; 12; 66.

La muestra posee tamaño impar n = 5 y el valor mediano está posicionado
en el lugar 
                      5 + 1  6 
                            = = 3 
                        2    2 

, o sea que el valor de la mediana es el valor de la variable ubicado en el 3º
lugar.

                           0; 5; 7; 12; 66.

Me = 7 inasistencias

Int erpretación: el 50% de los alumnos tiene inasistencia menores o
iguales a 7.



    Ø Ejempl o 4
En el caso de que n sea par
Supongamos que contamos las inasistencias de 6 alumnos.
X = inasistencias de alumnos
xi : 0; 66; 12; 5; 7;10

Solución. Primero se ordenan los datos
0; 5; 7; 10; 12; 66.

Las muestra posee tamaño par n = 6,
                                  6 + 1  7 
                                        = = 3 5 
                                             , 
Posición de los valores centrales  2     2 

Los valores centrales ocupan el tercer y cuarto lugar, la mediana se
obtiene como el promedio de los dos valores centrales:



                                                                                                4 3 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                      0; 5; 7; 10; 12; 66 

      7 + 10 
Me  =         = 8 5 » 8 
                 , 
        2 
Int erpretación: el 50% de los alumnos tienen inasistencias menores o
iguales a 8.

Deben quedar claro dos conceptos:

Primero: La mediana no se ve influenciada por los valores extremos, ya
que en su cálculo interviene el orden y no la magnitud de los valores.

Segundo: la media aritmética es sensible a valores extremos.

       La medi a na se puede determinar para va ria bles cua ntitati va s
continua s discreta s y para varia bles cua litati va s que se miden en
esca l a ordi nal.

1. 3. Modo.

      El Modo es el valor de la variable que ocurre con mayor frecuencia.
Se designa frecuentemente como Mo.

      Se debe hacer notar aquí que el Mo es un valor de variable y la
frecuencia de este valor sugiere su importancia estadística.

     Cuando dos valores ocurren con la misma frecuencia y ésta es la
más alta, ambos valores son modas, por lo que el conjunto de datos es
bimodal.

      Cuando más de dos valores ocurren con la misma frecuencia y ésta
es la más alta, todos los valores son modas, por lo que el conjunto de
datos es multimodal.

         Cuando ningún valor se repite, se dice que no hay moda.

   Ø Ejempl o 5 .
   Calcule las modas para los siguientes conjuntos de datos:

Serie    A: 4,5; 7,6; 2,8; 4,5; 3,6; 2,6
Serie    B: 4; 5; 3; 4; 6; 8; 5
Serie    C: 27; 27; 27; 55; 55; 55; 88; 88; 99
Serie    D: 1; 2; 3; 6; 7; 8; 9; 10



                                                                                                  4 4 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Solución:
En l a seri e A. El número 4,5 es la moda pues es el valor que ocurre con
mayor frecuencia(2 veces).
En l a seri e B. Los números 4 y 5 son modas, ya que ambos ocurren con
la frecuencia más alta (2 veces).
En l a serie C. Los números 27 y 55 son modas, ya que ambos ocurren
con la frecuencia más alta (3 veces).
En l a seri e D. No hay moda, ya que ningún valor se repite.

      En reali da d, l a moda no se utiliza mucho con da tos numéricos.
Sin embargo, entre l a s di stinta s medi da s de tendencia central que
consi dera mos, la moda es la úni ca que puede usarse cua ndo se trata
de va ri a bles cualitativa s nominal es.



    Ø Ejempl o 6 .
      Una encuesta efectuada a estudiantes mostró que el 84 tiene
aparato de televisión; 76 videocasetera; 39 videojuegos y el 35 reproductor
de DVD. En tanto que el televisor es el aparato más frecuente, es posible
afirmar que la moda es el televisor.

      No podemos calcular una media o mediana para datos como éstos,
cualitativos a nivel nominal.


3.­ Cálculo de las medidas de posición en series de frecuencias

Veremos como se calculan la medidas de posición y tendencia central
cuando los datos están agrupados en una serie de frecuencias.

3.1. Variables agrupadas en serie de frecuencias simple

3.1.a. Media aritmética.
Como en una serie de frecuencias, fi nos indica las veces que se repite el
valor de la variable, debemos considerarlas en el cálculo de la media
aritmética.




                                                                                              4 5 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




   Ø Ejemplo 7
Una maestra esta interesada en conocer el número promedio de hermanos
de su alumnos. Para ello tomó de una muestra de 25 alumnos.

Tabla 1. Alumnos de tercer año de polimodal de la Escuela Sarmiento
clasificados según el número de hermanos

                        Nº de hermanos                          Nº de alumnos
                              (x i)                                   (fi)
                               0                                       1
                               1                                       9
                               2                                       7
                               3                                       5
                               4                                       3
                             Total                                    25
                                                                 Fuente: Datos ficticios

      Si aplicamos la fórmula 2.1, deberíamos sumar 1 vez cero, nueve
veces 1 y así sucesivamente hasta sumar 3 veces 4 y dividir esa suma
entre 25 que es el tamaño de la muestra.

xi: nº de hermanos
fi : número de alumnos que poseen xi hermanos 

                           25 

                           å x i 
                           i   
                            =1          0 + 1  + 1 + 2  + 3  + 4  + 4  50 
                                             ...      ...  ...  ... 
                   x  ==            =                                 =     = 2 
                            25                        25                25 

       Pero, este cálculo se podría realizar en forma más simple y es
obtener esa misma suma reemplazándola por la multiplicación. Utilizando
la frecuencia fi que indica las veces que se repite el valor de la variable xi. 

                                    x  f 1  + x 2  f 2  + ... + x 5  f 5 
                                     i
                             x  =
                                          f 1  + f 2  + ... + f 5 

ahora expresando literalmente la fórmula de la media aritmética tenemos

                                                     n 
                                                1 
                                         x =      å x i  f i 
                                                n  i =1 


      Este promedio se conoce como media aritmética ponderada. Para
poder calcular la media aritmética ponderada correspondiente al ejemplo
planteado, agregamos a la tabla de frecuencias anterior una columna


                                                                                                 4 6 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




auxiliar que facilitará el cálculo de la media.

Tabla 2. Alumnos de tercer año de polimodal de la Escuela Sarmiento
clasificados según el número de hermanos

                          Nº de hermanos               Nº de alumnos              xi*fi
                                 (xi)                        (fi)
                                  0                           1                  0
                                  1                           9                  9
                                  2                           7                 14
                                  3                           5                 15
                                  4                           3                 12
                               Total                         25                 50
                                                                        Fuente: Datos ficticios


x  = 
        1    n 

          å x i  f i        . 
                        =  1  50 =  2
                          25 
        n  i =1 


     Podemos concluir diciendo que los alumnos de tercer año de
polimodal de la Escuela Sarmiento en promedio poseen 2 hermanos.

3.1.b. Mediana

Una maestra esta interesada en conocer la mediana del número de
hermanos de una muestra de 44 alumnos que concurren a una escuela
rural.

Tabla 3. Alumnos de una Escuela rural clasificados según el número de
hermanos

                                    Nº de hermanos             Nº de alumnos
                                          (x i)                (frecuencia, fi)

                                              2                      5
                                              3                      5
                                              4                     30
                                              5                      4
                                             Total                  44
                                                 Fuente: Datos ficticios

      En esta serie de frecuencias de variable cuantitativa discreta, los
datos ya están ordenados, por lo que solo resta encontrar el valor central,
cuya posición se encuentra en el lugar 

                                      n + 1       44 + 1  45 
                                              =          =    = 22 5 
                                                                  , 
                                        2           2      2 


                                                                                                          4 7 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




     O sea el valor mediano será el promedio de los valores de la variable
ubicados en el lugar 22 y 23. Para ello se deben seguir los siguientes
pasos:

1.­Calcular las frecuencias acumuladas correspondientes a cada valor de
la variable.

2.­Calcular el orden de localización de la mediana efectuando el cociente 

                  n + 1       44 + 1  45 
                          =          =    = 22 5 
                                              , 
                    2           2      2 

            donde n = tamaño de la muestra




Tabla 4. Alumnos de una Escuela rural clasificados según el número de
hermanos
               Nº de hermanos         Nº de alumnos        Frecuencias
                     (x i)            (frecuencia, fi)    acumulada (Fi)

                      2                     5                     5
                      3                     5                     10
                      4                     30                    40
                      5                     4                     44
                     Total                  44
                                                            Fuente: Datos ficticios



      Como el valor de la mediana se encuentra entre la posición 22 y la
posición 23, se busca en la columna de frecuencias acumuladas, el menor
valor que contiene a 22 (es 40), al que corresponde el valor de variable 4 y
el menor valor que contiene a 23 (es 40), al que corresponde el valor de
variable 4.

       Por lo que el valor mediano es el promedio de los dos valores
centrales. 
                              4 + 4 
                       Me  =         = 4 
                                2 
Int erpretación: el 50 % de los alumnos de escuelas rurales, tienen 4
hermanos o menos.


                                                                                               4 8 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




3.1.c. Moda

Ejemplo: Calcular el valor más frecuente del número de hermanos de los
alumnos de tercer año de polimodal de la Escuela Sarmiento (Tabla 2).

Solución: La variable que se estudia es una variable cuantitativa discreta.
Se busca en la columna fi el valor más alto, en este ejemplo es 9.
El valor de la moda es el valor de la variable que tiene frecuencia 9, es
decir

                                   Mo = 1

Int erpretación: La mayoría de los alumnos de tercer año de polimodal de
la Escuela Sarmiento. poseen un hermano .


3.2. Variable agrupada en serie de frecuencias con intervalos de clase,
para variable aleat oria cont inua

3.2.a. Media aritmética.

   Ø Ejemplo

      Para realizar un estudio sobre la nutrición de la población infantil
que concurre a la escuela en una localidad rural, se consultaron los pesos,
en kilogramos, de los 50 alumnos de la escuela, los que se muestran en la
Tabla 4. Los datos se agruparon en intervalos de amplitud 2 kg. y con
límite superior abierto. Determine el valor promedio del peso de los
alumnos.

Solución

1.­ Se calcula las marcas de clase

      Al organizar de esta forma los datos, se pierde información, pues la
tabla indica, por ejemplo que hay 12 alumnos que pesan entre 38 kg y 40
kg, pero no cuanto pesan cada uno. Ahora debemos encontrar un único
valor que represente o resuma a todos los valores del intervalo: ese valor es
el promedio o media aritmética de los límites del intervalo y se denomina
punto medio de la clase o marca de clase. Este valor representará el
valor xi de la fórmula de la media.




                                                                                               4 9 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




                                         38 + 40 
                                          x1 = 
                                                  = 39 
                                             2 
                                  40 + 42 
                           x 2 =           = 41 = x  + a  = 39 + 2 = 41 
                                                   i 
                                     2 

Se introduce una nueva columna en la tabla que la denominaremos xi


Tabla 4. Peso de los alumnos de una escuela rural

               Intervalo    Nº de alumnos                Marca de clase          x i * fi
                  (kg)             fi                          xi

               38 a 40                    12                  39             468
               40 a 42                    19                  41             779
               42 a 44                    7                   43             301
               44 a 46                    6                   45             270
               46 a 48                    6                   47             282
                Total                     50                                2100
                                                                   Fuente: Datos ficticios

La fórmula para encontrar la media en serie de frecuencias es

                                          n 
                                    1 
                            x  =      å x i  f i 
                                    n  i  =1 


Pero en este caso xi representa a la marca de clase
                           n=tamaño de la muestra= å 
                                                                          f i 

      Ahora ya estamos en condiciones de aplicar la fórmula para el
cálculo de la media aritmética, por ello agregamos una columna que es el
producto de cada marca de clase por su frecuencia (xi*fi). 

                                         n 
                                 1                  1 
                           x =     å x i f i  = 50 * 2100 = 42 kg 
                                 n  i    =1
                                                 




Interpret ación: Los alumnos pesan en promedio 42 kg.




                                                                                                5 0 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




3.2.b. Mediana

   Ø Ejemplo
      Se desea conocer el peso mediano de los 50 alumnos de una escuela
rural (Tabla 4). El cálculo de la mediana en serie de frecuencias para
variable cuantitativa continua se efectúa utilizando la siguiente fórmula 

                                            å f i - F 
                                                    
                                                               ant  Me 
                             Me = L inf +     2                           * a 
                                                       f Me 

 L inf : límite inferior de la clase mediana 
 å f i 
   2 : Suma de la frecuencia entre 2 
   F  ant  Me 
         : frecuencia acumulada anterior a la clase mediana 
 f Me  : frecuencia absoluta de la clase mediana
 a:       amplitud del intervalo a = Lsup­ Linf


                  Peso de los alumnos de una escuela rural
                                Intervalo              Nº de alumnos
                                   (kg)                       fi

                                38 a 40                             12
                                40 a 42                             19
                                42 a 44                              7
                                44 a 46                              6
                                46 a 48                              6
                                 Total                              50
                                                                                 Fuente: Datos ficticios
Solución
1­En la tabla se agrega una columna para valores de frecuencias
acumuladas.

                  Peso de los alumnos de una escuela rural
               Intervalo (kg)        Nº de alumnos fi                                  Fi
                  38 a 40                   12                                         12
                  40 a 42                   19                                         31
                  42 a 44                    7                                         38
                  44 a 46                    6                                         44
                  46 a 48                    6                                         50
                   Total                    50



                                                                                                           5 1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                                                                              Fuente: Datos ficticios
2­ Se calcula 
                                  å f i 
                                      2

 El tamaño de la muestra se divide entre 2 porque la Mediana es el valor
de la variable que divide la serie ordenada de datos en 2 partes iguales. 

                                                 å f i  = 50  = 25 
                                                   2      2 

3­ Se busca en la columna Fi el menor valor que contiene a 25. En este
ejemplo el valor que corresponde es 31. Se señala la clase mediana y se
aplica la fórmula. 
                                                               å f i - F 
                                                                       
                                                                                  ant  Me 
                                                Me = L inf +     2                           * a 
                                                                          f Me 

                     50 
                         - 12 
                      2                  25 - 12            13 * 2 
           Me = 40 +          * 2 = 40 +         * 2 = 40 +         = 40 + 1 37 = 41 37 
                                                                            ,       , 
                        19                 19                19 


Int erpretación:
El 50% de los alumnos pesan 41,37 kg o menos.

3.2.c. Moda
   Ø Ejemplo
Se desea conocer el peso más frecuente de los 50 alumnos. El cálculo del
modo en serie de frecuencias para variable cuantitativa continua se realiza
utilizando la siguiente fórmula 


                                                                   D 
                                                                    1 
                                                Mo = L  Mo  +
                                                      inf                 * a 
                                                                D  + D 
                                                                 1     2 



Donde: 
D1  =  f Mo  - f anterior  a la clase  Modal 
D 2 =  f Mo  - f posterior  a la clase  Modal 
a: amplitud del intervalo



                                                                                                                        5 2 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Solución
      En la columna fi se busca el valor más alto, en nuestro ejemplo 19,
se señala la fila, ella constituye la clase modal.
Se calcula: 

            D1 = 19 - 12 = 7 
              

            D2 = 19 - 7 = 12 

           a = 42­ 40 = 2

     Se aplica la fórmula 

                          7                7          14 
            Mo = 40 +           * 2 = 40 + * 2 = 40 +         ,  kg 
                                                          = 40 74 
                        12 + 7            19          19 

Int erpretación: el peso más frecuente del grupo de alumnos es de 40,74
kg

Relación entre media, mediana y modo

Cuando la media, la mediana y el modo coinciden, la serie de datos
presenta una distribución simétrica unimodal.




                                     m= Me=Mo


     Cuando esa coincidencia no existe, se dice que la distribución
unimodal es asimétrica.

       La asimetría es positiva cuando la media es mayor que la mediana y
la mediana mayor que el modo, en éste caso vemos que la media aritmética
se dirige hacia el o los valores extremadamente grandes




                                                                                               5 3 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                Mo < Me <m
      La distribución presenta asimetría negativa cuando la media es
menor que la mediana y la mediana menor que el modo; en éste caso
vemos que la media aritmética se dirige hacia el o los valores
extremadamente pequeños.




                                            m<  Me< Mo


La distancia entre la media aritmética y el modo podría usarse como una
medida de asimetría (Ya­Lun Chou, 1990).

Asimetría = media – modo

Cuánto mayor es esta distancia, negativa o positiva, tanto más asimétrica
es la distribución


4­ Medidas de localización

Son Medidas de Posición que dividen los valores ordenados de una serie en
cuatro, diez o cien partes iguales y se denominan cuartiles, deciles y
percentiles.

4.1 Cua rtil es

Los cuartiles son tres valores Q1, Q2, Q3, que dividen a la serie ordenada
en cuatro partes iguales.
Por debajo del primero quedan el 25% de los datos; por debajo del segundo
el 50% de los mismos y por debajo del tercero el 75%. El segundo cuartil
coincide con la Mediana. 


                                                                                               5 4 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




4.2 Deciles
Los Deciles son nueve valores de la variable y dividen a la serie ordenada
de datos en 10 partes iguales, el decil 5 coincide con la Mediana, es decir
el 50% de los valores son menores o iguales al D5.


4.3 Percentil es
Los percentiles son 99 valores de la variable, que dividen al conjunto de
datos (ordenados de menor a mayor) en cien partes iguales el percentil 50
coincide con la mediana. Los percentiles se designan con la letra Pi, el
subíndice i, varía de 1 a 99, indicando el valor del percentil, que se desea
calcular.

         ü Cálculo de percent iles:

            Forma analítica

Para calcular los percentiles de una distribución de frecuencias se procede
del mismo modo que en el caso de la mediana, salvo que ahora dividiremos

                            n = å f i 
al tamaño de la muestra                  en cien partes iguales, en vez de dos.


   Ø Ejempl o
Se desea conocer P20 de licencia en las escuelas del centro de la ciudad de
Santiago del Estero en el año 2004.

Tabla 5. Días de inasistencia de los docentes de escuelas de la capital de
Santiago del Estero en el período escolar 2004.

                 Intervalo de clase       Nº de docentes               Fi
                  (días de licencia)             (fi)
                       0 a 10                    30                   30
                      10 a 20                    60                   90
                      20 a 30                    60                   150
                      30 a 40                    70                   220
                      40 a 50                    90                   310
                      50 a 60                   100                   410
                      60 a 70                    60                   470
                      70 a 80                    40                   510
                      80 a 90                    10                   520
                     90 a 100                    10                   530
                        Total                   530
                                Fuente: Datos ficticios




                                                                                               5 5 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




      El cálculo de percentiles para variables agrupadas en serie de
frecuencias con intervalos de clase, se efectúa utilizando la siguiente
fórmula: 

                                      i å f i 
                                                 - F  P 
                                                    ant  i 
                        P  = L inf + 100 
                         i                                    * a 
                                             f P 
                                                i 




L inf : Límite inferior de la clase donde se encuentra el percentil

i = valor del percentil que se busca

FantPi: frecuencia acumulada anterior a la clase donde se encuentra el
Percentil i

f Pi :frecuencia absoluta de la clase donde se encuentra el Pi

a:         amplitud del intervalo a =Lsup­ Linf




Solución
Cálculo del percentil 20

Pasos
1.­ Se agrega una columna de frecuencias acumuladas (Fi)

2.­ Se calcula 
        
 i å f i  20 * 530 
         =          = 106 
   100      100 

3.­ Se ubica en la columna Fi el menor valor que contiene a 106, en
nuestro ejemplo 150. La clase que tiene una Fi= 150 es la clase que
contiene al Percentil buscado

4.­ Se calcula a: Lsup –Linf = 30­20=10
5.­ Se aplica la fórmula 

              106 - 90           16 * 
                                     10 
 P20 = 20 +
                       *  = 20 +
                        10               = 22 67 » 23 días 
                                             , 
                60                 60 




                                                                                                     5 6 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Int erpretación
P20 = 23 días

El 20 % de los docentes toman 23 días de licencia o menos

         ü Rango percentil

            Forma analítica

      Se puede presentar, el problema inverso, es decir, conocer cuántos
docentes toman 52 días de licencia o menos, es decir nos dan como dato
un valor de la variable y nos preguntan que percentil le corresponde; a este
procedimiento se lo denomina calcular el Rango percentil.

  Es decir el rango percentil de un valor dado es el porcentaje de valores
comprendidos debajo del valor solicitado.

   Ø Ejemplo:
Calcular el rango percentil que le corresponde a 52 días de licencia de los
docentes de las escuelas de la ciudad de Santiago del Estero

Repetimos la tabla 5 para visualizar mejor el cálculo

Días de inasistencia de los docentes de escuelas de la capital de Santiago
del Estero en el período escolar 2004.

                  Intervalo de clase       Nº de docentes              Fi
                   (días de licencia)             (fi)
                        0 a 10                    30                  30
                       10 a 20                    60                  90
                       20 a 30                    60                  150
                       30 a 40                    70                  220
                       40 a 50                    90                  310
                       50 a 60                   100                  410
                       60 a 70                    60                  470
                       70 a 80                    40                  510
                       80 a 90                    10                  520
                      90 a 100                    10                  530
                         Total                   530
                                 Fuente: Datos ficticios

Solución
1.­ Ubicamos en la tabla el intervalo de clase donde se encuentra el valor
52 es el intervalo que va de 50 a 60.

2.­ Se calcula la Frecuencia acumulada que le correspondería al valor 52


                                                                                               5 7 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




con la siguiente fórmula 
                                             ( x  - L  ) 
                                                i    inf 
                               F ( x  ) = 
                                    i                     *  f int erv  + F  anterior 
                                                                           Clase 
                                                  a 

Donde:
F(xi)=  frecuencia acumulada correspondiente al valor que se busca
Linf    Límite inferior del intervalo de clase donde se encuentra xi
finterv  Frecuencia absoluta del intervalo donde se encuentra xi
a         amplitud del intervalo

F clase ant. Frecuencia acumulada de la clase anterior al intervalo donde
se encuentra xi 

                        (  - 50 
                         52    )            2 * 
                                               100 
            F (52  = 
                 )               *  + 310 =
                                  100               + 310 = 330 
                           10                 10 

3.­ Se calcula ahora el rango percentil con la siguiente fórmula 

                                          F ( x  ) 
                                               i 
                                R p  =              * 
                                                     100 
                                          å    f i 

                             330
                   R p  =         * 100 = 62 26  » 62 
                                            .  %     % 
                             530 




Int erpretación:
Xi= 52 días
Pi= 52

      El 62% de los docentes toman 52 días de licencia o menos.

(Cálculo gráfico de percentiles y rango percentil

Ejemplo
Calcular gráficamente el percentil 20

Solución
Se debe construir un gráfico de líneas; los pares de valores a graficar
corresponden al límite superior del intervalo con el porcentaje acumulado
correspondiente a dicha clase.
1.­ Calcular porcentaje acumulados. Para ello se necesita calcular:
a) frecuencia relativa para cada intervalo


                                                                                                5 8 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




b) porcentaje
c) porcentaje acumulado
2.­ Se grafica un polígono (Lsup; %acum.). El gráfico que se obtiene se
denomina ojiva.

Días de inasistencia de los docentes de escuelas de la capital de Santiago
del Estero en el período escolar 2004.

Interv alo de c lase      Nº de doce nte s              f ri          Porcentaje           Porcentaje
 (días de lice ncia)             (f i)                                   f ri*100          acumulado
      0 a 10                    30                 0,0566               5,67= 6                 6
     10 a 20                    60                 0,1132             11,32 = 11               17
     20 a 30                    60                 0,1132             11,32 = 11               28
     30 a 40                    70                 0,1321             13,21 = 13               41
     40 a 50                    90                 0,1698             16,98 = 17               58
     50 a 60                    100                0,1887             18,87 = 19               77
     60 a 70                    60                 0,1132             11,32 = 11               88
     70 a 80                    40                 0,0755              7,55 = 8                96
     80 a 90                    10                 0,0189              1,89 = 2                98
     90 a 100                   10                 0,0189               1,89 = 2              100
        Total                   530                                         100 


        100 

         90 
         80 
         70 

         60 
   % 




         50 

         40 

         30 

         20 
         10 

          0 
               0    10     20     30      40      50           60    70    80       90    100 

                                                Días 


5.­Si deseamos calcular el valor que corresponde al percentil 20. Se ubica
el valor 20 en el eje vertical y se traza una paralela al eje horizontal hasta
la curva y luego se traza una vertical hasta encontrar el valor de días
correspondiente, el que aproximadamente es 23.

Int erpretación:
 El 20 % los docentes incurren en 23 días de licencia o menos


                                                                                                        5 9 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




6.­Si deseamos conocer cual es el rango percent il que corresponde a 52
días, ubicamos ese valor en el eje horizontal y trazamos una paralela al eje
vertical hasta la curva y desde allí una paralela al eje horizontal, leemos en
el eje vertical el valor correspondiente al rango percentil (aproximadamente
60). 

       100 

        90 
        80 
        70 

        60 
  % 




        50 

        40 

        30 

        20 
        10 

         0 
              0    10     20     30      40      50      60      70     80      90     100 

                                               Días 


Los valores correctos se obtienen utilizando las fórmulas presentadas
anteriormente.




MEDIDAS DE VARIABILIDAD O DISPERSIÓN

      Las Medidas de Posición no son suficientes por si solas para
describir el conjunto de datos es necesario tener además una idea de como
se distribuyen los datos alrededor del centro de la distribución. Para eso
surgen las Medidas de Dispersión o variabilidad.




                                                                                                      6 0 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




1.­Medidas de variabilidad en series simple. Su cálculo

1.1. RANGO
Es llamado también amplitud total de variación de la variable. Se lo
obtiene como la diferencia entre el valor máximo y mínimo de la variable.

Distribución A: 1 5 5 5 5 5 5 5 5 9

Distribución B: 1 1 2 4 5 6 7 7 8 9

RA=9­1=8
RB=9­1=8

      En este caso el valor del rango es el mismo, a pesar de que notamos
que la variabilidad de las dos distribuciones es diferente.

      La desventaja de esta medida es que solo considera los valores
extremos     sin tener en cuenta el comportamiento del resto de las
observaciones. Por lo que observamos que a pesar de tener variabilidades
diferentes las dos distribuciones, el rango no la capta.

     Para solucionar este problema surgen otras medidas de variabilidad
como el desvío medio.

¿Cómo se puede medir la variabilidad de un conjunto de datos? Si por
variabilidad se entiende el grado en que los valores de la distribución
difieren de la media y entre si, entonces la desviación promedio de los
valores a partir de la media puede resultar una medida razonable de
variabilidad:

                                   å (x i - x ) 
                                        n 

     Se denomina desvío a la diferencia entre cada valor de la variabley
su medio.

      Cuando el valor de la variable es mayor que el valor medio el desvio
es positivo; cuando el valor de la variable es menor que el valor promedio
los desvíos son negativos.

      Pero por propiedades de la media sabemos que la suma de los
desvíos de los valores respecto a la media es siempre es cero, pues las
desviaciones positivas respecto a la media, anulan siempre a las



                                                                                               6 1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




desviaciones negativas, con lo que resulta siempre una suma igual a cero y
por ende el valor promedio.

      Como esta medida de variabilidad parece razonable, debemos
redefinir nuestra medida para evitar los valores negativos. Una manera de
hacerlo es considerar el valor absoluto de los desvíos; la medida que se
obtiene se denomina:


1.2.DESVIO MEDIO: Se define como el promedio del valor absoluto de los
                 desvíos; se designa con DM. 


                                  DM  =
                                             å d i = å x i  - x 
                                                 n        n 

Tabla 6: Distribución de puntajes de un grupo de alumnos
                      xi                    x  - x             d i 
                                   d i =     i

                      1                     ­4                   4
                      5                      0                   0
                      5                      0                   0
                      5                      0                   0
                      5                      0                   0
                      5                      0                   0
                      5                      0                   0
                      5                      0                   0
                      5                      0                   0
                      9                      4                   4
                  å xi  = 50  å (d i ) = 0             å d i  = 8
                  x = 5                                         8
                                                        DM  =      = 0 8 
                                                                      , 
                                                               10 
                               Fuente: Datos ficticios

      Pero generalmente no se puede operar fácilmente cuando se trabaja
con valor absoluto, por eso se considera una segunda forma de modificar
esos signos negativos y consiste en elevar los desvíos al cuadrado, lo que
dará desvíos al cuadrado positivos. Esta nueva medida de variabilidad se
denomina varianza.

1.3. Varianza es el promedio de los desvíos al cuadrado y se designa con
           S2 cuando se trata de una muestra y es un mejor estimador de
                                                 2
            la varianza poblacional( s ) cuando la suma de los desvíos al
            cuadrado se divide entre el tamaño de la muestra menos 1;
            por ello para una muestra la fórmula es:


                                                                                              6 2 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




          n 

         å (x i - x ) 
                         2 


S 2 =    i   
          =1                   Variancia de una muestra, para series simples
                n - 1 
          n 

         å ( x i - m )    2 

                               Variancia poblacional
s 2 =    i 
          =1 

                  N 


      Cuántos más tiendan los valores a diferir de la media, mayor será la
varianza. El valor numérico de la varianza de una distribución depende de
la unidad de medida que se utilice. Por consiguiente, cuando se compara
la varianza de dos o más distribuciones, hay que estar seguro que la
unidad de medida empleada es igual en todas las distribuciones. En el
ejemplo de la Tabla 7:

                          Distribución de puntajes de un grupo de alumnos

                                      xi
                                                   di= 
                                                          x  - x 
                                                           i                               (
                                                                                   d 2  = x  - x 
                                                                                    1      i        ) 
                                                                                                    2 


                                      1                   ­4                               16
                                      5                    0                                0
                                      5                    0                                0
                                      5                    0                                0
                                      5                    0                                0
                                      5                    0                                0
                                      5                    0                                0
                                      5                    0                                0
                                      5                    0                                0
                                      9                    4                               16
                                                   å (d i ) = 0                å (x i - x )  = 32 
                                                                                                2
                                 å xi  = 50                                             

                                    x = 5                                                  32 
                                                                               S 2 =           = 3 56 
                                                                                                  , 
                                                                                           9 
                                               Fuente: Datos ficticios


                                                            n 

                                                          å (x i - x ) 
                                                                          2 

                                                                                   32 
                                                  S 2 =   i   
                                                           =1 
                                                                               =       = 3 56 
                                                                                          , 
                                                                 n - 1             9 




                                                                                                              6 3 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




      Otra desventaja es que la varianza se expresa, en unidades al
cuadrado y no en término de las unidades originales de medición, lo que
hace difícil la tarea de relacionar en forma significativa el valor de la
varianza con el conjunto original de datos.

      Por eso es conveniente, considerar una medida de variabilidad que
se exprese en unidades originales. Esta nueva medida denominada
desviación estándar se obtiene al extraer a la varianza la raíz cuadrada.



1.4.Desv iación est ándar muestral

                                  n 

                                 å (x i - x ) 
                                                  2

                                 i   
                                  =1 
                          S  =
                                        n - 1 

                                  n 

                                 å (x i - x ) 
                                                  2

                                 i   
                                  =1                      32 
                          S  =                        =       = 3 56  = 1 89 
                                                                 ,       , 
                                        n - 1             9 

Desviación estándar poblacional

                                       n 

                                  å ( x i -m ) 
                                                      2

                                  i    =1 
                         s = 
                                             N 

      Nos debe quedar claro que la desviación estándar mide la variación
entre los valores. Los valores cercanos producirán una desviación estándar
pequeña, mientras que los valores dispersos producirán una desviación
estándar más grande.


2.­Medidas de variabilidad en series de frecuencia simple. Su cálculo

Ejemplo: Calcular la variabilidad de las inasistencias de 32 alumnos




                                                                                              6 4 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Tabla N° 7. Inasistencias de 32 alumnos

                               Nº de inasistencias         Nº de alumnos
                                       (x i)                     (fi)
                                       11                        12
                                       12                         9
                                       14                         5
                                       15                         4
                                       23                         2
                                      Total                      32

                                                   FUENTE: Datos ficticios

Cuando se trata de variables cuantitativas discretas el Rango se calcula:

2.1 Rango= Valor máximo ­Valor mínimo + 1

      Rango=R = 23 ­ 11+1=13 inasistencia


2.2 Desv ío medio en serie de frecuencia simple

        d i  *  f i  å x  - x  * f i 
DM  =  å
                        i 

        å f i           å f i 
Cálculo:
   1) Se   calcula la media aritmética
   2) Se   calcula los desvíos
   3) Se   obtiene el valor absoluto y se lo multiplica por su frecuencia
   4) Se   aplica la fórmula

                                 Inasistencias de 32 alumnos
      Nº de inasistencias          Nº de alumnos  x i*fi  d i =  x  - x         d      d i  *  f i 
                                                                  i              1
              (x i)                       (fi)
              11                          12               132      ­2           2        24
              12                           9               108      ­1           1        9
              14                           5                70       1           1        5
              15                           4                60       2           2        8
              23                           2                46      10          10        20
                                          32               416                            66 


                         x=   å x i  * f i  = 416  = 13 
                               å f i  32 


                                                                                                      6 5 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




                          DM  =      å d i  * f i  = 66  = 2 , 06 
                                      å f i  32 
2.3. Varianza en serie de frecuencia simple

                         n                              n 

                        å (x i - x )                  å (x i - x )  f i 
                                        2                            2 
                                             f i 
                S 2 =   i   
                         =1 
                                                    = i =1 

                               n - 1                     å f i  - 1 
   1)   Se   calcula la media aritmética
   2)   Se   calcula los desvíos
   3)   Se   elevan los desvíos al cuadrado
   4)   Se   multiplica cada desvío al cuadrado por su frecuencia
   5)   Se   aplica la fórmula

                                   Inasistencias de 32 alumnos
         Nº de inasistencias         Nº de alumnos  x i*fi  d i =  x  - x                                      d i 2    d i 2  *  f i 
                                                                    i 
                 (x i)                                (fi)
                 11                                   12         132                            ­2              4          48
                 12                                    9         108                            ­1              1          9
                 14                                    5          70                             1              1          5
                 15                                    4          60                             2              4          16
                 23                                    2          46                            10             100        200
                                                      32         416                                                      278
                                                    FUENTE: Datos ficticios


                                    n 

                                   å (x i - x )  f i 
                                                        2 

                                                                     278  278 
                          S 2  =   i 
                                    =1 
                                                               =           =               2 
                                                                                = 8 97 días 
                                                                                   , 
                                              n - 1                 32 - 1  31 

2.4 Desviación estándar en serie de frecuencia simple


                                                        n                               n 

                                                       å (x  - x ) *  f                å (x i - x )  *  f i 
                                                                        2                            2 
                                                               i              i 
                                                       i =1 
                                                                                       i 
                                                                                        =1 
                                        S=                                         =
                                                               n - 1                      å f i  - 1 
                                     n 

                                   å (x i - x )  *  f i 
                                                         2

                                   i   
                                     =1                                      278              278 
                          S  =                                      =               =              = 8 97  = 2 99 
                                                                                                      ,       , 
                                                    n - 1                   32 - 1             31 



                                                                                                                                         6 6 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




3.­ Medida de variabilidad en serie de frecuencias con int erv alos de
clase

Los siguientes datos corresponden a edades de los alumnos de los 2 ciclos
de EGB.

Tabla N°9. Edades de los alumnos de segundo ciclo del EGB

         Clases de       Marca de           fi      x i*fi    d i = ( x  - x )    d1 
                                                                                        d   
                                                                       i                 1
        edad en año      clase (xi)                                                        *fi
          6 a 8              7             4         28             ­4         4        16
          8 a 10             9             8         72             ­2         2        16
          10 a 12           11             11       121              0         0         0
          12 a 14           13             12       156              2         2        24
          14 a 16           15             2         30              4         4         8
           Total                           37       407                                 64
                                                                      Fuente: Datos ficticios

3.1.Rango
L.superior de la última clase – L.inferior de la primera clase. Como los
límites superiores de las clases son abiertos, es decir no toma el valor 16,
debemos colocar el valor 15,99

                      R = 15,99 – 6 = 9,99 años



   1)   Se   calculan las marcas de clase y luego la media aritmética
   2)   Se   calcula los desvíos
   3)   Se   elevan los desvíos al cuadrado
   4)   Se   multiplica cada desvío al cuadrado por su frecuencia
   5)   Se   aplica la fórmula


3.2. Desvío medio en serie de frecuencia de intervalos 


                      DM  =
                              å d i  * f i  = 64  = 1 . 73 
                               å f i  37 
   1) Se calculan las marcas de clase y luego la media aritmética




                                                                                                   6 7 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




                       x =   å x i  * f i  = 407  = 11 
                              å f i  37 
   2)   Se   calcula los desvíos
   3)   Se   obtiene el valor absoluto de los desvíos
   4)   Se   multiplica cada desvío absoluto por su frecuencia, se suma
   5)   Se   aplica la fórmula


3.3. Variancia serie de frecuencia con intervalos de clase

   1)   Se calculan las marcas de clase y luego la media aritmética
   2)   Se calculan los desvíos
   3)   Se elevan los desvíos al cuadrado
   4)   Se multiplica cada desvío al cuadrado por su frecuencia
   5)   Se aplica la fórmula

Edades de los alumnos de segundo ciclo del EGB

          Clases de       Marca de                 fi        x i*fi    d i = ( x  - x )    d i 2    d i 2 *fi
                                                                                i 
         edad en año      clase (xi)
           6 a 8              7              4      28           ­4                        16       64
           8 a 10             9              8      72           ­2                         4       32
           10 a 12           11             11     121            0                         0        0
           12 a 14           13             12     156            2                         4       48
           14 a 16           15              2      30            4                        16       32
            Total                           37     407                                              176
                                         Fuente: Datos ficticios



      Varianza en serie de frecuencias con intervalos de clase, la única
diferencia con las fórmulas para serie de frecuencias simples es que xi,
representa el punto medio de la clase o marca de clase

                                  n

                                 å (x i - x )  f i 
                                              2 

                                 i                           176  176 
                        S 2  =    =1 
                                                        =          =               2 
                                                                        = 4 89 años 
                                                                           , 
                                        n - 1               37 - 1  36 




                                                                                                                6 8 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




3.4 Desv iación estándar en serie de frecuencias con intervalos de clase.


                     n 

                    å (x i - x )  *  f i 
                                 2
                             
                    i 
                     =1                          176      176 
             S  =                           =           =      = 4 89  = 2 21 años 
                                                                  ,       , 
                           n - 1                37 - 1     36 



COEFICIENTE DE VARIACIÓN

     Las cuatro medidas de variabilidad enunciadas precedentemente son
medidas de variabilidad absoluta. El coeficiente de variación es una
medida de variabilidad relativa.

      Expresa la desviación estándar como un porcentaje de la media. Es
una medida adimensional, se expresa en % y sirve para comparar la
variabilidad entre dos o más distribuciones que provengan de diferentes
unidades de medidas o teniendo igual unidad de medida los valores de
diferente magnitud.

Coeficiente de variación muestral C.V . = S 100 
                                     
                                                          x 

Ejemplo
Decir cual de las siguientes distribuciones es más variable:

xi: peso de los alumnos de nivel inicial (kg)
34; 29; 28; 31; 40

yi: altura de los alumnos de nivel inicial (m)
1,24 1,54 1,38 1,37 1,56 


x =32,4 kg Sx=4,83kg 
 y =1,42 m Sy=0,13m

      No podemos decir que la variabilidad en peso es mayor que la
variabilidad en altura, ya que las variables están medidas en distintas
unidades, para poder compararlas la debemos expresar como porcentaje
de sus medias




                                                                                                   6 9 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




CVx=(4,83/32,4)*100=14,91%

CVy=(0,13/1,42)*100=9,15%


Conclusión: los alumnos tienen menor variabilidad en altura que en peso.

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
Uso de la ca lcul a dora científi ca para el cá lculo de Medi da s de
Posi ción y Di spersión Cal cul a dora s Casio model o f x­82W.
Seguir la s si guientes i nstrucciones:

      Debe procurar que la calculadora se encuentre en disposición para
efectuar cálculos estadísticos. Para ello apriete mode 2. En la parte
superior de la pantalla aparece la notación SD.

      Debe cerciorarse de que no hay nada acumulado en la memoria.
Para ello pulse SHIFT AC = y en su pantalla aparece el número cero. Se
está ahora en condiciones de introducir los datos.

Por ejemplo para serie simple: xi: 1 2 3 4 5

Marque el nº 1 y luego la tecla M+

Marque el nº 2 y luego la tecla M+

Marque el nº 3 y luego la tecla M+

     Así sucesivamente hasta haber cargado todos los datos.

       Para cerciorarse de la cantidad de datos introducidos

     Pulse ALPHA y la tecla 3 en el cursor aparece la letra n, apriete
ahora = y aparecerá el 5, pues Ud. introdujo los 5 valores.
Para obtener la media aritmética pulse SHIFT y la tecla 1, en la pantalla

aparece  x  apriete = y en su pantalla aparece el valor 3 que es el valor de
la media.

Para obtener la desviación estándar marque SHIFT y la tecla 3, aparece en

su pantalla 
               s n-1
                        presione = y en su pantalla aparecerá el valor 1,58

       Si aprieta ahora la tecla x2 obtendrá 2,50 que es el valor de la


                                                                                                    7 0 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




varianza muestral S2

   Si desea obtener la suma de los valores de x presione Alpha y la tecla 2.

      Para el caso de que la serie sea de frecuencia simple

      Se coloca la máquina en modo estadística Mode 2

      Presione SHIFT AC =; ya tiene la memoria limpia.

      Se introduce el valor xi, luego SHIFT, la tecla que tiene la coma.
Aparece en la pantalla x i ; ahora introduzca el valor de fi y una vez que
tenga en la pantalla x i ; f i recién apriete M+ ; continúe así hasta introducir
todos los valores de su serie, para el cálculo de la media, desviación
estándar y varianza se procede luego apretando las teclas indicadas
anteriormente.

      Cuando se trabaja con todos los datos de una población para el
cálculo de la desviación estándar se aprieta SHIFT y la tecla 2




                                                              GUÍA DE EJERCITACIÓN

Actividad 1

a) Los siguientes son pesos individuales de 10 alumnos de primer año de
EGB:
     30, 32, 30.5, 31, 33, 31, 32.9, 34, 34.6, 35

b) En la etapa de diagnóstico destinada a implementar un Plan de Salud
Bucal en alumnos de EGB, en una escuela el odontólogo determinó el
número de caries que presentaba cada alumno. Los siguientes son número
de caries que presentaban 9 de dichos alumnos:


                                                                                                7 1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




2, 4, 0, 2, 3, 5, 1, 2, 2

c) En un curso se tomó ocho alumnos al azar y se les preguntó cuál era el
salario que percibía mensualmente su padre. Ellos son los siguientes:
3000, 1000, 570, 400, 600, 1500, 500, 570

1.­ En cada caso determine y clasifique el tipo de variable que se
considera.

2.­ ¿Cómo se denomina en cada caso el conjunto de datos obtenidos para
la variable que se estudia?

3.­ Determine en cada uno de los incisos a, b y c, la Media Aritmética,
Mediana y Modo.

4.­ En cuál de los casos arriba detallados ¿la media no es una Medida de
Posición adecuada?


Actividad 2

a) En cada una de las series de datos de la Actividad 1, calcule Rango,
Desviación Media, Desviación estándar y Coeficiente de Variación.
b) Si Ud. quiere comparar la variabilidad de los datos de cada una de las
series presentadas en la Actividad 1, cuál medida de dispersión emplearía?




                                                                                                 7 2 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Actividad 3

Para realizar una evaluación del Número de puntos obtenidos en una
Prueba de Matemáticas realizada a los 30 alumnos de 6° de EGB, se
ordenó dicha variable en la siguiente serie de frecuencias:

            N° de puntos     0    1    2    3    4    5    6    7    8    9   10
                 xi
           N° de alumnos     0    1    0    4    3    8    6    4    1    2    1
                  fi



a) Calcule Media, Mediana y Modo.

b) Determine Desviación Estándar, Varianza y Coeficiente de Variación.

c) Indique si la distribución que se analiza es simétrica o no. En caso de
ser asimétrica, indique que tipo de asimetría presenta.

d) A los fines de la evaluación, cuál de las tres Medidas de Posición sería
más correcta utilizar?



Actividad 4

       Los siguientes datos corresponden a Tipo de Deportes que prefieren
los alumnos de una escuela.

                        Tipo de deportes        N° de alumnos
                                                       fi
                            Basquet                   220
                             Fútbol                   500
                         Pelota al cesto              180
                            Hockey                    100
                              Total                  1000

a) Indique qué tipo de variable es.
b) Determine la Medida de Posición que corresponda a este caso.




                                                                                              7 3 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Actividad 5

Las alturas de alumnos de un curso de Polimodal en                          una escuela se
muestran en la siguiente Tabla:

                                      altura            fi
                                       (m)
                                    1.10­1.15           3
                                    1.15­1.20           4
                                    1.20­1.25           6
                                    1.25­1.30           5
                                    1.30­1.35           9
                                    1.35­1.40           9
                                    1.40­1.45           6
                                    1.45­1.50           2
                                    1.50­1.55           1
                                    1.55­1.60           1
                                    1.60­1.65           1

a) Qué tipo de variable se considera?

b) Encuentre     frecuencias        acumuladas,              porcentajes     y    porcentajes
acumulados.

c) Encuentre Media Aritmética, Mediana y Modo.

d) Calcule Desviación estándar y Coeficiente de variación.

e) Realice el gráfico de la distribución porcentual acumulada.

f) Determine gráfica y analíticamente el rango percentil para las siguientes
alturas:
1.18, 1.47, 1.56, 1.62.

g) Determine gráfica y analíticamente las alturas correspondientes a los
percentiles:
10, 25, 50, 75




                                                                                               7 4 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




                                   UNI DA D I V

              PROBABILIDADES Y DISTRIBUCIONES DE
            PROBABILIDADES – INFERENCIA ESTADÍSTICA

1.­ INTRODUCCIÓN

      La teoría de probabilidad tiene sus orígenes en la teoría de la
casualidad. Históricamente, la teoría de la Probabilidad comenzó con el
estudio de los juegos de azar, tales como la ruleta y las cartas.

      La teoría de la Probabilidad no es tan extraña como pudiera
pensarse. Sin duda alguna, en la vida diaria con mucha frecuencia
emitimos juicios probabilísticos, aunque a menudo no lo reconocemos
como tales.

       Por ejemplo, supongamos que, por razones diferentes, usted no está
preparado para la clase de hoy. Seriamente usted considera faltar a clase.
¿Qué factores influirán en su decisión? Obviamente una consideración
será la probabilidad de que el profesor descubra su falta de preparación. Si
el riesgo es alto, usted decide no ir a clase. Veamos, hay dos alternativas
posibles:

      1. Su falta de preparación será descubierta.
      2. Su falta de preparación no será descubierta.

       Hay incertidumbre en esta situación porque hay más de una
alternativa posible. Su decisión de asistir a clase, dependerá del grado de
certeza asociado con cada una de estas alternativas. Así, si usted está
bastante seguro de que prevalezca la primera alternativa, usted decidirá no
ir a clase.

      Supóngase que su profesor con frecuencia pide a los estudiantes que
participen en clase activamente. De hecho, usted ha notado que la mayoría
de los estudiantes son interrogados en cada sesión de clase. Este es un
ejemplo en el cual hay un alto grado de certeza asociada con la primera
alternativa. Dicho de esta manera, la probabilidad del primero es mayor
que la del segundo. Por consiguiente usted decide no ir a clase. Usted ha
tomado una decisión con base en un empleo intuitivo, de la probabilidad.

     Antes de estudiar la teoría de la probabilidad, es conveniente
comprender bien uno de los conceptos más importantes de la Inferencia
Estadística: el concepto de a zar



                                                                                                7 5 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




2.­ EL CONCEPT O DE AZAR

      Definimos una población como el conjunto completo de individuos,
objetos o medidas que tienen alguna característica común observable. Muy
rara vez se puede estudiar una población. Seleccionamos muestras de una
población con la esperanza de que los estadísticos de la muestra nos
permitan calcular los parámetros de la población. Para obtener una
correspondencia entre un estadístico y un parámetro, la muestra debe
representar una selección aleatoria de la población. Una forma de obtener
una muestra aleatoria, es mediante el Muestreo al Azar Simple, de tal
manera que cada individuo , objeto o medida tenga igual probabilidad de
ser seleccionado. Una característica sobre los sucesos aleatorios, es que
ningún suceso tiene efecto predecible sobre el siguiente. Podremos
comprender más clara y fácilmente el concepto de azar en relación con los
“juegos de azar, si suponemos que se juegan limpiamente. Conocer el
resultado del lanzamiento de una moneda al aire, del lanzamiento de un
dado, del resultado de un juego de ruleta, no nos ayudará en absoluto en
la predicción de los resultados por venir. Esta característica de los sucesos
al azar se conoce como i ndependenci a . Si la independencia existe,
podemos hablar de sucesos realmente al azar.

      La segunda característica importante del azar es que cuando la
muestra se extrae de una población, cada elemento debe tener una
probabilidad igual de selección. Así, si nuestra selección o modo de
selección favorece ciertos sucesos o ciertas colecciones de sucesos, no
podemos afirmar que los resultados son al azar.


3.­ PROBABILIDAD Y ESTADÍSTICA

      La Estadística Descriptiva, hace referencia a los datos que se tienen
en la mano. Cuando se quiere ir más allá de los datos disponibles, es
necesario inferir o sea utilizar la Estadística Inferencial. Como ella infiere
el todo (población) a partir de la información que da una parte de ese todo
(muestra), el conocimiento que adquiere es incompleto y por lo tanto no
“totalmente cierto” es decir, se debe trabajar con probabilidades. Por ello,
antes de estudiar las aplicaciones de la Estadística Inferencial es necesario
estudiar probabilidades.




                                                                                               7 6 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




4.­ TEORÍAS DE PROBABILIDAD

       Se puede considerar la probabilidad como la teoría que tiene que ver
con los posibles resultados de los experimentos. Estos deben ser
potencialmente repetitivos, es decir, debemos ser capaces de reproducirlos
bajo condiciones similares. Debe ser posible enumerar cada resultado que
pueda ocurrir, y debemos ser capaces de establecer las frecuencias
relativas de estos resultados.

      Se distingue el enfoque clásico , frecuencial y axiomático de la teoría
de probabilidad.



4.1.­EXPERIMENTOS ALEATORIOS. ESPACIO MUESTRAL. EVENTOS.

      El lanzamiento de un dado, o de una moneda, la extracción de un
naipe de la baraja, de las bolillas de la lotería son experiencias aleatorias,
pues sus resultados dependen del azar. También son aleatorios: el tiempo
de espera de una persona en la parada del autobús, sexo de los hijos en
un matrimonio, el número de hijos que tendrá un matrimonio, etc.

      Los primeros (lanzamiento, extracciones) son fáciles de seguir, pues
se pueden repetir tantas veces como se quiera de forma rápida. A partir de
ellos se obtienen leyes que rigen los fenómenos aleatorios y se aplican al
estudio de situaciones aleatorias.

             Conceptos necesarios para definir probabilidades

Experimentos aleat orios: son aquellos que, repetidos bajo idénticas
      condiciones, no arrojan un único resultado sino un conjunto de
      ellos.
  ü Ejemplos: Arrojar un dado
  ü Arrojar una moneda

Espacio muestral. Es el conjunto de los resultados posibles de un
      experimento aleatorio y se denota con M.

Ejemplos.
     ü Para el caso de arrojar un dado, el espacio muestral resultante
        es:



                                                                                               7 7 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




      M= {1,  ,  ,  ,  ,  } 
            2 3 4 5 6 
      ü Para el caso            de arrojar una moneda, el espacio muestral
        resultante es:

      M={C, S}

          Para       el caso de arrojar una moneda y                                    un     dado
          simultáneamente ,el espacio muestral resultante es:

     M = í(cara, 1) , ( cara , 2 ) .....,(cara , 6) , (sello , 1),...(sello, 6)ý

Event o simple .Es cada uno de los resultados de un experimento aleatorio
       que no puede desglosarse en componentes más simples. Se
       designan con la letra minúscula.

Ejemplos
     ü Para el caso de arrojar un dado. Obtener el número 1, es un
         evento simple, lo mismo ocurre con los números restantes
     e={1}
     e={2}
     ü Para el experimento aleatorio arrojar una moneda al aire, los
         evento simples son
     e={c}
     e={s}

Event o compuest o. Es un subconjunto del Espacio Muestral. Es el
       resultado de la unión de eventos simples. Se lo representa con letra
       mayúscula.
     ü Para el caso de arrojar un dado. El espacio muestral es
         M= {1,  ,  ,  ,  ,6 
               2 3 4 5 } 
         ·   Obtener número par, es el resultado de la unión de los
             eventos simples 2, 4, 6, y constituyen un subconjunto del
             espacio muestral.
             P={2, 4, 6}

         ·   Obtener número impar
             I={3, 5, 7}

         ·   Obtener un número menor que 4
             A={1, 2,3}

Suceso seguro: es el conjunto total M(espacio muestral).



                                                                                                  7 8 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Suceso imposible: es el conjunto vacío.

  Opera ciones con sucesos

      En las aplicaciones de la teoría de probabilidades trataremos
muchas veces con eventos relacionados entre sí, más que con un solo
evento. Por esta razón consideraremos ahora un experimento aleatorio
arbitrario, con su espacio muestral correspondiente M, y cualesquiera dos
eventos A y B en el experimento. Entonces:

*Union de Eventos A È B ( A unión B , A o B ) representa el evento que
     ocurre si, y solo si ocurre A u ocurre B o ambos ( Una notación más
     antigua que representa a A È B              es A + B, y el nombre
     correspondiente es suma de dos eventos)

*Intersección de Event os. A Ç B ( A intersección B ó A y B ) representa
      el evento que ocurre si, y solo si, ocurren A y B simultáneamente,
      esto es, si ocurren en la misma ejecución del experimento en
      consideración.

Event os mutuament e exclusivos. Son los eventos que no ocurren
     simultáneamente. Este caso se representa solamente cuando
A Ç B = Ø, el evento vacío, de tal manera que A y B no tienen puntos en
     común.
*. El evento  A  es el complemento del evento A con respecto al espacio
muestral M y contiene a todos los resultados de M que no se encuentran
en A.
   Ø Ejemplo Para el caso del arrojar una dado, el espacio muestral es
       M= {1,  ,  ,  ,  ,  } 
             2 3 4 5 6 

     ü Evento A obtener un nº par

           A={2, 4, 6} 

            A ={1, 3, 5 }

  Ø Ejemplo:

  Un experimento consiste en tirar un dado y observar el número de
puntos que aparece en la cara superior. El espacio muestral se puede




                                                                                               7 9 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




describir fácilmente, ya que es finito. Las posibilidades para el dado son
seis: 1, 2, 3, 4, 5, 6. Por lo tanto, los posibles resultados son:

                 M = {1, 2, 3,4, 5, 6}

b) Describir los siguientes eventos:
                    A: Sale un numero par.
                    A: Sale un numero par.
                    B: Sale un número impar.
                    B: Sale un número impar.
                    C: Sale un número menor que 4
                    C: Sale un número menor que
                    D: Sale un número mayor que 3.
                    D: Sale un número mayor que 3.
                    E: Sale un número impar o mayor que 3.
                    E: Sale un número impar mayor que 3.
                    F. Sale un número par y menor que 4.
                    F. Sale un número par menor que 4.
                    G: Sale un número par y un impar.
                    G: Sale un número par un impar.
Solución
Solución

            v El evento:”Sale un número par” , está representado por la
              letra A, su descripción puede realizarse mediante el
              siguiente conjunto :

            A = {2 4 6  ,
                  ,  ,  } 

            v El evento “ Sale un número impar ”, está representado por
              la letra B, su descripción puede realizarse mediante el
              siguiente conjunto :

           B = { 1 , 3 , 5 }.

            v El evento “ Sale un número menor que 4” ”, está
              representado por la letra C, su descripción puede realizarse
              mediante el siguiente conjunto :

           C= í1 , 2 , 3 ý

            v El evento     “Sale un número mayor que 3”, está
              representado por la letra D, su descripción puede realizarse
              mediante el siguiente conjunto :

           D= í4 , 5 , 6 ý

            v El evento “ Sale un número impar o mayor que 3”, se
              representa por la letra E, está formado por todos los
              resultado de B o de D o de ambos. Este evento recibe el
              nombre de unión de B y D, se denota por B È D y su


                                                                                               8 0 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




               descripción         puede       realizarse       mediante       el    siguiente
               conjunto:

            B È D = E =í1 , 3 , 4 , 5 , 6ý

            v El evento “ Sale un número par y menor que 4”, se
              representa por la letra F, está formado por los resultados
              comunes tanto a A como a C. Este evento recibe el nombre
              de intersección de A y C, se denota por A Ç C y su
              descripción puede realizarse mediante el siguiente conjunto
              :

           A Ç C = F = í2 ý

            v El evento “ Sale Un número par y un número impar”, se
              representa mediante la letra G, está formado por la
              intersección de los eventos A y B, estos eventos no tienen
              nada en común, por lo tanto la intersección de ellos es
              vacía. A y B son mutuament e excluyentes o disjuntos..

           A Ç B = G = íý = Æ



   4.2. DEFINICIÓN CLÁSICA DE PROBABILIDAD (PROBABILIDAD A
   PRIORI)

      Supóngase que queremos conocer la probabilidad de que una
moneda caiga con la cara hacia arriba. Como hay solo dos posibles
resultados   (cara o seca) adoptamos una situación ideal en la cual
esperamos que cada resultado tenga igual probabilidad de ocurrir. Así, la
                                                    1 
probabilidad de que se presente una cara, P ( C) =  2 

 Definición :La probabilidad de un evento A en un experimento aleatorio
está dado por: el cociente entre el número de casos favorables y el número
de casos igualmente posibles 

                                   N º de casos  favorables  a  A 
                  P   A  =
                    ( ) 
                             N º  total  de casos  igualmente  posibles 

      Por ejemplo, la probabilidad de extraer el as de espada de una baraja
      ordinaria de 52 cartas es 1/52.


                                                                                              8 1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




      ü Pero la probabilidad de sacar un as de espada rojo es cero
        (puesto que no hay figuras de espadas rojas en la baraja) no hay
        sucesos posibles que favorezcan este resultado.

      ü    Si los ev entos son mut uamente excluyentes (esto es, si los dos
          eventos no pueden ocurrir simultáneamente), pues A Ç B = Ø , la
          P (Ø ) = 0


   4.3.   DEFINICIÓN    DE     PROBABILIDAD                                  FRECUENCIAL
   (PROBABILIDAD A POSTERIORI)

      Las probabilidades se aproximan después de realizar la experiencia.
Por ejemplo, para saber cuál es la probabilidad de obtener el as con un
dado determinado, se arroja el dado 600 veces en las cuales se obtienen
113 veces un as.

      La probabilidad de obtener un as con ese dado es estimada por la
frecuencia relativa = 113/600 = 0.1883.

      Realice ( u observe) un procedimiento un gran número de veces y
cuente las ocasiones que el suceso A ocurre en realidad. Con base en estos
resultados reales, P(As) se estima de la siguiente forma : 
                                        f (As) 
                               P(As)  »         = f r(As)
                                        å f 


   4.4. AXIOMAS DE PROBABILIDAD

1.­ Si E es un evento cualquiera en un espacio muestral M , entonces

                  0≤  P ( E ) ≤ 1
   La probabilidad de un suceso varía entre 0 y 1.

2.­ Al espacio muestral M completo le corresponde

                  P(M)=1

3.­ Si A y B son eventos mutuamente exclusivos, entonces se cumple

                  P(AÈB)=P(A)+P(B)


                                                                                                8 2 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Si el espacio muestral es infinito, debemos reemplazar el axioma 3 por

3* .­ Si E1 , E      2   , . . . . son eventos mutuamente exclusivos, entonces
tenemos que

        P (E1 È E        2    È . . . ) = P ( E1 ) + P ( E       2   ) + ........



      4.5. PROPIEDADES:

1.­    Si       Ø es el conjunto vacio, entonces P (Ø ) = 0 . Imposibilidad

      Por ejemplo, la probabilidad de extraer el as de espada de una baraja
ordinaria de 52 cartas es 1/52. Pero la probabilidad de sacar un as de
espada rojo es cero (puesto que no hay figuras de espadas rojas en la
baraja).no hay sucesos posibles que favorezcan este resultado.

2.­ Si E    c   es el complemento de un evento E , entonces

                             P (E   c   ) = 1 – P( E )

3.­ Si A Ì B , entonces P ( A ) menor o igual a P ( B ).

              v La probabilidad de que ocurra el evento A , es decir que al
                 lanzar un dado salga un número par , se calcula como
                                 P(A) =3/6 = 1/2
        donde:
        · el número de resultados favorables es 6, ya que A = í2, 4, 6 ý,
           tiene 3 elementos.
        · el número total de resultados es 6, ya que M= {1 , 2 , 3 , 4 ,5, 6}
           tiene 6 elementos.

              v La probabilidad de que ocurra el evento B, es decir que al
                 lanzar un dado salga un número impar , se calcula como
                                 P(B) =3/6 = 1/2
        donde:
        · el número de resultados favorables es 6, ya que B = í1,3,5 ý,
           tiene 3 elementos.
        · el número total de resultados es 6, ya que M = {1 ,2 ,3, 4, 5 , 6}
           tiene 6 elementos.




                                                                                                          8 3 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




      v La probabilidad de que ocurra el evento C, es decir que al
         lanzar un dado salga un número menor que 4 , se calcula
         como
                         P(C) =3/6 = 1/2
donde:
· el número de resultados favorables es 6, ya que   C= í1 ,2, 3 ý,
   tiene 3 elementos.
· el número total de resultados es 6, ya que M = {1 , 2, 3, 4, 5 , 6}
   tiene 6 elementos.


      v La probabilidad de que ocurra el evento D, es decir que al
         lanzar un dado salga un número mayor que 3 , se calcula
         como
                         P(D) =3/6 = 1/2
donde:
· el número de resultados favorables es 6, ya que D= í4, 5, 6 ý,
   tiene 3 elementos.
· el número total de resultados es 6, ya que M = {1 , 2,3 , 4, 5 , 6}
   tiene 6 elementos.

      v La probabilidad de que ocurra el evento E, es decir que al
         lanzar un dado salga un número impar o mayor que 3 , se
         calcula como
                            P(E) =5 / 6
donde:
· el número de resultados favorables es 5,ya que E=í1,3,4,5,6 ý,
   tiene 5 elementos.
· el número total de resultados es 6, ya que M = {1 , 2, 3 , 4 ,5, 6}
   tiene 6 elementos.

      v La probabilidad de que ocurra el evento F, es decir que al
         tirar un dado salga un número par y menor que 4 , se
         calcula como
                            P(F) =1 / 6
donde:
· el número de resultados favorables es 1, ya que F = í2 ý, tiene 1
   elemento.
· el número total de resultados es 6, ya que M = {1,2 , 3 , 4, 5, 6}
   tiene 6 elementos.

      v La probabilidad de que ocurra el evento G, esta formado
        por la intersección de los eventos A y B que son



                                                                                         8 4 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




             mut uamente excluy entes, decir que al lanzar un dado ,”
             un número impar y par “ , es cero, ya que es imposible de
             que ocurra dicho evento. La probabilidad del evento nulo o
             vacio siempre es 0.se calcula como
                              P(G) = P (Ø ) = 0
   donde:
   · el número de resultados favorables es vacio, ya que G = íý.
   · el número total de resultados es 6, ya que M = {1, 2, 3, 4 , 5 , 6}
      tiene 6 elementos.


4.5.TEOREMA DE LA SUMA DE PROBABILIDADES

   Sean A y B dos eventos del espacio muestral M generado por un
experimento aleatorio. El teorema de la suma de probabilidades dice
que la probabilidad de la unión de A y B es la suma de las
probabilidades menos la probabilidad de la intersección. En símbolos:

   Sean A y B Ì  M  entonces
   P(AÈB)=P(A)+P(B)­ P(AÇB)

   Si los eventos son mutuamente excluyentes, el último término
   desaparece, pues  A Ç B = Ø y P (Ø ) = 0
              P(AÈB)=P(A)+P(B)

ü En el ejemplo, calcule la probabilidad del evento “ sale cara o sale
  un número par” correspondiente al experimento de lanzar
  simultáneamente un dado y una moneda, utilizando el teorema de la
  suma de probabilidades.

El espacio muestral M= {(1,c); (1,s); (2,c); (2,s) ; (3,c); (3,s) ; (4,c); (4,s)
; (5,c); (5,s) ; (6,c); (6,s)

c: salga cara
P: salga número par

   P(CÈP)=P(C)+P(P)­ P(CÇP)
                6   6  3  9  3 
                  + -     =   = = 0 75 
                                   , 
   P (C È P )= 12  12  12  12  4 




                                                                                             8 5 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   4.6. PROBABILIDAD CONDICIONAL

      Muchas veces necesitamos encontrar la probabilidad de un evento B
si se sabe que ha ocurrido un evento A. Esta probabilidad se llama
probabilidad condicional de B dado A, y se representa como P ( B / A ) .
En este caso A sirve como un espacio muestral nuevo ( reducido ) , y la
probabilidad es la fracción de P( A) que corresponde a A ÇB. Así que

                                    P ( A Ç B )
                            P(B/A) = P  A   
                                         ( )
      Del mismo modo, la probabilidad condicional de A dado B es

                              P ( A Ç B )
               P  ( A / B )  = P  B   
                                   ( )

. Volviendo al ejemplo del dado:

a) halle la probabilidad de que aparezca un número menor que 4 dado que
apareció un número mayor que 3

b) halle la probabilidad de que aparezca un número impar dado que
apareció un número mayor que 3

Solución :

a) P ( C / D ) se denomina probabilidad condicional de C dado que ha
ocurrido el evento D , se define como
                    P ( C / D ) = P ( C Ç D ) / P( D )

En este caso M = í1 , 2 , 3 , 4 , 5 , 6 ý

C = í 1 , 2 , 3 ý , D = í 4 , 5 , 6 ý , P( D ) = 3 / 6 = 1 /2 , P( C Ç ) = 0

                    P(C/D)= 0/½ =0

b) P ( B / D) es la probabilidad condicional de que aparezca un número
impar dado que apareció un número mayor que 3.

P( D )= 3 / 6 = 1 / 2                  P ( B Ç D ) = 1/6

                    P ( B / D = P( B Ç D ) / P( D ) = 1/6 / 12 = 1/3




                                                                                                 8 6 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   4.7..TEOREMA DEL PRODUCTO DE PROBABILIDADES


      En ocasiones, nos encontramos con la necesidad de determinar la
probabilidad de ocurrencia simultánea de dos o mas eventos. Para obtener
este resultado, deberemos aplicar la regla de multiplicación

Regla de la Multiplicación : Si A y B son eventos conteni dos en un
espa cio muestral M , y P ( A ) > 0 y P ( B )               > 0, entonces se cumple
que

                 P ( A y B ) = P(AÇB) = P(A) · P(B /A) = P ( B ) · P ( A
           /B)

Cuando los eventos son independientes: En el caso especial en el que la
ocurrencia de A no está en absoluto relacionada con la ocurrencia de B y
viceversa , se dice que los sucesos son independientes. La independencia
se representa simbólicamente por

                 P ( B/ A ) = P(B)             y                   P (A /B)=P(A).

Cuando los event os son independient es la regla de la multiplicación se
simplifica a : Si A y B son eventos contenidos en un espacio muestral M y
P(A)> 0 y P(B)> 0, entonces “La probabilidad de la intersección es el
producto de las probabilidades” :


                 P ( A y B ) = P(AÇB) = P(A) · P(B)

      En el ejemplo del dado : son A y C independientes?
      Si la probabilidad del resultado A no depende de la ocurrencia de un
segundo evento C ( o viceversa) se dice que A y C son eventos
independientes. En términos de probabilidad se expresa que A y C son
eventos independientes si

                 P ( A / C ) = P ( A ) ó bien P ( C / A ) = P ( C )
     En este caso A y C no son eventos independientes ( se denominan
dependientes), debido a que




                                                                                              8 7 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




     Si al lanzar un dado

     M:{1,2,3,4,5,6}

                                           A: número par
                                           B: numero impar

     P (A)=     3 
                6 

     P (C)=     3 
                6 

     P (A Ç C)=
                          1 
                          6 


                     1 
                     6         1 
     P (A/C):        3         3 
                     6 

                3          1 
     P(A)=
                6          2 




              P ( A / C ) = 1 / 3 que no es igual a P ( A ) = 1 / 2 ,
     Y

              P ( C / A ) = 1/3 que no es igual a P ( C ) = 1/2

 Debemos notar que los sucesos mutuamente exclusivos no son nunca in
dependientes, puesto que la ocurrencia de uno niega la posibilidad de
ocurrencia del segundo. Entonces :
                  P( A/ B ) = P( B/ A) = 0


Muestreo con y sin reemplazo

       Hay dos maneras de extraer objetos para obtener una muestra de
un conjunto dado de objetos, conocido como muestreo de una población;
estas son las siguientes.



                                                                                                        8 8 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




1.­ Muestreo con reemplazo significa que el objeto que se extrajo al azar
se coloca de nuevo en el conjunto dado, se mezcla completamente y se
precede a extraer al azar el siguiente objeto.

2. Muestreo sin reemplaz o significa que el objeto que se extrajo se deja
aparte y no se lo introduce nuevamente.



   Ø Ejemplo

      Una caja contiene 10 cuadernos, de los cuales 3 están con fallas.
   Dos cuadernos se extraen al azar sin reemplazo. Encontrar la
   probabilidad del evento tal que ninguno de los 2 cuadernos tenga fallas.
      Solución:
      Consideremos los eventos

      A : El primer cuaderno extraído no tiene fallas.
      B: El segundo cuaderno extraído no tiene fallas.

   Es claro que P ( A ) = 7/10, ya que 7 de los 10 cuadernos no son
defectuosos y estamos muestreando aleatoriamente, por lo cual cada
cuaderno tiene la misma probabilidad ( 1/10 ) de ser escogido.

      Si A ocurre, entonces quedan 9 cuadernos en la caja, 3 de los cuales
tienen fallas, por lo que

            P ( B / A )= = 6 / 9 = 2 / 3

Y por el teorema de la multiplicación, la respuesta es

            P ( A Ç B ) = 7 /10 . 2 / 3 = 0,47

   Ø Ejemplo

      Si se seleccionan dos cartas de un paquete de naipes bien barajado,
      ¿ cuál es la probabilidad de que ambas sean reinas?.

                                Solución
      Hay dos maneras de seleccionar las cartas: 1) Se puede seleccionar
      una carta, reponerla en la baraja , barajar y extraer una segunda
      carta. (Muestreo con reemplazo). 2) Se pueden seleccionar las dos
      cartas consecutivamente sin reemplazar la primera en la baraja
      (Muestreo sin reemplazo)


                                                                                               8 9 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




     1º. Sea A el suceso de una reina en la primera extracción, y B el
     suceso de una reina en la segunda extracción. Cuando el muestreo
     es con reemplazo, la probabilidad de extraer una reina permanece
     igual en las dos extracciones. Así, puesto que

     P ( A / B ) = P ( A ) y P ( B / A ) = P ( B ) , as dos extracciones son
     independientes, por lo tanto

           P ( A Ç B ) = P ( A ) . P ( B ) = 1/13 . 1/13 = 1 / 69

     2º. Cuando se emplea el muestreo sin reemplazo la probabilidad de
     obtener una reina en la segunda extracción se reduce siempre que la
     primera carta seleccionada haya sido una reina. En otras palabras ,
     cuando P ( B / A ) ¹ P ( B ) o P ( A / B ) ¹ P ( A ) , los sucesos no son
     independientes.. La probabilidad de extraer una reina en el segundo
     intento es 3 / 51. Empleando la fórmula correspondiente,
     encontramos que la probabilidad de seleccionar dos reinas en
     extracciones consecutivas procedentes de una baraja sin reemplazo ,
     es :

           P ( A Ç B ) = P ( A ) . P ( B / A ) = 1 / 13 . 3 / 51 = 1 / 221

Se debe notar que la diferencia entre ambos muestreos es despreciable
cuando la población es grande en relación con el tamaño de la muestra.

  Ø Ejemplo: Para un estudio, se obtiene una muestra de alumnos de
    una escuela y se los clasifica según lugar de residencia y el medio de
    transporte que utilizan para llegar a la misma, obteniéndose los
    siguientes resultados:


      Lugar de residencia          Medio para llegar a la e sc uela               Total
                                Caminado    Bicicleta      Ómnibus
      Barrio A                     100           20             50                170
      Barrio B                      50           20             30                100
      Barrio C                      30           10              5                 45
      Total                        180           50             85                315

  Suponga que se selecciona un alumno al azar de este grupo. Obtenga
  las probabilidades siguientes

  ü Que el alumno resida en el barrio A




                                                                                               9 0 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                   170 
               P ( A  = 
                    )   =
                   315  0.5397
ü Que el alumno resida en el barrio A o en el B
                                170 100  270 
                                    +    =     = 0 8571 
                                                  . 
              P(AÈB)=P(A)+P(B)= 315  315  315 
ü Que el alumno no sea del Barrio A 
                         315 - 170  145
               P ( A  = 
                    )                          = 0 4603 
                                                  . 
                            315  = 315 
ü Que el alumno sea del Barrio A y vaya caminando a la escuela
                           100 
               P(AÇC)= 315 =0.3175
ü Probabilidad que el alumno vaya en ómnibus a la escuela dado que
  vive en el barrio B
                                              30 
                           P ( B I O  315  30 
                                       ) 
                                          =        =     = 0 3 
                                                            , 
                              P ( B )        100  100 
               P(B/O)=                       315 
ü Probabilidad que el alumno vaya en ómnibus a la escuela o viva en
  el barrio B
                                         85 100  30  155 
                                              +      -      =
  P(OÈB)=P(O)+P(B)­ P(OÇB)= 315  315  315  315 =0.4921




                                                                                           9 1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   5.­ DISTRIBUCIÓN DE PROBABILIDAD

      Una distribución de probabilidad no es más que, como su nombre lo
indica, la asignación a cada evento posible, de un experimento, de la
probabilidad que le corresponde.

Definición. Cualquier regla o mecanismo que sirva para determinar

          P( X = x) , probabilidad de que la variable aleatoria X tome cada
          uno de los valores posibles x , se denomina una Di stribución
          de Proba bilida d

      Existen dos tipos de distribuciones que son importantes en las
aplicaciones prácticas, a saber: las distribuciones discretas y las
continuas. Una distribución discreta surge al contar ( por ejemplo, obtener
un 6 y un 4 al lanzar dos dados , o bien sacar un rey al extraer una carta
de la baraja española). Una distribución continua aparecerá si se mide (
por ejemplo altura de los alumnos y alumnas de la clase).

     Entre todas las distribuciones discretas, la Distribución Binomial es
la más sencilla. Entre las distribuciones continuas veremos la Distribución
Normal.


   5.1. VARIABLE ALEATORIA

      Una variable aleatoria X es una función cuyos valores son números
reales y dependen del “azar” .



   5.2.DIST RIBUCIONES         DE    PROBABILIDADES          DE VARIABLE
   ALEATORIA DISCRETA
      La siguiente es la distribución de la variable aleatoria
Xi = nº de puntos obtenidos al arrojar un dado perfecto , o sea que todas
sus caras son igualmente posibles:

           xi      1        2          3         4         5         6        Total
          P(xi)   1/6      1/6        1/6       1/6       1/6       1/6         1

       Obsérvese que se cumplen dos condiciones que son necesarias para
que un conjunto de pares ordenados (x,y) sea considerada una
distribución de probabilidades:


                                                                                               9 2 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   1) Para cada valor de x le corresponde un único valor de y que es un
      valor de probabilidad (no negativo y menor o igual a 1),
        å P ( x i )
   2)   M      =1
   3) Esta distribución recibe el nombre de uniforme, es una distribución
      de variable aleatoria discontinua y sus parámetros son los valores
      mínimo (a) y máximo (b) que puede tomar x. Esto se indica como 
      X  ~ U (a, b).




   5.2.1. DISTRIBUCIÓN BINOMIAL.

   La variable X toma los valores 0, 1, 2, 3, ... , n. (donde n es finito y bien
determinado). Se puede considerar que la Distribución Binomial es la
repetición de n pruebas independientes (por ejemplo tomar 4 pruebas en
un año). La función de probabilidades es: 

                           P ( x  =  C x  p x q n - x  ,
                                )     n 
                      x 
      donde  C n  son las combinaciones de n elementos tomadas de a x,
           p= probabilidad de éxito en una sola prueba,
           q = 1­ p = probabilidad de fracaso.

                                               x 
   La combinaciones se calculan como sigue:  C n  = (n.(n­1). (n­2)...(n­
x+1))/x!

   Los parámetros que definen a la distribución Binomial son n y p

   Las dos características necesarias de una distribución de probabilidad
consisten en que cada valor de P ( X = x½n , p ) tiene que ser mayor o
igual a 0 y que la suma de todos los valores de P ( X = x÷ n , p ) debe ser
igual a 1.

   Ø Ejemplo :Cuando se recibe un envío de lápices en la escuela, se
     seleccionan de manera aleatoria, 15 unidades con el propósito de
     verificar el porcentaje de unidades defectuosas en el envío. Con base
     en información pasada, la probabilidad de tener una unidad
     defectuosa es de 0.05. La directora ha decidido no recibir el envío
     cada vez que una muestra de 15 unidades tenga dos o más
     defectuosas. ¿Cuál es la probabilidad de que, se rechace el envío?




                                                                                                        9 3 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Solución
El modelo de distribución apropiado para esta situación es la distribución
binomial, se puede suponer que las 15 unidades que se seleccionan al día,
constituyen un conjunto de ensayos independientes de manera tal que la
probabilidad de tener una unidad defectuosa es de 0.05 entre ensayos.
Definimos a la variable aleatoria X : “número de unidades defectuosas”
que se encuentran entre las 15 unidades seleccionadas. El evento se
definirá como A : unidad defectuosa.

         La probabilidad de A es
         P(A) = 0,05
         El número de ensayos n = 15
         La probabilidad de que el envío no se reciba, es igual a la
         probabilidad de que X sea igual o mayor que dos:
            P(X ³ 2) = 1 – P(X < 2) = 1 – [P(X = 0) + P(X = 1)]

                                  15! 
                                           (0 05  0 (  - 0 05  15 -0 
                                             ,  )  1  ,  ) 
            P(0÷ 15, 0,05) =  0! (15 ­ 0)! 
                      = 1(0,95)15 = 0.4631


                                  15! 
                                           (0 05 1 (  - 0 05 15 -1 
                                             ,  )  1  ,  ) 
            P(1÷ 15, 0,05) =  1! (15 ­ 1)!                          =
                               = 15(0,05)(0,95)14 = 0,3658

            P(X ³ 2÷ 15, 0,05) = 1 – P(X < 2) =
                          =1 – (0,4631 + 0,3658) = 1 – 0,8289 = 0,1711

Por lo tanto la probabilidad de que, el envío sea rechazado es de 0,1711.

La distribución binomial es realmente una familia de distribuciones,
puesto que para cada valor diferente de n y p , que se denominan
parámetros de la distribución binomial, se puede definir una distribución
diferente. Sin tener en cuenta el valor de n , la distribución es simétrica
cuando p = 0,5. Cuando p es mayor que 0,5, la distribución es asimétrica
y su máximo se encuentra a la derecha del centro. Cuando p es menor que
0,5, la distribución es asimétrica y su máximo se encuentra a la izquierda
del centro.




                                                                                                 9 4 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Tablas de la Distribución Binomial El cálculo de las probabilidades
binomiales mediante la ecuación anterior puede resultar laborioso cuando
n es grande .Afortunadamente hay tablas de probabilidades binomiales y
entonces no es necesario el uso directo de la ecuación. Solamente
necesitamos utilizar una tabla con los valores dados de n , p y x para
obtener la probabilidad deseada

         Para explicar el uso de la Tabla consideremos nuevamente el
ejemplo en el cuál deseábamos conocer: La probabilidad de que la
dirección rechace el envío es igual a la probabilidad de que X sea igual o
mayor que dos : para hallar esta probabilidad en la tabla ,localizamos
primero n = 15 ,luego la columna de p = 0,05 y finalmente para x ,las filas
marcadas con un 0 y un 1

P(X ³ 2÷ 15 , 005) = 1 – P(X < 2) = 1 – [P(X = 0) + P(X = 1)] = 1 – [0.463 +
0.366] = 0.171

                                                 p
n    x    0,01   0,05    0,1   0,2   0,3   0,4   0,5   0,6   0,7   0,8   0,9   0,95    0,99   x
13   0    878    513     254   055   010   001   0+    0+    0+    0+    0+    0+      0+     0
     1    115    351     367   179   054   011   002   0+    0+    0+    0+    0+      0+     1
     2    7      111     245   268   139   045   010   001   0+    0+    0+    0+      0+     2
     3    0+     21      100   246   218   111   035   006   001   0+    0+    0+      0+     3
     4    0+     3       28    154   234   184   087   024   003   0+    0+    0+      0+     4
     5    0+     0+      006   069   180   221   157   066   014   001   0+    0+      0+     5
     6    0+     0+      001   023   103   197   209   131   044   006   0+    0+      0+     6
     7    0+     0+      0+    006   044   131   209   197   103   023   001   0+      0+     7
     8    0+     0+      0+    001   014   066   157   221   180   069   006   0+      0+     8
     9    0+     0+      0+    0+    003   024   087   184   234   154   028   003     0+     9
     10   0+     0+      0+    0+    001   006   035   111   218   246   100   021     0+     10
     11   0+     0+      0+    0+    0+    001   010   045   139   268   245   111     0+     11
     12   0+     0+      0+    0+    0+    0+    002   011   054   179   367   351     115    12
     13   0+     0+      0+    0+    0+    0+    0+    001   010   055   254   513     878    13

14   0    869    488     229   044   007   001   0+    0+    0+    0+    0+    0+      0+     0
     1    123    359     356   154   041   007   001   0+    0+    0+    0+    0+      0+     1
     2    008    123     257   250   113   032   006   001   0+    0+    0+    0+      0+     2
     3    0+     026     14    250   194   085   022   003   0+    0+    0+    0+      0+     3
     4    0+     004     035   172   229   155   061   014   001   0+    0+    0+      0+     4
     5    0+     0+      008   086   196   207   122   041   007   0+    0+    0+      0+     5
     6    0+     0+      001   032   126   207   183   092   023   002   0+    0+      0+     6
     7    0+     0+      0+    009   062   157   209   157   062   009   0+    0+      0+     7
     8    0+     0+      0+    002   023   092   183   207   126   032   001   0+      0+     8
     9    0+     0+      0+    0+    007   041   122   207   196   086   008   0+      0+     9
     10   0+     0+      0+    0+    001   014   061   155   229   172   035   004     0+     10



                                                                                                     9 5 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




      11   0+    0+     0+    0+    0+    003   022   085   194   250   114   026     0+     11
      12   0+    0+     0+    0+    0+    001   006   032   113   250   257   123     008    12
      13   0+    0+     0+    0+    0+    0+    001   007   041   154   356   359     123    13
      14   0+    0+     0+    0+    0+    0+    0+    001   007   044   229   488     869    14

15    0    860   463    206   035   005   0+    0+    0+    0+    0+    0+    0+      0+     0
      1    130   366    343   132   031   005   0+    0+    0+    0+    0+    0+      0+     1
      2    0+    135    267   231   092   022   003   0+    0+    0+    0+    0+      0+     2
      3    0+    031    129   250   170   063   014   002   0+    0+    0+    0+      0+     3
      4    0+    005    043   188   219   127   042   007   0+    0+    0+    0+      0+     4
      5    0+    001    010   103   206   186   092   024   003   0+    0+    0+      0+     5
      6    0+    0+     002   043   147   207   153   061   012   001   0+    0+      0+     6
      7    0+    0+     0+    014   081   177   196   118   035   003   0+    0+      0+     7
      8    0+    0+     0+    003   035   118   196   177   081   014   0+    0+      0+     8
      9    0+    0+     0+    001   012   061   153   207   147   043   0+    0+      0+     9
      10   0+    0+     0+    0+    003   024   092   186   206   103   010   001     0+     10
      11   0+    0+     0+    0+    001   007   042   122   219   188   043   005     0+     11
      12   0+    0+     0+    0+    0+    002   014   063   170   250   129   031     0+     12
      13   0+    0+     0+    0+    0+    0+    003   022   092   231   267   135     009    13
      14   0+    0+     0+    0+    0+    0+    0+    005   031   132   343   366     130    14
      15   0+    0+     0+    0+    0+    0+    0+    0+    005   035   206   463     860    15



     5.3. DISTRIBUCIONES                  DE     PROBABILIDADES                 DE      VARIABLE
     ALEATORIA CONTINUA

      En estas distribuciones no es posible calcular la probabilidad en
puntos sino que hay que hacerlo en intervalos. Recuérdese que en las
variables discontinuas las probabilidades de intervalos se obtenían
sumando las probabilidades que corresponden a cada punto o valor de la
variable. En variables continuas, los valores que puede tomar la variable
son infinitos por lo que es necesario hacer una suma infinita es decir una
integral. En las variables continuas, la probabilidad de un intervalo se
obtiene integrando la función de densidad.

   ü Ejemplo: la distribución rectangular X ~ R (0,2).
      Esta es una distribución rectangular (todos sus puntos tienen igual
densidad de probabilidad) que se extiende desde 0 a 2. El gráfico de su
función de densidad es el siguiente:




                                                                                                    9 6 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




en el que se puede observar que la función de densidad
 f(x) = 1/2
La probabilidad de encontrar valores de variables entre 1 y 2 se encuentra
integrando la función de densidad entre esos límites.
La integral entre esos límites corresponde al área bajo de la curva entre los
mismos.



   5.3.1.LA DISTRIBUCIÓN NORMAL

      Si una variable es continua, varía desde                          -¥    hasta + ¥           y su
función de densidad es: 
                                              2 
                                   1 æ x - m ö
                           1      - ç        ÷ 
            f (x)  =            e  2 è  s  ø

                        s 2p   ,
se dice que x tiene distribución normal con parámetros m y  s  (media
aritmética y desviación estándar). Esto se simboliza como sigue :
            X ~ N ( m ,  s  )




                                                                                                     9 7 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




      Su gráfica es la siguiente:
                        0,40 



                        0,30 
                f (x)




                        0,20 



                        0,10 




                        0,00 
                             4    6      8         10    12    14 
                                              x 


      La distribución normal presenta las siguientes características:

1) Presenta un máximo en x = m , por lo tanto Mo = m

2) Es simétrica y su eje de simetría es  f ( m ) , por lo que se deduce que Md =
m = Mo.


3) Tiene dos puntos de inflexión ubicados en  x  = m ± s

4) Toda transformación lineal de x da otra distribución normal.

5) Algunos sectores usados de la función son: 

      x  = m ± s corresponde aproximadamente al 68 % central 
      x  =  m ± 2 s corresponde aproximadamente al 95 % central 
      x  =  m ± 3 s corresponde aproximadamente al 99 % central


6) f(x) se acerca asintóticamente al eje x o sea que f(x) > 0.

                                                                                  +¥


                                                                                  ò f ( x ) dx  =  1
1) Por ser función de densidad, el área bajo de la curva es                       -¥



   Para calcular la probabilidad de un intervalo en la distribución normal,
por tratarse de una variable continua, debe hacerse mediante la 


                                                                                                     9 8 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




integración de la función de densidad, lo cual equivale a calcular el área
bajo de la curva. Considérese por ejemplo que la altura de los alumnos de
la escuela tiene distribución normal con media m = 1,6 m y desviación
estándar s = 0,1 m. La probabilidad de que al seleccionar un alumno al
azar, posea altura comprendida entre 1,5 y 1,65 (P(1,5<x<1,65)) se obtiene
integrando la función de densidad f(x), (en la cual se debe reemplazar los
valores correspondientes de m y s por 1,6 y 0,1 respectivamente) entre los
límites 1,5 y 1,65.



   La di stribuci ón normal está ndar
        Usando   la     propiedad           que        dice    que   la   transformación       lineal 
        x  ­ m
z  = 
          s      conduce          a   una         distribución        también    normal,      cuyos
parámetros son m z  =  O    y  s z  =  1 , se obtiene una nueva distribución que se
conoce con el nombre de distribución normal est ándar o normal 0,1 y
se la describe como

Z ~ N(0,1) cuya representación gráfica es la siguiente: 




                            ­5        ­3          0           3      5 
                                                  z




                                                                                                   9 9 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   Ta bla s de l a di stribuci ón normal

      El cálculo de probabilidades en la normal involucra el cálculo de
integrales que son muy engorrosas de resolver manualmente. Por ello, las
integrales están tabuladas para una distribución normal que es la
estándar.
      Vamos a aprender el uso de tablas de una cola

Tabla de “ 1 cola”

      En ella, los valores de probabilidad se encuentran en el cuerpo de la
tabla y los valores de z se forman utilizando la primera columna y la
primera fila (es decir en lo que se conoce como matriz de la tabla). En esta
tabla es importante considerar el signo de z.

Como su nombre lo indica, para el valor de z considerado, da el valor del
área bajo de la curva desde menos infinito hasta z. Por ejemplo si z = ­2.1
la tabla da P(z < ­2.1) = 0.0179.

   Ø Ejemplo :
Una población de pesos de alumnos en gr tiene distribución normal con
media y desviación estándar ( m y  s  ) de 50 y 5 Kg. respectivamente. ¿Cuál
es la probabilidad de

           ü que los alumnos pesen menos de 55 kg
            En símbolos, la probabilidad buscada es P(x £ 55)

            Para solucionar esto es necesario pasar de la normal que nos
            interesa a la normal estándar. Esto se consigue mediante el
            siguiente cambio de variable: 

                             x  ­ m
                     z  = 
                              s       en este caso x = 55 ,  m = 50  y s =  5  por lo que

                                       z = (55 ­ 50)/5 = 1.

                                       P(x £ 55) = P(z £ 1) = 0,8413

            Cuando se busca una valor por menor, la probabilidad se
            obtiene directamente en la tabla.

           ü que los alumnos pesen más de 57,75 kg
            En símbolos, la probabilidad buscada es P(x ³ 57,75)



                                                                                                 1 0 0 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




      Para solucionar esto es necesario pasar de la normal que nos
      interesa a la normal estándar. Esto se consigue mediante el
      siguiente cambio de variable: 

              x  ­ m
      z  = 
                  s     en este caso x = 57.75 ,  m = 50  y s =  5  por lo que

z = (57,75 ­ 50)/5 = 7,7/5 = 1,54.

P(x ³ 57,75)= P(z ³ 1,54) = 1­ P(z £ 1,54)=1­0,9382=0,0618



              z        .00       .01        .02        .03    .04
              1.0      0.841     0.843      0.846      0.8485 0.850
                       3         8          1                 8
              1.1      0.864     0.866      0.868      0.8708 0.872
                       3         5          6                 9
              1.2      0.884     0.886      0.888      0.8907 0.892
                       9         9          8                 5
              1.3      0.903     0.904      0.906      0.9082 0.909
                       2         9          6                 9
              1.4      0.919     0.920      0.922      0.9236 0.925
                       2         7          2                 1
              1.5      0.933     0.934      0.935      0.9370 0.938
                       2         5          7                 2
              1.6      0.945     0.946      0.947      0.9484 0.949
                       2         3          4                 5
              1.7      0.955     0.956      0.957      0.9582 0.959
                       4         4          3                 1
              1.8      0.964     0.964      0.965      0.9664 0.967
                       1         9          6                 1
              1.9      0.971     0.971      0.972      0.9732 0.973
                       3         9          6                 8
              2.0      0.977     0.977      0.978      0.9788 0.979
                       2         8          3                 3
              2.1      0.982     0.982      0.983      0.9834 0.983
                       1         6          0                 8
              2.2      0.986     0.986      0.986      0.9871 0.987
                       1         4          8                 5




                                                                                              1 0 1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




          ü que los alumnos pesen entre de 52,75 kg y 60 kg
           En símbolos, la probabilidad buscada es P(52,75 £ x £ 60)
           Para solucionar esto es necesario pasar de la normal que nos
           interesa a la normal estándar. Esto se consigue mediante el

                                                         x ­ m 
                                                  z = 
            siguiente cambio de variable                  s , se buscan dos valores de
            z, primero para el valor mayor de x, luego para el menor 

                                 60 ­ 50  10                         52,75 ­ 50  2 75 
                                                                                   , 
                          z    = 
                           2             =  = 2              z  = 
                                                              1                 =      = 0 55 
                                                                                          , 
                                   5       5                             5         5 

     Se buscan los valores en la tabla para z=2; P(z £ 2)=0,9861
     Se buscan los valores en la tabla para z=0,55; P(z £ 0,55)=0,7088

     Luego se restan los valores
     P(52,75 £ x £ 60)= P(0,55 £ z £ 2)=0,9861­0,7088=0,2773

         Los valores de z a más usados y que determinan intervalos
         centrales (1­a) son:
            z  = ±1 64   , 
         ·  0, 10             para el 90 % central
            z  , 05  = ±1 96 
                         , 
         ·  0                 para el 95% central
            z  = ±2 58   , 
         ·  0, 01             para el 99% central

      Ejemplo

En la población de pesos X ~ N(50 ; 5) ¿cuál es el intervalo que
corresponde al 95 % central de la población?

En la distribución de z, el 95 % central de la población corresponde al
intervalo que va desde ­1.96 a +1.96, o sea ± 1.96. Es muy simple, si se
desea que en el centro esté el 95 % o, en tanto por uno, 0.95, entonces en
                                                         z  = ±1 96 
                                                                , 
las colas debe quedar el 0.05. el valor que corresponde  0, 05      .

Ya se determinó el intervalo en z, ¿cómo se pasa a la normal con media 50
y desviación estándar 5? Se debe hacer el cambio inverso de variable: 

                         x  ­  m
                 z  =               entonces  x  =  m ± z s
                           s                                                  .



                                                                                             1 0 2 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Para indicar que el intervalo corresponde a un porcentaje central
determinado se acostumbra a llamar a a lo que queda en las colas. 


                                  x  =  m ± z a s
Volviendo entonces al ejemplo,      por ser  z a = 1.96, el intervalo que
corresponde al 95 % central de la población de pesos de los alumnos es:

     x = 50 ± 1.96 5 = 50 ± 9,80 .

El intervalo del 95 % central entonces va desde 40,20 kg a 59,80 kg.




                                                                                             1 0 3 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                                            GUÍA DE EJERCITACIÓN

Actividad 1

El Director de una escuela debe establecer turnos para que el
establecimiento siempre tenga dos administrativos durante el mes de
enero. Para ello de los cinco empleados que dispone (A, B, C, D, E) debe
formar grupos de dos seleccionados al azar, sin reemplazo.
Describa el espacio muestral de este experimento aleatorio.

Actividad 2

a) ¿Cómo sería el espacio muestral en la actividad anterior si el muestreo
   fuera con reemplazo?
b) ¿Cuál es la forma correcta de efectuar este experimento, para que el
   Director del establecimiento siempre tenga dos administrativos en el
   mes de enero?

Actividad 3

Dé dos ejemplos de sucesos seguros y dos de sucesos imposibles.

Actividad 4
En el experimento aleatorio de la Actividad N°1,
a) ¿Cuántos grupos de dos personas se formaron?
b) ¿En cuántos está A?
c) ¿En cuántos está B?
d) ¿En cuántos están A y B?
e) ¿En cuántos no ha sido seleccionado C?
f) ¿En cuántos han sido seleccionados A ó B ó C?
g) Calcule la probabilidad de cada uno de estos sucesos.

Actividad 5

Una oficina donde asignan becas para estudio a alumnos de EGB, realiza
la selección de los mismos para dos Becas de distinto origen de fondos; los
resultados posibles son Seleccionado (S) o No Seleccionado (NS). El
experimento consiste en tomar al azar un alumno y observar el resultado
en las dos selecciones.
a) Describa el espacio muestral de este experimento (suponga que todos
    los alumnos han estado inscriptos en las dos Becas)
b) ¿Cuál es la probabilidad de que el alumno haya sido seleccionado en
    las dos Becas?



                                                                                             1 0 4 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




c) ¿Cuál es la probabilidad que el alumno no haya sido seleccionado
   ninguna de las dos Becas?
d) ¿Cuál es la probabilidad que el alumno haya sido seleccionado en una
   Beca por lo menos?
e) ¿Cuál es la probabilidad que el alumno haya sido seleccionado a lo
   sumo en una Beca?


Actividad 6

Cada uno de los items siguientes representan las probabilidades de cada
uno de tres eventos simples.
Marque el item correcto, justificando al mismo tiempo su respuesta.

a) P(E1) = 0.8         P(E2) = 0.3              P(E3) = 0.1

b) P(E1) = 0.3          P(E2) = 0.2             P(E3) = 0.5

c) P(E1) = ­0.6          P(E2) = 0.2             P(E3) = 0.2

d) P(E1) = 1/3         P(E2) = 1/2              P(E3) = 1/6

Actividad 7

En una encuesta realizada a 90 alumnos que egresan del Polimodal en un
establecimiento educativo, se les preguntaba sobre el nivel de instrucción
alcanzado por los padres y si seguirían estudiando o no una carrera
superior. El resultado de la encuesta figura en la tabla siguiente:

                  Nivel de educación           ¿Seguirán              Total
                     de los padres           estudiando?
                                            Si        No
                      Superior              20        10               30
                     Secundario             30        10               40
                      Primario              15         5               20
                        Total               65        25               90

Si se selecciona un alumno al azar, cuál es la probabilidad de:
a) ¿Qué el alumno tenga padres con educación superior?
b) ¿Qué el alumno siga estudiando?
c) ¿Qué el alumno siga estudiando y tenga padres con educación
   primaria?
d) ¿Qué el alumno tenga padres con educación superior o secundaria?
e) ¿Qué el alumno tenga padres que no posean educación superior?



                                                                                                1 0 5 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




f) ¿Qué el alumno siga estudiando dado que posee padres con educación
   primaria?
g) ¿Qué el alumno no siga estudiando dado que posee padres con
   educación secundaria?
h) El evento que siga estudiando es independiente del nivel de educación
   Superior alcanzado por los padres?


Actividad 8

En un examen de 10 bolillas un alumno no sabe dos de ellas. ¿Cuál es la
probabilidad que le toquen justamente las dos bolillas que no sabe?

Actividad 9

Una prueba tiene 2 preguntas con dos opciones: Verdadero (V) o Falso(F).
a) ¿Cuál es la probabilidad de que acierte en las dos?
b) ¿Cuál es la probabilidad de que acierte por lo menos en una?
c) ¿Cuál es la probabilidad de que a las dos las conteste incorrectamente?

Actividad 10

En una escuela hay tres Profesores de Educación Física. La probabilidad
de que no asistan a clase cada uno de ellos es de 0.05. ¿ Cuál es la
probabilidad de que un día cualquiera falten los tres juntos?

Actividad 11

En un análisis realizado por el Director de un establecimiento educativo,
se determinó que de los alumnos ingresantes en EGB en una cohorte, solo
el 70% (en promedio) completó el polimodal. De ellos solo el 15% lo hizo en
el mismo establecimiento. ¿Cuál es la probabilidad de que un nuevo
alumno ingresante en EGB termine el Polimodal en la misma escuela?

Actividad 12

La probabilidad de que a un alumno le interese Matemáticas en un curso
es de 0.1. Si se toman 3 alumnos de dicho curso al azar:
¿Cuál es la probabilidad de que:
a) No le agrade a ninguno Matemáticas?
b) Le agrade por lo menos a un alumno esta materia?
c) Le agrade como máximo a 2 alumnos?




                                                                                             1 0 6 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




Actividad 13

La probabilidad de que un alumno apruebe una Prueba Integradora de
conocimientos de Matemática en el último año del Polimodal es de 0.25. Si
se seleccionan al azar 10 alumnos de un curso:
a) ¿Cuál es la probabilidad de que 5 alumnos aprueben?
b) ¿Cuál es la probabilidad de que no apruebe ningún alumno?
c) ¿Cuál es la probabilidad de que todos aprueben?
d) ¿Cuál es la probabilidad de que aprueben como mínimo 5 alumnos?
e) ¿Cuál es la probabilidad de que como máximo aprueben 5 alumnos?

Actividad 14

La probabilidad de que la última semana de clase los alumnos que egresan
cometan un acto de indisciplina serio es de 0.004. De 300 alumnos que
terminan este año:
¿Cuál es la probabilidad de que:
a) 8 alumnos terminen sus estudios con una sanción por este acto de
   indisciplina?
b) De qué más de 5 alumnos terminen sus estudios con una sanción por
   este acto de indisciplina?
c) De que menos de 4 terminen sus estudios con una sanción por este
   acto de indisciplina?
d) De qué ningún alumno cometa un acto de indisciplina serio?

Actividad 15

Los pesos de los alumnos de un curso de EGB se distribuyen normalmente
con m = 48 kg y s = 2 kg.
a) Obtenga los pesos estándar correspondientes a:
43 kg ; 44.5 kg ; 46 kg ; 49.5 kg ; 50 kg
b) ¿Cuál es la probabilidad de que un alumno tenga un peso menor a 44.5
   kg?
c) ¿Cuál es la probabilidad de que un alumno tenga un peso mayor a 46
   kg?
d) ¿Cuál es la probabilidad de que un alumno tenga un peso entre 44.5
   kg y 49.5 kg?
e) ¿Cuál es la probabilidad de que un alumno tenga un peso de por lo
   menos 46 kg?
f) Obtenga el Rango Percentil correspondiente a los pesos del item a).
   Interprete que significa cada uno de ellos.
g) Si el número de alumnos a los que se ha medido el peso en ese curso
   fuera de 200, ¿ cuántos alumnos tendrán un peso inferior a la media?.
   ¿Cuántos alumnos tendrán un peso superior a 52 kg?


                                                                                             1 0 7 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




h) ¿Qué porcentaje de alumnos tienen un peso comprendido entre 45 kg y
   47 kg?

Actividad 16

Los puntajes promedio con su correspondiente desviación estándar,
obtenidos por los alumnos del último curso de Polimodal en una escuela
en los exámenes finales de una asignatura son los siguientes:

                             CURSO             m         s
                               A              5.9       1.5
                               B             6.75        1

 Se supone que los puntajes se distribuyen normalmente:
a) Si un alumno del Curso A ha obtenido 7 puntos y otro del Curso B
   igual puntaje, quiere decir que el nivel de aprendizaje es el mismo en
   los dos cursos?. Justifique su respuesta.
b) ¿Qué porcentaje de alumnos obtuvieron más de 5 puntos en cada
   curso? Analice en base a esto el rendimiento de cada curso.
c) ¿Qué porcentaje de alumnos obtuvieron más de 7 puntos en cada
   curso?
d) ¿Qué porcentaje de alumnos obtuvieron menos de 4 puntos en cada
   curso?
e) ¿En base a estos resultados qué conclusión puede enunciar?




                                                                                             1 0 8 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




                                   UNI DA D  V

                                                          INFERENCIA ESTADÍSTICA

   1. INTRODUCCIÓN

      En capítulos anteriores se vió:

Est adíst ica Descriptiva : Su objetivo es la recolección y reducción de
datos . Se estudian técnicas para presentar los datos de una forma mas
comprensible y así poder visualizar propiedades de los mismos.

Cálculo de Probabilidades :La razón de su estudio es que la Estadística
incluye la toma de decisiones en presencia de incertidumbre. Estas
decisiones tomadas se basan en probabilidades. Aquí conocemos ( o
suponemos conocido) por completo el modelo probabilístico que usamos,
es decir, la población a estudiar la podemos representar por una variable
aleatoria X

      Recordemos que una población está constituida por todos los
elementos que poseen unos caracteres por cuyo estudio estamos
interesados. Una muestra, en cambio, es una parte de los elementos de la
población; pero esta parte ha de ser representativa del total.

      Cuando el estadístico puede observar todos los elementos de la
población ( observación exhaustiva) , entonces su tarea se reduce a
describir las características y regularidades de la población. Pero si la
observación no puede ser exhaustiva, entonces aquellas características
hay que estudiarlas a través de una muestra representativa.

        Hay que distinguir entre poblaciones finitas y poblaciones infinitas.
Se dice que una población es finita si tiene un número limitado de
sucesos o unidades elementales. Ejemplo de población finita son, en un
año dado los salarios recibidos por todos los docentes de un Colegio, los
títulos recibidos por todos los estudiantes de un país. Mientras el número
total de observaciones posibles sea limitado, se trata de una población
finita.




                                                                                              1 0 9 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




            En cambio, una población infinita es la que, consiste en un
   número infinitamente grande de observaciones. Por lo menos es teoría ,
   no hay límite alguno al número de unidades que puede abarcar. Por
   ejemplo, los resultados obtenidos al jugar dos dados constituyen una
   población infinita , lo mismo que los pesos al nacer de todos los seres
   humanos.. Una población infinita puede ser siempre generada a partir
   de un conjunto finito de valores o unidades si el muestreo se hace con
   reemplazo.


   2. INFERENCIA ESTADÍSTICA

                             Definición: La Inferencia Est adística es el
                             procedimiento por medio del cual se llega a
                             inferencias acerca de una población mediante
                             los resultados que se obtienen a part ir de una
                             muestra extraída de esa población.

       El objetivo principal de la Est adíst ica Inferencial es la esti ma ción
, esto es que mediante el estudio de una muestra aleatoria seleccionada de
una población se quiere generalizar las conclusiones al total de la misma.


Defi nición de muestra alea tori a

      Todo conjunto de n unidades de observación elementales tomadas
de una población dada, se puede considerar como una muestra de tamaño
n. Pero el tipo de muestra que aquí interesa es el de muestra aleatoria
Una muestra aleatoria se puede tomar con o sin reemplazo. Si la muestra
se toma con reemplazo, de una población , finita o infinita , la unidad
tomada se vuelve a dejar en la población y el número de unidades
disponibles para seguir la operación no se afecta. Esto tambien es cierto
cuando la muestra se toma de una población infinita sin reemplazo, es
decir, cuando la unidad escogida no se vuelve a la población. Cuando se
toma un elemento, sin reemplazar, de una población finita, el número de
unidades que quedan tras cada unidad que se saca se reduce en una
unidad, y en consecuencia la probabilidad de sacar cualquier unidad
restante en operaciones sucesivas se aumenta.

      Es necesario formular nuestro concepto en forma precisa. Por
definición, una muestra debe tener ciertas propiedades como sigue:

     Se supone que las muestras dan información acerca de la población
a que corresponde, ya que por lo general es demasiado costoso, requiere


                                                                                              1 1 0 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




demasiado tiempo, o es imposible observar o medir todos los objetos
pertenecientes a la población.. La muestra debe ser una selección
aleat oria . Es decir, cada elemento de la población debe tener una
probabilidad conocida de ser extraído, esto es, de ser tomado en la
muestra; el caso mas sencillo y más común es en donde la probabilidad es
la misma para todos los elementos de la población , y solo si se satisface
este requisito ( al menos aproximadamente) , los métodos estadísticos
darán resultados razonables y útiles.

      Además, es necesario que las n         ejecuciones del experimento
aleatorio con el que obtenemos         n    valores de la muestra sean
independientes, esto es, el resultado de una ejecución no debe influir en
las otras ejecuciones. Esto equivales a decir que la probabilidad de que
cualquier miembro de la población aparezca en una muestra, no depende
de la aparición o no aparición de los otros miembros de la población en la
muestra.

       Hay que tener presente que el conocimiento de las características de
una población, salvo algunas excepciones, no puede conseguirse con toda
exactitud mediante una muestra. Si se tiene una población humana y
suponemos que no existen errores de observación, la única manera de
obtener exactamente la estatura media, el porcentaje de analfabetos, , etc.
, en dicha población es observando todos los elementos de ella. Pero si esta
observación exhaustiva no es posible y se utiliza como medio supletorio
una muestra, entonces lo único que puede obtenerse, salvo en algunos
casos particulares, son estimaciones de aquellas características.

      El problema de la Inf erencia Esta dística se acostumbra a enfocar
de dos maneras distintas. Partiendo del hecho cierto de que una muestra,
en ge­ neral, no da una información exacta de las características de la
población que deseamos estudiar, puede procederse asi:

                    1º     Utilizar la muestra para estimar dichas
                    características. Este enfoque origina la Teoría de la
                    Esti ma ción , mediante la cual se da solución a los
                    problemas específicos que se plantean.

                    2º Emitir hipótesis sobre aquellas características
                    tomando como base la experiencia, otras informaciones
                    o incluso el presentimiento o la corazonada. Una
                    hipótesis así formulada tiene, evidentemente, poco valor
                    científico. Este valor se adquiere tomando una muestra
                    de la población y utilizándola para verificar o contrastar



                                                                                              1 1 1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                    la hipótesis., Este enfoque da lugar a la Teorí a de la
                    Verifi ca ci ón o Contra sta ción de hipótesis.

       Para distinguir claramente entre ambas , considérense los
siguientes ejemplos . Un candidato para un puesto público desea estimar
la proporción real de votantes que lo apoyan mediante la obtención de las
opiniones de una muestra aleatoria de 100 votantes. La fracción de ellos
que lo apoye puede utilizarse como una estimación de la proporción real de
la población total de votantes. Este problema pertenece al área de
estimación.

       Ahora considérese el caso en el cual una Profesora se interesa en
determinar si el sistema nuevo de evaluación( A ) implementado por el
Colegio es mejor que el sistema anterior de evaluación ( B ). Esta Profesora
podría suponer que el sistema A es mejor al sistema B y , después de
realizar las pruebas apropiadas , aceptar o rechazar esta hipótesis .En este
ejemplo se intenta tomar una decisión correcta respecto a la hipótesis
preestablecida.( La prueba de hipótesis no se verá en el desarrollo de esta
Asignatura ).


3. DISEÑOS DE MUESTREO

      La operación de tomar una muestra de una población se denomina
muestreo y los métodos de muestreo que se utilicen deben garantizar
aquella representatividad para que pueda hablarse correctamente de una
muestra estadística.

      Si se desea conocer, por ejemplo, el consumo medio de proteínas por
alumno y dia en una ciudad y tomamos para ello un grupo de familias
integrado por la de mas alto nivel de vida, se concluirá que ese grupo no es
representativo del total de familias de la ciudad.. Por tanto, el consumo
medio que se obtenga del citado grupo no es una buena estimación porque
entraña un error de un tipo distinto del que cabe esperar en una muestra
representativa.

      Conviene distinguir entre dos clases de error. De una parte existen
los errores muestrales, que son aquellos que están latentes en toda
muestra representativa, pues aun siéndolo no proporciona , salvo raras
excepciones, una medida exacta de las características de la población; por
ello hay que contar siempre con los errores muestrales o errores de
muestreo.




                                                                                              1 1 2 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




       Y por otra parte están los sesg os, bajo cuya denominación se
incluyen algunos errores específicos de las muestras como los debidos a su
falta de representatividad, y otros que son comunes a toda investigación
estadística, tanto si es exhaustiva como si no lo es. A este último grupo
pertenecen los errores de observa ci ón , los originados por definiciones
defectuoasas de los elementos de la población, de los caracteres a
investigar , los debidos a respuestas o medidas mal efectuadas , a
fórmulas inadecuadas, a cálculos equivocados, etc.

Ejemplo :Supongamos que deseamos tomar una muestra de 100
estudiantes de un Colegio para conocer la opinión del alumnado respecto a
la adecuación de las evaluaciones. Un posible método es situarse a las
nueve de la mañana en una entrada del Colegio y preguntar a los 100
primeros alumnos que aparezcan. Con este procedimiento los alumnos que
solo tienen clase por la tarde no estarán representaos en la muestra.
Además, estarán muy poco o nada representados los estudiantes que no
tengan clase a primera hora o los que teniéndola no acudan
habitualmente.

      Cuando algunos miembros de la población tienen una probabilidad
más alta que los otros de estar representados en una muestra se dice que
existe un sesgo de selección y la muestra puede no ser representativa de
la población. Por ejemplo, si existen diferencias marcadas de opinión entre
los alumnos nuevos y los veteranos, y la muestra sólo incluye a los
veteranos, tendrá un sesgo de selección.Una forma de evitar este sesgo es
tomar la muestra mediante un procedimiento de selección objetivo que
garantice a todos los elementos de la población la misma oportunidad de
aparecer en la muestra.

      El método anterior presenta además el riesgo de un sesgo adicional:
el sesgo por no respuesta. Si los estudiantes que no responden son los
más disconformes con las evaluaciones, la muestra contendrá una
proporción menor de estudiantes de estas categorías y, de nuevo, puede
no ser representativa de la población que tratamos de investigar. El sesgo
de no respuesta no puede evitarse con certeza pero deben tomarse
precauciones para prevenir que ocurra.

3.1. MUESTREO AL AZAR SIMPLE

     El muestreo aleatorio simple está fundamentado en el puro azar. Se
puede decir que es un muestreo en el que si se saca al azar una muestra
de n unidades, toda posible muestra de n unidades tiene la misma
probabilidad de ser seleccionada, Una muestra obtenida por este
procedimiento se dice muestra aleatoria si mpl e .


                                                                                             1 1 3 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




      Uno de los métodos comúnmente utilizados para lograr que la
muestra sea aleatoria es numerar todos los elementos de una población,
escribir los números en tarjetas o fichas o bolillas o cualesquiera cosas
físicamente homogéneas; poner luego en una bolsa estos objetos
numerados y mezclarlos completamente. Se define el tamaño n de la
muestra y se sacan los objetos al azar uno por uno, hasta que se obtenga
el número deseado de partidas para anotar. El procedimiento se puede
simplificar utilizando una tabla de números aleatorios.




3.2. MUESTREO ALEATORIO SISTEMÁTICO

      Cuando los elementos de la población están ordenados en listas, una
alternativa más fácil de ejecutar que el muestreo aleatorio simple es el
muestreo sist emát ico. Muy a menudo, si se desea un muestreo aleatorio
simple se sigue un procedimiento sistemático en vez de un método al azar.
Según el procedimiento sistemático, se obtiene una muestra tomando cada
k­ésima unidad de la población tras numerar las unidades de la población
o haberlas ordenado de alguna manera. La letra k representa un número
entero, que es aproximadamente la razón de muestreo entre el tamaño de
la población y el tamaño de la muestra. Así, si la población consiste en
10.000 unidades de muestreo y se desea una muestra de 500 unidades,
entonces

                          K = 10.000 / 500 = 20

   Y la muestra se obtiene tomando una unidad cada veinte de la
   población.

       Para que toda unidad de la población tenga igual probabilidad de
salir, el procedimiento debe empezar al azar. Con una razón de muestreo
de 20, se puede utilizar el procedimiento de la bolsa o del bolillero
poniendo 20 bolillas o 20 papelitos numerados de 1 a 20 en el bolillero o
bolsa. Tras revolver y mezclar completamente, se saca una bolilla al azar.
Si se saca la bolilla 11, se empieza con este número y se incluye enla
muestra cada vigésima bolilla a partir de esta, es decir, la treinta y una, la
cincuenta y una , y así sucesivamente.




                                                                                              1 1 4 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   3.3. MUESTREO POR ESTRATOS

       El muestreo aleatorio simple debe utilizarse cundo los elementos de
la población son homogéneos respecto a la característica a estudiar, es
decir, a priori la predicción que haríamos del valor de la variable sería el
mismo para todos los elementos. Un muestreo que sería mas efectivo que
este, es el muestreo aleatorio por estratos, procedimiento que exige tener
conocimiento previo de la población. El proceso de estratificación
contempla dividir la población en grupos o clases llamados estratos .
Dentro de cada uno de tales estratos, están los elementos situados de
manera más homogénea con respecto a las características que estén en
estudio. Para cada estrato se toma una submuestra              mediante el
procedimiento aleatorio simple, y la muestra global se obtiene combinando
las submuestras de todos los estratos.

      El muestreo por estratos es el más efectivo cuando se trata de
poblaciones heterogéneas tales como datos de desempleo ( que varían de
ocupación a ocupación ), ventas al por menor ( que difieren entre las
distintas regiones geográficas) , y las actitudes de los consumidores
respecto de malos nuevos modelos de automóviles ( en las que influyen
factores teles como el sexo, la edad, y la categoría de ingreso). Al hacerse la
estratificación, las clases se establecen de modo que las unidades de
muestreo tienden a ser uniformes dentro de cada clase, y las clases
tienden a ser diferentes entre sí. Así se puede controlar la proporción de
cada estrato en la muestra global y no dejarla al azar y queda asegurado
el carácter representativo de la muestra.

      El muestreo por estrato es por consiguiente una combinación de
submuestras de los estratos, que son muestras aleatorias simples o
sistemáticas. En cuanto tales, todo elemento disponible de cada estrato
tiene igual probabilidad de ser seleccionado, y esta será la situación aun
en el caso en que la muestra no sea proporcionada, en el cual las
probabilidades de ser seleccionado cada elemento individual de la
población no son iguales.


3.4.MUESTREO POR CONGLOMERADO

      Diametralmente opuesto al muestreo por estratos está el muestreo
por conglomerados, que consiste en seleccionar primero al azar grupos,
llamados conglomerados , de elementos individuales de la población, y en
tomar luego todos los elementos o una submuestra de ellos dentro de cada
conglomerado para constituir así la muestra global. Para lograr los mejores


                                                                                              1 1 5 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




resultados ern el plan del muestreo por conglomerado, se hacen tan
pequeñas como sea posible las diferencias entre conglomerados, en tanto
que las diferencias entre los elementos individuales dentro de cada
conglomerado se hacen tan grandes como sea posible.

      Por ejemplo, si queremos extraer una muestra aleatoria simple de los
estudiantes universitarios de un país sería necesario disponer de una lista
de todos ellos y de sus direcciones y teléfonos. Esta información puede no
estar disponible o ser muy cara de conseguir. Sin embargo, en este caso,
los estudiantes aparecen clasificados en universidades, facultades y
cursos. Podemos seleccionar en una primera etapa algunas universidades,
después algunas facultades al azar de cada universidad, dentro de las
facultades algunas clases y, dentro de las clases, estudiantes mediante
muestreo aleatorio.

      Para la primera etapa solo necesitamos una lista de universidades.
Para las universidades seleccionadas es necesario luego conocer las
facultades que incluyen. En las facultades elegidas necesitamos una lista
de las clases, y de las clases que se tomen, una relación de los
estudiantes. Esta información estará disponible por lo que este tipo de
muestreo será factible.

       Llamaremos conglomerados a estas unidades amplias donde se
clasifican los elementos de la población. En cada etapa de muestreo , en
lugar de seleccionar elementos al azar , seleccionamos conglomerados. Los
conglomerados se refieren a formas de agrupación física de las unidades
en el espacio o en el tiempo.

      Idealmente los conglomerados tienen que ser lo más parecido posible
a muestras aleatorias de la población , de manera que cada conglomerado
sea tan heterogéneo como la población a investigar.

      El muestreo por conglomerado tiene la ventaja de simplificar
enormemente la recogida de la información muestral. El inconveniente
obvio es que si los conglomerados son heterogéneos entre sí, como sólo se
analizan algunos de ellos, la muestra final puede no ser representativa de
la población.




                                                                                             1 1 6 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




3.5. MUESTREO POR CUOTAS

       A veces la estratificación no es posible, o es muy cara, y se recurre
en su lugar al muestreo por cuot as. Por ejemplo, se desea tomar una
muestra de una población para estudiar la proporción de personas que
están de acuerdo con el uso de remedios especiales. Si suponemos que la
edad y el sexo pueden influir en la opinión, deberíamos tomar una
muestra donde estas características sean las mismas que en la población
base, lo que implica una muestra estratificada. Sin embargo, esto requiere
una lista de las personas de la población que incluya su sexo y edad, lo
que puede no estar disponible. Sin embargo, si conocemos la proporción
de cada sexo y la distribución de la edad en la población, una solución
frecuente es exigir que estas características aparezcan en la muestra en la
misma proporción que en la población. Esto conduce a fijar cuotas de
hombres y mujeres por grupos de edad. El entrevistador debe conseguir
los elementos de la muestra respetando esta restricción de cuotas.


   4. ESTIMACIÓN DE PARÁMETROS

      Algunas cantidades que aparecen en las funciones de distribución,
como p de la distribución binomial , m y s en la distrIbución normal, se
llaman parámetros. Generalmente estamos interesados en conocer los
pa rá metros de la población, es decir , aquellas características que sirven
para determinarla. Ahora veremos como obtener estimaciones de
parámetros a partir de una muestra dada.

      Dada una población, se trata de estimar, esto es, de valorar, alguno
o algunos parámetros característicos de la misma, como, por ejemplo, a la
media aritmética. Recurriremos a la inferencia estadística, y mediante el
análisis de una muestra obtendremos una estimación de los valores
correspondientes a la población completa.

       Esta estimación puede ser por punto o por i nterval o, según se
trate de determinar un valor único del parámetro en cuestión o bien un
intervalo dentro del cual quede comprendido, con una cierta probabilidad,
el valor correspondiente al parámetro de toda la población .El intervalo en
cuestión recibe el nombre de intervalo de confianza y la probabilidad, el de
nivel de significación.




                                                                                              1 1 7 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   4.1. ESTIMACIÓN PUNTUAL

      La Inferencia Estadística está casi siempre concentrada en obtener
algún tipo de conclusión acerca de uno o más parámetros (características
poblacionales). Para hacerlo, se requiere que se obtenga datos muestrales
de las poblaciones en estudio. Entonces, las conclusiones pueden estar
basadas en los valores calculados de varias cantidades muestrales.

      Una esti ma ción puntual ó estima ci ón por punto es un solo valor
numérico utilizado para estimar el parámetro correspondiente de la
población. La estimación puntual se obtiene al seleccionar una estadística
apropiada y calcular su valor a partir de datos de la muestra dada.

     Sirve como una aproximación del valor exacto desconocido del
parámetro

      El estadíst ico que se utiliza para obtener una estimación puntual
recibe el nombre de esti ma dor puntual del pará metro .

       Es conveniente notar que se ha dado el nombre de estimación a un
solo valor calculado. La regla para calcular este valor o estimación se
conoce como estima dor. Los estimadores generalmente se presentan
como fórmulas. Por ejemplo la media  x  de una muestra es un estimador
de la media     m de la población correspondiente. El valor numérico
individual que resulta de la evaluación de la fórmula de la media se conoce
como estimación del parámetro m. De esta manera se tiene la estimación
m @  x  para m

       De forma similar , la variancia muestral,              S2 , se puede utilizar para
inferir algo acerca de s 2 .


       Ejemplo:
             Una muestra aleatoria de 3 baterías para calculadora podría
presentar duraciones observadas en horas de x1 = 5.0 , x2 = 6.4 y x3 =
5.9 . El valor calculado de la duración media muestral es  x  = 5.77 , y es
razonable considerar 5.77 como el valor adecuado de m .

       El enunciado : la estimación puntual de m                      es 5.77 “ se puede
escribir en forma abreviada m = 5.77.




                                                                                              1 1 8 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   4.2. ESTIMACIÓN        POR INTERVALO EN EL MUESTREO AL ZAR
   SIMPLE

      Supóngase que un grupo de investigadores quiere estimar la media
de una población que sigue una distribución normal y que, para ello,
extraen una muestra aleatoria de tamaño n de la población y calculan el
valor de  x , el cual utilizan como una estimación puntual de m . Aunque
este estimador de m posee todas las cualidades de un buen estimador, se
sabe que, debido a los caprichos del muestreo, no se puede esperar que  x 
sea igual a m.

        Un estimador puntual por ser un solo número, no proporciona por sí
mismo información alguna sobre la precisión y confiabilidad de la
estimación. El estimador puntual nada dice sobre lo cercano que está de
m  x  .

      Si se quiere llegar a asignar determinadas garantías o “confianza” a
los resultados de un proceso inferencial de estimación, cabe la posibilidad
de ampliar la óptica de la Esti ma ción Puntual analizada en el tema
anterior, pasando a la estimación mediante Intervalos de Confi a nza .

      En términos estadísticos las “garantías” asignables consisten en
afirmaciones de tipo probabilístico.

      La estimación de una magnitud desconocida mediante Intervalo de
Confi a nza consiste en derivar unos límites aleatorios que contendrán al
parámetro desconocido con una probabilidad fijada de antemano.

      Los extremos de un intervalo de conf ia nza son aleatorios, por lo
que podrán o no contener al verdadero parámetro y será posible evaluar la
probabilidad de que así ocurra. A la probabilidad de que un Intervalo de
Confianza contenga al parámetro poblacional objeto de análisis se le
denomina Nivel de Confi a nza y la denotaremos por g ( 1 ­ a )

      Por ejemplo, si escogemos g = 1 ­ a = 95 % , implica que 95 % de
todas las muestras daría lugar a un intervalo que incluye m o cualquier
otro parámetro que se esté estimando , y sólo 5 % de las muestras
producirá un intervalo erróneo. Cuánto mayor sea el nivel de confianza
podremos creer que el valor del parámetro que se estima está dentro del
intervalo.

     Al estimar un parámetro q , el problema correspondiente debería ser
la determinación de dos cantidades numéricas que dependen de los



                                                                                             1 1 9 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




valores de la muestra, y en cuyo intervalo se incluya el valor desconocido
del parámetro con certeza. Sin embargo, sabemos que a partir de una
muestra no podemos obtener conclusiones acerca de la población
correspondiente que sean 100 % verdaderas. Así, tenemos que ser más
modestos y modificar nuestro problema, de la siguiente manera.

      Escogemos una probabilidad g cercana a 1 , ( por ejemplo, g = 95 %
, 99 % o alguna semejante) . Luego, determinamos dos cantidades q 1 y q2
tales que la probabilidad de que incluyan el valor exacto desconocido del
parámetro q sea igual a g .

      Los n valores de la muestra se pueden considerar como valores
observados de n variables aleatorias X1 , X2 , ......., Xn . Entonces q1 y q2
son funciones de estas variables aleatorias y , por lo tanto, también son
variables aleatorias. . Nuestro requisito anterior se puede escribir como

                  P(q1 £ q £        q2 ) = g

Si conocemos q1 y q2 y se dá una muestra, podemos calcular un valor
numérico q1 de q1 , y un valor numérico q2 de q2 . El intervalo con
puntos extremos q1 y q2 se llaman intervalos de confianza o estimación
por intervalo para el parámetro desconocido q , y se representa

                  CONF í q1          £ q £ q2 ý

Los valores q1 y q2     se llaman límites de confianza inferior y superior
para q. El número g se llama nivel de confianza. Se elige g = 95 % , 99%
o algunas veces 99,9 %.

      Es evidente que si se intenta obtener una muestra y determinar un
intervalo de confianza correspondiente, entonces g es la probabilidad de
disponer de un intervalo que incluya el valor exacto desconocido del
parámetro.




                                                                                              1 2 0 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




   4.2.1. INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA
   DISTRIBUCIÓN NORMAL CUYA VARIANCIA ES CONOCIDA

       Sea x1 , · · · · , xn una muestra extraída de una población
distribuida normalmente o , a falta de esto, si n es lo bastante grande,y
cuya variancia    s 2 es conocida. Suponemos que la media          m es
desconocida , y que deseamos ­determinar un intervalo de confianza para
m . Los pasos necesarios para determinar un intervalo de confianza bajo
las suposiciones anteriores son .

     1 ª paso .Elegir un nivel de confianza g ( 95 % , 99 % ,o uno
semejante ).

      2 ª paso . Determinar el valor de z correspondiente mediante la tabla
de distribución normal estandarizada. Por ejemplo:


           g          0,90            0,95        0,99            0,999
           Z          1,645           1,960       2,576           3,291

     3ª paso . Calcular la media  x  de la muestra

     4ª paso . Calcular

                                z s
                         k =                          (1)
                                  n 

     Por lo tanto :

           Si  x  es la media de una muestra aleatoria de tamaño n de
una población con variancia conocida el intervalo de confianza de ( g ) 100
% para la media poblacional es.

                  CONF í  x  ­ k          £ m      £  x  + k ý


                                Z     S ≤  m ≤ X              S
                         X                        +  Z 
                                  n                       n

Ejemplo:
      Se calcula que la media de los promedios de los puntos de calidad de
una muestra aleatoria de 36 alumnos de los últimos años del nivel medio
es 2,6. Encuentre los intervalos de confianza del 95 % y del 99 % para la


                                                                                             1 2 1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




media total de alumnos del último año. Asuma que la desviación estándar
de la población es 0,3.

Solución:

      La estimación puntual de m es 2,6. El valor de z para el 95 % es z =
1,96. De aquí que el intervalo de confianza es :

                                        0, 
                                          3                      0, 
                                                                   3 
                    ( 2,6 – 1,96  ·          £ m £ 2,6 + 1,96  ·      )
                                         36                       36 

el cual se re duce a,           ( 2,50       , 2,70 )

Par a e nc ontr ar un i nter val o de l 99 % , se e nc ue ntr a e l valor
de z, donde z = 2,576

                                   0, 
                                     3                                            0, 
                                                                                    3 
          ( 2 , 6 – 2 , 5 7 6  ·        £   m    £ 2,6 +           2 , 5 7 6  ·        )
                                    36                                             36 

o simp le me nte :      ( 2,47 ,        2,73 )

Aho ra se obse rva que se re quie re un int ervalo más grande
para e stimar m con mayor precisión.

Si no se conoce la variabilidad de la población y solo se
dispone de la información proporcionada por la muestra, es
d e c i r s e c o n o c e  X  y s , s i e m p r e q u e s e t r a b a j e c o n u n
t a m a ñ o d e m u e s t r a g r a n d e : 

                                   Z    S ≤  m ≤ X                 S
                         X                          +  Z 
                                    n                          n




                                                                                                1 2 2 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                                                GUÍA DE EJERCICIOS

ACTIVIDAD 1

      El Departamento de Biología de una escuela desea estimar la
cantidad promedio de agua que consume diariamente cierta especie
animal en condiciones experimentales, para completar un estudio que se
está realizando.Esta investigación supone que la población de valores de
consumo diario de agua está normalmente distribuida y, con base en
experiencias pasadas, que la variancia de la población es de 4 gramos
cuadrados. Una muestra aleatoria de 40 animales arroja una media de
16,5 gramos.

     a) Estime puntualmente la cantidad promedio de agua .

     b) Con un nivel de confianza del 95 estime la cantidad promedio de
        agua.

     c) Realice los cálculos solicitados en el inciso b) pero con un nivel
        de confianza de 90 % . Compare los intervalos obtenidos.



ACTIVIDAD 2

      En una escuela para adultos , se seleccionó una muestra de 100
alumnos aparentemente sanos, de 25 años de edad, donde se muestra una
presión sanguínea media de 125. Si se supone que la desviación estándar
de la población es de 15, calcule
      a) El intervalo de confianza del 90 por ciento para m


     b) El intervalo confianza del 95 por ciento para m



   ACTIVIDAD 3
     Una investigación realizada en el área de educación sostiene que la
edad promedio de los docentes del área rural ha disminuido . La edad
promedio de los docentes rurales en elos últimos años fue de 35 años.

      Para ello,se extrae una muestra aleatoria de 100 docentes en la que
la edad promedio es de 28 años con una desviación estándar de 8 año.



                                                                                             1 2 3 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




¿Confirman estos datos la hipótesis de esta investigación?. Trabaje con
a = 0,01 y a = 0,05.


ACTIVIDAD 4

      Una muestra aleatoria que representa el tiempo ( en minutos) que
tardaron 36 estudiantes en familiarizarse con el manejo de un software
adquirido por las Autoridades del Colegio, dio un tiempo promedio de 10
minutos . El tiempo se distribuye normalmente. con una desviación
estándar de 3 minutos.

     a) Determine e interprete un intervalo del 95 % de confianza para el
        verdadero tiempo promedio.
     b) El instructor considera que el tiempo promedio requerido por los
        alumnos es mayor que 10 minutos, ¿ qué se puede decir de
        acuerdo con el intervalo hallado?.




                                                                                            1 2 4 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 




                  A N EXO 
TABLA S ESTADÍ STI CAS




                                                                             1 2 5 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                                                            1 2 6 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                                                            1 2 7 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                                                            1 2 8 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                                                            1 2 9 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                                                            1 3 0 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                                                            1 3 1 
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE




                                                                          BIBLIOGRAFÍA 


­  Benít ez, Celia de; Pece, Marta G.; Galíndez , Margarit a de. (2003).
   Serie Didáctica N°7: “Elementos de Estadística para técnicos en
   vivero y plantaciones forestales”, con guía de ejercitación. 

­    Barbancho, A. (1983). Estadística Elemental Moderna . 9a Edición.
     Ariel, S. A. – Barcelona. ISBN 84­344­2005­8. 



­    Daniel, W.W. (1997) Bioestadística. ISBN 968­18­5196­X. 



­     Kreyszig, E. (1994). Introducción a la Estadística Matemática .
     Principios y métodos. LIMUSA. –Noriega Editores. ISBN 968­18­
     0729­4. 



­    Peña, D. y Romo, J. (1999) . Introducción a la Estadística para las
     Ciencias Sociales. ISBN 84­481­1617­8. 



­    Triola, M.F.(2004). Estadística. Novena edición.ISBN 970­26­0519­
     9. Editorial Pearson. México. 837 pags. 



­    Ya­Lun, Chou. (1990). Análisis Estadístico. ISBN 970­10­0046­3.
     pags.808.




                                                                                            1 3 2 

Más contenido relacionado

PPT
Validez y Confiabilidad de instrumentos en la investigación cuantitativa
PPTX
Elaboración de tablas de frecuencia, estadística
DOCX
Fisica icfes 1 resuelto
PDF
Ejercicios de termodinamica
PDF
GUIA-No-2-ESTADISTICA GRADO 10 - 11.pdf
PDF
Estadística Aplicada a la Educación
DOCX
Asunto solicitud practicas
PPT
Basic Statistical Concepts and Methods
Validez y Confiabilidad de instrumentos en la investigación cuantitativa
Elaboración de tablas de frecuencia, estadística
Fisica icfes 1 resuelto
Ejercicios de termodinamica
GUIA-No-2-ESTADISTICA GRADO 10 - 11.pdf
Estadística Aplicada a la Educación
Asunto solicitud practicas
Basic Statistical Concepts and Methods

La actualidad más candente (20)

DOCX
Estadistica descriptiva
PPTX
Importancia de la estadística en la educacion
PPTX
Indicadores educativos (definicion)
DOCX
Ensayo sistema educativo
DOCX
Ensayo la estadistica y su aplicacion en docencia
DOCX
Definición de educación por diferentes autores
PPTX
La teleología de la educación por gr
PPTX
Problema y problematización
PDF
¿QUÉ ES LA INVESTIGACIÓN-ACCIÓN?
PPTX
Relación de la pedagogía con la filosofía
DOC
El diseño curricular sus tareas, componentes y niveles
PPT
SITUACION PROBLEMA
PPTX
El curriculum y niveles de concrecion
PPT
El estado y la educacion
PPTX
Cobertura educativa
PPT
Funcion Social de la Educacion
PPTX
Paradigma de la Investigación Positivista - Cuantitativo
PDF
Escuela como institucion social
PPT
Educación definición, concepto
DOC
Conclusión sobre observacion en el aula
Estadistica descriptiva
Importancia de la estadística en la educacion
Indicadores educativos (definicion)
Ensayo sistema educativo
Ensayo la estadistica y su aplicacion en docencia
Definición de educación por diferentes autores
La teleología de la educación por gr
Problema y problematización
¿QUÉ ES LA INVESTIGACIÓN-ACCIÓN?
Relación de la pedagogía con la filosofía
El diseño curricular sus tareas, componentes y niveles
SITUACION PROBLEMA
El curriculum y niveles de concrecion
El estado y la educacion
Cobertura educativa
Funcion Social de la Educacion
Paradigma de la Investigación Positivista - Cuantitativo
Escuela como institucion social
Educación definición, concepto
Conclusión sobre observacion en el aula
Publicidad

Similar a 7. metodologia y estadistica aplicada a la educacion (20)

PPTX
Estadistica Descriptiva Lila_Romero
DOCX
Trabajo estadistica yenni (1)
DOCX
Metodos estadisticos
PPTX
Estadistica
DOCX
PROYECTO DE AULA MATEMATICAS
DOCX
Proyecto de aula matematicas
DOCX
Proyecto de aula asignatura matematicas
DOCX
Investigacion estadisitica
DOCX
Presentacion Slideshare
PPTX
LGE. CLASE 1_PRODUC. Y ANAL. DE INF. EDUCATIVA (1) (1).pptx
PDF
Separata estadistica general - aula virtual
DOCX
EDUCACION
DOCX
Taller tecnologia
DOCX
I unidad Estadistica General
DOC
Es tadistica guia teorica unidad i microsoft word
DOC
Es tadistica guia teorica unidad i microsoft word
DOCX
La Estadística trabajo tipo estadistica ensayo.docx
PDF
Modulo Estadística 2011
PDF
Trabajo Tecnologia.pdf
PPSX
Estadistica descriptiva
Estadistica Descriptiva Lila_Romero
Trabajo estadistica yenni (1)
Metodos estadisticos
Estadistica
PROYECTO DE AULA MATEMATICAS
Proyecto de aula matematicas
Proyecto de aula asignatura matematicas
Investigacion estadisitica
Presentacion Slideshare
LGE. CLASE 1_PRODUC. Y ANAL. DE INF. EDUCATIVA (1) (1).pptx
Separata estadistica general - aula virtual
EDUCACION
Taller tecnologia
I unidad Estadistica General
Es tadistica guia teorica unidad i microsoft word
Es tadistica guia teorica unidad i microsoft word
La Estadística trabajo tipo estadistica ensayo.docx
Modulo Estadística 2011
Trabajo Tecnologia.pdf
Estadistica descriptiva
Publicidad

7. metodologia y estadistica aplicada a la educacion

  • 1. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  LGE ESPACIO CURRICULAR METODOLOGÍA Y ESTADÍSTICA APLICADA A LA EDUCACIÓN Autores:  Dra. Marta Graciela del Valle Pece  Mg. Ing. Margarita Juárez de Galíndez  Mg. Lic. María Mercedes Simonetti 1 
  • 2. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE PROGRAMA DE ESPACIO CURRICULAR UNIDAD I: Estadística Concepto. Etapas en el trabajo estadístico. Estadística Descriptiva e Inferencial. Variable: concepto. Clasificación de variables. Series simples. Agrupamiento de datos en series de frecuencias. Frecuencias absolutas. Frecuencias relativas. Porcentajes. Frecuencias acumuladas, frecuencias relativas acumuladas y porcentajes acumulados. Tasas de uso común: de escolarización, de analfabetismo, de desgranamiento, de retención. UNIDAD II: Presentación de dat os est adísticos. Partes funcionales y construcción de tablas estadísticas. Elementos estructurales de las tablas. Tablas simples, cruzadas. Análisis de tablas estadísticas. Técnicas de representaciones gráficas. Reglas de construcción. Gráficos según los distintos tipos de variables. UNIDAD III: Medidas de resumen. Medidas de tendencia central. Media aritmética, mediana y moda. Comparación de media, mediana y moda. Distribuciones simétricas y asimétricas. Medidas de dispersión. Rango, variancia y desviación estándar y desviación mediana. Coeficiente de variación. Medidas de localización. Percentiles y rango percentil. Aplicaciones. UNIDAD IV: Nociones element ales de probabilidad. Inferencia estadística. Experimentos aleatorios: conceptos básicos. Probabilidad clásica, frecuencial y axiomática. Teorema de la suma y del producto de probabilidades. Tabla de contingencia. Cálculo de probabilidades. Distribución de probabilidades de variables aleatorias discretas: Uniforme y Binomial. Cálculo de probabilidad en variables aleatorias continuas: distribución normal y distribución normal estándar. Población. Definición de muestra aleatoria. Diseños de muestreo. Muestreo al azar simple. Muestreo sistemático. Muestreo por estratos. Muestreo por conglomerados. Concepto. Estimación puntual y por Intervalos de confianza para muestras grandes en el Muestreo al Azar Simple. 2 
  • 3. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  UN I DADES I  y I I INTRODUCCIÓN La palabra Estadística proviene del latín status (estado). Precisamente la primera aplicación de la estadística consistió en la recopilación de datos y la construcción de gráficos para describir el estado de un país. Con el correr del tiempo esta herramienta fue evolucionando hasta que en la actualidad podríamos decir que no hay aspectos de la vida cotidiana donde no se aplique la Estadística. Hogares, gobiernos y negocios se apoyan en datos estadísticos para dirigir sus acciones. El objetivo que se persigue con este módulo es proporcionar al docente herramientas y técnicas para obtener datos, procesarlos para obtener información que sirva para la interpretación correcta de fenómenos que se producen en su ámbito de trabajo. ESTADÍSTICA. CONCEPTOS. La Estadíst ica es una colección de métodos para planear experimentos, obtener datos, y después organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en ellos (Triola, 2004). Otra definición considera a la Estadística como una disciplina perteneciente a la Matemática Aplicada que se dedica al estudio cuantitativo de fenómenos colectivos. Proporciona los métodos para: · La recolección de datos · Su ordenamiento, resumen y presentación, · Su análisis e interpretación y · Posterior enunciado de conclusiones. Los cuatro pasos que se han enumerado constituyen las etapas del trabajo estadístico. La primera etapa tiene como objetivo recolectar datos proveniente de medición, conteo u observación efectuado sobre el material objeto de estudio en base a un plan formulado según los principios del diseño experimental y las técnicas de muestreo. 3 
  • 4. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE La segunda etapa consiste en ordenar los datos en tablas estadísticas, presentarlos mediante gráficos y diagramas y resumirlos a través del cálculo de promedios, porcentajes e índices. En la tercera etapa se analizan los resultados obtenidos en la etapa anterior, y comienzan a distinguirse las características del fenómeno, lo que permite utilizar diferentes métodos para analizarlos e interpretarlos. En la última etapa se debe concluir acerca del estudio realizado. Si las conclusiones, se refieren exclusivamente a los datos de los que se dispone (una parte de la población que se desea estudiar), se dice que la Esta dísti ca es Descriptiva . Si por el contrario, las conclusiones van más allá de los datos que se dispone y se refieren a un conjunto mayor (población), del cual se extrajeron, se dice que la Esta dí stica es Inf erencial ; las conclusiones van de lo particular (muestra) a lo general (la población).Esta se basa en el estudio de la teoría de probabilidades que nos permite medir el error de nuestras afirmaciones. Las est adísticas (en plural) se obtienen como resultado del trabajo estadístico y están constituidas por porcentajes, promedios, tablas, gráficos y otros elementos que describen un fenómeno y ayudan a su comprensión (Ej.: estadísticas demográficas, estadísticas del fútbol, estadísticas de accidentes de tránsito, estadísticas universitarias, etc.). Es necesario definir algunos conceptos importantes: por ejemplo Población. Se define población como el conjunto de individuos u objetos que comparten una característica común, en la que el investigador está interesado. Muestra. Es un subconjunto de la población. Debe ser representativa, es decir se deben mantener las mismas características de la población en estudio. Una población puede ser finita o infinita. Población finita Una población finita es aquella que puede ser físicamente listada Población infinita. Una población es infinita, cuando en la práctica no puede ser físicamente listada 4 
  • 5. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Ejempl o. Una población puede ser definida como los alumnos de la escuela San Francisco. Los alumnos pueden ser listados e individualizados a través de los registros áulicos. Es un ejemplo de pobl a ción f inita . Personas portadoras de SIDA en Santiago del Estero, constituyen un ejemplo de pobl a ción i nfinita . Unidad de observación: es aquélla sobre la cual se efectúan las mediciones u observaciones. La unidad de observación puede ser una persona, una familia, una planta, una parcela, etc. Dat o: es el valor que se obtiene de la medición, observación o conteo efectuada en la unidad de observación o unidad de muestreo. Por ejemplo si el objetivo de una investigación es el rendimiento de los alumnos, la unidad de observación es el alumno. El número de materias rendidas contadas en un alumno es el dato. El conjunto de datos obtenidos de cada unidad de observación constituirá la base para el análisis estadístico del rendimiento de los alumnos de la escuela San Francisco. Va ri a bles. Concepto y ti pos. Variable. Una variable es cualquier característica que varía de una unidad de muestreo a otra en la población o en la muestra Ejempl o 1: Supóngase que interesa conocer la salud de los alumnos, entonces la variable a observa r en cada alumno será el esta do de sa l ud, el que podrá asumir dos valores: sano o enfermo. Ejempl o 2: Si interesa saber el número de herma nos que posee ca da a lumno, se tendrá valores que van desde 0(ningún hermano), 1, 2...,n y se deberá contar cuantos hermanos posee cada alumno. 5 
  • 6. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Ejempl o 3: Si el objetivo de un estudio fuera la ta lla alcanzada por alumnos, se debe medir la variable altura la que, expresada en metros podrá tener valores mayores a 1 metro. En los tres ejemplos anteriores, el nombre de la variable y la forma de obtener sus valores está resaltado en negrita. En el primer ejemplo, los valores que puede asumir la variable son calidades, por lo que se dice que la variable es cualitat iva. Las calidades o categorías pueden ser naturales como al definir la variable sexo, o arbitrarias como la clasificación de alturas en bajas, medianas y altas. Por el contrario, en los otros dos ejemplos los valores que asumen las variables pueden expresarse mediante números, por lo que las dos últimas variables son cuant it ativas. En el caso de número de hermanos, la variable toma sólo determinados valores en el intervalo que va de cero a n por lo que se la denomina variable cuantitat iva discreta o discontinua; cuando la variable toma los infinitos valores dentro del intervalo se dice que la variable es cuantitat iv a continua Otra forma de clasificación de las variables es mediante el empleo de cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. Cuando se manejan datos reales el nivel de medición es importante ya que orienta sobre el procedimiento estadístico a utilizar. Un nivel de medición es nominal cuando los valores de variables son nombres, etiquetas o categorías y no se puede establecer un orden entre ellos. Ejempl o: colores de ojos, estado de salud, lugar de nacimiento de un alumno. Aunque las ciudades pueden ser ordenadas según su tamaño, densidad poblacional, grado de contaminación del aire, etc., en general, la variable “lugar de nacimiento” no tiene un orden establecido Con estos datos no es posible realizar cálculos. A veces se asignan números a las diferentes categorías; a la variable salud que posee dos valores sano y enfermo, podemos codificarlas numéricamente de la siguiente manera 1= sano, 2= enfermo pero esto no es nada más que una codificación y tales números no tienen significado computacional. Un nivel de medición es ordinal cuando se puede establecer un orden entre las categorías de la variable. Ejemplo: máximo nivel de instrucción alcanzado por los padres de los alumnos: analfabeto, primario, secundario, terciario, universitario. 6 
  • 7. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Lo único que podemos decir es que el nivel de instrucción secundario es mayor que el primario y que el universitario es mayor que el primario, secundario o terciario, pero no podemos decir cuanto mayor es una categoría de la variable respecto a la otra. Supongamos que se codifican dichos niveles con 1, 2, 3, 4 y 5. Si bien se podría hacer la diferencia entre 2­1=1 y 4­3=1, este resultado 1 no significa que entre el primario y el analfabeto hay la misma cantidad de conocimiento que entre el universitario y el nivel terciario. Otro niv el de medición es el de int erv alo. En este nivel la diferencia entre dos valores de datos tiene un significado. En este nivel no hay un cero natural, donde nada de la cantidad esté presente. El valor del cero es convencional Ejempl o: La variable Temperatura está medida en escala de intervalo. Un termómetro por ejemplo, mide la temperatura en grados que son del mismo tamaño en cualquier punto de la escala. Aquí no existe un punto de partida natural, el valor 0° es arbitrario y no representa la ausencia total de calor. La diferencia entre 20ºC y 21ºC es la misma que entre 12ºC y 13ºC Se pueden realizar operaciones de suma y resta pero no cociente entre valores. Por último el nivel de medición de razón o cociente aunque se parece al nivel de medición de intervalo tiene un punto de partida o cero inherente (donde cero indica que nada de la cantidad está presente). Para los valores en este nivel tanto las diferencias como los cocientes tienen significado. En este nivel se pueden realizar todas las operaciones. Ejemplo: Los precios de los libros de texto (0$ representa ningún costo y un precio de $60 es dos veces más costoso que uno de $30). 7 
  • 8. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Datos Variable  Variable  Categórica o  numérica o  cualitativa  cuantitativa  Escala  Escala  Escala de  Escala de  nominal  ordinal  intervalo  razón  minal  Seri es de datos. Series si mples El conjunto de valores de una variable constituye una serie de datos. Se presentan a continuación series de datos referidas a los tres ejemplos que se dieron para ilustrar tipos de variables: Ejemplo 1: En el año 2004, se examinan 30 alumnos de un Curso de EGB1 de la escuela San Francisco y se anota su estado de salud (S=Sano, E=Enfermo). Generalmente las variables se designan con las últimas letras del abecedario en mayúscula por ej. X y los valores que toma la variable con x minúscula; incluso se coloca x i donde el subíndice i indica el número de individuo observado; de éste modo las 30 observaciones son: x i : S, S, E, E, E, S, S, E, S, S, S, S, S, E, S, S, S, S, E, S, S, S, S, S, S, S, S, S, S, S. El subíndice “ i “ varía de 1 a 30. Así, x1 = S; x7 = S; X14 = E; . . . x30 =S. Ejempl o 2: Un maestro de la Escuela San Martín interroga a sus 30 alumnos de primer grado de EGB1 sobre el número de hermanos que poseen. Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0.  8 
  • 9. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE El subíndice “i“ va desde 1 a 30 y entonces x1 = 4; x5 = 0; x12 = 5; . .; x30 =0. Ejemplo 3: Un maestro mide la talla de sus 25 alumnos de Sección Maternal de la Escuela San Francisco la que expresada en cm es la siguiente: xi(cm): 70,75,74,87,92,89,72,83,84,79,98,99,95,87,84,85,79,78,95,99,97,84,86,78, 74. Ahora “i” va desde 1 a 25, entonces x1 = 70; x2 = 75; . . .; x25 =74. Los datos en brut o, t al cual fueron obt enidos, sin agrupar const it uyen una serie simple. Tablas y gráficos Orga ni za ci ón de datos ca tegóricos o cua litativos. Cuando la masa de datos obtenidos es muy grande y éstos están desordenados, no dan información alguna; conviene por lo tanto ordenarlos y tabularlos, haciendo uso de tablas estadísticas, que deben confeccionarse de tal modo que los datos resulten fáciles de ser leídos e interpretados. Con los datos del ejemplo 1 se puede construir una tabla de frecuencias. Tabla de frecuencias. Una tabla de frecuencias para variable cualitativa, es una tabla que asocia cada categoría de la variable con el número de veces que se repite la categoría. Tabla 1. Alumnos de un curso EGB1, de la Escuela San Francisco, según estado de salud. Año 2004. i Categorías:xi Frecuencias: fi (Estado de salud) (nº de alumnos) 1 Sano 24 2 Enfermo 6 Total 30 Fuente: Datos ficticios 9 
  • 10. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Frecuencia absoluta: Es el nº de veces que se repite cada categoría de la variable. Se la simboliza con fi. La suma de las frecuencias absolutas, es igual al nº total de observaciones, 2  å  f i  en éste caso 30 ( = 1 =30). Nótese que “ i “ ahora se refiere a las i  categorías, x1 = Sano, f1 = 24; x2 = Enfermo, f2= 6. La tabla de frecuencias, es la más sencilla de las tablas y es una tabla de simple entrada pues los individuos se clasifican según una única variable, estado de salud en el ejemplo . Los datos organizados en tabla de simple entrada para variable cualit ativa, pueden presentarse mediante gráficos, que tiene la finalidad de que la información entre por los ojos. El gráfico que puede usarse en éste caso es el gráfico de barras. Gráfico 1a. Alumnos de un curso EGB1, de la Escuela San Francisco, según estado de salud. Año 2004.  30  25  Nº de alumnos  20  15  10  5  0  Sanos  Enfermos  Estado de salud  Fuente: Datos ficticios . Para su construcción se utiliza el sistema de coordenadas ortogonales. Sobre el eje horizontal se colocan las distintas categorías de la variable en estudio (estado de salud) y sobre el eje vertical con una escala adecuada, se representan las frecuencias. Se dibujan barras de ancho 1 0 
  • 11. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE constante, una para cada valor de la variable, con una altura que representa el valor de la frecuencia que corresponde a cada categoría. Es conveniente que la separación entre las barras sea menor que el ancho de las mismas. El ancho de las barras debe elegirse teniendo en cuenta el espacio disponible, el número de categorías de la variable a representar y la altura que les corresponde, con el objeto de obtener un gráfico proporcionado. Las barras pueden dibujarse en sentido vertical u horizontal. Gráfico 1b. Alumnos de un curso EGB1, de la Escuela. San Francisco, según estado de salud. Año 2004 Estado de salud  Enfermos  Sanos  0  5  10  15  20  25  30  Nº de alumnos Fuente: Datos ficticios En algunos trabajos es necesario calcular frecuencias relativas. Frecuencia relativa de una categoría es la proporción de veces que ocurre dicha categoría. Se obtiene dividiendo la frecuencia absoluta de cada categoría entre la suma de las frecuencias de todas las categorías. La suma en éste caso es f1 + f2 = 24 + 6 = 30, y se expresa literalmente mediante el signo å que se denomina sumatoria, así  i  = 2  å  i  = 1 fi  = f  1  + f  2  = 24  + 6  = 30  1 1 
  • 12. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE a la frecuencia relativa de la clase i­ésima se la simboliza con fri y se la calcula de la siguiente manera:  f i  fr  = i  å f i La suma de las frecuencias relativas es siempre igual a 1. n  å fri   = 1  i  =1  Si se multiplica las frecuencias relativas por 100 se obtienen porcent ajes. En éste ejemplo sería: Tabla 2. Alumnos de un curso EGB1, de la Escuela. San Francisco, según estado de salud. Año 2004. i xi fi f ri Porcentajes: (Estado de salud) % 1 Sano 24 24/30=0,80 80 2 Enfermo 6 6/30=0,20 20 Total 30 1.00 100 Fuente: Datos ficticios Se pueden representar los datos de la tabla 2 mediante un gráfico de barras, sólo que en el eje vertical van los porcentajes. Gráfico 2. Alumnos de un curso EGB1, de la Escuela San Francisco, según estado de salud. Año 2004. % 100  80  60  40  20  0  sanos  enfermos  Estado de salud  Fuente: Datos ficticios  1 2 
  • 13. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Otro gráfico adecuado para representar series de frecuencias de variable cualitativa es el gráfico de sectores circulares, llamado gráfico de tortas o pie charts . Tabla 3. Alumnos de un curso EGB1, de la Escuela San Francisco, según sexo. Año 2004 Sexo fi f ri 360ºxf ri (nº de alumnos) Varones 15 0,38 137º Mujeres 25 0,62 223º Total 40 1,00 360º Fuente: Datos ficticios Se elige un radio por ej 3cm (el valor del radio se elige según el espacio que se disponga para el gráfico) y se grafica un círculo. La superficie de dicho círculo representa el total de alumnos (40), en consecuencia, le corresponde un ángulo de 360°. Se puede discriminar mediante sectores circulares la porción que corresponde a las mujeres y a los varones. Los grados correspondientes a los sectores se obtienen multiplicando la frecuencia relativa por 360º. Gráfico 3. Alumnos de un curso EGB1, de la Escuela. San Francisco, según sexo. Año 2004 Varones  Mujeres 38%  62%  Fuente: Datos ficticios  1 3 
  • 14. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Va ri a bles cua ntitativa s. Ejemplo: Nº de hermanos que tienen los alumnos de primer grado de EGB1 de la escuela San Martín Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0 Para el caso de v ariables cuantitat ivas discretas, la tabla de frecuencias se construye de la siguiente manera: se ubica el valor mayor y el menor valor de la variable (en el ejemplo 2 del n° de hermanos por alumno, el menor valor es cero y el valor mayor 6), se colocan todos los valores correspondientes en la primera columna de la tabla, y luego se cuentan las veces que se presentan dichos valores. La tabla resultante es: Tabla 5. Alumnos de primer grado de EGB1 de la escuela San Martín según Nº de hermanos Xi fi Fi fr % 0 5 5 0,17 17 1 5 10 0,17 17 2 6 16 0,20 20 3 3 19 0,10 10 4 4 23 0,13 13 5 3 26 0,10 10 6 4 30 0,13 13 Total 30 1,0 100 Fuente: Datos ficticios La diferencia que existe entre cada clase es constante e igual a 1. Además de las frecuencias relativas (cuyo cálculo se explicó en párrafos anteriores) aquí se puede calcular también las frecuencias acumuladas Fi. La frecuencia acumulada de una clase se obtiene sumándole a la frecuencia de la clase, la frecuencia de las clases anteriores. F (0)=5 F (1)=5+5=10 F (2)=5+5+6=16 = Fi (1)+6 La tabla de frecuencias para variables cuantitativas discretas se representa mediante un gráfico de bastones. En la abscisa se colocan los valores de la variable y se levanta para cada uno de ellos una línea de altura igual a su frecuencia. 1 4 
  • 15. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Gráfico 4. Alumnos de primer grado de EGB1 de la escuela San Martín según Nº de hermanos  6  5  4  frecuencia  3  2  1  0  0  1  2  3  4  5  6  Número de hermanos  Fuente: Datos ficticios Int erpretación: El número 6 en la columna de fi significa que 6 alumnos tienen 2 hermanos El número 19 en la columna Fi significa que 19 alumnos tienen 3 hermanos o menos El número 20 en la columna de porcentajes significa que el 20% de los alumnos tienen 2 hermanos Para el caso de variables cuantit ativas continuas como los datos del ejemplo 3 (altura en cm. de 25 alumnos de una sección maternal de la Escuela San Francisco) que fueron obtenidos por medición, se recomienda construir intervalos de clase, cuya amplitud depende de la cantidad de intervalos que se deseen construir y la cantidad de datos que posee la serie simple. Es recomendable que los intervalos de clases sean iguales, es decir que la amplitud de los mismos (a) sea constante. La técnica a emplear para el agrupamiento de una serie simple de variable cuantitativa continua es sencilla. 1 5 
  • 16. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE xi (cm): 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85, 79, 78, 95, 99, 97, 84, 86, 78, 74 1. ­Se ubica el valor mayor que toma la variable (99 cm) y el valor menor (70 cm). 2. ­ Se obtiene la diferencia, la que se denomina Rango o amplitud de variación y se designa con la letra R.  R = x  - x  = 99 - 70 = 29  max min  3.– El número de intervalos aproximado se puede calcular con la siguiente fórmula:  log(n + 1)  n   de intervalos = ° log(2)  dónde n: n° de valores de la serie o tamaño de la muestra log: logaritmo decimal  log(  + 1  25  )  n °de int erv  = .  = 4 7004 » 5 int ervalos  .  log(  )  2  Cuando en la variable que se estudia existen intervalos predeterminados, el número de clases o intervalos dependerá de la amplitud que se usa habitualmente. 4. ­ El rango se divide entre el nº de clases o intervalos de clases, 5 para éste ejemplo, (se recomienda que el número de intervalos no sea menor que 5, ni mayor de 15, pues en el primer casos se reduce demasiado la información y en el segundo no se cumple con el objetivo del agrupamiento) obteniéndose una idea aproximada de la longitud o amplitud del intervalo de clase.  Rango  29  a =  = = 5 8 @ 6  .  n º de int ervalos  5  Éste valor de amplitud es orientativo, por lo que se decide tomar una amplitud de intervalo 5 cm para facilitar el agrupamiento. 5.­ Se delimitan las clases buscando preferentemente valores enteros para sus límites. Se debe elegir el límite inferior del 1er intervalo de tal manera que contenga al menor valor de la serie (70 cm). La elección recae en el 70. El límite superior del 1er intervalo, se obtiene sumando al Li la amplitud. 1 6 
  • 17. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Li del 1er intervalo = 70 Ls del 1er intervalo = Li + a= 70 + 5 = 75 El límite inferior del 2do intervalo debe coincidir con el límite superior del primer intervalo. Li del 2do intervalo = 75 Ls del 2do intervalo Li + a= 75+ 5 = 80 El límite inferior del 3er intervalo debe coincidir con el límite superior del 2do intervalo, y así sucesivamente, hasta que el límite superior del último intervalo, contenga el valor observado más alto de la variable. 6.­ Una vez formadas las clases se procede al conteo, que consiste en determinar el nº de observaciones (frecuencias) de cada clase. Una manera sencilla de hacerlo es leyendo la serie simple y ubicando mediante marcas cada valor de la variable en su clase correspondiente. De ésta manera cuando se termine de pasar lista a la serie simple, el agrupamiento ha sido efectuado. Tabla 6. Alumnos de Sección maternal de la escuela San Francisco según su altura. Intervalo de clase xi fi fri (altura en cm) (marca de clase) 70 a 75 72.5 4 0.16 75 a 80 77.5 5 0.20 80 a 85 82.5 4 0.16 85 a 90 87.5 5 0.20 90 a 95 92.5 1 0.04 95 a 100 97.5 6 0.24 Total 25 1.00 Fuente: Datos ficticios Un problema que se puede presentar es el siguiente: si un valor de la variable coincide con uno de los límites del intervalo, por ejemplo la altura 95 cm ¿dónde se lo ubica? ¿en el quinto o en el sexto intervalo de clase? La respuesta es: puede ubicarlo en cualquiera de los intervalos, pero si se elige un criterio se lo debe respetar hasta el final del agrupamiento. En éste ejemplo al nº 95 se lo ubica en el 6° intervalo, de la misma manera, cuando aparezca por ejemplo un valor 85, debe ser anotado como perteneciente al intervalo en el que el nº 85 se encuentra como límite inferior. El intervalo de clase es cerrado en el límite inferior y abierto en el superior. Esto se indica de la siguiente forma [75 80  los valores del ;  )  intervalo van desde 75 a 79,9999. 1 7 
  • 18. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 7.­ Se agrega una tercera columna, titulada “marca de clase” o “punto medio de clase” que se designa con xi que contiene los valores correspondientes a los puntos medios de cada uno de los intervalos y se calcula así:  Li  + Ls  1  1  70 + 75  x1 =    = = 72 5  ,  2  2  Li  + Ls 2  75 + 80  x 2 =  2  = = 77 5  ,  2  2  También se puede calcular de la siguiente manera  x 2 =  x  + a  = 72 5 + 5 = 77 5  1  ,  ,  Al efectuar el agrupamiento, se pierde detalle de la información ya que, por ejemplo, de los valores que resultaron ubicados en la primera clase, sólo se sabe ahora que se encuentran entre 70 y 75. Por eso, en caso de ser necesario asignar un valor a cada uno de ellos, como es en el cálculo de la media aritmética a partir de la tabla de frecuencias, se opta por pensar que todos tienen igual valor, que es el correspondiente al punto medio de clase. Un gráfico adecuado para representar una serie de frecuencias de variable cuantitativa continua es el hist ograma (gráfico nº 5). Su construcción es fácil. Se utiliza el sistema de coordenadas cartesianas ortogonales. En el eje de las ordenadas (vertical) se marcan las frecuencias (fi) y en el de las abscisas (horizontal), la variable según la cual se efectuó la clasificación (altura). Consiste en rectángulos adyacentes (uno por cada clase) con bases materializadas por la amplitud de clases (5 cm). La altura está dada por la frecuencia correspondiente a la clase. Cuando las clases son iguales, el área del histograma es proporcional a la frecuencia total. 1 8 
  • 19. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Gráfico 5.Alumnos de Sección maternal de la escuela San Francisco según su altura 7  6  5  4  Nº alum. 3  2  1  0  70  75  80  85  90  95  100  Altura (cm)  Fuente: Datos ficticios Otro gráfico adecuado para representar la serie de frecuencias de variable cuantitativa continua es el polígono de frecuencias (gráfico 6). Se emplea para su realización el sistema de coordenadas cartesianas ortogonales. Se coloca la variable clasificadora en el eje horizontal y las frecuencias en el vertical. La construcción es sencilla, se marcan tantos puntos como pares de valores (xi,fi) o sea marcas de clase, frecuencias haya en la tabla. En la tabla Nº 6 vemos que hay 6 pares de valores; el primer par tiene abscisa 72,5 y ordenada 4 y así sucesivamente hasta marcar el sexto par. Luego se unen los puntos mediante trazos rectos. Algunos autores, en su afán de mantener la proporcionalidad entre la superficie y la frecuencia aconsejan cerrar el polígono de frecuencias uniendo el primer punto con la marca de clase inmediata anterior y el último punto con la inmediata superior; en éstos dos casos la unión de los puntos se realiza con trazos cortados. La principal ventaja de los polígonos de frecuencias consiste en que ellos permiten dibujar en el mismo sistema de eje dos o más polígonos correspondientes a series diferentes que tengan similar posición sobre el eje de las x, así se puede compararlos, lo cual resulta engorroso efectuar con los histogramas a causa de la superposición de las superficies de los rectángulos.  1 9 
  • 20. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  Gráfico 6.Alumnos de Sección maternal de la escuela San Francisco según su altura 7  6  Nº de alum nos  5  4  3  2  1  0  65  70  75  80  85  90  95  100  105  Altura(cm)  Fuente: Datos ficticios Como cada miembro de una población presenta diversas características, se puede necesitar clasificarlos de acuerdo a dos de ellas. Cuando el número de individuos medidos es pequeño, se enumeran todos los pares de observaciones, si alguno de ellos aparece dos veces, se lo repite y la presentación suele hacerse de modo que una de las dos variables esté ordenada. Tabla 9. Alumnos de una escuela según su peso y altura. Peso 39 40 41 42 43 43 44 45 50 52 (kg) Alt (m) 1,27 1,30 1,30 1,31 1,34 1,35 1,37 1,39 1,45 1,49 Fuente: Datos ficticios Para representar estos datos que corresponden a dos variables cuantitativas continuas se utilizan los g ráf icos de dispersión o scatter plot , que se construye de la siguiente manera: se coloca una de las variables en las abscisas o eje horizontal, por ejemplo la altura y la otra variable, el peso, en el eje vertical, con sus escalas correspondientes, luego se marcan tantos puntos como pares de valores (xi, yi) se tengan. 2 0 
  • 21. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  Gráfico 7. Alumnos de una escuela según su peso y altura 1,55  1,5  1,45  Al tura (m)  1,4  1,35  1,3  1,25  35  40  45  50  55  Peso (kg)  Fuente: Datos ficticios Éste gráfico sirve para mostrar la relación entre las dos variables y se usa cuando para el mismo valor de xi se tiene diferentes valores de yi. Si esto no ocurre puede utilizarse el gráfico lineal, que se construye de igual manera que el anterior, con la única diferencia que se unen los puntos. Éste gráfico, se suele emplear, especialmente, en los casos donde la variable que se representa en el eje horizontal es el tiempo. De éste modo se puede ver la evolución de la otra variable en el período considerado. Pueden representar simultáneamente en el mismo gráfico dos o más variables, como se observará al representar gráficamente los datos de la tabla Nº 10 Tabla 10. Inasistencias mensuales de alumnos de Segundo grado A de EGB1 de la Escuela San Martín según sexo Meses N° de inasist. Mujeres Varones Marzo 3 4 Abril 5 7 Mayo 2 4 Junio 6 5 Julio 8 8 Agosto 4 5 Sept. 3 4 Octubre 4 3 Noviem. 5 2 Diciem. 1 6 Fuente: Datos ficticios 2 1 
  • 22. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  Gráfico 8. Inasistencias mensuales de alumnos de Segundo grado A de EGB1 de la Escuela San Martín según sexo 9  Mujeres  8  Varones  7  Nº de inas is tenc ias  6  5  4  3  2  1  0  M  A  M  J  J  A  S  O  N  D  Meses  Fuente: Datos ficticios Cuando los pares de valores son muy numerosos, las tablas se presentan según lo muestra la tabla 11; en éste caso se dice que las tablas son de doble entrada pues son dos las variables de clasificación. Tabla 11. Alumnos de la escuela Nº 42 según ocupación de la madre y lugar de residencia. Ocupación Barrios Total de la Madre A B C A. de casa 400 500 200 1100 Profesional 200 200 50 450 Empleada 300 400 100 800 Total 900 1100 350 2350 Fuente: Datos ficticios En este ejemplo cada alumno se caracteriza según la variable Ocupación de la madre (variable cualitativa nominal) y Barrio de residencia (variable cualitativa nominal). 2 2 
  • 23. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Los valores que se encuentran en la celda son frecuencias, es decir representan la cantidad de alumnos que comparten las dos características. Las partes de una tabla son: La ma triz , formada por la primera fila, lleva los encabezamientos de las columnas y / o la primera columna que titula a las filas. El cuerpo constituido por celdas. La información proporcionada por los valores de las celdas se completa con la suministrada por los encabezamientos de las filas y columnas; en las celdas se encuentra la frecuencia, es decir la cantidad de elementos o individuos que poseen las dos características. Por ejemplo el 100 de la última celda significa que en esa escuela hay 100 alumnos que viven en el Barrio C y cuyas madres son empleadas. El gráfico que se utiliza para representar éste tipo de tablas es el gráf ico de barra s compuesta s (gráfico 9) y el gráfi co de barra s a grupa da s (gráfico 10). Gráfi co de barra s compuesta s La construcción del gráfico de barras compuestas es sencilla. Se comienza dibujando las barras como si fueran simples es decir con las alturas correspondientes a los totales y luego se yuxtaponen los valores parciales hasta alcanzar el de su suma. En el ejemplo, Barrio A, se procede de la siguiente manera: se marca una barra de altura 900, en ella se indica la subdivisión que corresponde a alumnos cuyas madres son amas de casa con el valor 400; para marcar el nº de alumnos que es 200, se marca 400+200=600 en el eje vertical lo que queda corresponde nº de alumnos cuyas madres son empleadas. De igual manera se procede con los barrios B y C. 2 3 
  • 24. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Gráfico 9. Alumnos de la escuela Nº 42 según ocupación de la madre y lugar de residencia  1200  Empleada  Profesional  1000  Nº de alumnos  A. de casa  800  600  400  200  0  A  B  C  Lu gar  de  r e sid en cia  Fuente: Datos ficticios Gráfi co de barra s a grupa da s Sirven para representar fenómenos similares a los que originan barras compuestas. La diferencia con éstas estriba en que, para cada valor de la variable independiente “x” en éste ejemplo lugar de residencia, se dibujan grupo de barras . El número de barras en cada grupo es el del número de categorías de la segunda variable, en este ejemplo ocupación de las madres. Gráfico 10. Alumnos de la escuela Nº 42 según ocupación de la madre y lugar de residencia  600  A. de casa  Prof esional  500  Empleada  Nº de alumnos  400  300  200  100  0  A  B  C  Lu gar  de  r e sid en cia  Fuente: Datos fict ic ios 2 4 
  • 25. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Otro tipo de gráficos son los gráficos de figuras o pictogramas. Son los más indicados para publicaciones de divulgación popular , por su fácil e inmediata interpretación. Consisten en dibujos esquemáticos y relacionados con el fenómeno a representar. Cada figura es equivalente a una cantidad determinada, preferentemente entera, de unidades de la variable dependiente y el número de unidades no su tamaño, es proporcional a la magnitud a representar. Cart ogramas: Se emplean cuando es importante señalar la distribución geográfica de un determinado acontecimiento, razón por la cual se construyen sobre planos o mapas. Cart ogramas de señalización (Gráfico 11): Sirven para indicar la distribución de una variable cualitativa sobre una base geográfica. Mediante figuras, colores o diferentes rayados se señala que hay en lugares determinados. Gráfico 11. Qué es lo que caracteriza a cada provincia argentina. Fuente: Pensando en Plural. División de educación tributaria. AFIP. Mayo 2005. ISBN Nº987­9101­26­X 2 5 
  • 26. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE En este mapa, se observa lo que caracteriza a cada provincia argentina. Por ejemplo en Santiago del Estero las aguas termales; en La Pampa la producción de trigo, etc... Cart ogramas de densidad: además de indicar que hay y dónde, de ellos se puede obtener la información de cuánto hay. Mediante diferente rayado o colores y también utilizando barras sobre la base geográfica, se puede expresar la cuantía del fenómeno como así también su ubicación. Suelen utilizarse pictogramas, gráficos de líneas, en general cualquiera de los descriptos, sobre el mapa o plano. Resumiendo: los datos se ordenan, clasifican y presentan en formas de tablas. Las tablas pueden de ser de simple entrada(cuando los individuos se clasifican según una variable), de doble entrada(cuando los individuos se clasifican según dos características) y de triple o más entradas (cuando se clasifican los datos según tres o más variables).Las tablas se complican a medida que se agregan más variables, por lo tanto es preferible varias tablas sencillas a una complicada. Toda tabla debe llevar título, el cuál debe responder a las preguntas ¿Según?, ¿Qué?, ¿Cuándo? y ¿Dónde?. No se debe olvidar la fuente de datos que indica de donde proviene la información. Se debe incluir los totales. En caso de expresar los datos en porcentajes, deben indicarse los totales de los cuales provienen. Con respecto a los gráficos, éstos constituyen una de las formas más útiles de presentación de datos estadísticos. Su importancia reside en las múltiples formas que pueden adoptar, lo que permite su aplicación a una amplia gama de finalidades: didácticas, de investigación, etc. Sirven para mostrar la relación entre una o más variables. La variedad de tipo de representaciones gráficas exige una cautelosa elección de acuerdo a su finalidad. La selección de la presentación gráfica debe, por lo tanto tener los siguientes aspectos: Tipo de análisis estadístico, características y número de los fenómenos o variables a representar y público al que va dirigido. 2 6 
  • 27. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Recomendaciones para la construcción correcta de un gráfico. Una vez elegido el tipo de gráfico adecuado, es conveniente no descuidar las siguientes consideraciones: · Decidir cuál de las variables es la independiente “x” y cuál la dependiente “y”. · La representación gráfica debe ser sencilla, simple y explicarse por sí misma. · Título se coloca encabezando el gráfico y debe responder a las preguntas; qué, según, cuándo, dónde?. · Fuente de datos. Se coloca al pie del gráfico. · Escalas se elige de tal modo que no alteren la objetividad de la representación, hecho éste muy utilizado para fines publicitarios donde es común ver escalas construidas con el propósito de alterar el fenómeno exagerando ventajas y enmascarando la realidad, o lo que es peor aún eliminando la graduación de los ejes, evitando de ésta forma todo patrón de comparación. Las escalas deben construirse buscando obtener como resultado un dibujo armónico y proporcionado. · Debe nominarse los ejes de modo tal que no quede duda alguna acerca de las variables que en ellos se representan. · No olvidar el corte de ejes en caso de ser necesario. Éste debe efectuarse entre el 0 y el valor mínimo a representar. · Aclaración de las unidades de representación. · Las referencias serán colocadas al pie o al costado del gráfico. · En caso de usarse abreviaturas, éstas serán aclaradas con la debida extensión, en el renglón siguiente al correspondiente a las fuentes. · En lo posible acompañar los gráficos con las tablas estadísticas que lo originen. · Si el tra ba jo lo requiere y es necesario expresar al gunos va l ores en %, deben consignarse la s cifra s de la s cual es provienen éstos porcenta jes. 2 7 
  • 28. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE ÍNDICES El Índice es un indicador útil tanto para fijar situaciones como para hacer un diagnóstico. Cuando interesa comparar los valores de una característica de la educación (matrícula, asistencia de alumnos, número de profesores, etc...) en el tiempo o en el espacio, ya sea comparando dos valores entre sí o todos con uno de ellos se puede realizar un cociente cuyo resultado se denomina Índice simple. Ejemplo: Se desea comparar la matrícula escolar de una escuela en el año 2004 con la matrícula en el año 1994. Si la primera es de 4000 alumnos y la de 1994 es de 2000, el Indice será: 4000 I2004/1994= = 2  2000  Lo que indica que la matrícula en el año 2004 es el doble que la matrícula de 10 años atrás, en esa escuela. El valor que va en el denominador se llama ba se . El Indice del año base es 1: 2000 I1994/1994= 2000  = 1  Con frecuencia se multiplica por 100 los índices con lo que entonces los índices son los porcentajes correspondientes siendo 100 el porcentaje del índice base. Los Índices más comunes utiliz ados en educación son: · Razón de alumnos mat riculados en las escuelas con respecto a la población en edad escolar. N °alumnos  matriculad os  I=  Población en edad  escolar  2 8 
  • 29. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Ejemplo: En el año 2001, en la localidad de La Banda según el INDEC, la población en edad escolar fue de 88735 y los alumnos matriculados fue de 32613. La razón de alumnos matriculados es entonces en ese año de: 32613 I= = 0 37  .  88735  Es decir que solo el 37% del total de la población en edad escolar asiste a la escuela. · Alumnos por maestro en las escuelas primarias. N °  alumnos  I= N °maestros  Ejemplo: Si el total de alumnos de una escuela es de 1000 y el plantel docente informa que hay 40 maestros( Datos ficticios), la razón alumnos por maestro es: 1000 I= = 25  40  Es decir que en esa escuela hay 25 alumnos por cada maestro. · Porcentaje de población analfabeta de 15 años y más. N °  analfabeto  .de 15  s   años  y  más  I= *  100  Población de 15  años  y  más  Ejemplo: En la provincia de Santiago del Estero según el INDEC, en el año 2001 el total de población de 15 años y más fue de 571546 personas. De ellas, 31625 no tenían ninguna instrucción. El Porcentaje de población analfabeta para la provincia es entonces, 31625 I=  *  100 = 5 53  .  %  571546  2 9 
  • 30. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE · Tasa de ausentismo de docent es Es el porcentaje de ausentismo de docentes en un período de tiempo determinado. N º de días de ausencia de todos  los docentes  un período  en  Ta= * 100  N º de días de clase de todos los docentes en ese período  Ejemplo: Si en una escuela hay una planta docente de 115 personas y el total de inasistencias de los docentes(por diversas causas) en el año es de 3101días, la Tasa de ausentismo se calcula como sigue(considere que los días de clase en el año son 180): 3101 Ta= * 100 = 14 98  .  %  115 * 180  · Tasa de desgranamiento Es la proporción de alumnos ingresados al primer grado (o curso) que no lograron culminar todos los grados (o cursos) correspondientes al nivel, en el período establecido.  N º de alumnos que no cul  aron sus estudios en el  período establecid  min  o  Td = * 100  N º de alumnos matriculad  al inicio del  período  os  Ejemplo: Si en el estudio de la cohorte 1974­1980 el número de alumnos matriculados en la Argentina en la escuela primaria al inicio del período es de 729048 y los que no culminaron sus estudios es de 337292 (Fuente: Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. Troquil­Bs.As.­ 1996­Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura: Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE. Año 1999) la Tasa de desgranamiento es: 337292 Td= 729048  = 0 46  .  Es decir que en ese período hay un desgranamiento del 46%. El 46% de los alumnos matriculados al inicio del período no culminaron sus estudios al final del mismo.  3 0 
  • 31. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE · Tasa de retención de la cohort e Es la proporción de alumnos ingresados al primer grado (o curso) que lograron culminar todos los grados (o cursos) correspondientes al nivel, en el período establecido.  N º de alumnos que cul  aron sus estudios en el  período establecid  min  o  Tr = *  100  N º  de alumnos matriculad  al inicio del  período  os  Ejemplo: Si en el mismo período considerado en el ejercicio anterior terminan el 7ª grado 391756 alumnos de los 729048 matriculados, la Tasa de retención será: 391756 = 0 5374  .  Tr= 729048  Es decir que la Tasa de retención es aproximadamente del 54%. El 54% de los alumnos matriculados al inicio del período culminaron sus estudios al final del mismo. · Tasa de escolarización Proporción de la población en edad escolar que está efectivamente escolarizada  N º de alumnos matriculad  os  Ez = *  100  Población en edad  escolar  Ejemplo: La población de 5 años y más para Sgo. del Estero en el 2001 según el INDEC es de 706794 habitantes. De ellos asisten a la escuela 237708. La Tasa de escolarización es: 237708 I= *  100 = 33 63  .  %  706794  Es decir que el 33.63% de la población en edad escolar asiste a la escuela.  3 1 
  • 32. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE GUÍA DE EJERCITACIÓN Actividad 1 Clasifique en base al siguiente listado las variables socio educativas, en cualitativas nominales u ordinales y cuantitativas discretas o continuas Variable Tipo 1­ Religión 2­ Nº de alumnos promocionados por curso 3­ Barrios 4­ Nivel de educación alcanzado por el tutor 5­ Edad de los alumnos 6­ Sexo 7­ Nº de inasistencias mensuales 8­ Altura de los alumnos 9­ Lugar de nacimiento 10­ Peso de los alumnos 11­ Horas de estudio diario 12­ Nº de materias que cursan 13­ Nº de hermanos que tiene cada alumno 14­ Grado de satisfacción por la asignatura 15 Superficie construída por escuela 16 Nº de escuelas por Departamento 17 Categorías de escuela 3 2 
  • 33. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Actividad 2 Los siguientes datos corresponden a Nº de inasistencias de los alumnos de un curso correspondientes al primer cuatrimestre xi : 8 5 3 4 2 5 4 4 10 6 6 7 5 5 3 9 7 2 6 4 9 4 5 0 8 6 5 1 1 4 5 7 2 7 6 4 9 4 5 3 a) ¿Que indica el subíndice i? b) ¿Cuál es la variable que se estudia?. Clasifíquela. c) Ud. debe presentar un cuadro de inasistencias de los alumnos. ¿Cómo construye el mismo? d) Incluya en la tabla: frecuencias acumuladas, frecuencias relativas, porcentaje y porcentaje acumulado correspondiente a cada valor de la variable. e) Presente los resultados con el gráfico apropiado. Actividad 3 En un curso de 50 alumnos de un establecimiento de la Capital del a Pcia. De Sgo. Del Estero, se empleó la técnica de profundización de temas por grupo en el desarrollo de contenidos teóricos. Se distribuyó un cuestionario con la finalidad de determinar la actitud de los mismos ante esta modalidad de estudio. Una de las preguntas estaba referida al grado de conformidad sobre el desarrollo de los contenidos teóricos. Los resultados obtenidos fueron los siguientes: xi : MC MD C I C MC D D MC MC I MC I MC D MC MD C D C MC D MC D MC D MD I C C C MD MC I C MC MC D C MC C MC D MD MC I D MC I MC Donde: MC: muy conforme C: conforme I: indiferente D: disconforme MD: Muy disconforme 3 3 
  • 34. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE a) Indique el tamaño de la muestra b) Ud. debe representar al establecimiento en una reunión de profesores en la que participan distintos Colegios de la Capital. ¿Como presentaría la opinión del alumnado? c) Que título colocaría a la presentación? d) Incluya en la misma frecuencias relativas y porcentajes correspondiente a cada valor de la variable. e) Presente esos mismos resultados con un gráfico de barras simples. f) Indique si corresponde calcular frecuencia acumulada. En el caso de respuesta afirmativa obtenga dicha frecuencia. g) Analice los resultados obtenidos Actividad 4 En un estudio realizado en el Instituto Santo Tomás de Aquino para determinar la zona de influencia del mismo según el lugar de residencia de los alumnos, los resultados obtenidos fueron los siguientes: Alumnos del Instituto Santo Tomás de Aquino según el barrio en el que residen. Barrios Número de alumnos Barrio Belgrano 300 Barrio Cabildo 150 Barrio Contreras 30 Barrio Ejército Argentino 20 Total 500 Fuente: Datos ficticios a) ¿Que representa el número 500? b) ¿Cuál es la variable de clasificación? Indique de que tipo de variable se trata. c) Obtenga frecuencias relativas y los porcentajes correspondientes. d) Determine si corresponde calcular frecuencias acumulada. e) Realice gráfico de tortas. f) ¿Qué otro gráfico puede emplear para representar estos datos? 3 4 
  • 35. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Actividad 5 Los siguientes datos corresponden a la edad de los tutores de alumnos que concurren al EGB de un establecimiento escolar xi : 44 30 45 48 31 45 33 35 54 44 45 47 38 56 29 43 43 62 60 30 52 36 45 31 31 32 34 32 54 55 55 46 61 39 43 38 47 45 38 37 63 49 34 48 34 64 44 47 36 60 50 52 37 41 29 37 49 37 39 56 39 46 46 31 60 29 53 40 41 58 Presentar los datos : a) En una tabla con un número aproximado de intervalos de clase. b) En una tabla con 5 intervalos c) ¿Que gráficos utilizaría para representar los datos contenidos en estas tablas? d) Con la tabla presentada en el item b, realice un histograma. e) Con la tabla presentada en el item a, realice un polígono de frecuencias. Actividad 6 Los siguientes datos corresponden a alumnos analfabetos por Departamento en la Pcia. de Santiago del Estero, discriminados por sexo. Año 2001 Departamento Total Sexo Varones Mujeres Capital 4587 2299 2288 Banda 4752 2461 2291 Río Hondo 3473 1960 1513 Robles 2116 1166 950 FUENTE: INDEC. Censo Nacional de Población, Hogares y Viviendas. 2001. En base a los datos proporcionados en la tabla anterior realice: a) Gráfico de barras simples que muestre el número total de alumnos analfabetos por Departamento. ¿Que otro tipo de gráfico podría utilizar en la representación? b) Gráfico de tortas que muestre el número de alumnos analfabetos discriminados por sexo para el Departamento Robles. c) Realice un gráfico de barras agrupadas por Departamento 3 5 
  • 36. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE d) Realice un gráfico de barras porcentuales por Departamento discriminando dentro de cada una de ellas los porcentajes de varones y mujeres analfabetos. Actividad 7 Utilice un gráfico lineal para mostrar la evolución de egresados del Polimodal Año Nº de egresados 1980 233 1985 278 1990 321 1995 375 2000 391 FUENTE: Datos ficticios Actividad 8 En base a los datos de la siguiente tabla: Población en edad escolar, Nº de alumnos matriculados y Nº de maestros correspondiente a cuatro lugares de la República Argentina. Lugar Población en Nº de Nº de Nº de edad escolar alumnos alumnos no maestros matriculados matriculados A 300000 248.000 7.000 B 150000 106.000 4.000 C 25000 24.000 1.200 D 160000 142.000 4.750 Fuente: Datos Ficticios Calcular para cada lugar: a) Proporción de alumnos matriculados b) Nº de alumnos por maestro c) Tasa de escolarización d) Número de alumnos No matriculados e) Porcentaje de alumnos No matriculados 3 6 
  • 37. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Actividad 9 Dada la siguiente tabla, calcule la retención y el desgranamiento de cada cohorte y en base a los resultados realice el análisis correspondiente Retención y Desgranamiento de la Escuela Primaria. Su evolución en 3 ciclos escolares del período 1964­1980 Ciclo Escolar Alumnos matriculados 1er Grado 7º Grado 1964 ­ 1970 723.264 321.940 1969 ­ 1975 751.049 375.723 1974 ­ 1980 729.048 391.756 Fuente: Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. Troquil­ Bs.As.­1996­Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura: Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE. Año a) Calcule la tasa de desgranamiento b) Calcule la tasa de retención c) Interprete los resultados obtenidos Actividad 10 La siguiente tabla fue extraída del Censo Nacional de Población, Hogares y Vivienda . 2001. Población de 10 años y más de departamentos de Santiago del Estero, por condición de alfabetismo y sexo. Año 2001. Provincia Población Condición de alfabetismo de 10 años Alfabetos Analfabetos y más Total Varones Mujeres Total Varones Mujeres Total 607.782 571.067 284.309 286.758 36.715 19.030 17.685 Capital 191.311 186.724 87.894 98.830 4.587 2.299 2.288 Banda 97.689 92.937 45.066 47.871 4.752 2.461 2.291 Río 38.435 34.962 17.361 17.601 3.473 1.960 1.513 Hondo Copo 19.241 17.264 9.156 8.108 1.977 948 1.029 a) Calcular la tasa de analfabetismo de los distintos Departamentos que se muestran en la Tabla. b) ¿Cuál es el porcentaje de población de más de 10 años sabiendo que la población total de Santiago del Estero, según el Censo del año 2001 es de 804.457 ? 3 7 
  • 38. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE c) ¿Cuál es la tasa de analfabetismo de las mujeres en los distintos departamentos? d) Calcule la tasa de analfabetismo correspondiente a los varones de los distintos departamentos. 3 8 
  • 39. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  UN I DA D I I I MEDIDAS DE POSICIÓN Y DISPERSIÓN INTRODUCCIÓN En todo trabajo estadístico luego de recolectar los datos, ordenarlos, agruparlos en tablas y presentarlos gráficamente, es preciso extraer alguna información que caracterice a la población de la cual se los extrajo. Por ello, el objetivo de éste capítulo es interiorizarlos acerca de las medidas de posición y variación más utilizadas para caracterizar a la población en estudio, y en que caso se emplea cada una de ellas, interpretando los resultados a través del pensamiento crítico. Los métodos de éste capítulo suelen denominarse métodos de estadística descriptiva, porque su objetivo es resumir o describir las características importantes de un conjunto de datos. Éstas características se refieren al centro, variación, distribución, datos distantes y cambios a través del tiempo. 1. Medida s de posición Supongamos que una directora está preocupada por las notas obtenidas en las pruebas de Matemáticas. Lo primero que se le ocurrirá es tener una idea de si las notas de una muestra de alumnos se ubican cerca de la calificación cinco o cerca de la calificación nueve. Necesita resumir los datos y calcular alguna medida que sirva para que, con un único valor sencillo y representativo pueda establecer si los alumnos se posicionan cerca de una calificación de 5 puntos o si por el contrario se posicionan cerca de la calificación de nueve puntos; a estas medidas se las denominan Medidas de Posición, y si además indican el centro de ése conjunto de valores, se denominan Medidas de posición y tendencia central. Se conocen varias formas de determinar el centro de un conjunto de datos. A continuación, se indicarán tres que son las más comúnmente utilizadas: media, mediana y modo. 3 9 
  • 40. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 1.1. Media aritmét ica La media (aritmética) es la medida de posición y tendencia central más empleada para describir los datos; constituye lo que la mayoría de la gente denomina promedio. Es quizás la más conocida y usada. La media aritmética en una serie simple de datos, se la obtiene al dividir la suma de todos los valores de la variable entre la cantidad de valores sumados. A la media aritmética se la representa con  x : a)Cálculo de las media aritmética en series simples Ø Ejempl o 1 Se registró los días de inasistencias en un año, de una muestra de cinco alumnos del primer ciclo del EGB y se desea averiguar cuál es el promedio de inasistencias de esa muestra. La variable en estudios es: X = nº de inasistencias de los alumnos Los valores de la variable son: xi : 0; 16; 12; 5; 7  5  0 + 16 + 12 + 5 + 7  x  + x 2  + x  + x  + x  å x i  i  x  =  = 1 3  4  5  = =1  5  5  5  , y su fórmula de cálculo es la siguiente  n  å x i i  =1  x =  n  2.1 En la fórmula se utiliza la letra griega å (sigma mayúscula) que indica que los valores de la variable deben sumarse. El símbolo n denota el tamaño de la muestra, que es el número de alumnos observados. Cuando los datos provienen de una muestra el símbolo de la media aritmética es  x (se denomina “x barra”); si se calcula la media aritmética con los datos de toda la población se simboliza con  N å x i i  =1 m =  N  2.2 4 0 
  • 41. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE å denota la sumatoria del conjunto de valores. xi expresan los diferentes valores que toma la variable. n tamaño de la muestra, cantidad de valores observados N tamaño de la población Como nuestros datos constituyen una muestra para calcular la media utilizamos la fórmula 2.1  5  å x i  i    =1 0 + 16 + 12 + 5 + 7  40  x = = = = 8  5  5  5  Int erpretación: Los alumnos tienen en promedio 8 inasistencias por año. Algunas propiedades de la media aritmética 1­La media aritmética es reproductora del total. 2­ Si llamamos desvío a la diferencia entre un valor y la media aritmética å (d i ) = å (x i  - x ) = 0 x i  d i = x  - x  i  0 0 – 8 =­8 5 5 ­ 8 =­3 7 7 ­ 8 =­1 12 12 – 8 = 4 16 16 – 8 = 8 Total 0 Una desventaja de la media es su sensibilidad a valores extremos, de modo que un valor excepcional puede afectarla de una manera drástica, en este caso no representa en forma adecuada al centro de dicho conjunto y tiende a dirigirse a ese valor extremo. Si por equivocación al pasar los datos en el ejemplo de las inasistencias de los 5 alumnos colocamos 66 en vez de 16: Ø Ejempl o 2 X = inasistencias de alumnos xi : 0; 66; 12; 5; 7 4 1 
  • 42. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE La inasistencia promedio toma el valor 18, alejándose el promedio hacia al valor extremo 66.  5  å x i  i    =1 0 + 66 + 12 + 5 + 7  90  x  == = = = 18  5  5  5  La media aritmética no representa el centro del conjunto de datos. Este problema o desventaja se resuelve utilizando otra medida de resumen de datos que se denomina: mediana. La medi a aritmética se puede cal cula r cua ndo los val ores de la s varia bles son cua ntitativos ta nto conti nuos como discretos. 1. 2 Mediana. La mediana (de un conjunto de datos):es una medida de tendencia central que divide a la serie ordenada de datos en dos partes iguales, de tal forma que el 50% de los datos son menores o iguales a la mediana y el otro 50% mayores o iguales a ella. La mediana se designa con Me. a) Cálculo de la mediana en series simples Ø Ejempl o 3 Ø Se va n a consi derar dos ca sos: cua ndo el ta ma ño de la muestra es i mpar y cua ndo n es par Ø Se desea determinar el valor mediano de las inasistencias de los alumnos del ejemplo 2, El tamaño de la muestra, “n” es impar. X: inasistencias de alumnos xi : 0; 66; 12; 5; 7 Para su cálculo debemos ordenar primero los datos en forma ascendente o descendente. Si el número de observaciones es impar, la mediana es el valor de la variable que se localiza exactamente en la mitad de la lista. En caso de que el número de observaciones fuera par, el valor de la 4 2 
  • 43. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE mediana se obtiene promediando los dos valores centrales. Esos valores centrales se posicionan en el lugar  n + 1 2  Solución. Primero se ordenan los datos 0; 5; 7; 12; 66. La muestra posee tamaño impar n = 5 y el valor mediano está posicionado en el lugar  5 + 1  6  = = 3  2  2  , o sea que el valor de la mediana es el valor de la variable ubicado en el 3º lugar. 0; 5; 7; 12; 66. Me = 7 inasistencias Int erpretación: el 50% de los alumnos tiene inasistencia menores o iguales a 7. Ø Ejempl o 4 En el caso de que n sea par Supongamos que contamos las inasistencias de 6 alumnos. X = inasistencias de alumnos xi : 0; 66; 12; 5; 7;10 Solución. Primero se ordenan los datos 0; 5; 7; 10; 12; 66. Las muestra posee tamaño par n = 6, 6 + 1  7  = = 3 5  ,  Posición de los valores centrales  2  2  Los valores centrales ocupan el tercer y cuarto lugar, la mediana se obtiene como el promedio de los dos valores centrales: 4 3 
  • 44. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 0; 5; 7; 10; 12; 66  7 + 10  Me  =  = 8 5 » 8  ,  2  Int erpretación: el 50% de los alumnos tienen inasistencias menores o iguales a 8. Deben quedar claro dos conceptos: Primero: La mediana no se ve influenciada por los valores extremos, ya que en su cálculo interviene el orden y no la magnitud de los valores. Segundo: la media aritmética es sensible a valores extremos. La medi a na se puede determinar para va ria bles cua ntitati va s continua s discreta s y para varia bles cua litati va s que se miden en esca l a ordi nal. 1. 3. Modo. El Modo es el valor de la variable que ocurre con mayor frecuencia. Se designa frecuentemente como Mo. Se debe hacer notar aquí que el Mo es un valor de variable y la frecuencia de este valor sugiere su importancia estadística. Cuando dos valores ocurren con la misma frecuencia y ésta es la más alta, ambos valores son modas, por lo que el conjunto de datos es bimodal. Cuando más de dos valores ocurren con la misma frecuencia y ésta es la más alta, todos los valores son modas, por lo que el conjunto de datos es multimodal. Cuando ningún valor se repite, se dice que no hay moda. Ø Ejempl o 5 . Calcule las modas para los siguientes conjuntos de datos: Serie A: 4,5; 7,6; 2,8; 4,5; 3,6; 2,6 Serie B: 4; 5; 3; 4; 6; 8; 5 Serie C: 27; 27; 27; 55; 55; 55; 88; 88; 99 Serie D: 1; 2; 3; 6; 7; 8; 9; 10 4 4 
  • 45. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Solución: En l a seri e A. El número 4,5 es la moda pues es el valor que ocurre con mayor frecuencia(2 veces). En l a seri e B. Los números 4 y 5 son modas, ya que ambos ocurren con la frecuencia más alta (2 veces). En l a serie C. Los números 27 y 55 son modas, ya que ambos ocurren con la frecuencia más alta (3 veces). En l a seri e D. No hay moda, ya que ningún valor se repite. En reali da d, l a moda no se utiliza mucho con da tos numéricos. Sin embargo, entre l a s di stinta s medi da s de tendencia central que consi dera mos, la moda es la úni ca que puede usarse cua ndo se trata de va ri a bles cualitativa s nominal es. Ø Ejempl o 6 . Una encuesta efectuada a estudiantes mostró que el 84 tiene aparato de televisión; 76 videocasetera; 39 videojuegos y el 35 reproductor de DVD. En tanto que el televisor es el aparato más frecuente, es posible afirmar que la moda es el televisor. No podemos calcular una media o mediana para datos como éstos, cualitativos a nivel nominal. 3.­ Cálculo de las medidas de posición en series de frecuencias Veremos como se calculan la medidas de posición y tendencia central cuando los datos están agrupados en una serie de frecuencias. 3.1. Variables agrupadas en serie de frecuencias simple 3.1.a. Media aritmética. Como en una serie de frecuencias, fi nos indica las veces que se repite el valor de la variable, debemos considerarlas en el cálculo de la media aritmética. 4 5 
  • 46. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  Ø Ejemplo 7 Una maestra esta interesada en conocer el número promedio de hermanos de su alumnos. Para ello tomó de una muestra de 25 alumnos. Tabla 1. Alumnos de tercer año de polimodal de la Escuela Sarmiento clasificados según el número de hermanos Nº de hermanos Nº de alumnos (x i) (fi) 0 1 1 9 2 7 3 5 4 3 Total 25 Fuente: Datos ficticios Si aplicamos la fórmula 2.1, deberíamos sumar 1 vez cero, nueve veces 1 y así sucesivamente hasta sumar 3 veces 4 y dividir esa suma entre 25 que es el tamaño de la muestra. xi: nº de hermanos fi : número de alumnos que poseen xi hermanos  25  å x i  i    =1 0 + 1  + 1 + 2  + 3  + 4  + 4  50  ...  ...  ...  ...  x  == = = = 2  25  25  25  Pero, este cálculo se podría realizar en forma más simple y es obtener esa misma suma reemplazándola por la multiplicación. Utilizando la frecuencia fi que indica las veces que se repite el valor de la variable xi.  x  f 1  + x 2  f 2  + ... + x 5  f 5  i x  = f 1  + f 2  + ... + f 5  ahora expresando literalmente la fórmula de la media aritmética tenemos n  1  x =  å x i  f i  n  i =1  Este promedio se conoce como media aritmética ponderada. Para poder calcular la media aritmética ponderada correspondiente al ejemplo planteado, agregamos a la tabla de frecuencias anterior una columna 4 6 
  • 47. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE auxiliar que facilitará el cálculo de la media. Tabla 2. Alumnos de tercer año de polimodal de la Escuela Sarmiento clasificados según el número de hermanos Nº de hermanos Nº de alumnos xi*fi (xi) (fi) 0 1 0 1 9 9 2 7 14 3 5 15 4 3 12 Total 25 50 Fuente: Datos ficticios x  =  1  n  å x i  f i  .  =  1  50 =  2 25  n  i =1  Podemos concluir diciendo que los alumnos de tercer año de polimodal de la Escuela Sarmiento en promedio poseen 2 hermanos. 3.1.b. Mediana Una maestra esta interesada en conocer la mediana del número de hermanos de una muestra de 44 alumnos que concurren a una escuela rural. Tabla 3. Alumnos de una Escuela rural clasificados según el número de hermanos Nº de hermanos Nº de alumnos (x i) (frecuencia, fi) 2 5 3 5 4 30 5 4 Total 44 Fuente: Datos ficticios En esta serie de frecuencias de variable cuantitativa discreta, los datos ya están ordenados, por lo que solo resta encontrar el valor central, cuya posición se encuentra en el lugar  n + 1 44 + 1  45  = = = 22 5  ,  2  2  2  4 7 
  • 48. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE O sea el valor mediano será el promedio de los valores de la variable ubicados en el lugar 22 y 23. Para ello se deben seguir los siguientes pasos: 1.­Calcular las frecuencias acumuladas correspondientes a cada valor de la variable. 2.­Calcular el orden de localización de la mediana efectuando el cociente  n + 1 44 + 1  45  = = = 22 5  ,  2  2  2  donde n = tamaño de la muestra Tabla 4. Alumnos de una Escuela rural clasificados según el número de hermanos Nº de hermanos Nº de alumnos Frecuencias (x i) (frecuencia, fi) acumulada (Fi) 2 5 5 3 5 10 4 30 40 5 4 44 Total 44 Fuente: Datos ficticios Como el valor de la mediana se encuentra entre la posición 22 y la posición 23, se busca en la columna de frecuencias acumuladas, el menor valor que contiene a 22 (es 40), al que corresponde el valor de variable 4 y el menor valor que contiene a 23 (es 40), al que corresponde el valor de variable 4. Por lo que el valor mediano es el promedio de los dos valores centrales.  4 + 4  Me  =  = 4  2  Int erpretación: el 50 % de los alumnos de escuelas rurales, tienen 4 hermanos o menos. 4 8 
  • 49. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 3.1.c. Moda Ejemplo: Calcular el valor más frecuente del número de hermanos de los alumnos de tercer año de polimodal de la Escuela Sarmiento (Tabla 2). Solución: La variable que se estudia es una variable cuantitativa discreta. Se busca en la columna fi el valor más alto, en este ejemplo es 9. El valor de la moda es el valor de la variable que tiene frecuencia 9, es decir Mo = 1 Int erpretación: La mayoría de los alumnos de tercer año de polimodal de la Escuela Sarmiento. poseen un hermano . 3.2. Variable agrupada en serie de frecuencias con intervalos de clase, para variable aleat oria cont inua 3.2.a. Media aritmética. Ø Ejemplo Para realizar un estudio sobre la nutrición de la población infantil que concurre a la escuela en una localidad rural, se consultaron los pesos, en kilogramos, de los 50 alumnos de la escuela, los que se muestran en la Tabla 4. Los datos se agruparon en intervalos de amplitud 2 kg. y con límite superior abierto. Determine el valor promedio del peso de los alumnos. Solución 1.­ Se calcula las marcas de clase Al organizar de esta forma los datos, se pierde información, pues la tabla indica, por ejemplo que hay 12 alumnos que pesan entre 38 kg y 40 kg, pero no cuanto pesan cada uno. Ahora debemos encontrar un único valor que represente o resuma a todos los valores del intervalo: ese valor es el promedio o media aritmética de los límites del intervalo y se denomina punto medio de la clase o marca de clase. Este valor representará el valor xi de la fórmula de la media. 4 9 
  • 50. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  38 + 40  x1 =    = 39  2  40 + 42  x 2 =  = 41 = x  + a  = 39 + 2 = 41  i  2  Se introduce una nueva columna en la tabla que la denominaremos xi Tabla 4. Peso de los alumnos de una escuela rural Intervalo Nº de alumnos Marca de clase x i * fi (kg) fi xi 38 a 40 12 39 468 40 a 42 19 41 779 42 a 44 7 43 301 44 a 46 6 45 270 46 a 48 6 47 282 Total 50 2100 Fuente: Datos ficticios La fórmula para encontrar la media en serie de frecuencias es n  1  x  =  å x i  f i  n  i  =1  Pero en este caso xi representa a la marca de clase n=tamaño de la muestra= å  f i  Ahora ya estamos en condiciones de aplicar la fórmula para el cálculo de la media aritmética, por ello agregamos una columna que es el producto de cada marca de clase por su frecuencia (xi*fi).  n  1  1  x = å x i f i  = 50 * 2100 = 42 kg  n  i  =1   Interpret ación: Los alumnos pesan en promedio 42 kg. 5 0 
  • 51. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 3.2.b. Mediana Ø Ejemplo Se desea conocer el peso mediano de los 50 alumnos de una escuela rural (Tabla 4). El cálculo de la mediana en serie de frecuencias para variable cuantitativa continua se efectúa utilizando la siguiente fórmula  å f i - F    ant  Me  Me = L inf + 2  * a  f Me  L inf : límite inferior de la clase mediana  å f i  2 : Suma de la frecuencia entre 2  F  ant  Me  : frecuencia acumulada anterior a la clase mediana  f Me  : frecuencia absoluta de la clase mediana a: amplitud del intervalo a = Lsup­ Linf Peso de los alumnos de una escuela rural Intervalo Nº de alumnos (kg) fi 38 a 40 12 40 a 42 19 42 a 44 7 44 a 46 6 46 a 48 6 Total 50 Fuente: Datos ficticios Solución 1­En la tabla se agrega una columna para valores de frecuencias acumuladas. Peso de los alumnos de una escuela rural Intervalo (kg) Nº de alumnos fi Fi 38 a 40 12 12 40 a 42 19 31 42 a 44 7 38 44 a 46 6 44 46 a 48 6 50 Total 50 5 1 
  • 52. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Fuente: Datos ficticios 2­ Se calcula  å f i  2 El tamaño de la muestra se divide entre 2 porque la Mediana es el valor de la variable que divide la serie ordenada de datos en 2 partes iguales.  å f i  = 50  = 25  2 2  3­ Se busca en la columna Fi el menor valor que contiene a 25. En este ejemplo el valor que corresponde es 31. Se señala la clase mediana y se aplica la fórmula.  å f i - F    ant  Me  Me = L inf + 2  * a  f Me  50  - 12  2  25 - 12  13 * 2  Me = 40 + * 2 = 40 + * 2 = 40 + = 40 + 1 37 = 41 37  ,  ,  19  19  19  Int erpretación: El 50% de los alumnos pesan 41,37 kg o menos. 3.2.c. Moda Ø Ejemplo Se desea conocer el peso más frecuente de los 50 alumnos. El cálculo del modo en serie de frecuencias para variable cuantitativa continua se realiza utilizando la siguiente fórmula  D  1  Mo = L  Mo  + inf * a  D  + D  1  2  Donde:  D1  =  f Mo  - f anterior  a la clase  Modal  D 2 =  f Mo  - f posterior  a la clase  Modal  a: amplitud del intervalo 5 2 
  • 53. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Solución En la columna fi se busca el valor más alto, en nuestro ejemplo 19, se señala la fila, ella constituye la clase modal. Se calcula:  D1 = 19 - 12 = 7    D2 = 19 - 7 = 12  a = 42­ 40 = 2 Se aplica la fórmula  7  7  14  Mo = 40 + * 2 = 40 + * 2 = 40 + ,  kg  = 40 74  12 + 7  19  19  Int erpretación: el peso más frecuente del grupo de alumnos es de 40,74 kg Relación entre media, mediana y modo Cuando la media, la mediana y el modo coinciden, la serie de datos presenta una distribución simétrica unimodal. m= Me=Mo Cuando esa coincidencia no existe, se dice que la distribución unimodal es asimétrica. La asimetría es positiva cuando la media es mayor que la mediana y la mediana mayor que el modo, en éste caso vemos que la media aritmética se dirige hacia el o los valores extremadamente grandes 5 3 
  • 54. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Mo < Me <m La distribución presenta asimetría negativa cuando la media es menor que la mediana y la mediana menor que el modo; en éste caso vemos que la media aritmética se dirige hacia el o los valores extremadamente pequeños. m<  Me< Mo La distancia entre la media aritmética y el modo podría usarse como una medida de asimetría (Ya­Lun Chou, 1990). Asimetría = media – modo Cuánto mayor es esta distancia, negativa o positiva, tanto más asimétrica es la distribución 4­ Medidas de localización Son Medidas de Posición que dividen los valores ordenados de una serie en cuatro, diez o cien partes iguales y se denominan cuartiles, deciles y percentiles. 4.1 Cua rtil es Los cuartiles son tres valores Q1, Q2, Q3, que dividen a la serie ordenada en cuatro partes iguales. Por debajo del primero quedan el 25% de los datos; por debajo del segundo el 50% de los mismos y por debajo del tercero el 75%. El segundo cuartil coincide con la Mediana.  5 4 
  • 55. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 4.2 Deciles Los Deciles son nueve valores de la variable y dividen a la serie ordenada de datos en 10 partes iguales, el decil 5 coincide con la Mediana, es decir el 50% de los valores son menores o iguales al D5. 4.3 Percentil es Los percentiles son 99 valores de la variable, que dividen al conjunto de datos (ordenados de menor a mayor) en cien partes iguales el percentil 50 coincide con la mediana. Los percentiles se designan con la letra Pi, el subíndice i, varía de 1 a 99, indicando el valor del percentil, que se desea calcular. ü Cálculo de percent iles: Forma analítica Para calcular los percentiles de una distribución de frecuencias se procede del mismo modo que en el caso de la mediana, salvo que ahora dividiremos n = å f i  al tamaño de la muestra en cien partes iguales, en vez de dos. Ø Ejempl o Se desea conocer P20 de licencia en las escuelas del centro de la ciudad de Santiago del Estero en el año 2004. Tabla 5. Días de inasistencia de los docentes de escuelas de la capital de Santiago del Estero en el período escolar 2004. Intervalo de clase Nº de docentes Fi (días de licencia) (fi) 0 a 10 30 30 10 a 20 60 90 20 a 30 60 150 30 a 40 70 220 40 a 50 90 310 50 a 60 100 410 60 a 70 60 470 70 a 80 40 510 80 a 90 10 520 90 a 100 10 530 Total 530 Fuente: Datos ficticios 5 5 
  • 56. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE El cálculo de percentiles para variables agrupadas en serie de frecuencias con intervalos de clase, se efectúa utilizando la siguiente fórmula:  i å f i  - F  P  ant  i  P  = L inf + 100  i  * a  f P  i  L inf : Límite inferior de la clase donde se encuentra el percentil i = valor del percentil que se busca FantPi: frecuencia acumulada anterior a la clase donde se encuentra el Percentil i f Pi :frecuencia absoluta de la clase donde se encuentra el Pi a: amplitud del intervalo a =Lsup­ Linf Solución Cálculo del percentil 20 Pasos 1.­ Se agrega una columna de frecuencias acumuladas (Fi) 2.­ Se calcula    i å f i  20 * 530  = = 106  100 100  3.­ Se ubica en la columna Fi el menor valor que contiene a 106, en nuestro ejemplo 150. La clase que tiene una Fi= 150 es la clase que contiene al Percentil buscado 4.­ Se calcula a: Lsup –Linf = 30­20=10 5.­ Se aplica la fórmula  106 - 90  16 *  10  P20 = 20 +   *  = 20 + 10  = 22 67 » 23 días  ,  60  60  5 6 
  • 57. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Int erpretación P20 = 23 días El 20 % de los docentes toman 23 días de licencia o menos ü Rango percentil Forma analítica Se puede presentar, el problema inverso, es decir, conocer cuántos docentes toman 52 días de licencia o menos, es decir nos dan como dato un valor de la variable y nos preguntan que percentil le corresponde; a este procedimiento se lo denomina calcular el Rango percentil. Es decir el rango percentil de un valor dado es el porcentaje de valores comprendidos debajo del valor solicitado. Ø Ejemplo: Calcular el rango percentil que le corresponde a 52 días de licencia de los docentes de las escuelas de la ciudad de Santiago del Estero Repetimos la tabla 5 para visualizar mejor el cálculo Días de inasistencia de los docentes de escuelas de la capital de Santiago del Estero en el período escolar 2004. Intervalo de clase Nº de docentes Fi (días de licencia) (fi) 0 a 10 30 30 10 a 20 60 90 20 a 30 60 150 30 a 40 70 220 40 a 50 90 310 50 a 60 100 410 60 a 70 60 470 70 a 80 40 510 80 a 90 10 520 90 a 100 10 530 Total 530 Fuente: Datos ficticios Solución 1.­ Ubicamos en la tabla el intervalo de clase donde se encuentra el valor 52 es el intervalo que va de 50 a 60. 2.­ Se calcula la Frecuencia acumulada que le correspondería al valor 52 5 7 
  • 58. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE con la siguiente fórmula  ( x  - L  )  i  inf  F ( x  ) =  i  *  f int erv  + F  anterior  Clase  a  Donde: F(xi)= frecuencia acumulada correspondiente al valor que se busca Linf Límite inferior del intervalo de clase donde se encuentra xi finterv Frecuencia absoluta del intervalo donde se encuentra xi a amplitud del intervalo F clase ant. Frecuencia acumulada de la clase anterior al intervalo donde se encuentra xi  (  - 50  52  )  2 *  100  F (52  =  )  *  + 310 = 100  + 310 = 330  10  10  3.­ Se calcula ahora el rango percentil con la siguiente fórmula  F ( x  )  i  R p  =  *  100  å f i  330 R p  =  * 100 = 62 26  » 62  .  %  %  530  Int erpretación: Xi= 52 días Pi= 52 El 62% de los docentes toman 52 días de licencia o menos. (Cálculo gráfico de percentiles y rango percentil Ejemplo Calcular gráficamente el percentil 20 Solución Se debe construir un gráfico de líneas; los pares de valores a graficar corresponden al límite superior del intervalo con el porcentaje acumulado correspondiente a dicha clase. 1.­ Calcular porcentaje acumulados. Para ello se necesita calcular: a) frecuencia relativa para cada intervalo 5 8 
  • 59. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE b) porcentaje c) porcentaje acumulado 2.­ Se grafica un polígono (Lsup; %acum.). El gráfico que se obtiene se denomina ojiva. Días de inasistencia de los docentes de escuelas de la capital de Santiago del Estero en el período escolar 2004. Interv alo de c lase Nº de doce nte s f ri Porcentaje Porcentaje (días de lice ncia) (f i) f ri*100 acumulado 0 a 10 30 0,0566 5,67= 6 6 10 a 20 60 0,1132 11,32 = 11 17 20 a 30 60 0,1132 11,32 = 11 28 30 a 40 70 0,1321 13,21 = 13 41 40 a 50 90 0,1698 16,98 = 17 58 50 a 60 100 0,1887 18,87 = 19 77 60 a 70 60 0,1132 11,32 = 11 88 70 a 80 40 0,0755 7,55 = 8 96 80 a 90 10 0,0189 1,89 = 2 98 90 a 100 10 0,0189 1,89 = 2 100 Total 530 100  100  90  80  70  60  %  50  40  30  20  10  0  0  10  20  30  40  50  60  70  80  90  100  Días  5.­Si deseamos calcular el valor que corresponde al percentil 20. Se ubica el valor 20 en el eje vertical y se traza una paralela al eje horizontal hasta la curva y luego se traza una vertical hasta encontrar el valor de días correspondiente, el que aproximadamente es 23. Int erpretación: El 20 % los docentes incurren en 23 días de licencia o menos 5 9 
  • 60. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 6.­Si deseamos conocer cual es el rango percent il que corresponde a 52 días, ubicamos ese valor en el eje horizontal y trazamos una paralela al eje vertical hasta la curva y desde allí una paralela al eje horizontal, leemos en el eje vertical el valor correspondiente al rango percentil (aproximadamente 60).  100  90  80  70  60  %  50  40  30  20  10  0  0  10  20  30  40  50  60  70  80  90  100  Días  Los valores correctos se obtienen utilizando las fórmulas presentadas anteriormente. MEDIDAS DE VARIABILIDAD O DISPERSIÓN Las Medidas de Posición no son suficientes por si solas para describir el conjunto de datos es necesario tener además una idea de como se distribuyen los datos alrededor del centro de la distribución. Para eso surgen las Medidas de Dispersión o variabilidad. 6 0 
  • 61. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 1.­Medidas de variabilidad en series simple. Su cálculo 1.1. RANGO Es llamado también amplitud total de variación de la variable. Se lo obtiene como la diferencia entre el valor máximo y mínimo de la variable. Distribución A: 1 5 5 5 5 5 5 5 5 9 Distribución B: 1 1 2 4 5 6 7 7 8 9 RA=9­1=8 RB=9­1=8 En este caso el valor del rango es el mismo, a pesar de que notamos que la variabilidad de las dos distribuciones es diferente. La desventaja de esta medida es que solo considera los valores extremos sin tener en cuenta el comportamiento del resto de las observaciones. Por lo que observamos que a pesar de tener variabilidades diferentes las dos distribuciones, el rango no la capta. Para solucionar este problema surgen otras medidas de variabilidad como el desvío medio. ¿Cómo se puede medir la variabilidad de un conjunto de datos? Si por variabilidad se entiende el grado en que los valores de la distribución difieren de la media y entre si, entonces la desviación promedio de los valores a partir de la media puede resultar una medida razonable de variabilidad: å (x i - x )  n  Se denomina desvío a la diferencia entre cada valor de la variabley su medio. Cuando el valor de la variable es mayor que el valor medio el desvio es positivo; cuando el valor de la variable es menor que el valor promedio los desvíos son negativos. Pero por propiedades de la media sabemos que la suma de los desvíos de los valores respecto a la media es siempre es cero, pues las desviaciones positivas respecto a la media, anulan siempre a las 6 1 
  • 62. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE desviaciones negativas, con lo que resulta siempre una suma igual a cero y por ende el valor promedio. Como esta medida de variabilidad parece razonable, debemos redefinir nuestra medida para evitar los valores negativos. Una manera de hacerlo es considerar el valor absoluto de los desvíos; la medida que se obtiene se denomina: 1.2.DESVIO MEDIO: Se define como el promedio del valor absoluto de los desvíos; se designa con DM.  DM  = å d i = å x i  - x  n  n  Tabla 6: Distribución de puntajes de un grupo de alumnos xi x  - x  d i  d i =  i 1 ­4 4 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 9 4 4 å xi  = 50  å (d i ) = 0 å d i  = 8 x = 5 8 DM  =  = 0 8  ,  10  Fuente: Datos ficticios Pero generalmente no se puede operar fácilmente cuando se trabaja con valor absoluto, por eso se considera una segunda forma de modificar esos signos negativos y consiste en elevar los desvíos al cuadrado, lo que dará desvíos al cuadrado positivos. Esta nueva medida de variabilidad se denomina varianza. 1.3. Varianza es el promedio de los desvíos al cuadrado y se designa con S2 cuando se trata de una muestra y es un mejor estimador de 2 la varianza poblacional( s ) cuando la suma de los desvíos al cuadrado se divide entre el tamaño de la muestra menos 1; por ello para una muestra la fórmula es: 6 2 
  • 63. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE n  å (x i - x )  2  S 2 = i    =1  Variancia de una muestra, para series simples n - 1  n  å ( x i - m )  2  Variancia poblacional s 2 =  i  =1  N  Cuántos más tiendan los valores a diferir de la media, mayor será la varianza. El valor numérico de la varianza de una distribución depende de la unidad de medida que se utilice. Por consiguiente, cuando se compara la varianza de dos o más distribuciones, hay que estar seguro que la unidad de medida empleada es igual en todas las distribuciones. En el ejemplo de la Tabla 7: Distribución de puntajes de un grupo de alumnos xi di=  x  - x  i ( d 2  = x  - x  1  i )  2  1 ­4 16 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 9 4 16 å (d i ) = 0 å (x i - x )  = 32  2 å xi  = 50    x = 5 32  S 2 =  = 3 56  ,  9  Fuente: Datos ficticios n  å (x i - x )  2  32  S 2 = i    =1  = = 3 56  ,  n - 1  9  6 3 
  • 64. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Otra desventaja es que la varianza se expresa, en unidades al cuadrado y no en término de las unidades originales de medición, lo que hace difícil la tarea de relacionar en forma significativa el valor de la varianza con el conjunto original de datos. Por eso es conveniente, considerar una medida de variabilidad que se exprese en unidades originales. Esta nueva medida denominada desviación estándar se obtiene al extraer a la varianza la raíz cuadrada. 1.4.Desv iación est ándar muestral n  å (x i - x )  2 i    =1  S  = n - 1  n  å (x i - x )  2 i    =1  32  S  = = = 3 56  = 1 89  ,  ,  n - 1  9  Desviación estándar poblacional n  å ( x i -m )  2 i  =1  s =  N  Nos debe quedar claro que la desviación estándar mide la variación entre los valores. Los valores cercanos producirán una desviación estándar pequeña, mientras que los valores dispersos producirán una desviación estándar más grande. 2.­Medidas de variabilidad en series de frecuencia simple. Su cálculo Ejemplo: Calcular la variabilidad de las inasistencias de 32 alumnos 6 4 
  • 65. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Tabla N° 7. Inasistencias de 32 alumnos Nº de inasistencias Nº de alumnos (x i) (fi) 11 12 12 9 14 5 15 4 23 2 Total 32 FUENTE: Datos ficticios Cuando se trata de variables cuantitativas discretas el Rango se calcula: 2.1 Rango= Valor máximo ­Valor mínimo + 1 Rango=R = 23 ­ 11+1=13 inasistencia 2.2 Desv ío medio en serie de frecuencia simple d i  *  f i  å x  - x  * f i  DM  =  å i  å f i  å f i  Cálculo: 1) Se calcula la media aritmética 2) Se calcula los desvíos 3) Se obtiene el valor absoluto y se lo multiplica por su frecuencia 4) Se aplica la fórmula Inasistencias de 32 alumnos Nº de inasistencias Nº de alumnos x i*fi  d i =  x  - x  d    d i  *  f i  i  1 (x i) (fi) 11 12 132 ­2 2 24 12 9 108 ­1 1 9 14 5 70 1 1 5 15 4 60 2 2 8 23 2 46 10 10 20 32 416 66  x= å x i  * f i  = 416  = 13  å f i  32  6 5 
  • 66. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  DM  = å d i  * f i  = 66  = 2 , 06  å f i  32  2.3. Varianza en serie de frecuencia simple n  n  å (x i - x ) å (x i - x )  f i  2  2  f i  S 2 = i    =1  = i =1  n - 1  å f i  - 1  1) Se calcula la media aritmética 2) Se calcula los desvíos 3) Se elevan los desvíos al cuadrado 4) Se multiplica cada desvío al cuadrado por su frecuencia 5) Se aplica la fórmula Inasistencias de 32 alumnos Nº de inasistencias Nº de alumnos x i*fi  d i =  x  - x  d i 2  d i 2  *  f i  i  (x i) (fi) 11 12 132 ­2 4 48 12 9 108 ­1 1 9 14 5 70 1 1 5 15 4 60 2 4 16 23 2 46 10 100 200 32 416 278 FUENTE: Datos ficticios n  å (x i - x )  f i  2  278  278  S 2  = i  =1  = = 2  = 8 97 días  ,  n - 1  32 - 1  31  2.4 Desviación estándar en serie de frecuencia simple n  n  å (x  - x ) *  f  å (x i - x )  *  f i  2 2  i  i  i =1    i  =1  S= = n - 1  å f i  - 1  n  å (x i - x )  *  f i  2 i    =1  278  278  S  = = = = 8 97  = 2 99  ,  ,  n - 1  32 - 1  31  6 6 
  • 67. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 3.­ Medida de variabilidad en serie de frecuencias con int erv alos de clase Los siguientes datos corresponden a edades de los alumnos de los 2 ciclos de EGB. Tabla N°9. Edades de los alumnos de segundo ciclo del EGB Clases de Marca de fi x i*fi  d i = ( x  - x )  d1    d    i  1 edad en año clase (xi) *fi 6 a 8 7 4 28 ­4 4 16 8 a 10 9 8 72 ­2 2 16 10 a 12 11 11 121 0 0 0 12 a 14 13 12 156 2 2 24 14 a 16 15 2 30 4 4 8 Total 37 407 64 Fuente: Datos ficticios 3.1.Rango L.superior de la última clase – L.inferior de la primera clase. Como los límites superiores de las clases son abiertos, es decir no toma el valor 16, debemos colocar el valor 15,99 R = 15,99 – 6 = 9,99 años 1) Se calculan las marcas de clase y luego la media aritmética 2) Se calcula los desvíos 3) Se elevan los desvíos al cuadrado 4) Se multiplica cada desvío al cuadrado por su frecuencia 5) Se aplica la fórmula 3.2. Desvío medio en serie de frecuencia de intervalos  DM  = å d i  * f i  = 64  = 1 . 73  å f i  37  1) Se calculan las marcas de clase y luego la media aritmética 6 7 
  • 68. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  x = å x i  * f i  = 407  = 11  å f i  37  2) Se calcula los desvíos 3) Se obtiene el valor absoluto de los desvíos 4) Se multiplica cada desvío absoluto por su frecuencia, se suma 5) Se aplica la fórmula 3.3. Variancia serie de frecuencia con intervalos de clase 1) Se calculan las marcas de clase y luego la media aritmética 2) Se calculan los desvíos 3) Se elevan los desvíos al cuadrado 4) Se multiplica cada desvío al cuadrado por su frecuencia 5) Se aplica la fórmula Edades de los alumnos de segundo ciclo del EGB Clases de Marca de fi x i*fi  d i = ( x  - x )  d i 2  d i 2 *fi i  edad en año clase (xi) 6 a 8 7 4 28 ­4 16 64 8 a 10 9 8 72 ­2 4 32 10 a 12 11 11 121 0 0 0 12 a 14 13 12 156 2 4 48 14 a 16 15 2 30 4 16 32 Total 37 407 176 Fuente: Datos ficticios Varianza en serie de frecuencias con intervalos de clase, la única diferencia con las fórmulas para serie de frecuencias simples es que xi, representa el punto medio de la clase o marca de clase n å (x i - x )  f i  2  i  176  176  S 2  = =1  = = 2  = 4 89 años  ,  n - 1  37 - 1  36  6 8 
  • 69. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  3.4 Desv iación estándar en serie de frecuencias con intervalos de clase. n  å (x i - x )  *  f i  2   i  =1  176  176  S  = = = = 4 89  = 2 21 años  ,  ,  n - 1  37 - 1  36  COEFICIENTE DE VARIACIÓN Las cuatro medidas de variabilidad enunciadas precedentemente son medidas de variabilidad absoluta. El coeficiente de variación es una medida de variabilidad relativa. Expresa la desviación estándar como un porcentaje de la media. Es una medida adimensional, se expresa en % y sirve para comparar la variabilidad entre dos o más distribuciones que provengan de diferentes unidades de medidas o teniendo igual unidad de medida los valores de diferente magnitud. Coeficiente de variación muestral C.V . = S 100    x  Ejemplo Decir cual de las siguientes distribuciones es más variable: xi: peso de los alumnos de nivel inicial (kg) 34; 29; 28; 31; 40 yi: altura de los alumnos de nivel inicial (m) 1,24 1,54 1,38 1,37 1,56  x =32,4 kg Sx=4,83kg  y =1,42 m Sy=0,13m No podemos decir que la variabilidad en peso es mayor que la variabilidad en altura, ya que las variables están medidas en distintas unidades, para poder compararlas la debemos expresar como porcentaje de sus medias 6 9 
  • 70. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE CVx=(4,83/32,4)*100=14,91% CVy=(0,13/1,42)*100=9,15% Conclusión: los alumnos tienen menor variabilidad en altura que en peso. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Uso de la ca lcul a dora científi ca para el cá lculo de Medi da s de Posi ción y Di spersión Cal cul a dora s Casio model o f x­82W. Seguir la s si guientes i nstrucciones: Debe procurar que la calculadora se encuentre en disposición para efectuar cálculos estadísticos. Para ello apriete mode 2. En la parte superior de la pantalla aparece la notación SD. Debe cerciorarse de que no hay nada acumulado en la memoria. Para ello pulse SHIFT AC = y en su pantalla aparece el número cero. Se está ahora en condiciones de introducir los datos. Por ejemplo para serie simple: xi: 1 2 3 4 5 Marque el nº 1 y luego la tecla M+ Marque el nº 2 y luego la tecla M+ Marque el nº 3 y luego la tecla M+ Así sucesivamente hasta haber cargado todos los datos. Para cerciorarse de la cantidad de datos introducidos Pulse ALPHA y la tecla 3 en el cursor aparece la letra n, apriete ahora = y aparecerá el 5, pues Ud. introdujo los 5 valores. Para obtener la media aritmética pulse SHIFT y la tecla 1, en la pantalla aparece  x  apriete = y en su pantalla aparece el valor 3 que es el valor de la media. Para obtener la desviación estándar marque SHIFT y la tecla 3, aparece en su pantalla  s n-1   presione = y en su pantalla aparecerá el valor 1,58 Si aprieta ahora la tecla x2 obtendrá 2,50 que es el valor de la 7 0 
  • 71. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE varianza muestral S2 Si desea obtener la suma de los valores de x presione Alpha y la tecla 2. Para el caso de que la serie sea de frecuencia simple Se coloca la máquina en modo estadística Mode 2 Presione SHIFT AC =; ya tiene la memoria limpia. Se introduce el valor xi, luego SHIFT, la tecla que tiene la coma. Aparece en la pantalla x i ; ahora introduzca el valor de fi y una vez que tenga en la pantalla x i ; f i recién apriete M+ ; continúe así hasta introducir todos los valores de su serie, para el cálculo de la media, desviación estándar y varianza se procede luego apretando las teclas indicadas anteriormente. Cuando se trabaja con todos los datos de una población para el cálculo de la desviación estándar se aprieta SHIFT y la tecla 2 GUÍA DE EJERCITACIÓN Actividad 1 a) Los siguientes son pesos individuales de 10 alumnos de primer año de EGB: 30, 32, 30.5, 31, 33, 31, 32.9, 34, 34.6, 35 b) En la etapa de diagnóstico destinada a implementar un Plan de Salud Bucal en alumnos de EGB, en una escuela el odontólogo determinó el número de caries que presentaba cada alumno. Los siguientes son número de caries que presentaban 9 de dichos alumnos: 7 1 
  • 72. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 2, 4, 0, 2, 3, 5, 1, 2, 2 c) En un curso se tomó ocho alumnos al azar y se les preguntó cuál era el salario que percibía mensualmente su padre. Ellos son los siguientes: 3000, 1000, 570, 400, 600, 1500, 500, 570 1.­ En cada caso determine y clasifique el tipo de variable que se considera. 2.­ ¿Cómo se denomina en cada caso el conjunto de datos obtenidos para la variable que se estudia? 3.­ Determine en cada uno de los incisos a, b y c, la Media Aritmética, Mediana y Modo. 4.­ En cuál de los casos arriba detallados ¿la media no es una Medida de Posición adecuada? Actividad 2 a) En cada una de las series de datos de la Actividad 1, calcule Rango, Desviación Media, Desviación estándar y Coeficiente de Variación. b) Si Ud. quiere comparar la variabilidad de los datos de cada una de las series presentadas en la Actividad 1, cuál medida de dispersión emplearía? 7 2 
  • 73. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Actividad 3 Para realizar una evaluación del Número de puntos obtenidos en una Prueba de Matemáticas realizada a los 30 alumnos de 6° de EGB, se ordenó dicha variable en la siguiente serie de frecuencias: N° de puntos 0 1 2 3 4 5 6 7 8 9 10 xi N° de alumnos 0 1 0 4 3 8 6 4 1 2 1 fi a) Calcule Media, Mediana y Modo. b) Determine Desviación Estándar, Varianza y Coeficiente de Variación. c) Indique si la distribución que se analiza es simétrica o no. En caso de ser asimétrica, indique que tipo de asimetría presenta. d) A los fines de la evaluación, cuál de las tres Medidas de Posición sería más correcta utilizar? Actividad 4 Los siguientes datos corresponden a Tipo de Deportes que prefieren los alumnos de una escuela. Tipo de deportes N° de alumnos fi Basquet 220 Fútbol 500 Pelota al cesto 180 Hockey 100 Total 1000 a) Indique qué tipo de variable es. b) Determine la Medida de Posición que corresponda a este caso. 7 3 
  • 74. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Actividad 5 Las alturas de alumnos de un curso de Polimodal en una escuela se muestran en la siguiente Tabla: altura fi (m) 1.10­1.15 3 1.15­1.20 4 1.20­1.25 6 1.25­1.30 5 1.30­1.35 9 1.35­1.40 9 1.40­1.45 6 1.45­1.50 2 1.50­1.55 1 1.55­1.60 1 1.60­1.65 1 a) Qué tipo de variable se considera? b) Encuentre frecuencias acumuladas, porcentajes y porcentajes acumulados. c) Encuentre Media Aritmética, Mediana y Modo. d) Calcule Desviación estándar y Coeficiente de variación. e) Realice el gráfico de la distribución porcentual acumulada. f) Determine gráfica y analíticamente el rango percentil para las siguientes alturas: 1.18, 1.47, 1.56, 1.62. g) Determine gráfica y analíticamente las alturas correspondientes a los percentiles: 10, 25, 50, 75 7 4 
  • 75. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  UNI DA D I V PROBABILIDADES Y DISTRIBUCIONES DE PROBABILIDADES – INFERENCIA ESTADÍSTICA 1.­ INTRODUCCIÓN La teoría de probabilidad tiene sus orígenes en la teoría de la casualidad. Históricamente, la teoría de la Probabilidad comenzó con el estudio de los juegos de azar, tales como la ruleta y las cartas. La teoría de la Probabilidad no es tan extraña como pudiera pensarse. Sin duda alguna, en la vida diaria con mucha frecuencia emitimos juicios probabilísticos, aunque a menudo no lo reconocemos como tales. Por ejemplo, supongamos que, por razones diferentes, usted no está preparado para la clase de hoy. Seriamente usted considera faltar a clase. ¿Qué factores influirán en su decisión? Obviamente una consideración será la probabilidad de que el profesor descubra su falta de preparación. Si el riesgo es alto, usted decide no ir a clase. Veamos, hay dos alternativas posibles: 1. Su falta de preparación será descubierta. 2. Su falta de preparación no será descubierta. Hay incertidumbre en esta situación porque hay más de una alternativa posible. Su decisión de asistir a clase, dependerá del grado de certeza asociado con cada una de estas alternativas. Así, si usted está bastante seguro de que prevalezca la primera alternativa, usted decidirá no ir a clase. Supóngase que su profesor con frecuencia pide a los estudiantes que participen en clase activamente. De hecho, usted ha notado que la mayoría de los estudiantes son interrogados en cada sesión de clase. Este es un ejemplo en el cual hay un alto grado de certeza asociada con la primera alternativa. Dicho de esta manera, la probabilidad del primero es mayor que la del segundo. Por consiguiente usted decide no ir a clase. Usted ha tomado una decisión con base en un empleo intuitivo, de la probabilidad. Antes de estudiar la teoría de la probabilidad, es conveniente comprender bien uno de los conceptos más importantes de la Inferencia Estadística: el concepto de a zar 7 5 
  • 76. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 2.­ EL CONCEPT O DE AZAR Definimos una población como el conjunto completo de individuos, objetos o medidas que tienen alguna característica común observable. Muy rara vez se puede estudiar una población. Seleccionamos muestras de una población con la esperanza de que los estadísticos de la muestra nos permitan calcular los parámetros de la población. Para obtener una correspondencia entre un estadístico y un parámetro, la muestra debe representar una selección aleatoria de la población. Una forma de obtener una muestra aleatoria, es mediante el Muestreo al Azar Simple, de tal manera que cada individuo , objeto o medida tenga igual probabilidad de ser seleccionado. Una característica sobre los sucesos aleatorios, es que ningún suceso tiene efecto predecible sobre el siguiente. Podremos comprender más clara y fácilmente el concepto de azar en relación con los “juegos de azar, si suponemos que se juegan limpiamente. Conocer el resultado del lanzamiento de una moneda al aire, del lanzamiento de un dado, del resultado de un juego de ruleta, no nos ayudará en absoluto en la predicción de los resultados por venir. Esta característica de los sucesos al azar se conoce como i ndependenci a . Si la independencia existe, podemos hablar de sucesos realmente al azar. La segunda característica importante del azar es que cuando la muestra se extrae de una población, cada elemento debe tener una probabilidad igual de selección. Así, si nuestra selección o modo de selección favorece ciertos sucesos o ciertas colecciones de sucesos, no podemos afirmar que los resultados son al azar. 3.­ PROBABILIDAD Y ESTADÍSTICA La Estadística Descriptiva, hace referencia a los datos que se tienen en la mano. Cuando se quiere ir más allá de los datos disponibles, es necesario inferir o sea utilizar la Estadística Inferencial. Como ella infiere el todo (población) a partir de la información que da una parte de ese todo (muestra), el conocimiento que adquiere es incompleto y por lo tanto no “totalmente cierto” es decir, se debe trabajar con probabilidades. Por ello, antes de estudiar las aplicaciones de la Estadística Inferencial es necesario estudiar probabilidades. 7 6 
  • 77. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 4.­ TEORÍAS DE PROBABILIDAD Se puede considerar la probabilidad como la teoría que tiene que ver con los posibles resultados de los experimentos. Estos deben ser potencialmente repetitivos, es decir, debemos ser capaces de reproducirlos bajo condiciones similares. Debe ser posible enumerar cada resultado que pueda ocurrir, y debemos ser capaces de establecer las frecuencias relativas de estos resultados. Se distingue el enfoque clásico , frecuencial y axiomático de la teoría de probabilidad. 4.1.­EXPERIMENTOS ALEATORIOS. ESPACIO MUESTRAL. EVENTOS. El lanzamiento de un dado, o de una moneda, la extracción de un naipe de la baraja, de las bolillas de la lotería son experiencias aleatorias, pues sus resultados dependen del azar. También son aleatorios: el tiempo de espera de una persona en la parada del autobús, sexo de los hijos en un matrimonio, el número de hijos que tendrá un matrimonio, etc. Los primeros (lanzamiento, extracciones) son fáciles de seguir, pues se pueden repetir tantas veces como se quiera de forma rápida. A partir de ellos se obtienen leyes que rigen los fenómenos aleatorios y se aplican al estudio de situaciones aleatorias. Conceptos necesarios para definir probabilidades Experimentos aleat orios: son aquellos que, repetidos bajo idénticas condiciones, no arrojan un único resultado sino un conjunto de ellos. ü Ejemplos: Arrojar un dado ü Arrojar una moneda Espacio muestral. Es el conjunto de los resultados posibles de un experimento aleatorio y se denota con M. Ejemplos. ü Para el caso de arrojar un dado, el espacio muestral resultante es: 7 7 
  • 78. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE M= {1,  ,  ,  ,  ,  }  2 3 4 5 6  ü Para el caso de arrojar una moneda, el espacio muestral resultante es: M={C, S} Para el caso de arrojar una moneda y un dado simultáneamente ,el espacio muestral resultante es: M = í(cara, 1) , ( cara , 2 ) .....,(cara , 6) , (sello , 1),...(sello, 6)ý Event o simple .Es cada uno de los resultados de un experimento aleatorio que no puede desglosarse en componentes más simples. Se designan con la letra minúscula. Ejemplos ü Para el caso de arrojar un dado. Obtener el número 1, es un evento simple, lo mismo ocurre con los números restantes e={1} e={2} ü Para el experimento aleatorio arrojar una moneda al aire, los evento simples son e={c} e={s} Event o compuest o. Es un subconjunto del Espacio Muestral. Es el resultado de la unión de eventos simples. Se lo representa con letra mayúscula. ü Para el caso de arrojar un dado. El espacio muestral es M= {1,  ,  ,  ,  ,6  2 3 4 5 }  · Obtener número par, es el resultado de la unión de los eventos simples 2, 4, 6, y constituyen un subconjunto del espacio muestral. P={2, 4, 6} · Obtener número impar I={3, 5, 7} · Obtener un número menor que 4 A={1, 2,3} Suceso seguro: es el conjunto total M(espacio muestral). 7 8 
  • 79. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Suceso imposible: es el conjunto vacío. Opera ciones con sucesos En las aplicaciones de la teoría de probabilidades trataremos muchas veces con eventos relacionados entre sí, más que con un solo evento. Por esta razón consideraremos ahora un experimento aleatorio arbitrario, con su espacio muestral correspondiente M, y cualesquiera dos eventos A y B en el experimento. Entonces: *Union de Eventos A È B ( A unión B , A o B ) representa el evento que ocurre si, y solo si ocurre A u ocurre B o ambos ( Una notación más antigua que representa a A È B es A + B, y el nombre correspondiente es suma de dos eventos) *Intersección de Event os. A Ç B ( A intersección B ó A y B ) representa el evento que ocurre si, y solo si, ocurren A y B simultáneamente, esto es, si ocurren en la misma ejecución del experimento en consideración. Event os mutuament e exclusivos. Son los eventos que no ocurren simultáneamente. Este caso se representa solamente cuando A Ç B = Ø, el evento vacío, de tal manera que A y B no tienen puntos en común. *. El evento  A  es el complemento del evento A con respecto al espacio muestral M y contiene a todos los resultados de M que no se encuentran en A. Ø Ejemplo Para el caso del arrojar una dado, el espacio muestral es M= {1,  ,  ,  ,  ,  }  2 3 4 5 6  ü Evento A obtener un nº par A={2, 4, 6}  A ={1, 3, 5 } Ø Ejemplo: Un experimento consiste en tirar un dado y observar el número de puntos que aparece en la cara superior. El espacio muestral se puede 7 9 
  • 80. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE describir fácilmente, ya que es finito. Las posibilidades para el dado son seis: 1, 2, 3, 4, 5, 6. Por lo tanto, los posibles resultados son: M = {1, 2, 3,4, 5, 6} b) Describir los siguientes eventos: A: Sale un numero par. A: Sale un numero par. B: Sale un número impar. B: Sale un número impar. C: Sale un número menor que 4 C: Sale un número menor que D: Sale un número mayor que 3. D: Sale un número mayor que 3. E: Sale un número impar o mayor que 3. E: Sale un número impar mayor que 3. F. Sale un número par y menor que 4. F. Sale un número par menor que 4. G: Sale un número par y un impar. G: Sale un número par un impar. Solución Solución v El evento:”Sale un número par” , está representado por la letra A, su descripción puede realizarse mediante el siguiente conjunto : A = {2 4 6  , ,  ,  }  v El evento “ Sale un número impar ”, está representado por la letra B, su descripción puede realizarse mediante el siguiente conjunto : B = { 1 , 3 , 5 }. v El evento “ Sale un número menor que 4” ”, está representado por la letra C, su descripción puede realizarse mediante el siguiente conjunto : C= í1 , 2 , 3 ý v El evento “Sale un número mayor que 3”, está representado por la letra D, su descripción puede realizarse mediante el siguiente conjunto : D= í4 , 5 , 6 ý v El evento “ Sale un número impar o mayor que 3”, se representa por la letra E, está formado por todos los resultado de B o de D o de ambos. Este evento recibe el nombre de unión de B y D, se denota por B È D y su 8 0 
  • 81. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE descripción puede realizarse mediante el siguiente conjunto: B È D = E =í1 , 3 , 4 , 5 , 6ý v El evento “ Sale un número par y menor que 4”, se representa por la letra F, está formado por los resultados comunes tanto a A como a C. Este evento recibe el nombre de intersección de A y C, se denota por A Ç C y su descripción puede realizarse mediante el siguiente conjunto : A Ç C = F = í2 ý v El evento “ Sale Un número par y un número impar”, se representa mediante la letra G, está formado por la intersección de los eventos A y B, estos eventos no tienen nada en común, por lo tanto la intersección de ellos es vacía. A y B son mutuament e excluyentes o disjuntos.. A Ç B = G = íý = Æ 4.2. DEFINICIÓN CLÁSICA DE PROBABILIDAD (PROBABILIDAD A PRIORI) Supóngase que queremos conocer la probabilidad de que una moneda caiga con la cara hacia arriba. Como hay solo dos posibles resultados (cara o seca) adoptamos una situación ideal en la cual esperamos que cada resultado tenga igual probabilidad de ocurrir. Así, la 1  probabilidad de que se presente una cara, P ( C) =  2  Definición :La probabilidad de un evento A en un experimento aleatorio está dado por: el cociente entre el número de casos favorables y el número de casos igualmente posibles  N º de casos  favorables  a  A  P   A  = ( )  N º  total  de casos  igualmente  posibles  Por ejemplo, la probabilidad de extraer el as de espada de una baraja ordinaria de 52 cartas es 1/52. 8 1 
  • 82. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  ü Pero la probabilidad de sacar un as de espada rojo es cero (puesto que no hay figuras de espadas rojas en la baraja) no hay sucesos posibles que favorezcan este resultado. ü Si los ev entos son mut uamente excluyentes (esto es, si los dos eventos no pueden ocurrir simultáneamente), pues A Ç B = Ø , la P (Ø ) = 0 4.3. DEFINICIÓN DE PROBABILIDAD FRECUENCIAL (PROBABILIDAD A POSTERIORI) Las probabilidades se aproximan después de realizar la experiencia. Por ejemplo, para saber cuál es la probabilidad de obtener el as con un dado determinado, se arroja el dado 600 veces en las cuales se obtienen 113 veces un as. La probabilidad de obtener un as con ese dado es estimada por la frecuencia relativa = 113/600 = 0.1883. Realice ( u observe) un procedimiento un gran número de veces y cuente las ocasiones que el suceso A ocurre en realidad. Con base en estos resultados reales, P(As) se estima de la siguiente forma :  f (As)  P(As)  » = f r(As) å f  4.4. AXIOMAS DE PROBABILIDAD 1.­ Si E es un evento cualquiera en un espacio muestral M , entonces 0≤  P ( E ) ≤ 1 La probabilidad de un suceso varía entre 0 y 1. 2.­ Al espacio muestral M completo le corresponde P(M)=1 3.­ Si A y B son eventos mutuamente exclusivos, entonces se cumple P(AÈB)=P(A)+P(B) 8 2 
  • 83. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Si el espacio muestral es infinito, debemos reemplazar el axioma 3 por 3* .­ Si E1 , E 2 , . . . . son eventos mutuamente exclusivos, entonces tenemos que P (E1 È E 2 È . . . ) = P ( E1 ) + P ( E 2 ) + ........ 4.5. PROPIEDADES: 1.­ Si Ø es el conjunto vacio, entonces P (Ø ) = 0 . Imposibilidad Por ejemplo, la probabilidad de extraer el as de espada de una baraja ordinaria de 52 cartas es 1/52. Pero la probabilidad de sacar un as de espada rojo es cero (puesto que no hay figuras de espadas rojas en la baraja).no hay sucesos posibles que favorezcan este resultado. 2.­ Si E c es el complemento de un evento E , entonces P (E c ) = 1 – P( E ) 3.­ Si A Ì B , entonces P ( A ) menor o igual a P ( B ). v La probabilidad de que ocurra el evento A , es decir que al lanzar un dado salga un número par , se calcula como P(A) =3/6 = 1/2 donde: · el número de resultados favorables es 6, ya que A = í2, 4, 6 ý, tiene 3 elementos. · el número total de resultados es 6, ya que M= {1 , 2 , 3 , 4 ,5, 6} tiene 6 elementos. v La probabilidad de que ocurra el evento B, es decir que al lanzar un dado salga un número impar , se calcula como P(B) =3/6 = 1/2 donde: · el número de resultados favorables es 6, ya que B = í1,3,5 ý, tiene 3 elementos. · el número total de resultados es 6, ya que M = {1 ,2 ,3, 4, 5 , 6} tiene 6 elementos. 8 3 
  • 84. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  v La probabilidad de que ocurra el evento C, es decir que al lanzar un dado salga un número menor que 4 , se calcula como P(C) =3/6 = 1/2 donde: · el número de resultados favorables es 6, ya que C= í1 ,2, 3 ý, tiene 3 elementos. · el número total de resultados es 6, ya que M = {1 , 2, 3, 4, 5 , 6} tiene 6 elementos. v La probabilidad de que ocurra el evento D, es decir que al lanzar un dado salga un número mayor que 3 , se calcula como P(D) =3/6 = 1/2 donde: · el número de resultados favorables es 6, ya que D= í4, 5, 6 ý, tiene 3 elementos. · el número total de resultados es 6, ya que M = {1 , 2,3 , 4, 5 , 6} tiene 6 elementos. v La probabilidad de que ocurra el evento E, es decir que al lanzar un dado salga un número impar o mayor que 3 , se calcula como P(E) =5 / 6 donde: · el número de resultados favorables es 5,ya que E=í1,3,4,5,6 ý, tiene 5 elementos. · el número total de resultados es 6, ya que M = {1 , 2, 3 , 4 ,5, 6} tiene 6 elementos. v La probabilidad de que ocurra el evento F, es decir que al tirar un dado salga un número par y menor que 4 , se calcula como P(F) =1 / 6 donde: · el número de resultados favorables es 1, ya que F = í2 ý, tiene 1 elemento. · el número total de resultados es 6, ya que M = {1,2 , 3 , 4, 5, 6} tiene 6 elementos. v La probabilidad de que ocurra el evento G, esta formado por la intersección de los eventos A y B que son 8 4 
  • 85. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE mut uamente excluy entes, decir que al lanzar un dado ,” un número impar y par “ , es cero, ya que es imposible de que ocurra dicho evento. La probabilidad del evento nulo o vacio siempre es 0.se calcula como P(G) = P (Ø ) = 0 donde: · el número de resultados favorables es vacio, ya que G = íý. · el número total de resultados es 6, ya que M = {1, 2, 3, 4 , 5 , 6} tiene 6 elementos. 4.5.TEOREMA DE LA SUMA DE PROBABILIDADES Sean A y B dos eventos del espacio muestral M generado por un experimento aleatorio. El teorema de la suma de probabilidades dice que la probabilidad de la unión de A y B es la suma de las probabilidades menos la probabilidad de la intersección. En símbolos: Sean A y B Ì  M  entonces P(AÈB)=P(A)+P(B)­ P(AÇB) Si los eventos son mutuamente excluyentes, el último término desaparece, pues A Ç B = Ø y P (Ø ) = 0 P(AÈB)=P(A)+P(B) ü En el ejemplo, calcule la probabilidad del evento “ sale cara o sale un número par” correspondiente al experimento de lanzar simultáneamente un dado y una moneda, utilizando el teorema de la suma de probabilidades. El espacio muestral M= {(1,c); (1,s); (2,c); (2,s) ; (3,c); (3,s) ; (4,c); (4,s) ; (5,c); (5,s) ; (6,c); (6,s) c: salga cara P: salga número par P(CÈP)=P(C)+P(P)­ P(CÇP) 6 6  3  9  3  + - = = = 0 75  ,  P (C È P )= 12  12  12  12  4  8 5 
  • 86. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 4.6. PROBABILIDAD CONDICIONAL Muchas veces necesitamos encontrar la probabilidad de un evento B si se sabe que ha ocurrido un evento A. Esta probabilidad se llama probabilidad condicional de B dado A, y se representa como P ( B / A ) . En este caso A sirve como un espacio muestral nuevo ( reducido ) , y la probabilidad es la fracción de P( A) que corresponde a A ÇB. Así que P ( A Ç B ) P(B/A) = P  A    ( ) Del mismo modo, la probabilidad condicional de A dado B es P ( A Ç B ) P  ( A / B )  = P  B    ( ) . Volviendo al ejemplo del dado: a) halle la probabilidad de que aparezca un número menor que 4 dado que apareció un número mayor que 3 b) halle la probabilidad de que aparezca un número impar dado que apareció un número mayor que 3 Solución : a) P ( C / D ) se denomina probabilidad condicional de C dado que ha ocurrido el evento D , se define como P ( C / D ) = P ( C Ç D ) / P( D ) En este caso M = í1 , 2 , 3 , 4 , 5 , 6 ý C = í 1 , 2 , 3 ý , D = í 4 , 5 , 6 ý , P( D ) = 3 / 6 = 1 /2 , P( C Ç ) = 0 P(C/D)= 0/½ =0 b) P ( B / D) es la probabilidad condicional de que aparezca un número impar dado que apareció un número mayor que 3. P( D )= 3 / 6 = 1 / 2 P ( B Ç D ) = 1/6 P ( B / D = P( B Ç D ) / P( D ) = 1/6 / 12 = 1/3 8 6 
  • 87. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 4.7..TEOREMA DEL PRODUCTO DE PROBABILIDADES En ocasiones, nos encontramos con la necesidad de determinar la probabilidad de ocurrencia simultánea de dos o mas eventos. Para obtener este resultado, deberemos aplicar la regla de multiplicación Regla de la Multiplicación : Si A y B son eventos conteni dos en un espa cio muestral M , y P ( A ) > 0 y P ( B ) > 0, entonces se cumple que P ( A y B ) = P(AÇB) = P(A) · P(B /A) = P ( B ) · P ( A /B) Cuando los eventos son independientes: En el caso especial en el que la ocurrencia de A no está en absoluto relacionada con la ocurrencia de B y viceversa , se dice que los sucesos son independientes. La independencia se representa simbólicamente por P ( B/ A ) = P(B) y P (A /B)=P(A). Cuando los event os son independient es la regla de la multiplicación se simplifica a : Si A y B son eventos contenidos en un espacio muestral M y P(A)> 0 y P(B)> 0, entonces “La probabilidad de la intersección es el producto de las probabilidades” : P ( A y B ) = P(AÇB) = P(A) · P(B) En el ejemplo del dado : son A y C independientes? Si la probabilidad del resultado A no depende de la ocurrencia de un segundo evento C ( o viceversa) se dice que A y C son eventos independientes. En términos de probabilidad se expresa que A y C son eventos independientes si P ( A / C ) = P ( A ) ó bien P ( C / A ) = P ( C ) En este caso A y C no son eventos independientes ( se denominan dependientes), debido a que 8 7 
  • 88. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  Si al lanzar un dado M:{1,2,3,4,5,6} A: número par B: numero impar P (A)= 3  6  P (C)= 3  6  P (A Ç C)= 1  6  1  6  1  P (A/C): 3  3  6  3  1  P(A)= 6  2  P ( A / C ) = 1 / 3 que no es igual a P ( A ) = 1 / 2 , Y P ( C / A ) = 1/3 que no es igual a P ( C ) = 1/2 Debemos notar que los sucesos mutuamente exclusivos no son nunca in dependientes, puesto que la ocurrencia de uno niega la posibilidad de ocurrencia del segundo. Entonces : P( A/ B ) = P( B/ A) = 0 Muestreo con y sin reemplazo Hay dos maneras de extraer objetos para obtener una muestra de un conjunto dado de objetos, conocido como muestreo de una población; estas son las siguientes. 8 8 
  • 89. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 1.­ Muestreo con reemplazo significa que el objeto que se extrajo al azar se coloca de nuevo en el conjunto dado, se mezcla completamente y se precede a extraer al azar el siguiente objeto. 2. Muestreo sin reemplaz o significa que el objeto que se extrajo se deja aparte y no se lo introduce nuevamente. Ø Ejemplo Una caja contiene 10 cuadernos, de los cuales 3 están con fallas. Dos cuadernos se extraen al azar sin reemplazo. Encontrar la probabilidad del evento tal que ninguno de los 2 cuadernos tenga fallas. Solución: Consideremos los eventos A : El primer cuaderno extraído no tiene fallas. B: El segundo cuaderno extraído no tiene fallas. Es claro que P ( A ) = 7/10, ya que 7 de los 10 cuadernos no son defectuosos y estamos muestreando aleatoriamente, por lo cual cada cuaderno tiene la misma probabilidad ( 1/10 ) de ser escogido. Si A ocurre, entonces quedan 9 cuadernos en la caja, 3 de los cuales tienen fallas, por lo que P ( B / A )= = 6 / 9 = 2 / 3 Y por el teorema de la multiplicación, la respuesta es P ( A Ç B ) = 7 /10 . 2 / 3 = 0,47 Ø Ejemplo Si se seleccionan dos cartas de un paquete de naipes bien barajado, ¿ cuál es la probabilidad de que ambas sean reinas?. Solución Hay dos maneras de seleccionar las cartas: 1) Se puede seleccionar una carta, reponerla en la baraja , barajar y extraer una segunda carta. (Muestreo con reemplazo). 2) Se pueden seleccionar las dos cartas consecutivamente sin reemplazar la primera en la baraja (Muestreo sin reemplazo) 8 9 
  • 90. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 1º. Sea A el suceso de una reina en la primera extracción, y B el suceso de una reina en la segunda extracción. Cuando el muestreo es con reemplazo, la probabilidad de extraer una reina permanece igual en las dos extracciones. Así, puesto que P ( A / B ) = P ( A ) y P ( B / A ) = P ( B ) , as dos extracciones son independientes, por lo tanto P ( A Ç B ) = P ( A ) . P ( B ) = 1/13 . 1/13 = 1 / 69 2º. Cuando se emplea el muestreo sin reemplazo la probabilidad de obtener una reina en la segunda extracción se reduce siempre que la primera carta seleccionada haya sido una reina. En otras palabras , cuando P ( B / A ) ¹ P ( B ) o P ( A / B ) ¹ P ( A ) , los sucesos no son independientes.. La probabilidad de extraer una reina en el segundo intento es 3 / 51. Empleando la fórmula correspondiente, encontramos que la probabilidad de seleccionar dos reinas en extracciones consecutivas procedentes de una baraja sin reemplazo , es : P ( A Ç B ) = P ( A ) . P ( B / A ) = 1 / 13 . 3 / 51 = 1 / 221 Se debe notar que la diferencia entre ambos muestreos es despreciable cuando la población es grande en relación con el tamaño de la muestra. Ø Ejemplo: Para un estudio, se obtiene una muestra de alumnos de una escuela y se los clasifica según lugar de residencia y el medio de transporte que utilizan para llegar a la misma, obteniéndose los siguientes resultados: Lugar de residencia Medio para llegar a la e sc uela Total Caminado Bicicleta Ómnibus Barrio A 100 20 50 170 Barrio B 50 20 30 100 Barrio C 30 10 5 45 Total 180 50 85 315 Suponga que se selecciona un alumno al azar de este grupo. Obtenga las probabilidades siguientes ü Que el alumno resida en el barrio A 9 0 
  • 91. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 170  P ( A  =  )  = 315  0.5397 ü Que el alumno resida en el barrio A o en el B 170 100  270  + = = 0 8571  .  P(AÈB)=P(A)+P(B)= 315  315  315  ü Que el alumno no sea del Barrio A  315 - 170  145 P ( A  =  )  = 0 4603  .  315  = 315  ü Que el alumno sea del Barrio A y vaya caminando a la escuela 100  P(AÇC)= 315 =0.3175 ü Probabilidad que el alumno vaya en ómnibus a la escuela dado que vive en el barrio B 30  P ( B I O  315  30  )  =  = = 0 3  ,  P ( B )  100  100  P(B/O)=  315  ü Probabilidad que el alumno vaya en ómnibus a la escuela o viva en el barrio B 85 100  30  155  + - = P(OÈB)=P(O)+P(B)­ P(OÇB)= 315  315  315  315 =0.4921 9 1 
  • 92. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 5.­ DISTRIBUCIÓN DE PROBABILIDAD Una distribución de probabilidad no es más que, como su nombre lo indica, la asignación a cada evento posible, de un experimento, de la probabilidad que le corresponde. Definición. Cualquier regla o mecanismo que sirva para determinar P( X = x) , probabilidad de que la variable aleatoria X tome cada uno de los valores posibles x , se denomina una Di stribución de Proba bilida d Existen dos tipos de distribuciones que son importantes en las aplicaciones prácticas, a saber: las distribuciones discretas y las continuas. Una distribución discreta surge al contar ( por ejemplo, obtener un 6 y un 4 al lanzar dos dados , o bien sacar un rey al extraer una carta de la baraja española). Una distribución continua aparecerá si se mide ( por ejemplo altura de los alumnos y alumnas de la clase). Entre todas las distribuciones discretas, la Distribución Binomial es la más sencilla. Entre las distribuciones continuas veremos la Distribución Normal. 5.1. VARIABLE ALEATORIA Una variable aleatoria X es una función cuyos valores son números reales y dependen del “azar” . 5.2.DIST RIBUCIONES DE PROBABILIDADES DE VARIABLE ALEATORIA DISCRETA La siguiente es la distribución de la variable aleatoria Xi = nº de puntos obtenidos al arrojar un dado perfecto , o sea que todas sus caras son igualmente posibles: xi 1 2 3 4 5 6 Total P(xi) 1/6 1/6 1/6 1/6 1/6 1/6 1 Obsérvese que se cumplen dos condiciones que son necesarias para que un conjunto de pares ordenados (x,y) sea considerada una distribución de probabilidades: 9 2 
  • 93. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 1) Para cada valor de x le corresponde un único valor de y que es un valor de probabilidad (no negativo y menor o igual a 1), å P ( x i ) 2) M  =1 3) Esta distribución recibe el nombre de uniforme, es una distribución de variable aleatoria discontinua y sus parámetros son los valores mínimo (a) y máximo (b) que puede tomar x. Esto se indica como  X  ~ U (a, b). 5.2.1. DISTRIBUCIÓN BINOMIAL. La variable X toma los valores 0, 1, 2, 3, ... , n. (donde n es finito y bien determinado). Se puede considerar que la Distribución Binomial es la repetición de n pruebas independientes (por ejemplo tomar 4 pruebas en un año). La función de probabilidades es:  P ( x  =  C x  p x q n - x  , )  n  x  donde  C n  son las combinaciones de n elementos tomadas de a x, p= probabilidad de éxito en una sola prueba, q = 1­ p = probabilidad de fracaso. x  La combinaciones se calculan como sigue:  C n  = (n.(n­1). (n­2)...(n­ x+1))/x! Los parámetros que definen a la distribución Binomial son n y p Las dos características necesarias de una distribución de probabilidad consisten en que cada valor de P ( X = x½n , p ) tiene que ser mayor o igual a 0 y que la suma de todos los valores de P ( X = x÷ n , p ) debe ser igual a 1. Ø Ejemplo :Cuando se recibe un envío de lápices en la escuela, se seleccionan de manera aleatoria, 15 unidades con el propósito de verificar el porcentaje de unidades defectuosas en el envío. Con base en información pasada, la probabilidad de tener una unidad defectuosa es de 0.05. La directora ha decidido no recibir el envío cada vez que una muestra de 15 unidades tenga dos o más defectuosas. ¿Cuál es la probabilidad de que, se rechace el envío? 9 3 
  • 94. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Solución El modelo de distribución apropiado para esta situación es la distribución binomial, se puede suponer que las 15 unidades que se seleccionan al día, constituyen un conjunto de ensayos independientes de manera tal que la probabilidad de tener una unidad defectuosa es de 0.05 entre ensayos. Definimos a la variable aleatoria X : “número de unidades defectuosas” que se encuentran entre las 15 unidades seleccionadas. El evento se definirá como A : unidad defectuosa. La probabilidad de A es P(A) = 0,05 El número de ensayos n = 15 La probabilidad de que el envío no se reciba, es igual a la probabilidad de que X sea igual o mayor que dos: P(X ³ 2) = 1 – P(X < 2) = 1 – [P(X = 0) + P(X = 1)] 15!  (0 05  0 (  - 0 05  15 -0  ,  )  1  ,  )  P(0÷ 15, 0,05) =  0! (15 ­ 0)!  = 1(0,95)15 = 0.4631 15!  (0 05 1 (  - 0 05 15 -1  ,  )  1  ,  )  P(1÷ 15, 0,05) =  1! (15 ­ 1)!  = = 15(0,05)(0,95)14 = 0,3658 P(X ³ 2÷ 15, 0,05) = 1 – P(X < 2) = =1 – (0,4631 + 0,3658) = 1 – 0,8289 = 0,1711 Por lo tanto la probabilidad de que, el envío sea rechazado es de 0,1711. La distribución binomial es realmente una familia de distribuciones, puesto que para cada valor diferente de n y p , que se denominan parámetros de la distribución binomial, se puede definir una distribución diferente. Sin tener en cuenta el valor de n , la distribución es simétrica cuando p = 0,5. Cuando p es mayor que 0,5, la distribución es asimétrica y su máximo se encuentra a la derecha del centro. Cuando p es menor que 0,5, la distribución es asimétrica y su máximo se encuentra a la izquierda del centro. 9 4 
  • 95. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Tablas de la Distribución Binomial El cálculo de las probabilidades binomiales mediante la ecuación anterior puede resultar laborioso cuando n es grande .Afortunadamente hay tablas de probabilidades binomiales y entonces no es necesario el uso directo de la ecuación. Solamente necesitamos utilizar una tabla con los valores dados de n , p y x para obtener la probabilidad deseada Para explicar el uso de la Tabla consideremos nuevamente el ejemplo en el cuál deseábamos conocer: La probabilidad de que la dirección rechace el envío es igual a la probabilidad de que X sea igual o mayor que dos : para hallar esta probabilidad en la tabla ,localizamos primero n = 15 ,luego la columna de p = 0,05 y finalmente para x ,las filas marcadas con un 0 y un 1 P(X ³ 2÷ 15 , 005) = 1 – P(X < 2) = 1 – [P(X = 0) + P(X = 1)] = 1 – [0.463 + 0.366] = 0.171 p n x 0,01 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,95 0,99 x 13 0 878 513 254 055 010 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 1 115 351 367 179 054 011 002 0+ 0+ 0+ 0+ 0+ 0+ 1 2 7 111 245 268 139 045 010 001 0+ 0+ 0+ 0+ 0+ 2 3 0+ 21 100 246 218 111 035 006 001 0+ 0+ 0+ 0+ 3 4 0+ 3 28 154 234 184 087 024 003 0+ 0+ 0+ 0+ 4 5 0+ 0+ 006 069 180 221 157 066 014 001 0+ 0+ 0+ 5 6 0+ 0+ 001 023 103 197 209 131 044 006 0+ 0+ 0+ 6 7 0+ 0+ 0+ 006 044 131 209 197 103 023 001 0+ 0+ 7 8 0+ 0+ 0+ 001 014 066 157 221 180 069 006 0+ 0+ 8 9 0+ 0+ 0+ 0+ 003 024 087 184 234 154 028 003 0+ 9 10 0+ 0+ 0+ 0+ 001 006 035 111 218 246 100 021 0+ 10 11 0+ 0+ 0+ 0+ 0+ 001 010 045 139 268 245 111 0+ 11 12 0+ 0+ 0+ 0+ 0+ 0+ 002 011 054 179 367 351 115 12 13 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 010 055 254 513 878 13 14 0 869 488 229 044 007 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 1 123 359 356 154 041 007 001 0+ 0+ 0+ 0+ 0+ 0+ 1 2 008 123 257 250 113 032 006 001 0+ 0+ 0+ 0+ 0+ 2 3 0+ 026 14 250 194 085 022 003 0+ 0+ 0+ 0+ 0+ 3 4 0+ 004 035 172 229 155 061 014 001 0+ 0+ 0+ 0+ 4 5 0+ 0+ 008 086 196 207 122 041 007 0+ 0+ 0+ 0+ 5 6 0+ 0+ 001 032 126 207 183 092 023 002 0+ 0+ 0+ 6 7 0+ 0+ 0+ 009 062 157 209 157 062 009 0+ 0+ 0+ 7 8 0+ 0+ 0+ 002 023 092 183 207 126 032 001 0+ 0+ 8 9 0+ 0+ 0+ 0+ 007 041 122 207 196 086 008 0+ 0+ 9 10 0+ 0+ 0+ 0+ 001 014 061 155 229 172 035 004 0+ 10 9 5 
  • 96. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 11 0+ 0+ 0+ 0+ 0+ 003 022 085 194 250 114 026 0+ 11 12 0+ 0+ 0+ 0+ 0+ 001 006 032 113 250 257 123 008 12 13 0+ 0+ 0+ 0+ 0+ 0+ 001 007 041 154 356 359 123 13 14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 007 044 229 488 869 14 15 0 860 463 206 035 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 1 130 366 343 132 031 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 1 2 0+ 135 267 231 092 022 003 0+ 0+ 0+ 0+ 0+ 0+ 2 3 0+ 031 129 250 170 063 014 002 0+ 0+ 0+ 0+ 0+ 3 4 0+ 005 043 188 219 127 042 007 0+ 0+ 0+ 0+ 0+ 4 5 0+ 001 010 103 206 186 092 024 003 0+ 0+ 0+ 0+ 5 6 0+ 0+ 002 043 147 207 153 061 012 001 0+ 0+ 0+ 6 7 0+ 0+ 0+ 014 081 177 196 118 035 003 0+ 0+ 0+ 7 8 0+ 0+ 0+ 003 035 118 196 177 081 014 0+ 0+ 0+ 8 9 0+ 0+ 0+ 001 012 061 153 207 147 043 0+ 0+ 0+ 9 10 0+ 0+ 0+ 0+ 003 024 092 186 206 103 010 001 0+ 10 11 0+ 0+ 0+ 0+ 001 007 042 122 219 188 043 005 0+ 11 12 0+ 0+ 0+ 0+ 0+ 002 014 063 170 250 129 031 0+ 12 13 0+ 0+ 0+ 0+ 0+ 0+ 003 022 092 231 267 135 009 13 14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 031 132 343 366 130 14 15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 035 206 463 860 15 5.3. DISTRIBUCIONES DE PROBABILIDADES DE VARIABLE ALEATORIA CONTINUA En estas distribuciones no es posible calcular la probabilidad en puntos sino que hay que hacerlo en intervalos. Recuérdese que en las variables discontinuas las probabilidades de intervalos se obtenían sumando las probabilidades que corresponden a cada punto o valor de la variable. En variables continuas, los valores que puede tomar la variable son infinitos por lo que es necesario hacer una suma infinita es decir una integral. En las variables continuas, la probabilidad de un intervalo se obtiene integrando la función de densidad. ü Ejemplo: la distribución rectangular X ~ R (0,2). Esta es una distribución rectangular (todos sus puntos tienen igual densidad de probabilidad) que se extiende desde 0 a 2. El gráfico de su función de densidad es el siguiente: 9 6 
  • 97. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE en el que se puede observar que la función de densidad f(x) = 1/2 La probabilidad de encontrar valores de variables entre 1 y 2 se encuentra integrando la función de densidad entre esos límites. La integral entre esos límites corresponde al área bajo de la curva entre los mismos. 5.3.1.LA DISTRIBUCIÓN NORMAL Si una variable es continua, varía desde -¥ hasta + ¥ y su función de densidad es:  2  1 æ x - m ö 1  - ç ÷  f (x)  =  e  2 è s  ø s 2p , se dice que x tiene distribución normal con parámetros m y  s  (media aritmética y desviación estándar). Esto se simboliza como sigue : X ~ N ( m ,  s  ) 9 7 
  • 98. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Su gráfica es la siguiente: 0,40  0,30  f (x) 0,20  0,10  0,00  4  6  8  10  12  14  x  La distribución normal presenta las siguientes características: 1) Presenta un máximo en x = m , por lo tanto Mo = m 2) Es simétrica y su eje de simetría es  f ( m ) , por lo que se deduce que Md = m = Mo. 3) Tiene dos puntos de inflexión ubicados en  x  = m ± s 4) Toda transformación lineal de x da otra distribución normal. 5) Algunos sectores usados de la función son:  x  = m ± s corresponde aproximadamente al 68 % central  x  =  m ± 2 s corresponde aproximadamente al 95 % central  x  =  m ± 3 s corresponde aproximadamente al 99 % central 6) f(x) se acerca asintóticamente al eje x o sea que f(x) > 0. +¥ ò f ( x ) dx  =  1 1) Por ser función de densidad, el área bajo de la curva es  -¥ Para calcular la probabilidad de un intervalo en la distribución normal, por tratarse de una variable continua, debe hacerse mediante la  9 8 
  • 99. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE integración de la función de densidad, lo cual equivale a calcular el área bajo de la curva. Considérese por ejemplo que la altura de los alumnos de la escuela tiene distribución normal con media m = 1,6 m y desviación estándar s = 0,1 m. La probabilidad de que al seleccionar un alumno al azar, posea altura comprendida entre 1,5 y 1,65 (P(1,5<x<1,65)) se obtiene integrando la función de densidad f(x), (en la cual se debe reemplazar los valores correspondientes de m y s por 1,6 y 0,1 respectivamente) entre los límites 1,5 y 1,65. La di stribuci ón normal está ndar Usando la propiedad que dice que la transformación lineal  x  ­ m z  =  s conduce a una distribución también normal, cuyos parámetros son m z  =  O    y  s z  =  1 , se obtiene una nueva distribución que se conoce con el nombre de distribución normal est ándar o normal 0,1 y se la describe como Z ~ N(0,1) cuya representación gráfica es la siguiente:  ­5  ­3  0  3  5  z 9 9 
  • 100. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Ta bla s de l a di stribuci ón normal El cálculo de probabilidades en la normal involucra el cálculo de integrales que son muy engorrosas de resolver manualmente. Por ello, las integrales están tabuladas para una distribución normal que es la estándar. Vamos a aprender el uso de tablas de una cola Tabla de “ 1 cola” En ella, los valores de probabilidad se encuentran en el cuerpo de la tabla y los valores de z se forman utilizando la primera columna y la primera fila (es decir en lo que se conoce como matriz de la tabla). En esta tabla es importante considerar el signo de z. Como su nombre lo indica, para el valor de z considerado, da el valor del área bajo de la curva desde menos infinito hasta z. Por ejemplo si z = ­2.1 la tabla da P(z < ­2.1) = 0.0179. Ø Ejemplo : Una población de pesos de alumnos en gr tiene distribución normal con media y desviación estándar ( m y  s  ) de 50 y 5 Kg. respectivamente. ¿Cuál es la probabilidad de ü que los alumnos pesen menos de 55 kg En símbolos, la probabilidad buscada es P(x £ 55) Para solucionar esto es necesario pasar de la normal que nos interesa a la normal estándar. Esto se consigue mediante el siguiente cambio de variable:  x  ­ m z  =  s en este caso x = 55 ,  m = 50  y s =  5  por lo que z = (55 ­ 50)/5 = 1. P(x £ 55) = P(z £ 1) = 0,8413 Cuando se busca una valor por menor, la probabilidad se obtiene directamente en la tabla. ü que los alumnos pesen más de 57,75 kg En símbolos, la probabilidad buscada es P(x ³ 57,75) 1 0 0 
  • 101. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Para solucionar esto es necesario pasar de la normal que nos interesa a la normal estándar. Esto se consigue mediante el siguiente cambio de variable:  x  ­ m z  =  s en este caso x = 57.75 ,  m = 50  y s =  5  por lo que z = (57,75 ­ 50)/5 = 7,7/5 = 1,54. P(x ³ 57,75)= P(z ³ 1,54) = 1­ P(z £ 1,54)=1­0,9382=0,0618 z .00 .01 .02 .03 .04 1.0 0.841 0.843 0.846 0.8485 0.850 3 8 1 8 1.1 0.864 0.866 0.868 0.8708 0.872 3 5 6 9 1.2 0.884 0.886 0.888 0.8907 0.892 9 9 8 5 1.3 0.903 0.904 0.906 0.9082 0.909 2 9 6 9 1.4 0.919 0.920 0.922 0.9236 0.925 2 7 2 1 1.5 0.933 0.934 0.935 0.9370 0.938 2 5 7 2 1.6 0.945 0.946 0.947 0.9484 0.949 2 3 4 5 1.7 0.955 0.956 0.957 0.9582 0.959 4 4 3 1 1.8 0.964 0.964 0.965 0.9664 0.967 1 9 6 1 1.9 0.971 0.971 0.972 0.9732 0.973 3 9 6 8 2.0 0.977 0.977 0.978 0.9788 0.979 2 8 3 3 2.1 0.982 0.982 0.983 0.9834 0.983 1 6 0 8 2.2 0.986 0.986 0.986 0.9871 0.987 1 4 8 5 1 0 1 
  • 102. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  ü que los alumnos pesen entre de 52,75 kg y 60 kg En símbolos, la probabilidad buscada es P(52,75 £ x £ 60) Para solucionar esto es necesario pasar de la normal que nos interesa a la normal estándar. Esto se consigue mediante el x ­ m  z =  siguiente cambio de variable s , se buscan dos valores de z, primero para el valor mayor de x, luego para el menor  60 ­ 50  10  52,75 ­ 50  2 75  ,  z    =  2 =  = 2  z  =  1  =  = 0 55  ,  5  5  5  5  Se buscan los valores en la tabla para z=2; P(z £ 2)=0,9861 Se buscan los valores en la tabla para z=0,55; P(z £ 0,55)=0,7088 Luego se restan los valores P(52,75 £ x £ 60)= P(0,55 £ z £ 2)=0,9861­0,7088=0,2773 Los valores de z a más usados y que determinan intervalos centrales (1­a) son: z  = ±1 64  ,  ·  0, 10  para el 90 % central z  , 05  = ±1 96  ,  ·  0 para el 95% central z  = ±2 58  ,  ·  0, 01  para el 99% central Ejemplo En la población de pesos X ~ N(50 ; 5) ¿cuál es el intervalo que corresponde al 95 % central de la población? En la distribución de z, el 95 % central de la población corresponde al intervalo que va desde ­1.96 a +1.96, o sea ± 1.96. Es muy simple, si se desea que en el centro esté el 95 % o, en tanto por uno, 0.95, entonces en z  = ±1 96  ,  las colas debe quedar el 0.05. el valor que corresponde  0, 05  . Ya se determinó el intervalo en z, ¿cómo se pasa a la normal con media 50 y desviación estándar 5? Se debe hacer el cambio inverso de variable:  x  ­  m z  =  entonces  x  =  m ± z s s . 1 0 2 
  • 103. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Para indicar que el intervalo corresponde a un porcentaje central determinado se acostumbra a llamar a a lo que queda en las colas.  x  =  m ± z a s Volviendo entonces al ejemplo, por ser  z a = 1.96, el intervalo que corresponde al 95 % central de la población de pesos de los alumnos es: x = 50 ± 1.96 5 = 50 ± 9,80 . El intervalo del 95 % central entonces va desde 40,20 kg a 59,80 kg. 1 0 3 
  • 104. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE GUÍA DE EJERCITACIÓN Actividad 1 El Director de una escuela debe establecer turnos para que el establecimiento siempre tenga dos administrativos durante el mes de enero. Para ello de los cinco empleados que dispone (A, B, C, D, E) debe formar grupos de dos seleccionados al azar, sin reemplazo. Describa el espacio muestral de este experimento aleatorio. Actividad 2 a) ¿Cómo sería el espacio muestral en la actividad anterior si el muestreo fuera con reemplazo? b) ¿Cuál es la forma correcta de efectuar este experimento, para que el Director del establecimiento siempre tenga dos administrativos en el mes de enero? Actividad 3 Dé dos ejemplos de sucesos seguros y dos de sucesos imposibles. Actividad 4 En el experimento aleatorio de la Actividad N°1, a) ¿Cuántos grupos de dos personas se formaron? b) ¿En cuántos está A? c) ¿En cuántos está B? d) ¿En cuántos están A y B? e) ¿En cuántos no ha sido seleccionado C? f) ¿En cuántos han sido seleccionados A ó B ó C? g) Calcule la probabilidad de cada uno de estos sucesos. Actividad 5 Una oficina donde asignan becas para estudio a alumnos de EGB, realiza la selección de los mismos para dos Becas de distinto origen de fondos; los resultados posibles son Seleccionado (S) o No Seleccionado (NS). El experimento consiste en tomar al azar un alumno y observar el resultado en las dos selecciones. a) Describa el espacio muestral de este experimento (suponga que todos los alumnos han estado inscriptos en las dos Becas) b) ¿Cuál es la probabilidad de que el alumno haya sido seleccionado en las dos Becas? 1 0 4 
  • 105. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE c) ¿Cuál es la probabilidad que el alumno no haya sido seleccionado ninguna de las dos Becas? d) ¿Cuál es la probabilidad que el alumno haya sido seleccionado en una Beca por lo menos? e) ¿Cuál es la probabilidad que el alumno haya sido seleccionado a lo sumo en una Beca? Actividad 6 Cada uno de los items siguientes representan las probabilidades de cada uno de tres eventos simples. Marque el item correcto, justificando al mismo tiempo su respuesta. a) P(E1) = 0.8 P(E2) = 0.3 P(E3) = 0.1 b) P(E1) = 0.3 P(E2) = 0.2 P(E3) = 0.5 c) P(E1) = ­0.6 P(E2) = 0.2 P(E3) = 0.2 d) P(E1) = 1/3 P(E2) = 1/2 P(E3) = 1/6 Actividad 7 En una encuesta realizada a 90 alumnos que egresan del Polimodal en un establecimiento educativo, se les preguntaba sobre el nivel de instrucción alcanzado por los padres y si seguirían estudiando o no una carrera superior. El resultado de la encuesta figura en la tabla siguiente: Nivel de educación ¿Seguirán Total de los padres estudiando? Si No Superior 20 10 30 Secundario 30 10 40 Primario 15 5 20 Total 65 25 90 Si se selecciona un alumno al azar, cuál es la probabilidad de: a) ¿Qué el alumno tenga padres con educación superior? b) ¿Qué el alumno siga estudiando? c) ¿Qué el alumno siga estudiando y tenga padres con educación primaria? d) ¿Qué el alumno tenga padres con educación superior o secundaria? e) ¿Qué el alumno tenga padres que no posean educación superior? 1 0 5 
  • 106. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE f) ¿Qué el alumno siga estudiando dado que posee padres con educación primaria? g) ¿Qué el alumno no siga estudiando dado que posee padres con educación secundaria? h) El evento que siga estudiando es independiente del nivel de educación Superior alcanzado por los padres? Actividad 8 En un examen de 10 bolillas un alumno no sabe dos de ellas. ¿Cuál es la probabilidad que le toquen justamente las dos bolillas que no sabe? Actividad 9 Una prueba tiene 2 preguntas con dos opciones: Verdadero (V) o Falso(F). a) ¿Cuál es la probabilidad de que acierte en las dos? b) ¿Cuál es la probabilidad de que acierte por lo menos en una? c) ¿Cuál es la probabilidad de que a las dos las conteste incorrectamente? Actividad 10 En una escuela hay tres Profesores de Educación Física. La probabilidad de que no asistan a clase cada uno de ellos es de 0.05. ¿ Cuál es la probabilidad de que un día cualquiera falten los tres juntos? Actividad 11 En un análisis realizado por el Director de un establecimiento educativo, se determinó que de los alumnos ingresantes en EGB en una cohorte, solo el 70% (en promedio) completó el polimodal. De ellos solo el 15% lo hizo en el mismo establecimiento. ¿Cuál es la probabilidad de que un nuevo alumno ingresante en EGB termine el Polimodal en la misma escuela? Actividad 12 La probabilidad de que a un alumno le interese Matemáticas en un curso es de 0.1. Si se toman 3 alumnos de dicho curso al azar: ¿Cuál es la probabilidad de que: a) No le agrade a ninguno Matemáticas? b) Le agrade por lo menos a un alumno esta materia? c) Le agrade como máximo a 2 alumnos? 1 0 6 
  • 107. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Actividad 13 La probabilidad de que un alumno apruebe una Prueba Integradora de conocimientos de Matemática en el último año del Polimodal es de 0.25. Si se seleccionan al azar 10 alumnos de un curso: a) ¿Cuál es la probabilidad de que 5 alumnos aprueben? b) ¿Cuál es la probabilidad de que no apruebe ningún alumno? c) ¿Cuál es la probabilidad de que todos aprueben? d) ¿Cuál es la probabilidad de que aprueben como mínimo 5 alumnos? e) ¿Cuál es la probabilidad de que como máximo aprueben 5 alumnos? Actividad 14 La probabilidad de que la última semana de clase los alumnos que egresan cometan un acto de indisciplina serio es de 0.004. De 300 alumnos que terminan este año: ¿Cuál es la probabilidad de que: a) 8 alumnos terminen sus estudios con una sanción por este acto de indisciplina? b) De qué más de 5 alumnos terminen sus estudios con una sanción por este acto de indisciplina? c) De que menos de 4 terminen sus estudios con una sanción por este acto de indisciplina? d) De qué ningún alumno cometa un acto de indisciplina serio? Actividad 15 Los pesos de los alumnos de un curso de EGB se distribuyen normalmente con m = 48 kg y s = 2 kg. a) Obtenga los pesos estándar correspondientes a: 43 kg ; 44.5 kg ; 46 kg ; 49.5 kg ; 50 kg b) ¿Cuál es la probabilidad de que un alumno tenga un peso menor a 44.5 kg? c) ¿Cuál es la probabilidad de que un alumno tenga un peso mayor a 46 kg? d) ¿Cuál es la probabilidad de que un alumno tenga un peso entre 44.5 kg y 49.5 kg? e) ¿Cuál es la probabilidad de que un alumno tenga un peso de por lo menos 46 kg? f) Obtenga el Rango Percentil correspondiente a los pesos del item a). Interprete que significa cada uno de ellos. g) Si el número de alumnos a los que se ha medido el peso en ese curso fuera de 200, ¿ cuántos alumnos tendrán un peso inferior a la media?. ¿Cuántos alumnos tendrán un peso superior a 52 kg? 1 0 7 
  • 108. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE h) ¿Qué porcentaje de alumnos tienen un peso comprendido entre 45 kg y 47 kg? Actividad 16 Los puntajes promedio con su correspondiente desviación estándar, obtenidos por los alumnos del último curso de Polimodal en una escuela en los exámenes finales de una asignatura son los siguientes: CURSO m s A 5.9 1.5 B 6.75 1 Se supone que los puntajes se distribuyen normalmente: a) Si un alumno del Curso A ha obtenido 7 puntos y otro del Curso B igual puntaje, quiere decir que el nivel de aprendizaje es el mismo en los dos cursos?. Justifique su respuesta. b) ¿Qué porcentaje de alumnos obtuvieron más de 5 puntos en cada curso? Analice en base a esto el rendimiento de cada curso. c) ¿Qué porcentaje de alumnos obtuvieron más de 7 puntos en cada curso? d) ¿Qué porcentaje de alumnos obtuvieron menos de 4 puntos en cada curso? e) ¿En base a estos resultados qué conclusión puede enunciar? 1 0 8 
  • 109. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  UNI DA D  V INFERENCIA ESTADÍSTICA 1. INTRODUCCIÓN En capítulos anteriores se vió: Est adíst ica Descriptiva : Su objetivo es la recolección y reducción de datos . Se estudian técnicas para presentar los datos de una forma mas comprensible y así poder visualizar propiedades de los mismos. Cálculo de Probabilidades :La razón de su estudio es que la Estadística incluye la toma de decisiones en presencia de incertidumbre. Estas decisiones tomadas se basan en probabilidades. Aquí conocemos ( o suponemos conocido) por completo el modelo probabilístico que usamos, es decir, la población a estudiar la podemos representar por una variable aleatoria X Recordemos que una población está constituida por todos los elementos que poseen unos caracteres por cuyo estudio estamos interesados. Una muestra, en cambio, es una parte de los elementos de la población; pero esta parte ha de ser representativa del total. Cuando el estadístico puede observar todos los elementos de la población ( observación exhaustiva) , entonces su tarea se reduce a describir las características y regularidades de la población. Pero si la observación no puede ser exhaustiva, entonces aquellas características hay que estudiarlas a través de una muestra representativa. Hay que distinguir entre poblaciones finitas y poblaciones infinitas. Se dice que una población es finita si tiene un número limitado de sucesos o unidades elementales. Ejemplo de población finita son, en un año dado los salarios recibidos por todos los docentes de un Colegio, los títulos recibidos por todos los estudiantes de un país. Mientras el número total de observaciones posibles sea limitado, se trata de una población finita. 1 0 9 
  • 110. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE En cambio, una población infinita es la que, consiste en un número infinitamente grande de observaciones. Por lo menos es teoría , no hay límite alguno al número de unidades que puede abarcar. Por ejemplo, los resultados obtenidos al jugar dos dados constituyen una población infinita , lo mismo que los pesos al nacer de todos los seres humanos.. Una población infinita puede ser siempre generada a partir de un conjunto finito de valores o unidades si el muestreo se hace con reemplazo. 2. INFERENCIA ESTADÍSTICA Definición: La Inferencia Est adística es el procedimiento por medio del cual se llega a inferencias acerca de una población mediante los resultados que se obtienen a part ir de una muestra extraída de esa población. El objetivo principal de la Est adíst ica Inferencial es la esti ma ción , esto es que mediante el estudio de una muestra aleatoria seleccionada de una población se quiere generalizar las conclusiones al total de la misma. Defi nición de muestra alea tori a Todo conjunto de n unidades de observación elementales tomadas de una población dada, se puede considerar como una muestra de tamaño n. Pero el tipo de muestra que aquí interesa es el de muestra aleatoria Una muestra aleatoria se puede tomar con o sin reemplazo. Si la muestra se toma con reemplazo, de una población , finita o infinita , la unidad tomada se vuelve a dejar en la población y el número de unidades disponibles para seguir la operación no se afecta. Esto tambien es cierto cuando la muestra se toma de una población infinita sin reemplazo, es decir, cuando la unidad escogida no se vuelve a la población. Cuando se toma un elemento, sin reemplazar, de una población finita, el número de unidades que quedan tras cada unidad que se saca se reduce en una unidad, y en consecuencia la probabilidad de sacar cualquier unidad restante en operaciones sucesivas se aumenta. Es necesario formular nuestro concepto en forma precisa. Por definición, una muestra debe tener ciertas propiedades como sigue: Se supone que las muestras dan información acerca de la población a que corresponde, ya que por lo general es demasiado costoso, requiere 1 1 0 
  • 111. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE demasiado tiempo, o es imposible observar o medir todos los objetos pertenecientes a la población.. La muestra debe ser una selección aleat oria . Es decir, cada elemento de la población debe tener una probabilidad conocida de ser extraído, esto es, de ser tomado en la muestra; el caso mas sencillo y más común es en donde la probabilidad es la misma para todos los elementos de la población , y solo si se satisface este requisito ( al menos aproximadamente) , los métodos estadísticos darán resultados razonables y útiles. Además, es necesario que las n ejecuciones del experimento aleatorio con el que obtenemos n valores de la muestra sean independientes, esto es, el resultado de una ejecución no debe influir en las otras ejecuciones. Esto equivales a decir que la probabilidad de que cualquier miembro de la población aparezca en una muestra, no depende de la aparición o no aparición de los otros miembros de la población en la muestra. Hay que tener presente que el conocimiento de las características de una población, salvo algunas excepciones, no puede conseguirse con toda exactitud mediante una muestra. Si se tiene una población humana y suponemos que no existen errores de observación, la única manera de obtener exactamente la estatura media, el porcentaje de analfabetos, , etc. , en dicha población es observando todos los elementos de ella. Pero si esta observación exhaustiva no es posible y se utiliza como medio supletorio una muestra, entonces lo único que puede obtenerse, salvo en algunos casos particulares, son estimaciones de aquellas características. El problema de la Inf erencia Esta dística se acostumbra a enfocar de dos maneras distintas. Partiendo del hecho cierto de que una muestra, en ge­ neral, no da una información exacta de las características de la población que deseamos estudiar, puede procederse asi: 1º Utilizar la muestra para estimar dichas características. Este enfoque origina la Teoría de la Esti ma ción , mediante la cual se da solución a los problemas específicos que se plantean. 2º Emitir hipótesis sobre aquellas características tomando como base la experiencia, otras informaciones o incluso el presentimiento o la corazonada. Una hipótesis así formulada tiene, evidentemente, poco valor científico. Este valor se adquiere tomando una muestra de la población y utilizándola para verificar o contrastar 1 1 1 
  • 112. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE la hipótesis., Este enfoque da lugar a la Teorí a de la Verifi ca ci ón o Contra sta ción de hipótesis. Para distinguir claramente entre ambas , considérense los siguientes ejemplos . Un candidato para un puesto público desea estimar la proporción real de votantes que lo apoyan mediante la obtención de las opiniones de una muestra aleatoria de 100 votantes. La fracción de ellos que lo apoye puede utilizarse como una estimación de la proporción real de la población total de votantes. Este problema pertenece al área de estimación. Ahora considérese el caso en el cual una Profesora se interesa en determinar si el sistema nuevo de evaluación( A ) implementado por el Colegio es mejor que el sistema anterior de evaluación ( B ). Esta Profesora podría suponer que el sistema A es mejor al sistema B y , después de realizar las pruebas apropiadas , aceptar o rechazar esta hipótesis .En este ejemplo se intenta tomar una decisión correcta respecto a la hipótesis preestablecida.( La prueba de hipótesis no se verá en el desarrollo de esta Asignatura ). 3. DISEÑOS DE MUESTREO La operación de tomar una muestra de una población se denomina muestreo y los métodos de muestreo que se utilicen deben garantizar aquella representatividad para que pueda hablarse correctamente de una muestra estadística. Si se desea conocer, por ejemplo, el consumo medio de proteínas por alumno y dia en una ciudad y tomamos para ello un grupo de familias integrado por la de mas alto nivel de vida, se concluirá que ese grupo no es representativo del total de familias de la ciudad.. Por tanto, el consumo medio que se obtenga del citado grupo no es una buena estimación porque entraña un error de un tipo distinto del que cabe esperar en una muestra representativa. Conviene distinguir entre dos clases de error. De una parte existen los errores muestrales, que son aquellos que están latentes en toda muestra representativa, pues aun siéndolo no proporciona , salvo raras excepciones, una medida exacta de las características de la población; por ello hay que contar siempre con los errores muestrales o errores de muestreo. 1 1 2 
  • 113. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Y por otra parte están los sesg os, bajo cuya denominación se incluyen algunos errores específicos de las muestras como los debidos a su falta de representatividad, y otros que son comunes a toda investigación estadística, tanto si es exhaustiva como si no lo es. A este último grupo pertenecen los errores de observa ci ón , los originados por definiciones defectuoasas de los elementos de la población, de los caracteres a investigar , los debidos a respuestas o medidas mal efectuadas , a fórmulas inadecuadas, a cálculos equivocados, etc. Ejemplo :Supongamos que deseamos tomar una muestra de 100 estudiantes de un Colegio para conocer la opinión del alumnado respecto a la adecuación de las evaluaciones. Un posible método es situarse a las nueve de la mañana en una entrada del Colegio y preguntar a los 100 primeros alumnos que aparezcan. Con este procedimiento los alumnos que solo tienen clase por la tarde no estarán representaos en la muestra. Además, estarán muy poco o nada representados los estudiantes que no tengan clase a primera hora o los que teniéndola no acudan habitualmente. Cuando algunos miembros de la población tienen una probabilidad más alta que los otros de estar representados en una muestra se dice que existe un sesgo de selección y la muestra puede no ser representativa de la población. Por ejemplo, si existen diferencias marcadas de opinión entre los alumnos nuevos y los veteranos, y la muestra sólo incluye a los veteranos, tendrá un sesgo de selección.Una forma de evitar este sesgo es tomar la muestra mediante un procedimiento de selección objetivo que garantice a todos los elementos de la población la misma oportunidad de aparecer en la muestra. El método anterior presenta además el riesgo de un sesgo adicional: el sesgo por no respuesta. Si los estudiantes que no responden son los más disconformes con las evaluaciones, la muestra contendrá una proporción menor de estudiantes de estas categorías y, de nuevo, puede no ser representativa de la población que tratamos de investigar. El sesgo de no respuesta no puede evitarse con certeza pero deben tomarse precauciones para prevenir que ocurra. 3.1. MUESTREO AL AZAR SIMPLE El muestreo aleatorio simple está fundamentado en el puro azar. Se puede decir que es un muestreo en el que si se saca al azar una muestra de n unidades, toda posible muestra de n unidades tiene la misma probabilidad de ser seleccionada, Una muestra obtenida por este procedimiento se dice muestra aleatoria si mpl e . 1 1 3 
  • 114. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Uno de los métodos comúnmente utilizados para lograr que la muestra sea aleatoria es numerar todos los elementos de una población, escribir los números en tarjetas o fichas o bolillas o cualesquiera cosas físicamente homogéneas; poner luego en una bolsa estos objetos numerados y mezclarlos completamente. Se define el tamaño n de la muestra y se sacan los objetos al azar uno por uno, hasta que se obtenga el número deseado de partidas para anotar. El procedimiento se puede simplificar utilizando una tabla de números aleatorios. 3.2. MUESTREO ALEATORIO SISTEMÁTICO Cuando los elementos de la población están ordenados en listas, una alternativa más fácil de ejecutar que el muestreo aleatorio simple es el muestreo sist emát ico. Muy a menudo, si se desea un muestreo aleatorio simple se sigue un procedimiento sistemático en vez de un método al azar. Según el procedimiento sistemático, se obtiene una muestra tomando cada k­ésima unidad de la población tras numerar las unidades de la población o haberlas ordenado de alguna manera. La letra k representa un número entero, que es aproximadamente la razón de muestreo entre el tamaño de la población y el tamaño de la muestra. Así, si la población consiste en 10.000 unidades de muestreo y se desea una muestra de 500 unidades, entonces K = 10.000 / 500 = 20 Y la muestra se obtiene tomando una unidad cada veinte de la población. Para que toda unidad de la población tenga igual probabilidad de salir, el procedimiento debe empezar al azar. Con una razón de muestreo de 20, se puede utilizar el procedimiento de la bolsa o del bolillero poniendo 20 bolillas o 20 papelitos numerados de 1 a 20 en el bolillero o bolsa. Tras revolver y mezclar completamente, se saca una bolilla al azar. Si se saca la bolilla 11, se empieza con este número y se incluye enla muestra cada vigésima bolilla a partir de esta, es decir, la treinta y una, la cincuenta y una , y así sucesivamente. 1 1 4 
  • 115. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 3.3. MUESTREO POR ESTRATOS El muestreo aleatorio simple debe utilizarse cundo los elementos de la población son homogéneos respecto a la característica a estudiar, es decir, a priori la predicción que haríamos del valor de la variable sería el mismo para todos los elementos. Un muestreo que sería mas efectivo que este, es el muestreo aleatorio por estratos, procedimiento que exige tener conocimiento previo de la población. El proceso de estratificación contempla dividir la población en grupos o clases llamados estratos . Dentro de cada uno de tales estratos, están los elementos situados de manera más homogénea con respecto a las características que estén en estudio. Para cada estrato se toma una submuestra mediante el procedimiento aleatorio simple, y la muestra global se obtiene combinando las submuestras de todos los estratos. El muestreo por estratos es el más efectivo cuando se trata de poblaciones heterogéneas tales como datos de desempleo ( que varían de ocupación a ocupación ), ventas al por menor ( que difieren entre las distintas regiones geográficas) , y las actitudes de los consumidores respecto de malos nuevos modelos de automóviles ( en las que influyen factores teles como el sexo, la edad, y la categoría de ingreso). Al hacerse la estratificación, las clases se establecen de modo que las unidades de muestreo tienden a ser uniformes dentro de cada clase, y las clases tienden a ser diferentes entre sí. Así se puede controlar la proporción de cada estrato en la muestra global y no dejarla al azar y queda asegurado el carácter representativo de la muestra. El muestreo por estrato es por consiguiente una combinación de submuestras de los estratos, que son muestras aleatorias simples o sistemáticas. En cuanto tales, todo elemento disponible de cada estrato tiene igual probabilidad de ser seleccionado, y esta será la situación aun en el caso en que la muestra no sea proporcionada, en el cual las probabilidades de ser seleccionado cada elemento individual de la población no son iguales. 3.4.MUESTREO POR CONGLOMERADO Diametralmente opuesto al muestreo por estratos está el muestreo por conglomerados, que consiste en seleccionar primero al azar grupos, llamados conglomerados , de elementos individuales de la población, y en tomar luego todos los elementos o una submuestra de ellos dentro de cada conglomerado para constituir así la muestra global. Para lograr los mejores 1 1 5 
  • 116. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE resultados ern el plan del muestreo por conglomerado, se hacen tan pequeñas como sea posible las diferencias entre conglomerados, en tanto que las diferencias entre los elementos individuales dentro de cada conglomerado se hacen tan grandes como sea posible. Por ejemplo, si queremos extraer una muestra aleatoria simple de los estudiantes universitarios de un país sería necesario disponer de una lista de todos ellos y de sus direcciones y teléfonos. Esta información puede no estar disponible o ser muy cara de conseguir. Sin embargo, en este caso, los estudiantes aparecen clasificados en universidades, facultades y cursos. Podemos seleccionar en una primera etapa algunas universidades, después algunas facultades al azar de cada universidad, dentro de las facultades algunas clases y, dentro de las clases, estudiantes mediante muestreo aleatorio. Para la primera etapa solo necesitamos una lista de universidades. Para las universidades seleccionadas es necesario luego conocer las facultades que incluyen. En las facultades elegidas necesitamos una lista de las clases, y de las clases que se tomen, una relación de los estudiantes. Esta información estará disponible por lo que este tipo de muestreo será factible. Llamaremos conglomerados a estas unidades amplias donde se clasifican los elementos de la población. En cada etapa de muestreo , en lugar de seleccionar elementos al azar , seleccionamos conglomerados. Los conglomerados se refieren a formas de agrupación física de las unidades en el espacio o en el tiempo. Idealmente los conglomerados tienen que ser lo más parecido posible a muestras aleatorias de la población , de manera que cada conglomerado sea tan heterogéneo como la población a investigar. El muestreo por conglomerado tiene la ventaja de simplificar enormemente la recogida de la información muestral. El inconveniente obvio es que si los conglomerados son heterogéneos entre sí, como sólo se analizan algunos de ellos, la muestra final puede no ser representativa de la población. 1 1 6 
  • 117. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 3.5. MUESTREO POR CUOTAS A veces la estratificación no es posible, o es muy cara, y se recurre en su lugar al muestreo por cuot as. Por ejemplo, se desea tomar una muestra de una población para estudiar la proporción de personas que están de acuerdo con el uso de remedios especiales. Si suponemos que la edad y el sexo pueden influir en la opinión, deberíamos tomar una muestra donde estas características sean las mismas que en la población base, lo que implica una muestra estratificada. Sin embargo, esto requiere una lista de las personas de la población que incluya su sexo y edad, lo que puede no estar disponible. Sin embargo, si conocemos la proporción de cada sexo y la distribución de la edad en la población, una solución frecuente es exigir que estas características aparezcan en la muestra en la misma proporción que en la población. Esto conduce a fijar cuotas de hombres y mujeres por grupos de edad. El entrevistador debe conseguir los elementos de la muestra respetando esta restricción de cuotas. 4. ESTIMACIÓN DE PARÁMETROS Algunas cantidades que aparecen en las funciones de distribución, como p de la distribución binomial , m y s en la distrIbución normal, se llaman parámetros. Generalmente estamos interesados en conocer los pa rá metros de la población, es decir , aquellas características que sirven para determinarla. Ahora veremos como obtener estimaciones de parámetros a partir de una muestra dada. Dada una población, se trata de estimar, esto es, de valorar, alguno o algunos parámetros característicos de la misma, como, por ejemplo, a la media aritmética. Recurriremos a la inferencia estadística, y mediante el análisis de una muestra obtendremos una estimación de los valores correspondientes a la población completa. Esta estimación puede ser por punto o por i nterval o, según se trate de determinar un valor único del parámetro en cuestión o bien un intervalo dentro del cual quede comprendido, con una cierta probabilidad, el valor correspondiente al parámetro de toda la población .El intervalo en cuestión recibe el nombre de intervalo de confianza y la probabilidad, el de nivel de significación. 1 1 7 
  • 118. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 4.1. ESTIMACIÓN PUNTUAL La Inferencia Estadística está casi siempre concentrada en obtener algún tipo de conclusión acerca de uno o más parámetros (características poblacionales). Para hacerlo, se requiere que se obtenga datos muestrales de las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en los valores calculados de varias cantidades muestrales. Una esti ma ción puntual ó estima ci ón por punto es un solo valor numérico utilizado para estimar el parámetro correspondiente de la población. La estimación puntual se obtiene al seleccionar una estadística apropiada y calcular su valor a partir de datos de la muestra dada. Sirve como una aproximación del valor exacto desconocido del parámetro El estadíst ico que se utiliza para obtener una estimación puntual recibe el nombre de esti ma dor puntual del pará metro . Es conveniente notar que se ha dado el nombre de estimación a un solo valor calculado. La regla para calcular este valor o estimación se conoce como estima dor. Los estimadores generalmente se presentan como fórmulas. Por ejemplo la media  x  de una muestra es un estimador de la media m de la población correspondiente. El valor numérico individual que resulta de la evaluación de la fórmula de la media se conoce como estimación del parámetro m. De esta manera se tiene la estimación m @  x  para m De forma similar , la variancia muestral, S2 , se puede utilizar para inferir algo acerca de s 2 . Ejemplo: Una muestra aleatoria de 3 baterías para calculadora podría presentar duraciones observadas en horas de x1 = 5.0 , x2 = 6.4 y x3 = 5.9 . El valor calculado de la duración media muestral es  x  = 5.77 , y es razonable considerar 5.77 como el valor adecuado de m . El enunciado : la estimación puntual de m es 5.77 “ se puede escribir en forma abreviada m = 5.77. 1 1 8 
  • 119. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 4.2. ESTIMACIÓN POR INTERVALO EN EL MUESTREO AL ZAR SIMPLE Supóngase que un grupo de investigadores quiere estimar la media de una población que sigue una distribución normal y que, para ello, extraen una muestra aleatoria de tamaño n de la población y calculan el valor de  x , el cual utilizan como una estimación puntual de m . Aunque este estimador de m posee todas las cualidades de un buen estimador, se sabe que, debido a los caprichos del muestreo, no se puede esperar que  x  sea igual a m. Un estimador puntual por ser un solo número, no proporciona por sí mismo información alguna sobre la precisión y confiabilidad de la estimación. El estimador puntual nada dice sobre lo cercano que está de m  x  . Si se quiere llegar a asignar determinadas garantías o “confianza” a los resultados de un proceso inferencial de estimación, cabe la posibilidad de ampliar la óptica de la Esti ma ción Puntual analizada en el tema anterior, pasando a la estimación mediante Intervalos de Confi a nza . En términos estadísticos las “garantías” asignables consisten en afirmaciones de tipo probabilístico. La estimación de una magnitud desconocida mediante Intervalo de Confi a nza consiste en derivar unos límites aleatorios que contendrán al parámetro desconocido con una probabilidad fijada de antemano. Los extremos de un intervalo de conf ia nza son aleatorios, por lo que podrán o no contener al verdadero parámetro y será posible evaluar la probabilidad de que así ocurra. A la probabilidad de que un Intervalo de Confianza contenga al parámetro poblacional objeto de análisis se le denomina Nivel de Confi a nza y la denotaremos por g ( 1 ­ a ) Por ejemplo, si escogemos g = 1 ­ a = 95 % , implica que 95 % de todas las muestras daría lugar a un intervalo que incluye m o cualquier otro parámetro que se esté estimando , y sólo 5 % de las muestras producirá un intervalo erróneo. Cuánto mayor sea el nivel de confianza podremos creer que el valor del parámetro que se estima está dentro del intervalo. Al estimar un parámetro q , el problema correspondiente debería ser la determinación de dos cantidades numéricas que dependen de los 1 1 9 
  • 120. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE valores de la muestra, y en cuyo intervalo se incluya el valor desconocido del parámetro con certeza. Sin embargo, sabemos que a partir de una muestra no podemos obtener conclusiones acerca de la población correspondiente que sean 100 % verdaderas. Así, tenemos que ser más modestos y modificar nuestro problema, de la siguiente manera. Escogemos una probabilidad g cercana a 1 , ( por ejemplo, g = 95 % , 99 % o alguna semejante) . Luego, determinamos dos cantidades q 1 y q2 tales que la probabilidad de que incluyan el valor exacto desconocido del parámetro q sea igual a g . Los n valores de la muestra se pueden considerar como valores observados de n variables aleatorias X1 , X2 , ......., Xn . Entonces q1 y q2 son funciones de estas variables aleatorias y , por lo tanto, también son variables aleatorias. . Nuestro requisito anterior se puede escribir como P(q1 £ q £ q2 ) = g Si conocemos q1 y q2 y se dá una muestra, podemos calcular un valor numérico q1 de q1 , y un valor numérico q2 de q2 . El intervalo con puntos extremos q1 y q2 se llaman intervalos de confianza o estimación por intervalo para el parámetro desconocido q , y se representa CONF í q1 £ q £ q2 ý Los valores q1 y q2 se llaman límites de confianza inferior y superior para q. El número g se llama nivel de confianza. Se elige g = 95 % , 99% o algunas veces 99,9 %. Es evidente que si se intenta obtener una muestra y determinar un intervalo de confianza correspondiente, entonces g es la probabilidad de disponer de un intervalo que incluya el valor exacto desconocido del parámetro. 1 2 0 
  • 121. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 4.2.1. INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCIÓN NORMAL CUYA VARIANCIA ES CONOCIDA Sea x1 , · · · · , xn una muestra extraída de una población distribuida normalmente o , a falta de esto, si n es lo bastante grande,y cuya variancia s 2 es conocida. Suponemos que la media m es desconocida , y que deseamos ­determinar un intervalo de confianza para m . Los pasos necesarios para determinar un intervalo de confianza bajo las suposiciones anteriores son . 1 ª paso .Elegir un nivel de confianza g ( 95 % , 99 % ,o uno semejante ). 2 ª paso . Determinar el valor de z correspondiente mediante la tabla de distribución normal estandarizada. Por ejemplo: g 0,90 0,95 0,99 0,999 Z 1,645 1,960 2,576 3,291 3ª paso . Calcular la media  x  de la muestra 4ª paso . Calcular z s k =  (1) n  Por lo tanto : Si  x  es la media de una muestra aleatoria de tamaño n de una población con variancia conocida el intervalo de confianza de ( g ) 100 % para la media poblacional es. CONF í  x  ­ k £ m £  x  + k ý Z  S ≤  m ≤ X  S X  +  Z  n n Ejemplo: Se calcula que la media de los promedios de los puntos de calidad de una muestra aleatoria de 36 alumnos de los últimos años del nivel medio es 2,6. Encuentre los intervalos de confianza del 95 % y del 99 % para la 1 2 1 
  • 122. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE media total de alumnos del último año. Asuma que la desviación estándar de la población es 0,3. Solución: La estimación puntual de m es 2,6. El valor de z para el 95 % es z = 1,96. De aquí que el intervalo de confianza es : 0,  3  0,  3  ( 2,6 – 1,96  · £ m £ 2,6 + 1,96  · ) 36  36  el cual se re duce a, ( 2,50 , 2,70 ) Par a e nc ontr ar un i nter val o de l 99 % , se e nc ue ntr a e l valor de z, donde z = 2,576 0,  3  0,  3  ( 2 , 6 – 2 , 5 7 6  · £ m £ 2,6 + 2 , 5 7 6  · ) 36  36  o simp le me nte : ( 2,47 , 2,73 ) Aho ra se obse rva que se re quie re un int ervalo más grande para e stimar m con mayor precisión. Si no se conoce la variabilidad de la población y solo se dispone de la información proporcionada por la muestra, es d e c i r s e c o n o c e  X  y s , s i e m p r e q u e s e t r a b a j e c o n u n t a m a ñ o d e m u e s t r a g r a n d e :  Z  S ≤  m ≤ X  S X  +  Z  n n 1 2 2 
  • 123. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE GUÍA DE EJERCICIOS ACTIVIDAD 1 El Departamento de Biología de una escuela desea estimar la cantidad promedio de agua que consume diariamente cierta especie animal en condiciones experimentales, para completar un estudio que se está realizando.Esta investigación supone que la población de valores de consumo diario de agua está normalmente distribuida y, con base en experiencias pasadas, que la variancia de la población es de 4 gramos cuadrados. Una muestra aleatoria de 40 animales arroja una media de 16,5 gramos. a) Estime puntualmente la cantidad promedio de agua . b) Con un nivel de confianza del 95 estime la cantidad promedio de agua. c) Realice los cálculos solicitados en el inciso b) pero con un nivel de confianza de 90 % . Compare los intervalos obtenidos. ACTIVIDAD 2 En una escuela para adultos , se seleccionó una muestra de 100 alumnos aparentemente sanos, de 25 años de edad, donde se muestra una presión sanguínea media de 125. Si se supone que la desviación estándar de la población es de 15, calcule a) El intervalo de confianza del 90 por ciento para m b) El intervalo confianza del 95 por ciento para m ACTIVIDAD 3 Una investigación realizada en el área de educación sostiene que la edad promedio de los docentes del área rural ha disminuido . La edad promedio de los docentes rurales en elos últimos años fue de 35 años. Para ello,se extrae una muestra aleatoria de 100 docentes en la que la edad promedio es de 28 años con una desviación estándar de 8 año. 1 2 3 
  • 124. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE ¿Confirman estos datos la hipótesis de esta investigación?. Trabaje con a = 0,01 y a = 0,05. ACTIVIDAD 4 Una muestra aleatoria que representa el tiempo ( en minutos) que tardaron 36 estudiantes en familiarizarse con el manejo de un software adquirido por las Autoridades del Colegio, dio un tiempo promedio de 10 minutos . El tiempo se distribuye normalmente. con una desviación estándar de 3 minutos. a) Determine e interprete un intervalo del 95 % de confianza para el verdadero tiempo promedio. b) El instructor considera que el tiempo promedio requerido por los alumnos es mayor que 10 minutos, ¿ qué se puede decir de acuerdo con el intervalo hallado?. 1 2 4 
  • 132. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE BIBLIOGRAFÍA  ­  Benít ez, Celia de; Pece, Marta G.; Galíndez , Margarit a de. (2003). Serie Didáctica N°7: “Elementos de Estadística para técnicos en vivero y plantaciones forestales”, con guía de ejercitación.  ­  Barbancho, A. (1983). Estadística Elemental Moderna . 9a Edición. Ariel, S. A. – Barcelona. ISBN 84­344­2005­8.  ­  Daniel, W.W. (1997) Bioestadística. ISBN 968­18­5196­X.  ­  Kreyszig, E. (1994). Introducción a la Estadística Matemática . Principios y métodos. LIMUSA. –Noriega Editores. ISBN 968­18­ 0729­4.  ­  Peña, D. y Romo, J. (1999) . Introducción a la Estadística para las Ciencias Sociales. ISBN 84­481­1617­8.  ­  Triola, M.F.(2004). Estadística. Novena edición.ISBN 970­26­0519­ 9. Editorial Pearson. México. 837 pags.  ­  Ya­Lun, Chou. (1990). Análisis Estadístico. ISBN 970­10­0046­3. pags.808. 1 3 2