lunes, 30 de marzo de 2020

Unidad 1: Estadística en la vida de hoy.


Construcción de tablas de intervalos


Cuando los valores de la variable de un conjunto de datos son muy numerosos o trabajamos con variables cuantitativas continuas (decimales), es conveniente agrupar los valores de la variable en Intervalos de Clases.

Ejemplo:  "Estatura de los y las estudiantes del 2°b"

1,50
1,52
1,53
1,53
1,54
1,55
1,56
1,57
1,50
1,54
1,57
1,63
1,61
1,60
1,53
1,69
1,54
1,55
1,56
1,57
1,50
1,52
1,53
1,65
1,62
1,55
1,67
1,69
1,54
1,55
1,58
1,57
1,52
1,53
1,53
1,54
1,55
1,52
1,66
1,61
1,72

1,56
1,57
1,52
1,53
1,53
1,54
1,55
1,55
1,54
1,56
1,59
1,61
1,67

1,58
1,61
1,61
1,62
1,65
1,62
1,68
1,70
1,58
1,66
1,65
1,66
1,68

1,62
1,62
1,65
1,66
1,68
1,72
1,59
1,61
1,74
1,63
1,72
1,63
1,62





Para construir una tabla de intervalo, seguiremos los siguientes pasos:

1°  Determinar Longitud de Clase (R): Se debe restar dato mayor con el menor de la muestra
                R = Mayor Valor -  Menor Valor= 1,74 -  1,50 = 0,24

2°  Determinar el Número de Intervalos (N.I): Se saca la raíz de la cantidad de datos de la muestra(N) 

raíz de 80= 8, 944 por lo que podemos trabajar con 8 o 9. Consideremos el Valor 8   ya que es Factor de 24

3°  Determinemos el Tamaño de los Intervalos (c): respuesta del primer paso dividido con la del segundo paso.


Variable observada (xi), es la variable que analizamos en la investigación. Se construye de los intervalos Limite inferior y limite sumerior.


El dato menor será el limite inferir del primer intervalo, al cual al sumarle la amplitud nos dará el límite superior. Este valor será el límite inferior del segundo intervalo al cual al sumarle nuevamente la amplitud nos da el límite superior. Así sucesivamente hasta completar la cantidad de intervalos.

Primer intervalo: límite inferior 1,50 al límite superior 1,50 + 0,03 = 1,53
Segundo intervalo limite inferior 1,53 al límite superior 1,53 + 0,03 = 1,56;
…así sucesivamente….
Octavo intervalo límite inferior 1,71 al límite superior 1,71 + 0,03 = 1,74 (debe llegar o pasarse del dato mayor)


Con esto se obtienen intervalos “cerrados – abiertos”, es decir para contar los datos de fi, debemos de contar todos los datos que están desde el límite superior hasta antes del límite inferior, sin contar el límite inferior.

5°  Marcas de clase  (mc):  corresponde a la semi-suma de los límites de cada intervalos.


6° Frecuencia absoluta (fi), Cantidad de veces que se repita la variable observada. Debemos de contar en la muestra, cuantos decimales existen entre cada intervalo.


7° Frecuencia Acumulada (Fa): Se obtiene sumando sucesivamente las frecuencias absolutas.

8°Frecuencia Relativa (fr): Es la división entre la frecuencia absoluta y el número total de datos de la muestra.

9°-Frecuencia Relativa Acumulada (Fr.a): Se obtiene sumando sucesivamente las frecuencias relativas

|0°-Frecuencia Relativa Porcentual (fr%): Es la frecuencia relativa multiplicada por 100.

11°-Frecuencia Relativa Porcentual Acumulada (Fr.a%): Se obtiene sumando sucesivamente las frecuencias relativas porcentuales.

12°Frecuencia Relativa Gradual (f): Es la frecuencia relativa multiplicada por 360.

13°Frecuencia Relativa Gradual Acumulada (Fr.a°). Se obtiene sumando sucesivamente las frecuencias relativas gradual.

|Las columnas restantes no tienen nombres, se agregan para los futuros cálculos estadísticos, deben seguir las indicaciones que se encuentran sobre la tabla en dichas columnas..

14° mc * fi = multiplicar marca de clase con frecuencia absoluta

15° |mc -  | = marca de clases menos el promedio

16°  = Columna anterior multiplicada por frecuencia absoluta.

17°    = Columna anterior  (15°) multiplicada con la antIpenultima columna (16°)




                                       CALCULAR LAS MEDIDAS DE TENDENCIA CENTRAL


-    Promedio  : se obtiene al dividir el total de (mc · fi) con el total de datos, en nuestro caso 127,92 / 80 = 1,599. Interpretación: el promedio de altura de los estudiantes entrevistados es 1, 60 aproximadamente.

-         
-       Moda (mo): se obtiene al aplicar la siguiente formula:
 El intervalo modal, es el intervalo donde se encuentra la moda (número más grande en la frecuencia absoluta)



En nuestro ejemplo 22 es el número más grande en fa asociado al intervalo 1,53  -  1,56

Li Numero con que parte el intervalo modal, en nuestro caso 1,53
fi número más grande de la frecuencia absoluta, en nuestro caso 22
fi--1 es la frecuencia absoluta que se encuentra antes de fi, en nuestro caso 8
fi-+1 es la frecuencia absoluta que se encuentra después de fi, en nuestro caso 12.
ai es la amplitud de la clase, en nuestro caso 0,03


  
Interpretación: La estatura que más se repite en los estudiantes entrevistados es 1,55
-          
        Mediana (me):  Se obtiene al aplicar la siguiente formula: 

   

Primero debemos determinar N/2 es decir total de datos dividido en dos, en nuestro caso 80 /2 = 40 luego buscar el dato más cercano mayor en fa, lo que nos llevara al intervalo medial. En nuestro caso corresponde a 42, por lo que el intervalo medial es 156 -  159

fi es la frecuencia absoluta donde se encuentra el intervalo medial. En nuestro es 12.
Li numero con el que parte el intervalo donde se encuentra la mediana, en nuestro caso 1,56
Fi-1 es la frecuencia acumulada anterior a la clase mediana. En nuestro caso el número antes de 42 en la frecuencia acumulada es 30
a es la amplitud de la clase. En nuestro caso es 0,03.



Interpretación: en los datos céntralos encontramos a estudiantes que miden 1,56 metros.




En nuestro caso como     nos encontramos con una muestra asimétrica negativa, en donde las mayores concentraciones de estudiantes se encuentran en estaturas tienen estaturas superiores a la mediana, a pesar de que la moda es muy cercana a esta.


 CALCULAR LAS MEDIDAS DE POSICIÓN
Se calculan similar a la mediana con la única diferencia que en vez de buscar N/2 debemos calcular Cuartil N/4, Quintil N/5, Decil N/10, Percentil N/100 y se multiplican por el número que buscamos como indican las siguientes formulas:



Ejemplo:
Para encontrar el quintil 3 debemos calcular N/5 * 3, en nuestro caso seria 80/5*3= 48 busco el dato más cercano mayor en fa y encuentro 51 que pertenece al intervalo 1,59 – 1,62. 

fi es la frecuencia absoluta donde se encuentra el intervalo. En nuestro es 9.
Li numero con el que parte el intervalo, en nuestro caso 1,59
Fi-1 es la frecuencia acumulada anterior. En nuestro caso el número antes de 51 en la frecuencia acumulada es 42
ai es la amplitud de la clase. En nuestro caso es 0,03.



Interpretación: el 75% de los estudiantes miden menos que 1,61 y el 25% restante mide más o igual a 1,61.


CALCULAR LAS MEDIDAS DE DISPERSION

a-  Desviación media:  


Interpretación: Como este dato es menor que 0,6 la campana de distribución es cerrada por lo que los valores de la población se encuentran cercanos al promedio que es 1,60.

b- Varianza: 


c- Desviación típica o estándar: 



 Interpretación: Como este dato es menor que 0,6 la campana de distribución es cerrada por lo que los valores de la población se encuentran cercanos a la población.

d-  Coeficiente de variación de Person: 

.       
        interpretación: como 3,88% es < 20% es una muestra representativa, sus datos son homogéneos, y representan a la mayoría de los entrevistados.


e- Rango de variación:  


 interpretación: Los datos de dispersión de la mayoría de los entrevistados se encuentran concentrados entre 1,54 y 1,66.

GRAFICAS

1- TORTA : Utilizando los datos de frecuencia relativa gradual y con ayuda de un transportador debemos de medir grado a grado en una circunferencia, partiendo desde su radio.





2- HISTOGRAMA : utilizaremos Mc lo que ubicaremos en la linea horizontal x, ademas de fi lo que ubicaremos en la linea vertical y. Donde se juntan haremos una barra y desde el centro de la barra trazaremos una linea hasta el centro de la otra barra,


Actividad Practica:

I- I-             Utilice los siguientes datos para crear una tabla de frecuencia con intervalos, siguiendo cada uno de los pasos. “Notas de un curso”

Paso 6: Encerrar en un círculo diferentes colores las notas que corresponden a cada intervalo, anotar la cantidad de datos de cada intervalo en fi y completar el resto de la tabla.



Paso 7: Responda según corresponda.

a-    ¿Cuál es el promedio de notas del curso?

b-    ¿En que intervalo se encuentra la moda?

c-    ¿En que intervalo se encuentra la mediana?

d-    ¿Cuál es el porcentaje más bajo y en que intervalo se encuentra?

e-     ¿Qué Porcentaje de estudiantes tiene notas suficientes? (entre 4,0 – 7,0)

 ¿Qué porcentaje de estudiantes tiene notas Insuficientes? (Bajo 4,0)

  II- Trabajando desde un gráfico. A partir del siguiente gráfico, trabajando con la cantidad de infectados (casos)  construya:





II

No hay comentarios:

Publicar un comentario

Índice de contenidos

correo institucional dacorvalan@ceialmma.cl Módulo Nº 1: Números Unidad 1: Potencias, Raíces y Logaritmos . Descargar Guía N°1...