La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

ANÁLISIS E INTERPRETACIÓN DE DATOS

Presentaciones similares


Presentación del tema: "ANÁLISIS E INTERPRETACIÓN DE DATOS"— Transcripción de la presentación:

1 ANÁLISIS E INTERPRETACIÓN DE DATOS
SESIÓN 3: MEDIDAS DE TENDENCIA CENTRAL

2 INTRODUCCIÓN Hemos visto cómo se pueden resumir los datos obtenidos del estudio de una muestra (o una población) en una tabla estadística o un grafico. No obstante, tras la elaboración de la tabla y su representación gráfica, en la mayoría de las ocasiones resulta más eficaz “condensar” dicha información en algunos números que la expresen de forma clara y concisa.

3 En este sentido pueden examinarse varias características, siendo las más comunes:
La tendencia central de los datos La dispersion o variación con respecto a este centro; Los datos que ocupan ciertas posiciones. La simetría de los datos. La forma en la que los datos se agrupan.

4 ESTADÍSTICOS DE TENDENCIA CENTRAL
Buscamos obtener valores “centrales” en los datos presentados. Las medidas más comunes y relevantes son: Media Aritmética Mediana Moda

5 MEDIA ARITMÉTICA Representa el valor promedio de un conjunto de observaciones (datos) Se define como la suma de todos sus posibles valores, ponderada por las frecuencias de los mismos Puede presentar inconvenientes o poca representatividad de los datos en las siguientes situaciones: Es muy sensible a valores extremos por lo cuál no es recomendable para distribuciones con alta “asimetría” Si consideramos una variable discreta, por ejemplo, el número de hijos en las familias españolas el valor de la media puede no pertenecer al conjunto de valores de la variable; Por ejemplo x = 1, 2 hijos.

6 Mediana Llamaremos mediana (Med) al primer valor de la variable que deja por debajo de sí al 50% de las observaciones. Entre las propiedades de la mediana, vamos a destacar las siguientes: Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones extremas, ya que no depende de los valores que toma la variable, sino del orden de las mismas. Por ello es adecuado su uso en distribuciones asimétricas. Es de cálculo rápido y de interpretación sencilla. A diferencia de la media, la mediana de una variable discreta es siempre un valor de la variable que estudiamos (ej. La mediana de una variable número de hijos toma siempre valores enteros).

7 MODA Llamaremos moda a cualquier máximo relativo de la distribución de frecuencias, es decir, cualquier valor de la variable que posea una frecuencia mayor a las demás o bien el valor más recurrente entre las observaciones De la moda destacamos las siguientes propiedades: Es muy fácil de calcular. Puede no ser única. Existe para variables cualitativas

8 CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA VARIABLES CUALITATIVAS
Para variables cualitativas no es posible calcular aquellas medidas sobre las cuales los valores sean numéricos o dependan de la posición de los datos (debido a que no existen pesos en este tipo de variables) Por lo tanto el único estadígrafo posible de interpretar es la moda, donde simplemente buscaremos la observación (u observaciones) de mayor frecuencia

9 CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA VARIABLES CUANTITATIVAS
Para las variables cuantitativas el cálculo dependerá de dos características básicas: La agrupación de datos El tipo de variable (discreta o contínua)

10 CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS SIN AGRUPAR
Si los datos no están agrupados en una tabla de distribución de frecuencias calcularemos los estadísticos de tendencia central como sigue: - Media Aritmética: Sumaremos todas las observaciones y dividiremos el resultado por el número total de datos. Esto es: Por ejemplo: Si tenemos los datos: 3, 4 , 5 ,6, 3 , 2, 3, 4 ,5 ,6. Calculamos la media aritmética como:

11 - Mediana: Ordenaremos los datos y tomaremos el dato central (o centrales), por ejemplo si nuestros datos son: 3, 4 , 5 ,6, 3 , 2, 3, 4 ,5 ,6 Ordenamos los datos: 2, 3, 3, 3, 4, 4 ,5 ,5, 6 , 6 Buscamos el valor central Si los datos son diferentes tomamos el mayor de ellos, en este caso: Med= 4

12 - Moda: Para calcularla simplemente buscaremos el valor o valores que más se repitan. Por ejemplo si nuestros datos son: 3, 4 , 5 ,6, 3 , 2, 3, 4 ,5 ,6 La moda es el dato que más se repita, para este caso: Mo= 3 Nótese que esta medida no necesariamente es central para los datos debido a que no depende del peso de ellos, además note que pueden haber varias modas.

13 CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS
Si bien es cierto que las medidas de tendencia central son supremamente fáciles de calcular para datos sin agrupar también lo es que exigen un trabajo que llega a ser sumamente arduo cuando se trata de muchos datos. Para los datos agrupados es fundamental realizar diferenciación sobre si nuestra variable es discreta o continua y dependiendo de tal naturaleza proceder con el cálculo

14 CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS: Variable discreta
En el caso de la variable discreta calcularemos las medidas de tendencia central así: Media aritmética: Es decir debemos multiplicar cada modalidad de clase por su frecuencia absoluta y sumar dichos resultados, por último dividirlos por el total de observaciones

15 EJEMPLO xi ni Ni hi Hi xini 1 2 0.1 4 6 0.2 0.3 8 3 12 0.6 18 16 0.8 5 20 TOTAL 49 Es decir que el valor promedio de los datos es de 3.2, nótese que pese a ser una variable discreta el valor de la media aritmética no es entero.

16 MEDIANA PARA DATOS AGRUPADOS: VARIABLE DISCRETA
Dado que definimos la mediana como el primer valor que deja tras de sí al 50% de las observaciones lo primero que debemos saber es cuál es ese 50% para esto dividiremos por 2 al total de datos. Luego buscaremos en la frecuencia absoluta acumulada el primer valor que supere dicho resultado e identificamos su valor de modalidad de clase

17 EJEMPLO Dividimos el total de datos por 2: N/2= 20/2=10
xi ni Ni hi Hi xini 1 2 0.1 4 6 0.2 0.3 8 3 12 0.6 18 16 0.8 5 20 TOTAL 49 Dividimos el total de datos por 2: N/2= 20/2=10 Buscamos el primer valor que supere a 10 en la frecuencia acumulada (en este caso 12) y procedemos a identificar a que modalidad pertenece ese valor de frecuencia acumulada, para este caso: Med= 3

18 MODA PARA DATOS AGRUPADOS: VARIABLE DISCRETA
Dado que definimos la moda como el valor más recurrente buscaremos en la frecuencia absoluta más alta e identificamos su valor de modalidad de clase

19 EJEMPLO xi ni Ni hi Hi xini 1 2 0.1 4 6 0.2 0.3 8 3 12 0.6 18 16 0.8 5 20 TOTAL 49 Buscamos la frecuencia absoluta más alta y procedemos a identificar a que modalidad pertenece ese valor de frecuencia acumulada (puede ser más de una modalidad), para este caso: Mo= 3

20 CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS: Variable continua
En el caso de la variable continua calcularemos las medidas de tendencia central así: Media aritmética: Es decir debemos multiplicar cada marca de clase por su frecuencia absoluta y sumar dichos resultados, por último dividirlos por el total de observaciones

21 EJEMPLO Es decir que el valor promedio de los datos es de 27 Li-1 - Li
Xi ni Ni hi Hi xini 0-10 5 2 0.1 10 10-20 15 4 6 0.2 0.3 60 20-30 25 12 0.6 150 30-40 35 16 0.8 140 40-50 45 20 1 180 TOTAL 540 Es decir que el valor promedio de los datos es de 27

22 MEDIANA PARA DATOS AGRUPADOS: VARIABLE CONTINUA
Dado que definimos la mediana como el primer valor que deja tras de sí al 50% de las observaciones lo primero que debemos saber es cuál es ese 50% para esto dividiremos por 2 al total de datos. Luego buscaremos en la frecuencia absoluta acumulada el primer valor que supere dicho resultado, hasta acá es el mismo procedimiento que en variable discreta, sin embargo la mediana es un único valor no un grupo de valores, por lo tanto ese valor está en esa modalidad que supera al 50% de las observaciones; para saber exactamente cuál es el valor procederemos a aplicar la siguiente fórmula:

23 FÓRMULA PARA CÁLCULO DE LA MEDIANA EN VARIABLE CONTINUA (D.A)
Una vez identificamos la modalidad que contiene a la mediana aplicaremos: Donde: Li-1 es el límite inferior de la modalidad que contiene a la mediana N es el total de datos Ni-1 es la frecuencia acumulada de la clase anterior a la que contiene a la mediana ni es la frecuencia de la clase que contiene a la mediana C es el tamaño de clase

24 EJEMPLO Dividimos el total de datos por 2: N/2= 20/2=10
xi ni Ni hi Hi xini 1 2 0.1 4 6 0.2 0.3 8 3 12 0.6 18 16 0.8 5 20 TOTAL 49 Li Li Xi ni Ni hi Hi xini 0-10 5 2 0.1 10 10-20 15 4 6 0.2 0.3 60 20-30 25 12 0.6 150 30-40 35 16 0.8 140 40-50 45 20 1 180 TOTAL 540 Dividimos el total de datos por 2: N/2= 20/2=10 Buscamos el primer valor que supere a 10 en la frecuencia acumulada (en este caso 12) y procedemos a identificar a que modalidad pertenece ese valor de frecuencia acumulada, para este caso el intervalo 20-30, identificamos los valores de las variables que nos pide la fórmula: Li-1= 20 , N/2 = 10, Ni-1= 6 , ni = 6, C = =10

25 Ahora aplicámos la fórmula: Li-1= 20 , N/2 = 10, Ni-1= 6 , ni = 6, C = =10 Por lo tanto Med = 26.66

26 MODA PARA DATOS AGRUPADOS: VARIABLE DISCRETA
Dado que definimos la moda como el valor más recurrente buscaremos en la frecuencia absoluta más alta e identificamos la modalidad de clase (que llamaremos clase modal), debido a que la moda es uno o más valores exactos y no grupos de valores aplicaremos la siguiente fórmula para calcularla: Donde: Li-1 es el límite superior de la clase modal ni= frecuencia absoluta de la clase modal ni-1= frecuencia absoluta de la clase anterior a la clase modal ni+1= frecuencia absoluta de la clase siguiente a la clase modal C= tamaño de clase

27 EJEMPLO xi ni Ni hi Hi xini 1 2 0.1 4 6 0.2 0.3 8 3 12 0.6 18 16 0.8 5 20 TOTAL 49 Li Li Xi ni Ni hi Hi xini 0-10 5 2 0.1 10 10-20 15 4 6 0.2 0.3 60 20-30 25 12 0.6 150 30-40 35 16 0.8 140 40-50 45 20 1 180 TOTAL 540 Buscamos la frecuencia absoluta más alta y procedemos a identificar a que modalidad pertenece ese valor de frecuencia acumulada (puede ser más de una modalidad), para este caso la clase modal es 20-30, identificamos cada variable en la fórmula: Li-1 = 20, ni= 6, ni-1= 4, ni+1= 4, C= 30-20=10

28 Ahora aplicamos la fórmula: Li-1 = 20, ni= 6, ni-1= 4, ni+1= 4, C= 30- 20=10 Por lo tanto M0 = 25


Descargar ppt "ANÁLISIS E INTERPRETACIÓN DE DATOS"

Presentaciones similares


Anuncios Google