La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

BLOQUE III: EXPLORACIÓN Y DESCRIPCION DE UN GRUPO DE DATOS Tema 9 ESTADÍSTICOS DE POSICIÓN Y DE TENDENCIA CENTRAL.

Presentaciones similares


Presentación del tema: "BLOQUE III: EXPLORACIÓN Y DESCRIPCION DE UN GRUPO DE DATOS Tema 9 ESTADÍSTICOS DE POSICIÓN Y DE TENDENCIA CENTRAL."— Transcripción de la presentación:

1 BLOQUE III: EXPLORACIÓN Y DESCRIPCION DE UN GRUPO DE DATOS Tema 9 ESTADÍSTICOS DE POSICIÓN Y DE TENDENCIA CENTRAL

2 1. Introducción 2. Media aritmética 2.1. Definición 2.2. Cálculo 2.3. Propiedades 3. Mediana 3.1. Definición 3.2. Cálculo 3.3. Propiedades 4. Moda 4.1. Definición 4.2. Propiedades 5. Cuantiles 5.1. Definición 5.2. Cálculo

3 Amón, J. (1991). Estadística para psicólogos. Vol I. Estadística Descriptiva. Madrid: Pirámide. Botella, J.; León, O.; San Martín, R., y Barriopedro, M.I. (2001). Análisis de Datos en Psicología I. Teoría y Ejercicios. Madrid: Pirámide. De la Fuente, E.I. y García, J. (1998). Análisis de datos en Psicología. Ejercicios de estadística descriptiva. Granada: Urbano. Escobar, M. (1999). Análisis gráfico/exploratorio. Cuadernos de Estadística nº 2. Madrid: Muralla-Hespérides. Freixa, M., Salafranca, L., Guardia, J., Ferrer, R. y Turbany, J. (1992). Análisis Exploratorio de Datos: nuevas técnicas estadísticas. Barcelona: PPU. McRae, S. (1995). Modelos y métodos para las Ciencias del Comportamiento. Barcelona: Ariel.

4 Merino, J.M; Moreno, E; Padilla, M; Rodríguez-Miñón, P; Villarino, A. (2001). Análisis de Datos en Psicología I. Madrid: UNED. Palmer, A. (1995). El análisis exploratorio de datos. Madrid: Eudema Pérez, F.J., Manzano, V. y Fazeli, H. (1998). Problemas resueltos de Análisis de Datos. Madrid: Pirámide. Pérez, F.J., Manzano, V. y Fazeli, H. (1999). Análisis de Datos en Psicología. Madrid: Pirámide. San Martín, R., Espinosa, L. y Fernández, L. (1987). Psicoestadística Descriptiva. Madrid: Pirámide. Stenberg, R.J. (1993). Investigar en Psicología. Barcelona: Paidós.

5 1. INTRODUCCIÓN En el tema anterior se ha hecho hincapié en los conceptos de visualización de los datos. Mediante el análisis visual se efectúa una aproximación de carácter exploratorio para obtener una primera impresión de la distribución empírica de la variable analizada. El objetivo de este capítulo es introducir al alumno en la situación práctica de realizar la descripción de una variable estadística. El análisis descriptivo de una variable se refiere a aquellos procedimientos que nos permiten resumir la información recogida en los datos que han resultado de la medición de dicha variable. Una característica descriptiva de un grupo de datos es su posición, así como el centro de la distribución de frecuencias, resumido en el valor o valores alrededor de los cuales se encuentran la totalidad de los datos.

6 ESTADISTICOS DE POSICION 1.La media aritmética es el punto en el que se concentra el peso de la distribución de frecuencias. 2.La mediana es, una vez ordenados los datos, el valor que ocupa la posición central en la distribución. 3.La moda es el valor más frecuente entre los datos que se han recogido. 4.Los cuantiles son valores de la variable que dividen en partes iguales la distribución de frecuencias. Los cuantiles más utilizados son de tres tipos: Cuartiles, Q 1, Q 2 y Q 3 dividen en cuatro partes iguales la distribución de frecuencias. Deciles, D 1, D 2, …, D 9 dividen en diez partes iguales la distribución de frecuencias. Percentiles, P1, P2, …, P 99, dividen en cien partes iguales la distribución de frecuencias.

7 2. MEDIA ARITMÉTICA 2.1. DEFINICIÓN Es la medida resumen más utilizada y la más intuitiva, hasta el punto de que expresiones como media, promedio, etc. Forman parte del lenguaje común. Formaliza el concepto intuitivo de centro de gravedad o punto de equilibrio de las observaciones. 2.2. CALCULO a) Datos no agrupados Dado un conjunto de observaciones: La media se obtiene como: Es decir, la media aritmética de n valores no es mas que su suma dividida por el número de ellos

8 b) Datos agrupados Cuando tenemos los datos agrupados en intervalos, o en cada valor hay distintas frecuencias, pueden usarse alternativamente las siguientes expresiones:

9 Ejemplo Datos no agrupados: 10, 5, 2, 7, 9, 5, 7, 6, 5, 9, 12, 2, 6, 6, 9, 12, 6, 6, 6, 4, 9, 7, 12

10 X n j X j n j X j 1-3 2 2 4 4-6 10 5 50 7-9 7 8 56 10-12 4 11 44 23 154 23 154 Datos organizados en tablas de frecuencia Agrupemos los datos anteriores en intervalos: Luego, la media = 154/23=6,70 Importante: al agrupar en intervalos el valor de la media aritmética suele variar de si la calculamos sin agrupar, además varia dependiendo del número de intervalos utilizados. No sucedería así si hubiéramos elegido intervalos de amplitud la unidad

11 Características: Constituye el “centro de gravedad” de la distribución de frecuencias Es sensible a la variación de cada una de las puntuaciones. Basta con que varíe una para que varíe la media. Es función de todas y cada una de las puntuaciones No es recomendable calcularla cuando la distribución de frecuencias es muy asimétrica. Es decir, cuando existe alguna o algunas puntuaciones extremas El nivel de medida de las variables para calcular la media ha de ser al menos de intervalo (no es posible calcularla con variables nominales ni ordinales)

12 2.3. PROPIEDADES 1.Las suma aritmética de las desviaciones respecto de la media siempre es 0: 2. Si sumamos una constante a un conjunto de puntuaciones, la media quedará aumentada en esa misma constante 3. Si multiplicamos por una constante a un conjunto de puntuaciones, la media aritmética quedará multiplicada por esa misma constante. 4. Una variable definida como la combinación lineal de otras variables (Y=aX+b) tiene como media la misma combinación lineal de las medias que intervienen en su definición

13 6. Si sumamos diferentes variables, la media de la suma es la suma de las respectivas medias: W= X + Y + Z

14 3. MEDIANA 3.1. DEFINICIÓN Se considera el punto o valor numérico que ocupa la posición central, es decir, deja por debajo de sí y por encima de sí el 50% de los datos 3.2. CALCULO a) Datos no agrupados Una vez ordenados los datos constituye el valor central. Su calculo dependerá de si el número de valores es par o impar Par: la mediana son los dos valores centrales, que se puede aproximar por la media aritmética de ambos PAR: 23 29 32 33 34 35 38 38 41 43 Impar: la mediana es el valor central IMPAR: 5 6 6 7 7 8 9 9 10 11 12

15 b) Datos agrupados en intervalos Donde, L i -1 es el límite inferior del intervalo. N representa el total de puntuaciones N i-1 representa la frecuencia acumulada del intervalo anterior, en que está contenida la mediana, n i la frecuencia absoluta del intervalo a i es la amplitud del intervalo

16 Ejemplo: Supongamos que el consumo de cocaína, en miligramos, semanales de un conjunto de pacientes que can a ser sometidos a tratamiento está tabulado en la siguiente tabla de frecuencias Consumo (mlg) Nº pacientes 0-1010-2020-3030-4040-5050-6060-70812101421169

17 Para calcular las frecuencias calculamos N i y buscar el intervalo donde se encuentra el valor 50. Como tenemos 90 elementos, será el intervalo que ocupa el valor 45 y es el intervalo 40-50 Consu.niNi 0-1010-2020-3030-4040-5050-6060-708121014211698203044658190 90 L i -1 =40 N=90 N i -1 =44 N i =21 A i =10

18 1. La suma de las diferencias (en valor absoluto) de n con respecto a su mediana es igual o menor que suma de las diferencias en valor absoluto con respecto a cualquier otro valor 2. Es menos sensible que la media a la variación de cada una de las puntuaciones. Aunque la variación de una sola puntuación elegida a propósito puede hacer variar la mediana. Sin embargo, la variación de forma anárquica de la mayoría e incluso de todas las puntuaciones puede dejar invariante la mediana 3. Es función del los intervalos elegidos (de su amplitud, de su número y de los límites de los mismos)

19 4. Es fundamento de diversas técnicas estadísticas, pero de muchas menos que de técnicas basadas en la media 5. Podría ser calculada aunque el intervalo máximo no tenga límite superior y/o el mínimo no tenga límite inferior (siempre y cuando éstos intervalos no contengan dentro de sí mas del 50% de los datos) 6. La mediana es un punto tal, que la vertical levantada sobre el mismo divide el área total del histograma en dos áreas con idéntica superficie 7. Es más recomendable que la media cuando la distribución de frecuencias es muy asimétrica

20 8. Dados r grupos con medianas Md 1, Md 2,…Md r, la mediana total del grupo es igual o mayor que la mediana mínima e igual o menor que la máxima

21 4. MODA 4.1. DEFINICIÓN Es el valor más frecuente de la distribución de frecuencias. 4.2. CALCULO 1. Nivel de intervalo o de razón a)Datos no agrupados Puntuación a la que corresponde la frecuencia máxima. Es decir, lapuntuación que más se repite b) Datos agrupados en intervalos Si la distribución está expresada en intervalos el intervalo modal será el de mayor frecuencia, y la moda será, simplemente dicho intervalo completo o se aproxima por el punto medio del mismo

22 2. Nivel ordinal Valor o categoría ordinal a la que corresponde la frecuencia máxima 3. Nivel nominal Modalidad o categoría nominal a la que corresponde la frecuencia máxima 4.2. PROPIEDADES 1.Es muy fácil de calcular 2.Tiene el inconveniente de no ser necesariamente única. Dentro de una misma distribución pueden aparecer dos o más valores a los que corresponda la frecuencia máxima o distribuciones donde todos los intervalos tuvieran igual frecuencia (distribuciones amodales)

23 3.Es función de los intervalos elegidos (de su amplitud, de su número y de los límites de los mismos) 4.Podría ser calculada aunque el intervalo máximo no tenga límite superior y/o el mínimo no tenga límite inferior (siempre y cuando éstos intervalos no contengan dentro de sí la frecuencia máxima)

24 5. CUANTILES 5.1. DEFINICIÓN Y CALCULO En general se suelen denominar centiles. Definición: son los valores de la variable que una vez ordenados los datos dejan por debajo de sí un porcentaje determinado de los mismos Para su calculo se siguen los mismos pasos que para el calculo de la mediana. En realidad la mediana se corresponde con el percentil 50. Se diferencian tres tipos: a)Centiles ó Percentiles b)Cuartiles c)Deciles

25 a) Centiles o Percentiles Dividen a la distribución de frecuencias en 100 partes iguales. P 1, P 2, P 3,...,P 99 Así definiremos el percentil k como un valor numérico que deja por debajo de sí el k por ciento de las observaciones P 30 : valor que deja por debajo de sí el 30 por ciento de las observaciones

26 b) Cuartiles Una vez ordenados los datos, son los valores de la variable que dividen a la distribución de frecuencias en cuatro grupos iguales. En cada uno de ellos hay un 25% de los datos. Se representan: Q 1 =P 25 Q 2 =P 50 =Md Q 3 =P 75 c) Deciles Una vez ordenados los datos, son los valores de la variable que dividen a la distribución de frecuencias en diez partes iguales, de modo que entre dos deciles hay un 10% de los datos. Se representan por: D 1, D 2, D 3,…D 9

27 5.2. CALCULO a) Datos no agrupado en intervalos Se calculan igual que la mediana, en realidad esta se corresponde con el P 50 b) Datos agrupados en intervalos Los calculamos como percentiles: L i-1 es el límite inferior del intervalo. N representa el total de puntuaciones k es el valor del percentil que queremos calcular N i-1 representa la frecuencia acumulada del intervalo anterior, en que está contenido el percentil n i la frecuencia absoluta del intervalo a i es la amplitud del intervalo

28 Imaginemos que en el ejemplo anterior queremos calcular el P45. Esto es, el valor que deja por debajo de si el 45% de los datos. Como tenemos 90 datos tenemos que buscar en la columna de N i, el valor que deja este valor por debajo de sí. El 45% de 90 es 40.5. El intervalo donde esta este valor es 30-40. Consu.niNi 0-1010-2020-3030-4040-5050-6060-708121014211698203044658190 90 L i -1 =30 N=90 N i -1 =30 k=45 N i =14 a i =10


Descargar ppt "BLOQUE III: EXPLORACIÓN Y DESCRIPCION DE UN GRUPO DE DATOS Tema 9 ESTADÍSTICOS DE POSICIÓN Y DE TENDENCIA CENTRAL."

Presentaciones similares


Anuncios Google