Programa Académico de Maestría en Educación para Docentes de la Región Callao ESTADISTICA PARA LA INVESTIGACIÓN PSICOPEDAGÓGICA II José Luis Morón Octubre - 2011 Sesión 1
1-2 Introducción Análisis descriptivo e inferencial y en el cual se proporciona una serie de procedimientos para evaluar estadísticamente la conformidad de la información empírica
1-2 Competencia Conoce y usa procedimientos estadísticos para la realización de pruebas estadísticas paramétricas y no paramétricas y análisis multivariados. Gestiona con SPSS información, contrastada y establece conclusiones en base al análisis de los datos
Definición de Estadística 1-2 Definición de Estadística Estadística es la ciencia de recolectar, organizar, presentar, analizar e interpretar datos con el propósito de ayudar a una toma de decisiones más efectiva.
Estadística Descriptiva Estadística Descriptiva: Conjunto de métodos y procedimientos gráficos y numéricos que organizan, resumen y presentan datos Es usada para transformar datos en información.
Estadística Descriptiva Recolectar Datos Instrumentos, Encuestas Presentar Datos Tablas y Gráficos Resumir Datos Media muestral
Estadística Inferencial Estadística Inferencial: Conjunto de métodos utilizados para saber “algo” acerca de una población basándose en una muestra. Es usada para transformar información en conocimiento.
Estadística Inferencial Estimación Estimar el peso promedio de la población usando el peso promedio de la muestra. Prueba de Hipótesis Probar que el peso promedio de la población es 65 kg. Extraer conclusiones y/o tomar decisiones concernientes a una población basándose en los resultados de una muestra.
Población y Muestra TODOS los posibles PARTE “representativa” Individuos, objetos, mediciones y conteos Un PARÁMETRO describe a una Población. Muestra PARTE “representativa” de la Población. Un ESTADÍSTICO describe a una Muestra.
1-7 Variable Números X=edad Se pueden definir muchas variables
Resumen de Tipos de Variables 1-11 Resumen de Tipos de Variables DATOS Cualitativos o de atributos Cuantitativos o numéricos Discretos Continuos (Conteo) (Medición)
Tipos de variables Cualitativas Si se expresan con las 1-11 Tipos de variables Cualitativas Si se expresan con las escalas nominal u ordinal Tipo de variable Cuantitativas Si se expresan con las escalas intervalar y de razón
Distribución en Categorías 1-14 Distribución en Categorías Mutuamente excluyente: un individuo, objeto o artículo, al ser incluido en una categoría, debe excluirse de las demás. Completamente incluyente: cada individuo, objeto o artículo debe clasificarse en al menos una categoría.
Distribución de Frecuencias Distribución Acumulada Ordenamiento de Datos Datos Numéricos Arreglo de Datos Distribución de Frecuencias Distribución Acumulada Histograma Ojiva Tablas Polígono
Distribución de Frecuencias Ordenamiento de los datos en clases. Indica el número de observaciones (datos) que caen en cada clase. Clase Grupo de valores que describe una característica de los datos. Tipos de Clases Cualitativas Cuantitativas Discretas Continuas
Pasos para construir una Distribución de Frecuencias 1. Calcule el alcance o rango (Dato mayor - Dato menor). 2. Determine el número de clases. Usualmente entre 6 y 15. (Ley Sturges) 3. Calcule el intervalo de clase. Divida el alcance entre el número de clases 4. Determine los límites de cada clase. Límite Superior y Límite Inferior 6. Asigne las observaciones a cada clase y efectúe el conteo.
Distribución de Frecuencias Frec. Relativa Clase Frecuencia Frec. Relativa Acumulada 48.8-49.2 2 0.07 0.07 49.3-49.7 5 0.16 0.23 49.8-50.2 11 0.37 0.60 50.3-50.7 6 0.20 0.80 50.8-51.2 3 0.10 0.90 51.3-51.7 3 0.10 1.00 30 1.00 Distribución de Frecuencias Relativas Acumuladas
Organización de los datos Tablas de frecuencias Cualitativa Barras Sectores Circulares Gráficos Variable Tablas de frecuencias Gráfico de barras Discreta Cuantitativa Tabla de frecuencias por intervalos de clase Histogramas Continua
Distribución de Frecuencias Distribución Acumulada Ordenamiento de Datos Datos Numéricos Arreglo de Datos Distribución de Frecuencias Distribución Acumulada Histograma Ojiva Tablas Polígono
Histograma Clase Frecuencia 48.8-49.2 2 49.3-49.7 5 49.8-50.2 11 48.8-49.2 2 49.3-49.7 5 49.8-50.2 11 50.3-50.7 6 50.8-51.2 3 51.3-51.7 3 12 10 8 Frecuencia 6 4 2 48.8 49.3 49.8 50.3 50.8 51.3 49.2 49.7 50.2 50.7 51.2 51.7
Polígono de Frecuencias Clase Marca Frecuencia 48.8-49.2 49.0 2 49.3-49.7 49.5 5 49.8-50.2 50.0 11 50.3-50.7 50.5 6 50.8-51.2 51.0 3 51.3-51.7 51.5 3 12 10 8 Frecuencia 6 4 2 48.5 49.0 49.5 50.0 50.5 51.0 51.5 52.0
Ojiva 30 27 24 Frecuencia Acumulada Relativa 18 48.8-49.2 2 48.8 0 Clase Frec. Menor Frec. Abs. que Acum. 18 48.8-49.2 2 48.8 0 49.3-49.7 5 49.3 2 49.8-50.2 11 49.8 7 50.3-50.7 6 50.3 18 50.8-51.2 3 50.8 24 51.3-51.7 3 51.3 27 51.8 30 Frecuencia Acumulada Relativa 7 2 48.8 49.3 49.8 50.3 50.8 51.3 51.8
Diagrama de Tallo y Hoja 1 2 3 4 5 6 68 1255578899 1145566677778999 000122345678999 11667 12
Características de los Datos 1-2 Características de los Datos
Moda Medidas de Tendencia central Media Mediana Resúmenes numéricos Medidas de dispersión Rango Varianza, desv. Estándar, Rango intercuartil Medidas de Simetría y apuntamiento Indice de simetría
Características de los Datos Tendencia Central (Posición) Dispersión (Variación) Sesgo
Tendencia Central Media Aritmética Media Ponderada Media Geométrica Mediana Moda
3-4 Media de una Muestra Para datos no agrupados, la media de una muestra es la suma de todos los valores divididos entre el número total de los mismos: donde denota la media muestral n es el número total de valores en la muestra.
Propiedades de la Media Aritmética 3-6 Propiedades de la Media Aritmética Todo conjunto de datos tiene un valor medio. Al evaluar la media se incluyen todos los valores. Un conjunto de valores sólo tiene una media. Desventaja Es afectada por los valores extremos.
Media Aritmética Es la medida más común de tendencia central. Es afectada por valores extremos. 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Media = 5 Media = 6
3-10 Mediana Mediana: es el punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. La misma cantidad de valores se encuentra por arriba de la mediana que por debajo de ella. Nota: para un conjunto con un número par de números, la mediana será el promedio aritmético de los dos números medios.
Mediana No es afectada por los valores extremos. 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Mediana = 5 Mediana = 5
Propiedades de la mediana 3-12 Propiedades de la mediana La mediana es única para cada conjunto de datos. No se ve afectada por valores muy grandes o muy pequeños.
Moda Valor que ocurre más a menudo. No es afectada por valores extremos. Puede no existir una moda. Pueden haber varias modas. 0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Sin Moda Moda = 9
1-2 Medidas de Dispersión
Desviación Estándar de Desviación Estándar de Dispersión Varianza Desviación Estándar Coeficiente de Variación Alcance Varianza de la Población Desviación Estándar de la Población Varianza de la Muestra Desviación Estándar de la Muestra Alcance Intercuartil
Alcance o Rango
Alcance Diferencia entre la mayor y la menor de las observaciones Alcance = xmayor – xmenor No toma en cuenta la forma en que están distribuidos los datos. Alcance: 12 - 7 = 5 Alcance: 12 - 7 = 5 7 8 9 10 11 12 7 8 9 10 11 12
Cuartiles Los datos se ordenan de menor a mayor. El alcance intercuartil es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1. 25% 25% 25% 25% Observación Menor Observación Mayor
Desviación de la Media
Promedio de desviación de cada dato 2 -2 1 2 3 4 5 1 -1
Varianza de la Población Desviación cuadrática promedio con relación a la media de la Población
Desviación Estándar de la Población Raíz Cuadrada de la Varianza de la Población
Varianza de la Muestra Desviación cuadrática promedio (n-1) con relación a la media de la Muestra
Desviación Estándar de la Muestra Raíz Cuadrada de la Varianza de la Muestra
Varianza de la Población Datos Agrupados
Desviación Estándar de la Población Datos Agrupados
Varianza de la Muestra Datos agrupados
Desviación Estándar de la Muestra Datos Agrupados
Comparación de Desviaciones Estándar Datos A Media = 15.5 s = 3.338 11 12 13 14 15 16 17 18 19 20 21 Datos B Media = 15.5 s = .9258 11 12 13 14 15 16 17 18 19 20 21 Datos C Media = 15.5 s = 4.57 11 12 13 14 15 16 17 18 19 20 21
Interpretación y usos de la Desviación Estándar 4-14 Interpretación y usos de la Desviación Estándar Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporción mínima de valores que está dentro de k desviaciones estándar desde la media es al menos 1 - 1/k2 , donde k es una constante mayor que 1.
Interpretación y usos de la Desviación Estándar 4-15 Interpretación y usos de la Desviación Estándar Regla empírica: para una distribución de frecuencias simétrica de campana: Cerca de 68% de las observaciones estará dentro de ±1σ de la media (μ); Cerca de 95% de las observaciones estará dentro de ±2σ de la media (μ); Casi todas (alrededor de 99.7%) las observaciones estarán dentro de ±3σ de la media (μ).
Curva de Distribución Normal -3σ -2σ -1σ μ +1σ +2σ +3σ
34.13% 34.13% 13.60% 13.60% 2.135% 2.135% 0.135% 0.135% -3σ -2 σ -1σ +1σ +2σ +3σ μ 68.26% 95.46% 99.73%
Resultado Estándar -3σ -2σ -1σ +1σ +2σ +3σ μ
-3σ -2σ -1σ +1σ +2σ +3σ μ 160 80 100
4-17 Dispersión Relativa El coeficiente de variación es la razón de la desviación estándar a la media aritmética, expresada como porcentaje:
Medida de Curtosis Como medida de curtosis se usa el coeficiente de curtosis, que indica la forma de la distribución de los datos con respecto a una distribución normal. Un valor cero indica que la curva es mesocúrtica (curva normal), si es positivo indica que la curva es leptocúrtica (apuntada) y si es negativo platocúrtica (achatada).
Medida de Curtosis El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución. Se definen 3 tipos de distribuciones según su grado de curtosis: Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable. Sesión 4
Medidas de forma: Curtosis Leptocúrtica Mesocúrtica Platicúrtica
Medida de Curtosis El Coeficiente de Curtosis arroja los siguientes resultados: g2 = 0 (distribución mesocúrtica). g2 > 0 (distribución leptocúrtica). g2 < 0 (distribución platicúrtica). Sesión 4
Ejemplo de Dispersión Relativa ¿Cuál de las dos tiene menor dispersión?
Ejemplo de Dispersión Relativa La distribución B tiene menor dispersión
Medidas de Asimetría El concepto de asimetría se refiere a si la curva que forman los valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media aritmética) Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher. Los resultados pueden ser los siguientes: g1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media) g1 > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda) g1 < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha)
Sesgo de una distribución Positivamente Sesgada Negativamente Sesgada Simétrica Media < Mediana < Moda Media = Mediana = Moda Moda < Mediana < Media