Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porAndrea Aguilar Pérez Modificado hace 9 años
1
ESTADISTICA Medición y evaluación en psicología y educación
Robert L. Thorndike Elizabeth P. Hagen Capitulo II Estadística Estadística para las ciencias sociales Runyon / Haber Varios capítulos
2
Estadística Puede ser considerada como un método para manejar datos.
Es una herramienta para la recopilación, organización y análisis de hechos numéricos o de observaciones. DESCRIPTIVA INFERENCIAL
3
Estadística descriptiva
Su propósito principal es el presentar la información de una forma mas cómoda, utilizable y comprensible. Al realizar la función descriptiva el estadista formula reglas y procedimientos para la presentación de los datos en una forma útil y significativa. Se refiere a la recolección, presentación, descripción, análisis e interpretación de una colección de datos, esencialmente consiste en resumir éstos con uno o dos elementos de información (medidas descriptivas) que caracterizan la totalidad de los mismos.
4
Estadística inferencial o inductivas
Se ocupa de la generalización de información o en forma mas especifica de hacer deducciones a cerca de la poblaciones basándose en muestras tomadas de ellas. Se refiere al proceso de lograr generalizaciones acerca de las propiedades del todo, población, partiendo de lo específico, muestra. las cuales llevan implícitos una serie de riesgos. Es el conjunto de técnicas que se utiliza para obtener conclusiones que sobrepasan los límites del conocimiento aportado por los datos, busca obtener información de un colectivo mediante un metódico procedimiento del manejo de datos de la muestra.
5
Conceptos en estadística
Variable = Característica de una persona, medio ambiente o situación experimental, que puede variar de persona a persona, de un medio ambiente a otro o de una experiencia a otra. Datos = Números o medidas obtenidas como resultado de observaciones. Pueden ser recuentos (datos de frecuencias). Población o universo = Conjunto completo de individuos, objetos o medida que tiene alguna característica común observable. Parámetro = Cualquier característica medible de una población. Muestra = Un subconjunto de la población o universo
6
Variable Es una característica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores. Variables cualitativas Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser: Dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer Politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir: Variable cualitativa ordinal: Puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave. Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia. Varliables cuantitativas Se expresan mediante cantidades numéricas. Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5). Variable continua: Puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg, ...) o la altura (1,64 m, 1,65 m, 1,66 m, ...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera.
7
Agrupación de datos Distribución de frecuencias o tabla de frecuencias: Es la organización de datos de manera sistemática Es ordenar los resultados de forma descendente y agregar el numero de frecuencias Es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente Ci de 30 estudiantes del segundo grado de secundaria X f 154 I 115 II 147 113 136 110 134 109 133 108 131 105 128 104 122 103 121 100 119 93 118 90 117 85 116 Ci de 30 estudiantes del segundo grado de secundaria 154 131 122 100 113 119 133 115 117 110 104 116 103 121 109 147 128 93 90 105 118 134 85 108 136
8
Agrupación en intervalos de clase
El agrupamiento en intervalos de clase implica una especie de “ruptura de la escala” en la cual asignamos los datos a clases de mutantes excluyente en donde estas se definen en términos de agrupamiento empleado. Dos razones par este tipo de agrupaciones Es antieconómico y poco practico el manejo de un gran numero de datos dispersos Algunos de los datos tienen asociada una frecuencia tan baja que no justifica mantenerlos como entidades distintas o separadas Procedimiento: Hállese la diferencia entre el mas alto y el mas bajo y añada 1 para obtener el total de datos: (154 – 85) + 1 = 70 Divídase este numero por 15 (esto depende del investigador) para obtener el numero de datos en cada intervalo (70/15) si el valor no da entero se puede redondear. (4.6 = i=5 ) Tómese el dato mas bajo de los datos originales como limite inferior del primer intervalo
9
Técnicas de representación gráfica
Es representar los datos mediante un dibujo de tal modo que el lector pueda percibir fácilmente las características esenciales de una distribución de frecuencias y compararla con otra. DIAGRAMA DE BARRA Un gráfico dibujado usando barras rectangulares para mostrar qué tan grande es cada valor. Las barras pueden ser horizontales o verticales En el eje horizontal o eje de abscisas, se representan los datos o modalidades En el eje vertical o de ordenadas, se representan las frecuencias de cada dato o modalidad
10
HISTOGRAMA Un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos.
11
Polígono de frecuencias
Es un gráfico lineal que se utiliza en el caso de una variable cuantitativa. Para realizar el polígono unimos los puntos medios de las bases superiores del diagrama de barras o del histograma
12
Medidas de tendencia Central
Es un índice de localización central empleada en la descripción de las distribuciones de frecuencia. A menudo los datos se acumulan alrededor de un valor central situado entre dos valores extremos de las variables que se estudian MEDIA MEDIANA MODA
13
Media aritmética Media _ = X1+X2+X3+…+XN ∑x X N
154 2 147 3 136 4 134 5 133 6 131 7 128 8 122 9 121 10 119 11 12 118 13 117 14 15 116 16 115 17 18 113 19 110 20 109 21 108 22 23 105 24 104 25 103 26 27 100 28 93 29 90 30 85 3473 Promedio 115,8 Media aritmética La media de varias cantidades, es la suma de todas las cantidades dividida entre el número de ellas. También se llama promedio. Expresión algebraica: Media _ = X1+X2+X3+…+XN ∑x X N = 3473 116 X 30
14
Ci de 30 estudiantes del segundo grado de secundaria
Media aritmética Ci de 30 estudiantes del segundo grado de secundaria X N Multiplica 154 1 147 136 134 133 131 128 122 121 119 2 238 118 117 234 116 115 230 113 110 109 108 216 105 104 103 206 100 93 90 85 Total 3473 Alumnos 30 Media Para hallar la media de los datos de una tabla de frecuencias correspondiente a una variable cuantitativa: Se multiplica cada dato por su frecuencia y se suman los resultados. La suma total se divide por la suma de todas las frecuencias. Media = 116
15
MODA Intervalo de clase f 1 3 2 8 4 95-99 90-94 85-89 Se determina mas fácilmente, puesto que se obtiene a simple vista y no mediante el calculo. La moda es simplemente la calificación que se presenta con mayor frecuencia Moda
16
Mediana Se define como el dato o dato potencial de una distribución, por arriba y por debajo del cual caen la mitad de las frecuencias Se llama mediana de un conjunto de datos numéricos al que ocupa el valor central. Para calcularla, ordenamos las cantidades de menor a mayor y elegimos la del medio. Si hay un número par de datos, la mediana es el promedio de los dos valores centrales. EJEMPLOS: Estos son los pesos de 7 niños: 39 kg - 43 kg - 52 kg - 41 kg - 47 kg - 38 kg -45 kg Ordenamos los valores: 43 De esta forma podemos visualizar el valor central.
17
Ci de 30 estudiantes del segundo grado de secundaria
X N 154 1 147 136 134 133 131 128 122 121 119 118 117 116 115 113 110 109 108 105 104 103 100 93 90 85 Medidas de Tendencia Central Moda Polimodal Media Mediana ( )/2 = 115.5
18
Uso de la media, moda y mediana
Las Medidas de tendencia central, nos permiten identificar los valores más representativos de los datos, de acuerdo a la manera como se tienden a concentrar. La Media nos indica el promedio de los datos; es decir, nos informa el valor que obtendría cada uno de los individuos si se distribuyeran los valores en partes iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las cuales cuenta con el cincuenta porciento de los datos. Por último la Moda indica el valor que más se repite dentro de los datos.
19
Uso de la media, moda y mediana
Las medidas de tendencia central permiten: Mostrar en qué lugar se ubica la persona promedio o típica del grupo. Sirve como un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico. Sirve como un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones. Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos
20
Distribución de frecuencias
Mediana Media
21
Curva de frecuencias Mediana Media
22
Curvas de frecuencia Las representaciones graficas correspondientes son las curvas de frecuencia acumulada y la curva de porcentajes acumulados. La curva que se caracteriza por una concentración de datos en el centro de la distribución es llamada LEPTOCURTICA En la curva donde predomina la menor concentración de datos en el centro de la distribución es llamada PLATICURTICA La forma ideal de la curva es llamada MESOCURTICA
23
Curva de frecuencias Una curva normal es una distribución simétrica, porque si se la dobla por la mitad, ambas partes coinciden. Cuando una distribución no es simétrica se dice que es sesgada
24
Medidas de Variabilidad
25
Medidas de dispersión La medida de dispersión llamada también medida de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media..
26
Medidas de dispersión Rango 2. Rango semicuartil
3. La desviación media 4. La varianza 5. Desviación estándar
27
Ci de 30 estudiantes del segundo grado de secundaria
Rango La medida más simple de variabilidad es el rango de puntuaciones de cada grupo. Este es simplemente la diferencia entre la mas alta y la mas baja de las puntuaciones El CI de estudiantes de secundaria seria =69 Ci de 30 estudiantes del segundo grado de secundaria X f 154 I 115 II 147 113 136 110 134 109 133 108 131 105 128 104 122 103 121 100 119 93 118 90 117 85 116 Aunque el rango tiene un significado muy claro, se utiliza poco a causa de su marcada inestabilidad, debido a valores extremos que puedan encontrarse en la distribución.
28
Rango semi-intercuartil Cálculo de los cuartiles
Con la finalidad de superar la inestabilidad del rango como medida de dispersión se emplea el rango semi-intercuartil. Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana. Cálculo de los cuartiles 1 Ordenamos los datos de menor a mayor. 2 Buscamos el lugar que ocupa cada cuartil mediante la expresión . Número impar de datos 2, 5, 3, 6, 7, 4, 9
29
Rango semi-intercuartil
Número par de datos 2, 5, 3, 4, 6, 7, 1, 9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 N 154 147 136 134 133 131 128 122 121 119 118 117 116 115.5 115 113 110 109 108 105 104 103 100 93 90 85 X Media Mediana Medidas de tendencia central Rango (185-85= 69) Q1 Q2 Q3 Rango semi-intercuatil
30
Rango semi-intercuartil Cálculo de los cuartiles
Con la finalidad de superar la inestabilidad del rango como medida de dispersión se emplea el rango semi-intercuartil. Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana. Cálculo de los cuartiles 1 Ordenamos los datos de menor a mayor. 2 Buscamos el lugar que ocupa cada cuartil mediante la expresión . Número impar de datos 2, 5, 3, 6, 7, 4, 9
31
Desviación media Esta medida indica la dispersión de los datos alrededor de los datos y nunca puede ser negativo. Cuanto más cercano a cero esté menor dispersión, aunque al no tratarse de una medida por si misma para la interpretación de datos hay que tener en cuenta para la desviación estándar La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media. La desviación media se representa por
32
Varianza La varianza es la medida de mayor utilidad en todos los análisis estadísticos. La varianza misma no es de utilidad directa, ella es la base de todos los cálculos en estadística, es decir, nos sirve para calcular la desviación standard, el error standard, el coeficiente de regresión, el coeficiente de correlación y, por supuesto, para hacer el análisis de varianza, entre otros. La varianza también es llamada media cuadrática, media cuadrada o cuadrado de la media (en inglés Variance y Mean Square) es una medida de la dispersión de los valores alrededor de la media. Mientras más dispersos los valores, mayor será la varianza y por el contrario cuando los valores son muy similares, es decir, no varían mucho, la varianza será muy pequeña hasta llegar a cero cuando todos los valores son exactamente iguales. Así, cuando se desea que algo sea uniforme.
33
s2 = Formula para obtener la varianza
Un método fácil de calcular la varianza de un grupo de datos numéricos es sumando las diferencias entre cada valor y la media de la muestra y luego dividiendo esa suma entre el número de observaciones. Como un ejemplo sencillo, vamos a calcular la varianza de las notas de algunos estudiantes: x1 = 15, x2 = 7, x3 = 12, x4 = 10, x5 = 17, x6 = 13, x7 = 10, x8 = 20, x9 = 14, x10 = 15, x11 = 11, x12 = 5. Primero re-agruparemos los valores en orden ascendente, así que ahora serán: X1 = 5, x2 = 7, x3 = 10, x4 = 10, x5 = 11, x6 = 12, x7 = 13, x8 = 14, x9 = 15, x10 = 15, x11 = 17, x12 = 20. Luego calculamos su media: en este caso es de que redondearemos a A la media le restaremos cada uno de los valores (por ejemplo: 15 – = 2.58; 7 – = y así sucesivamente hasta llegar a los 12 datos), luego cada uno de esos valores se eleva al cuadrado (por ejemplo: = ; = y así sucesivamente), luego se suman todos estos valores cuadrados y la suma (en este caso ) se divide entre el número de grados de libertad (11) que resulta en que redondeamos a Lógicamente es el mismo resultado que por método anterior. Existen otros métodos para calcular la varianza, pero estos son los más comúnmente usados.
34
Desviación estándar o típica
Es el componente estadístico más usado en todos los experimentos e investigaciones científicas y es una medida de la media de las variaciones de los valores. La desviación estándar es la variación o dispersión verdadera y absoluta de los valores estudiados. Se simboliza con sigma minúscula, σ, para la población y con s para la muestra. Su cálculo es muy sencillo una vez que se tiene la varianza, pues es solo la raíz cuadrada de dicha varianza y por ser el producto de una raíz cuadrada, su valor es positivo y negativo y se le prepone el símbolo ±. s = s = En nuestro caso será la raíz cuadrada de 17.90, es decir, s = es ± que redondearemos a ±4.23.
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.