La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Medidas de tendencia central

Presentaciones similares


Presentación del tema: "Medidas de tendencia central"— Transcripción de la presentación:

1 Medidas de tendencia central

2 Medidas de tendencia central
Medidas de Posición: son aquellos valores numéricos que nos permiten dar una medida de tendencia central, dividiendo el recorrido de la variable en dos, o bien fragmentar la cantidad de datos en partes iguales. Las más usuales son la media, la mediana, la moda, los cuartiles, quintiles, deciles y percentiles

3 Medidas de tendencia central
Medidas de Dispersión: se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficientes para variables cuantitativas. Las más usuales son el desvío estándar y la varianza.

4 La Media Aritmética La media aritmética se la conoce como promedio o media

5 El cálculo de la Media Dado un conjunto de observaciones
La media se representa mediante y se obtiene dividiendo la suma de todos los datos por el número de ellos, es decir:

6 Media aritmética La media aritmética de un conjunto de datos es el cociente entre la suma de todos los datos y el número de estos. Ejemplo: las notas de Juan el año pasado fueron: Hay 7 datos 5, 6, 4, 7, 8, 4, 6 que suman 40 La nota media de Juan es: Nota media =

7 Cálculo de la media aritmética cuando los datos se repiten.
1º. Se multiplican los datos por sus frecuencias absolutas respectivas, y se suman. 2º. El resultado se divide por el total de datos. Ejemplo. Las notas de un grupo de alumnos fueron: Datos por frecuencias Total de datos

8 Mediana La mediana, a diferencia de la media no busca el valor central del recorrido de la variable según la cantidad de observaciones, sino que busca determinar el valor que tiene aquella observación que divide la cantidad de observaciones en dos mitades iguales. Por lo tanto es necesario atender a la ordenación de los datos, y debido a ello, este cálculo depende de la posición relativa de los valores obtenidos. Es necesario, antes que nada, ordenar los datos de menor a mayor (o viceversa). en caso que N sea impar

9 Los pesos, en kilogramos, de 7 jugadores de un equipo de fútbol son:
La mediana La mediana de un conjunto de datos es un valor del mismo tal que el número de datos menores que él es igual al número de datos mayores que él. Los pesos, en kilogramos, de 7 jugadores de un equipo de fútbol son: Ejemplo: 72, 65, 71, 56, 59, 63, 72 1º. Ordenamos los datos: 56, 59, 63, 65, 71, 72, 72 2º. El dato que queda en el centro es 65. La mediana vale 65. Caso: Si el número de datos fuese par, la mediana es la media aritmética de los dos valores centrales. Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es:

10 Moda La moda, es aquel dato, aquel valor de la variable que más se repite; es decir, aquel valor de la variable (que puede no ser un único valor) con una frecuencia mayor.

11 La moda de un conjunto de datos es el dato que más se repite.
Ejemplo. Una zapatería ha vendido en una semana los zapatos que se reflejan en la tabla: El número de zapato más vendido, el dato con mayor frecuencia absoluta, es el 41. Lo compran 35 personas La moda es 41.

12 Medidas de Dispersión La Varianza El cuadrado de la desviación estándar recibe el nombre de varianza y se representa por La suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de cualquier otro valor que no sea la media aritmética. Si observamos, veremos que la varianza no es más que el desvío estándar al cuadrado. Precisamente la manera de simbolizarla es. Por lo mismo, el desvío estándar puede definirse como la raíz cuadrada de la varianza

13 Medidas de Dispersión El desvío estándar
Es posible identificar conjuntos de datos que a pesar de ser muy distintos en términos de valores absolutos, poseen la misma media. Una medida diferencial para identificar esos conjuntos de datos es la concentración o dispersión alrededor de la media. Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que todas las desviaciones sean positivas. La raíz cuadrada del promedio de estas cantidades recibe el nombre de desvío estándar, o desviación típica y es representada por la siguiente fórmula:

14 8 cms. Aquí tenemos 9 rectángulos cuya altura es de 8 centímetros (y todos tienen la misma base). ¿Existe alguna variación respecto de su altura entre estos rectángulos? ¿Cuál es el promedio de la altura de estos rectángulos? 9 = 72 9 = 8

15 10 cms 6 cms 8 cms. El quinto rectángulo y el octavo rectángulo en un acto de rebeldía cambiaron su altura. El quinto rectángulo, ahora de color rojo, mide 10 centímetros, y el octavo rectángulo, de color azul, mide 6 centímetros? ¿Cuál es el nuevo promedio de estos 9 rectángulos? 9 = 72 9 = 8 ... ¡el mismo promedio! Pero... ¿ha habido variación?

16 8 cms. 10 cms 6 cms El rectángulo rojo tiene +2 centímetros sobre el promedio, y el rectángulo azul tiene –2 centímetros bajo el promedio. Los otros rectángulos tienen cero diferencia respecto del promedio. Si sumamos estas diferencias de la altura respecto del promedio, tenemos – 2 + 0 = 0 Este valor nos parece indicar que ¡no ha habido variabilidad! Y sin embargo, ante nuestros ojos, sabemos que hay variación.

17 8 cms. 10 cms 6 cms Una forma de eliminar los signos menos de aquellas diferencias que sean negativas, esto es de aquellos mediciones que estén bajo el promedio, es elevar al cuadrado todas las diferencias, y luego sumar... (– 2) = 8 Y este resultado repartirlo entre todos los rectángulos, es decir lo dividimos por el número de rectángulos que es 9 9 8 (– 2) = 9 = 0,89

18 8 cms. 10 cms 6 cms Se dice entonces que la varianza fue de 0,89 Observemos que las unidades involucradas en el cálculo de la varianza están al cuadrado. En rigor la varianza es de 0,89 centímetros cuadrados. De manera que se define La raíz cuadrada de la varianza se llama desviación estándar

19 8 cms. 10 cms 6 cms Que la desviación estándar haya sido de 0,943 significa que en promedio la altura de los rectángulos variaron (ya sea aumentando, ya sea disminuyendo) en 0,943 centímetros. Es claro que esta situación es “en promedio”, puesto que sabemos que los causantes de la variación fueron los rectángulos quinto y octavo. Esta variación hace repartir la “culpa” a todos los demás rectángulos que se “portaron bien”. La desviación estándar mide la dispersión de los datos respecto del promedio

20 8 cms. 10 cms 6 cms 4 cms 7 cms. ¿Cuál es la varianza y la desviación estándar de las alturas de los rectángulos? En primer lugar debemos calcular el promedio 9 = 7,44 Luego debemos calcular la varianza

21 Este es el valor de la varianza
8 cms. 10 cms 6 cms 4 cms 7 cms. 0,56 -3,44 2,56 -0,44 -1,44 Promedio 7,44 0,562 + (-3,44)2 + 0, , , ,562 + (-0,44)2 + (-1,44)2 + 0,562 22,2224 9 = 9 = 2,469 Este es el valor de la varianza

22 10 cms 8 cms. 6 cms 4 cms 7 cms. Promedio 7,44 Si la varianza fue de 2,469, entonces la desviación estándar es de... Lo que significa que, en promedio, los rectángulos se desviaron más o menos (más arriba o más abajo) en 1,57 centímetros.

23 Para entender la varianza necesariamente debe saber:
Sumar Restar Multiplicar Dividir Potencia de orden 2 Raíz cuadrada Y es claro que esto no es suficiente (salvo que queramos que aprenda de memoria los cálculos). Necesitamos estimular su imaginación para que “vea” la variabilidad existente en la naturaleza. Entregue una lista de fenómenos en que un mismo atributo tenga variabilidad si se mide este atributo a un número de individuos u objetos.

24 Cuartil, Quintiles, Deciles, Percentiles
La mediana, como vimos, separa en dos mitades el conjunto ordenado de observaciones. Podemos a su vez subdividir cada mitad en dos, de tal manera que resulten cuatro partes iguales. Cada una de esas divisiones se conoce como Cuartil y lo simbolizaremos mediante la letra Q agregando un subíndice según a cual de los cuatro cuartiles nos estemos refiriendo. Se llama primer cuartil (Q1) a la mediana de la mitad que contiene los datos más pequeños. Este cuartil, corresponde al menor valor que supera – o que deja por debajo de él – a la cuarta parte de los datos. Se llama tercer cuartil (Q3) a la mediana de la mitad formada por las observaciones más grandes. El tercer cuartil es el menor valor que supera – o que deja por debajo de él – a las tres cuartas partes de las observaciones. Con esta terminología, la mediana es el segundo cuartil (Q2) y el cuarto cuartil (Q4) coincide con el valor que toma el último dato, luego de ordenados.


Descargar ppt "Medidas de tendencia central"

Presentaciones similares


Anuncios Google