La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Yadira María Alvarado Salas I Cuatrimestre 2014 – UNED 3 era Tutoría

Presentaciones similares


Presentación del tema: "Yadira María Alvarado Salas I Cuatrimestre 2014 – UNED 3 era Tutoría"— Transcripción de la presentación:

1 Yadira María Alvarado Salas I Cuatrimestre 2014 – UNED 3 era Tutoría
XS-104 Estadística I Yadira María Alvarado Salas I Cuatrimestre 2014 – UNED 3 era Tutoría

2 Capítulo 7 Distribuciones de frecuencias

3 La necesidad de resumir la información cuantitativa: La distribución de frecuencias
Las distribuciones de frecuencia son clasificaciones que se refieren a variables cuantitativas (continuas o discretas). Resulta valioso disponer de elementos descriptivos que den información acerca de 3 aspectos: Forma: la forma o patrón de distribución de los datos. Posición: la posición de la distribución, o sea, alrededor de qué valor se tienden a concentrar los datos (valores centrales). Dispersión: la dispersión de los datos alrededor de los valores centrales o promedios (variabilidad). Esto es fácil cuando el conjunto de interés tiene pocos datos. Cuando los datos son numerosos, se recurre a agruparlos en una distribución de frecuencias. Definición: la distribución de frecuencias es una ordenación o arreglo en clases o categorías que muestra, para cada una de ellas, el número de elementos contenidos (frecuencia).

4 Distribución de frecuencias de variables discretas
Ejemplo: Número de hermanos de 32 alumnos de un colegio rural de San José.

5 Distribución de frecuencias de variables discretas
Ejemplo: Número de hermanos de 32 alumnos de un colegio rural de San José.

6 Distribución de frecuencias de variables discretas
Ejemplo: Número de hermanos de 32 alumnos de un colegio rural de San José.

7 Distribución de frecuencias de variables discretas
Ejemplo: Número de hermanos de 32 alumnos de un colegio rural de San José.

8 Distribución de frecuencias de variables discretas
Ejemplo: Número de hermanos de 32 alumnos de un colegio rural de San José.

9 Distribución de frecuencias de variables discretas
Ejemplo: Número de hermanos de 32 alumnos de una escuela rural Gráficos

10 Distribución de frecuencias de variables discretas
Ejemplo: Número de hermanos de 32 alumnos de una escuela rural Gráficos

11 Distribución de frecuencias de variables discretas

12 Distribución de frecuencias de variables discretas

13 Distribución de frecuencias de variables discretas

14 Distribución de frecuencias de variables discretas

15 Distribución de frecuencias de variables discretas

16 Distribución de frecuencias de variables discretas

17 Distribución de frecuencias de variables discretas
¿Cómo obtener los datos que faltan en la tabla de frecuencias?

18 Distribución de frecuencias de variables discretas
¿Cómo obtener los datos que faltan en la tabla de frecuencias?

19 Distribución de frecuencias de variables discretas
¿Cómo obtener los datos que faltan en la tabla de frecuencias?

20 Distribución de frecuencias de variables discretas
Los datos en rojo son los que faltaban.

21 Distribución de frecuencias de variables discretas
Los datos en rojo son los que faltaban.

22 Distribución de frecuencias de variables discretas
Ejemplo: Número de hermanos de 32 alumnos de una escuela rural. Frecuencias acumuladas discretas “Menos de”.

23 Distribución de frecuencias de variables discretas
Ejemplo: Número de hermanos de 32 alumnos de una escuela rural. Frecuencias acumuladas discretas “Menos de”.

24 La medición de variables continuas y el problema del redondeo
Teóricamente una variable continua puede ser medida con la exactitud que se quiera. En la realidad, las variables continuas se expresan redondeadas en cierto tipo de unidades. Redondeo a la unidad más próxima: Si el primer dígito de la parte del número a eliminar: Es menor que 5, el dígito precedente permanece igual. Es mayor que 5, el dígito precedente aumenta una unidad Es exactamente 5, entonces: Si el dígito precedente es impar, éste aumenta una unidad Si el dígito precedente es par, éste permanece igual.

25 La medición de variables continuas y el problema del redondeo
Redondeo hacia abajo El último dígito que interesa, se conserva. El resto del número se elimina. Redondeo hacia arriba El último dígito que se desea conservar, se incrementa en una unida. Excepto si va seguido únicamente de ceros.

26 La medición de variables continuas y el problema del redondeo
Ilustración del redondeo con los tres diferentes métodos

27 La medición de variables continuas y el problema del redondeo
Ilustración del redondeo con los tres diferentes métodos

28 Distribución de variables continuas
Peso de 60 estudiantes hombres (en Kg)

29 Distribución de variables continuas
Peso de 60 estudiantes hombres (en Kg)

30 Distribución de variables continuas
Amplitud o recorrido: Valor mayor – valor menor 88 – 45 = 43 Cantidad de clases: no menor a 6, ni mayor de 15 43 / 6 = 7,16 43 / 8 = 5,38 43 / 10 = 4,30 Intervalo: preferible de 5, 10 o múltiplos de ellos. El intervalo más apropiado es de 5 Kg. La cantidad de clases es de 9. ¿Dónde empieza la primera clase? En 45

31 Distribución de variables continuas

32 Límites reales y límites indicados, intervalo de clase y punto medio
Límites de clases Son los valores que definen una clase. Las clases deben ser: Exhaustivas: todas las observaciones quedan clasificadas. Mutuamente excluyentes: ninguna observación está en más de una clase. Hay que distinguir entre: Límites indicados: aparecen indicados en la distribución. Límites reales: señalan la verdadera extensión de la clase. Ejemplo peso de estudiantes (variable continua): Límites indicados: etc. Estos límites no señalan la verdadera extensión de la clase. Límites reales, con redondeo al Kg más próximo: 44,5 - 49, ,5 - 54, ,5 - 59,5 etc.

33 Límites reales y límites indicados, intervalo de clase y punto medio
Relación entre límites reales y el criterio de redondeo

34 Límites reales y límites indicados, intervalo de clase y punto medio
Indica la amplitud de clase. Cálculo: límite real superior - límite real inferior. Usualmente las clases son iguales, por lo que el intervalo es usualmente uniforme. Se pueden usar clases desiguales, por lo que la amplitud variaría.

35 Límites reales y límites indicados, intervalo de clase y punto medio
Es el valor central de la clase. Se puede calcular de dos formas: Promedio de los límites reales: (44,5 + 49,5) / 2 = 47 Límite inferior más la mitad del intervalo de la clase 44, / 2 = 44,5 + 2,5 = 47 Si las clases son de igual amplitud, los puntos medios se obtienen al sumar repetidamente el intervalo al punto medio de la clase anterior: = 52 … Función importante: el punto medio representa a la clase en ciertos cálculos. Al agrupar se pierde información individual. Los errores se compensan y se vuelve despreciable.

36 Límites reales y límites indicados, intervalo de clase y punto medio
Clases abiertas Se ubican al principio o al final de la distribución. Resuelven problemas especiales de clasificación. No permiten calcular el punto medio. Es mejor evitar su uso.

37 Frecuencias absolutas y relativas, simples y acumuladas
Frecuencia absoluta Cantidad de elementos u observaciones pertenecientes a una misma clase. Frecuencia relativa Cálculo: frecuencia absoluta / total de observaciones. Indica la importancia relativa de la clase. Es conveniente presentarla en porcentaje. Facilitan el análisis y las comparaciones. Frecuencias acumuladas Cantidad de observaciones mayores o menores que uno de sus límites. Cálculo: suma de frecuencias absolutas o relativas ascendente o descendente.

38 Frecuencias acumuladas

39 Frecuencias acumuladas

40 Frecuencias acumuladas

41 Frecuencias acumuladas

42 Frecuencias acumuladas

43 Frecuencias acumuladas

44 Frecuencias acumuladas

45 Frecuencias acumuladas

46 Frecuencias acumuladas
¿Cómo interpretar los datos de la fila resaltada?

47 Frecuencias acumuladas

48 Frecuencias acumuladas
Resumen de algunas reglas básicas: Si las observaciones no son muchas, puede resultar innecesario construir una distribución de frecuencias y será suficiente ordenar los datos por magnitud creciente. Las clases deben ser exhaustivas y mutuamente excluyentes. Debe procurarse, como regla general, que el número de clases no sea menor que 6 ni mayor a 15. Siempre que sea posible, evite las clases de diferente amplitud y también las clases abiertas. Si hay errores alrededor de los cuales existen concentraciones de los datos, es recomendable que se tornen como puntos medios.

49 La representación gráfica de las distribuciones de frecuencias
Histogramas: Gráfico de barras verticales, cuyas barras no guardan separación entre sí, y pueden tener diferente anchura.

50 La representación gráfica de las distribuciones de frecuencias
Histogramas: Gráfico de barras verticales, cuyas barras no guardan separación entre sí, y pueden tener diferente anchura.

51 La representación gráfica de las distribuciones de frecuencias
Polígono de frecuencias La abscisa (eje X) es el punto medio de la clase. La ordenada (eje Y) es la frecuencia. Los puntos se unen y conforman un polígono. El polígono se prolonga, como si existiera una clase adicional al principio y al final, ambas con frecuencia cero.

52 La representación gráfica de las distribuciones de frecuencias
Histograma y polígono de frecuencias Existe correspondencia entre las áreas bajo el polígono y el histograma.

53 La representación gráfica de las distribuciones de frecuencias
Representación de distribuciones con intervalos desiguales Gráfico erróneo:

54 La representación gráfica de las distribuciones de frecuencias
Representación de distribuciones con intervalos desiguales Gráfico correcto:

55 La representación gráfica de las distribuciones de frecuencias
Las “ojivas” o polígonos de frecuencias acumuladas Ojiva “Menos de”

56 La representación gráfica de las distribuciones de frecuencias
Las “ojivas” o polígonos de frecuencias acumuladas Ojiva “Menos de”

57 La representación gráfica de las distribuciones de frecuencias
Las “ojivas” o polígonos de frecuencias acumuladas Ojiva “Más de”

58 Capítulo 8 Medidas de tendencia central

59 Las medidas de tendencia central: ideas básicas
Propósito de las medidas de tendencia central: Resumir, en un solo número, el centro de los datos o punto central de localización de la distribución Medidas de tendencia central: Media aritmética o promedio Mediana Moda Media geométrica Media armónica

60 Símbolo de sumatoria Sistema de símbolos o notación:
X = variable en consideración (peso, ingreso, etc.). Subíndice i = indica el elemento i (valores positivos). Representa un valor particular. Xi = 55 Ejemplo: Peso de 6 estudiantes: 55, 64, 53, 79, 64, 68 Sumatoria (símbolo sigma)

61 Símbolo de sumatoria Propiedades del símbolo de sumatoria.
La sumatoria del producto de una constante por una variable es igual al producto de la constante por la sumatoria de la variable. La sumatoria de la suma algebraica de dos o más variables es igual a la suma algebraica de las sumatorias de las variables. La sumatoria de una constante, tomada de 1 a n, es igual a n veces la constante.

62 Moda, mediana y media aritmética en datos no agrupados
La moda (en datos no agrupados) Valor más frecuente, el que más se repite. Corresponde a la mayor frecuencia. Ventaja: no se ve afectada por valores extremos (altos o bajos). Limitación: requiere de un número suficiente de observaciones para manifestarse claramente. Puede no existir, no estar definida, puede no ser única. Puede haber más de un valor modal. Aplicada a datos cuantitativos y cualitativos.

63 Moda, mediana y media aritmética en datos no agrupados
Ejemplo con datos relativos

64 Moda, mediana y media aritmética en datos no agrupados
Mediana (datos no agrupados) Valor central de una serie de datos ordenados. No más de la mitad de los datos son menores que él, y no más de la mitad, mayores. 50% de los valores son menores o iguales que él y el otro 50% son mayores o iguales. Datos sin agrupar: Primero ordenar, luego calcular el valor central. Si el número de datos es par: Hay dos valores centrales, se debe calcular la media de los dos valores. Si n es impar, la posición determina el valor. Posición de la Mediana: ( n + 1 ) / 2

65 Moda, mediana y media aritmética en datos no agrupados
Mediana (datos no agrupados) Procedimiento de cálculo:

66 Moda, mediana y media aritmética en datos no agrupados
Mediana (datos no agrupados) Ventajas de la mediana: Siempre puede calcularse y el valor obtenido está bien definido. No es afectada por valores extremos, como sí lo es la media aritmética. Propiedad interesante: La suma de los valores absolutos de las desviaciones de los valores, con respecto a la mediana, es menor que las desviaciones con respecto a cualquier otro valor. Limitaciones: Es un valor calculado que no siempre coincide con un dato observado. No siempre puede ser usado en muchos procedimientos estadísticos.

67 Moda, mediana y media aritmética en datos no agrupados
Media aritmética (datos no agrupados) Ejemplo: edades de 12 personas. 20, 20, 22, 20, 30, 25, 25, 18, 20, 18, 22, 36

68 Moda, mediana y media aritmética en datos no agrupados
Media aritmética ponderada (datos no agrupados) X son los valores y W son los pesos. Cada valor se multiplica por la ponderación w.

69 Moda, mediana y media aritmética en datos no agrupados
Media aritmética ponderada (datos no agrupados)

70 Propiedades de la media aritmética
Media * # observaciones = suma observaciones La suma de las desviaciones da cero La suma (resta) de una constante en las observaciones, aumenta (disminuye) el promedio en esa constante. La multiplicación (división) de una constante en las observaciones, multiplica (divide) el promedio en esa constante.

71 Cálculo de las medidas de posición en datos agrupados
En datos agrupados no es posible aplicar directamente las fórmulas anteriores. La moda (Mo) (datos agrupados) Es el valor que se repite con más frecuencia Hay que ubicar “la clase modal” (mayor densidad de frecuencia). Li = Límite inferior clase modal. d1 = Diferencia entre clase modal y la clase anterior. d2 = Diferencia entre clase modal y la clase posterior. c = Intervalo de clase modal.

72 Cálculo de las medidas de posición en datos agrupados
La mediana (Me) (datos agrupados) La ordenada de la Me divide el área bajo la curva en dos partes iguales. n = Total de observaciones ó suma de frecuencia absoluta. Li = Límite inferior de la clase mediana (n/2) en frecuencia acumulada. fi = Frecuencia absoluta de la clase mediana. Fa = Frecuencia acumulada “Menos de” de la clase anterior a mediana. c = Intervalo de clase mediana. Ejemplo: suponga una Me = 64,45 Kg. Interpretación: Un 50% de los alumnos pesa menos de 63,45 Kg y la otra mitad pesa más de ese peso.

73 Cálculo de las medidas de posición en datos agrupados
Media aritmética (datos agrupados) punto medio de la clase i. fi = frecuencia de la clase i

74 Cálculo de las medidas de posición en datos agrupados
Media aritmética, ejemplo:

75 Uso de las medidas de tendencia central
El propósito de las medidas de tendencia central es caracterizar y representar un conjunto de datos. Corrientemente las medidas no compiten, sino que se complementan. Distribución simétrica: moda = mediana = media.

76 Uso de las medidas de tendencia central
Asimetría Se debe a la influencia de valores extremos. Asimetría positiva (hacia la derecha) Valores extremos altos Asimetría negativa (hacia la izquierda) Valores extremos bajos

77 La media geométrica y la media armónica
Forma correcta de promediar tasas de cambio, índices, tasas de crecimiento, distribuciones logarítmicas (ingresos, salarios, aumento precios). Limitación: todos los valores deben ser positivos. Véase ejemplo 10 pág 375.

78 La media geométrica y la media armónica
Se usa para promediar velocidades.

79 La media geométrica y la media armónica
Relación entre la media aritmética, la geométrica y la armónica

80 MUCHAS GRACIAS


Descargar ppt "Yadira María Alvarado Salas I Cuatrimestre 2014 – UNED 3 era Tutoría"

Presentaciones similares


Anuncios Google