La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Unidad I. Conceptos Básicos y Estadística Descriptiva

Presentaciones similares


Presentación del tema: "Unidad I. Conceptos Básicos y Estadística Descriptiva"— Transcripción de la presentación:

1 Unidad I. Conceptos Básicos y Estadística Descriptiva
Prof. Eliana Guzmán U. Semestre A-2011

2 Concepto de Estadística
Se refiere a un conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas. Tema 1. Introducción

3 Concepto de Estadística
Sus fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las características de todas las observaciones bajo consideración. Tema 1. Introducción

4 Áreas que conforman a la Estadística
Estadística Descriptiva (Deductiva): es la encargada de la organización, condensación, presentación de los datos en tablas y gráficos y del cálculo de medidas numéricas que permitan estudiar los aspectos más importantes de los datos. DESCRIBIR Tema 1. Introducción

5 Áreas que conforman a la Estadística
Estadística Inferencial o Inferencia Estadística: está definida por un conjunto de técnicas, mediante las cuales se hacen generalizaciones o se toman decisiones en base a información parcial obtenida mediante técnicas descriptivas. INFERIR Tema 1. Introducción

6 Áreas de Aplicación de la Estadística
El uso de la Estadística es muy amplio. Resulta difícil nombrar un área en la cual no se emplee. Los métodos estadísticos han encontrado aplicación en: Gobierno Negocios Ciencias Sociales Ingeniería Ciencias Física y Naturales Control de Calidad Procesos de Manufactura Muchos otros campos de la actividad intelectual. Tema 1. Introducción

7 Áreas de Aplicación de la Estadística
Esto se debe a la creciente facilidad con la cual se pueden manejar grandes cantidades de datos numéricos, debido al uso de … Tema 1. Introducción

8 Conceptos de Población y Muestra
Población: es la colección de todas las posibles mediciones u observaciones que pueden hacerse de una variable bajo estudio. Tema 1. Introducción

9 Conceptos de Población y Muestra
Se clasifica en dos categorías: Finita: es aquella que incluye una cantidad limitada contable de observaciones, individuos o medidas. Siempre que sea posible alcanzar (contar) el número total de todas las posibles mediciones, se considera como finita la población. Tema 1. Introducción

10 Conceptos de Población y Muestra
Infinita: es aquella que incluye un gran conjunto de observaciones o mediciones que no pueden alcanzarse por conteo. Al menos, hipotéticamente, no existe límite en cuanto al número de observaciones que el experimento puede generar. Tema 1. Introducción

11 Conceptos de Población y Muestra
es un conjunto de mediciones u observaciones tomadas a partir de una población. es un subconjunto de la población. Tema 1. Introducción

12 Conceptos de Población y Muestra
Muestra aleatoria: se considera aleatoria siempre y cuando cada observación, medición o individuo de la población tenga la misma probabilidad de ser seleccionado. Tema 1. Introducción

13 Tipos de datos y escalas de medida
Variables: son las características o lo que se estudia de cada individuo de la muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado civil, temperatura, cantidad de nacimientos, presión, grosor, diámetro, ... Datos: son los valores que toma la variable en cada caso. Tema 1. Introducción

14 Tipos de datos Cualitativos: son datos que solo toman valores asociados a las cualidades o atributos, clasificándolos en una de varias categorías, es decir, no son valores numéricos. Ej: Sexo: f/m. Hábito de fumar: Fumador/No fumador Color de ojos: negro, azul, marrón, … Religión: católica, evangélica, … Estado civil: soltero, casado, divorciado,… Tema 1. Introducción

15 Tipos de datos Cuantitativos: provienen de variables que pueden medirse, cuantificarse o expresarse numéricamente. Ejemplos: Peso Edad Estatura Presión Humedad Intensidad de un sismo Cantidad de hermanos Tema 1. Introducción

16 Escalas de medida Tipos de variables cuantitativas:
Discretas: es aquella que solo puede tomar un número finito o infinito numerable de valores. Ejemplo: cantidad de hermanos. Continuas: es la variable que puede tomar cualquier valor en una escala continua. Ejemplo: cantidad de líquido contenido en un recipiente. Tema 1. Introducción

17 Escalas de medida Escala Nominal. Escala Ordinal.
Escala de Intervalos. Escala de Razón o Proporción. Escala Absoluta. Variables Cualitativas Variables Cuantitativas Tema 1. Introducción

18 Escalas de medida Escala nominal: los datos se pueden agrupar en categorías que no mantienen una relación de orden entre si, por lo tanto no están definidas las operaciones lógicas (>, <, , ) sino solo las de igualdad o diferencia. Ejemplos: color de ojos, sexo, profesión, estado civil, religión. Tema 1. Introducción

19 Escalas de medida Escala ordinal: existe un cierto orden o jerarquía entre las categorías (>, <, , ). Ejemplos: grados militares, organigrama de una empresa, escalafón de los profesores universitarios, grados de disnea, estadiaje de un tumor. Tema 1. Introducción

20 Escalas de medida Escala de Intervalos: valores numéricos de las variables y además de las relaciones de orden (>, <, , ), se pueden establecer distancias, es decir, tienen sentido las operaciones de suma y resta. Tiene dos propiedades: Existe una unidad de medida que se mantiene constante para todos los valores que toma la variable. Existe un valor patrón u origen relativo que no significa la ausencia de valor en la variable. Tema 1. Introducción

21 Escalas de medida Ejemplo: temperatura, nivel de ruido, movimientos sísmicos. Tema 1. Introducción

22 Escalas de medida Escala de razón o proporción: es la más completa y general de todas las escalas. Se caracteriza porque los valores de la variable son números entre los cuales, además de las relaciones de orden (>, <, , ) y distancia (+,-), se pueden establecer múltiplos y proporciones. Ejemplos: peso, altura, volumen… Tema 1. Introducción

23 Escalas de medida Escala Absoluta: se caracteriza porque los valores que toma la variable son el resultado de contar y por lo tanto, está constituida por los enteros positivos y el cero. Ejemplos: número de hermanos, cantidad de autos vendidos, cantidad de accidentes en una intersección, cantidad de hijos,… Tema 1. Introducción

24 Datos Univariantes y Multivariantes
Univariantes o unidimensionales: sólo recogen información sobre una característica (Ej: edad de los alumnos de una clase). Bivariantes o bidimensionales: recogen información sobre dos características de la población. (Ej: edad y estatura de los alumnos de una clase). Tema 1. Introducción

25 Datos Univariantes y Multivariantes
Multivariantes o pluridimensionales: recogen información sobre tres ó más características. (Ej: edad, estatura y peso de los alumnos de una clase). Tema 1. Introducción

26 Abusos que se pueden cometer con la Estadística
Conclusiones erróneas debido a que los datos son numéricamente insuficientes. Representaciones gráficas engañosas (escalas). Datos muestrales no representativos: Muestra que no incluye a elementos de toda la población. Ciertas categorías de personas no responden correctamente. Respuestas voluntarias (sesgadas). Tema 1. Introducción

27 TEMA 2. ESTADÍSTICA DESCRIPTIVA

28 Organización de los datos
Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación. Tema 2. Estadística Descriptiva

29 Organización de los datos
Formas de organizar los datos: Un arreglo: es la forma más sencilla de organizar los datos en bruto, consiste en colocar las observaciones en orden según su magnitud: ascendente o descendente. Poco práctica cuando se tiene una gran cantidad de datos. Tema 2. Estadística Descriptiva

30 Organización de los datos
Una distribución de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa. Clase Pto. Medio fi Fi fri FRi Tema 2. Estadística Descriptiva

31 Organización de los datos
La Distribución de Frecuencias: Se recomienda su uso cuando se tienen grandes cantidades de datos (n). Su construcción requiere, en primer lugar, la selección de los límites de los intervalos de clase. Para definir la cantidad de intervalos de clase (k), se puede usar: La regla de Sturges: k = log(n) k = n Tema 2. Estadística Descriptiva

32 Organización de los datos
La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de 20), que la verdadera naturaleza de la distribución sea imposible de visualizar. La amplitud de todas las clases deberá ser la misma. Se recomienda que sea impar y que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto. Los límites de las clases deben tener una cifra significativa más que los datos en bruto. Tema 2. Estadística Descriptiva

33 Organización de los datos
Determinar: Punto medio = (Li+Ls)/2. Frecuencia absoluta de la clase (fi). Frecuencia acumulada de la clase (Fi). Frecuencia relativa de la clase (fri): fri = fi/n Frecuencia relativa acumulada de la clase (FRi). Tema 2. Estadística Descriptiva

34 Ejemplos de Distribución de Frecuencias
A continuación se presentan las calificaciones de 60 estudiantes que presentaron la PINA en el año 2009: Tema 2. Estadística Descriptiva

35 Ejemplos de Distribución de Frecuencias
a) Construya una distribución de frecuencias. b) Qué puede concluir de estos datos.

36 Representación gráfica de los datos
Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos. Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos: Histogramas. Polígono de frecuencias. Ojiva o Polígono de frecuencias acumuladas. Tema 2. Estadística Descriptiva

37 Representación gráfica de los datos
Histograma

38 Representación gráfica de los datos
Histograma y Polígono de Frecuencias Tema 2. Estadística Descriptiva

39 Representación gráfica de los datos
Ojiva Tema 2. Estadística Descriptiva

40 Representación gráfica de los datos
Para datos cualitativos se usan: Curvas Barras Sectores Tema 2. Estadística Descriptiva

41 Representación gráfica de los datos
Barras Barras

42 Representación gráfica de los datos
Curvas

43 Representación gráfica de los datos
Sectores, torta o circular Tema 2. Estadística Descriptiva

44 Ejemplos de construcción de gráficos
Tema 2. Estadística Descriptiva

45 Medidas de tendencia central o posición
Corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos. Forma como los datos pueden condensarse en un solo valor central alrededor del cual todos los datos muestrales se distribuyen. Tema 2. Estadística Descriptiva

46 Medidas de tendencia central o posición
Las medidas de tendencia central más importantes son: Media: Aritmética y Aritmética ponderada. Mediana. Moda. Tema 2. Estadística Descriptiva

47 Media Aritmética Es la suma de todas las observaciones dividida entre el número total de observaciones. Expresada de forma más intuitiva, podemos decir que la media aritmética es la cantidad total de la variable distribuida a partes iguales entre cada observación. (wikipedia) Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable. (wikipedia) Tema 2. Estadística Descriptiva

48 Cálculo de la media aritmética
Para datos no agrupados: Para datos agrupados: Tema 2. Estadística Descriptiva Donde: mi: punto medio de la clase i fi: frecuencia absoluta de la clase i k: cantidad de clases

49 Mediana Es el valor que ocupa la posición central de un conjunto de observaciones, una vez que han sido ordenados en forma ascendente o descendente. Divide al conjunto de datos en dos partes iguales. Tema 2. Estadística Descriptiva

50 Cálculo de la mediana Para datos no agrupados:
Si n es impar: posición donde se ubica la mediana es igual a (n+1)/2. Si n es par: (n+1)/2 no es entero, por lo tanto la mediana será igual al promedio de las dos posiciones centrales. Tema 2. Estadística Descriptiva

51 Cálculo de la mediana Datos agrupados: clase mediana es la que contiene a la observación que ocupa la posición n/2. Donde: Lm: límite inferior de la clase mediana. F(xm-1): frecuencia acumulada de la clase anterior a la clase mediana. f(xm): frecuencia absoluta de la clase mediana. Cm: amplitud de la clase mediana. Tema 2. Estadística Descriptiva

52 Moda Observación o clase que tiene la mayor frecuencia en un conjunto de observaciones. Un conjunto de datos puede ser unimodal, bimodal o multimodal. Es la única medida de tendencia central que se puede determinar para datos de tipo cualitativo. Tema 2. Estadística Descriptiva

53 Cálculo de la moda Para datos no agrupados: es simplemente la observación que más se repite. Para datos agrupados: Donde: Lim: límite inferior de la clase modal. 1: diferencia entre fi de la clase modal y la anterior. 2: diferencia entre fi de la clase modal y la posterior. Cm: amplitud de la clase modal (clase de mayor frecuencia). Tema 2. Estadística Descriptiva

54 Relación entre la media, la mediana y la moda
Tema 2. Estadística Descriptiva Cuando los datos son sesgados es mejor emplear la Md

55 Propiedades, ventajas y desventajas de la media
La suma de las diferencias entre las media muestral y el valor de cada observación es cero. La media de una constante es la constante. Si todas las observaciones xi se multiplican por una constante a, la X también se debe multiplicar por ese mismo valor constante. Tema 2. Estadística Descriptiva

56 Propiedades, ventajas y desventajas de la media
Si se somete a una variable estadística X a un cambio de origen y escala, Y = a + bX, la media aritmética de dicha variable X varía en la misma proporción. La media de la suma de dos variables es igual a la suma de sus medias. Tema 2. Estadística Descriptiva

57 Propiedades, ventajas y desventajas de la media
Emplea en su cálculo toda la información disponible. Se expresa en las mismas unidades que la variable en estudio. Es el centro de gravedad de toda la distribución, representando a todos los valores observados. Es una valor único. Tema 2. Estadística Descriptiva

58 Propiedades, ventajas y desventajas de la media
Se trata de un concepto familiar para la mayoría de las personas. Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos. Tema 2. Estadística Descriptiva

59 Propiedades, ventajas y desventajas de la media
Se ve adversamente afectada por valores extremos, perdiendo representatividad. Si el conjunto de datos es muy grande puede ser tedioso su cálculo manual. No se puede calcular para datos cualitativos. No se puede calcular para datos que tengan clases de extremo abierto, tanto superior como inferior. Tema 2. Estadística Descriptiva

60 Ventajas y desventajas de la mediana
Fácil de calcular si el número de observaciones no es muy grande. No se ve influenciada por valores extremos, ya que solo influyen los valores centrales. Fácil de entender. Tema 2. Estadística Descriptiva

61 Ventajas y desventajas de la mediana
Se puede calcular para cualquier tipos de datos cuantitativos, incluso los datos con clase de extremo abierto. Es la medida de tendencia central más representativa en el caso de variables que solo admiten la escala ordinal. Tema 2. Estadística Descriptiva

62 Ventajas y desventajas de la mediana
No utiliza en su “cálculo” toda la información disponible. No pondera cada valor por el número de veces que se ha repetido. Hay que ordenar los datos antes de determinarla. Tema 2. Estadística Descriptiva

63 Ventajas y desventajas de la moda
No requiere cálculos. Puede usarse para datos tanto cuantitativos como cualitativos. Fácil de interpretar. No se ve influenciada por valores extremos. Se puede calcular en clases de extremo abierto. Tema 2. Estadística Descriptiva

64 Ventajas y desventajas de la moda
Para conjuntos pequeños de datos su valor no tiene casi utilidad, si es que de hecho existe. Solo tiene significado en el caso de una gran cantidad de datos. No utiliza toda la información disponible. No siempre existe, si los datos no se repiten. Tema 2. Estadística Descriptiva

65 Ventajas y desventajas de la moda
En ocasiones, el azar hace que una sola observación se no representativa se el valor más frecuente del conjunto de datos. Difícil de interpretar si los datos tiene 3 o más modas. Tema 2. Estadística Descriptiva

66 Medidas de dispersión, variación o variabilidad.
Son valores numéricos que indican o describen la forma en que las observaciones están dispersas o diseminadas, con respecto al valor central. Tema 2. Estadística Descriptiva

67 Medidas de dispersión, variación o variabilidad.
Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta. Tema 2. Estadística Descriptiva

68 Medidas de dispersión, variación o variabilidad.
Rango. Varianza. Desviación Típica. Coeficiente de variación. Tema 2. Estadística Descriptiva

69 Medidas de dispersión: Rango
Rango (amplitud o recorrido): Está determinado por los dos valores extremos de los datos muestrales, es simplemente la diferencia entre la mayor y menor observación. Es una medida de dispersión absoluta, ya que depende solamente de los datos y permite conocer la máxima dispersión. Tema 2. Estadística Descriptiva

70 Medidas de dispersión: Rango
Casi no se emplea debido a que depende únicamente de dos valores. No proporciona una medida de variabilidad de las observaciones con respecto al centro de la distribución. Notación: R Tema 2. Estadística Descriptiva

71 Medidas de dispersión: Varianza
Es un valor numérico que mide el grado de dispersión relativa porque depende de la posición de los datos x1,x2,…,xn con respecto a la media. Es el promedio al cuadrado de las desviaciones de cada observación con respecto a la media. Notación: s2, 2, var(X) Tema 2. Estadística Descriptiva

72 Medidas de dispersión: Varianza
Si la varianza de un conjunto de observaciones es grande se dice que los datos tiene una mayor variabilidad que un conjunto de datos que tenga un varianza menor. Para datos NO agrupados: Tema 2. Estadística Descriptiva

73 Medidas de dispersión: Varianza
Para datos agrupados en una distribución de frecuencias:

74 Medidas de dispersión: Desviación Típica
Es la raíz cuadrada de la varianza. Notación: s, . Tema 2. Estadística Descriptiva

75 Medidas de dispersión: Coeficiente de Variación
Es una medida de dispersión relativa que permite comparar el nivel de dispersión de dos muestras de variables estadísticas diferentes. No tiene dimensiones. Notación: CV Tema 2. Estadística Descriptiva

76 Ventajas y Desventajas del Rango
Útil cuando se quiere conocer la extensión de las variaciones extremas (valor máximo de la dispersión). Fácil de calcular. Tema 2. Estadística Descriptiva

77 Ventajas y Desventajas del Rango
No es una MD con respecto al centro de la distribución. Solo emplea dos valores en su cálculo. No se puede calcular en distribuciones de límite de clase abierto. Tema 2. Estadística Descriptiva

78 Propiedades, Ventajas y Desventajas de la Varianza
Siempre es mayor o igual a cero y menor que infinito. La varianza de una constante es cero. Si a una variable X la sometemos a Y=a+bX, la varianza de Y será Var(Y) = b2Var(X) Tema 2. Estadística Descriptiva

79 Propiedades, Ventajas y Desventajas de la Varianza
Es útil cuando se compara la variabilidad de dos o más conjuntos de datos. Utiliza toda la información disponible. Desventajas: No proporciona ayuda inmediata cuando se estudia la dispersión de un solo conjunto de datos. Difícil de interpretar por tener sus unidades elevadas al cuadrado. Tema 2. Estadística Descriptiva

80 Ventajas y Desventajas de la Desviación Típica
Esta expresada en las mismas unidades que la variable en estudio. Utiliza todas las observaciones en su cálculo. Fácil de interpretar. Desventajas: No tiene. Tema 2. Estadística Descriptiva

81 Ventajas y Desventajas del Coeficiente de Variación
Es la única MD que permite comparar el nivel de dispersión de dos muestras de variables diferentes. Emplea toda la información disponible en su cálculo. Fácil de calcular. Tema 2. Estadística Descriptiva

82 Ventajas y Desventajas del Coeficiente de Variación
No es una MD con respecto al centro de la distribución de los datos. Tema 2. Estadística Descriptiva

83 Medidas de Forma Son medidas numéricas que permiten determinar la forma que tiene la curva de los datos, por lo tanto, sirven para corroborar lo que los gráficos muestran. Medidas de forma Asimetría Kurtosis o apuntamiento Coeficiente de Pearson Coeficiente de Fisher Tema 2. Estadística Descriptiva

84 Medidas de Forma: Asimetría
Permiten estudiar la forma de la curva, dependiendo de cómo se agrupan los datos. Tema 2. Estadística Descriptiva

85 Medidas de Forma: Asimetría
Coeficiente de Asimetría de Pearson: Fácil de calcular e interpretar. Cálculo: Interpretación: ASP = 0, X=Md Simétrica > 0, X>Md Asimétrica Positiva < 0, X<Md Asimétrica Negativa Tema 2. Estadística Descriptiva

86 Medidas de Forma: Asimetría
Coeficiente de Asimetría de Fisher: No es de fácil cálculo, pero si su interpretación. Datos NO agrupados Datos Agrupados Tema 2. Estadística Descriptiva

87 Medidas de Forma: Asimetría
Interpretación: ASF = 0, Simétrica > 0, Asimétrica Positiva < 0, Asimétrica Negativa Tema 2. Estadística Descriptiva

88 Medidas de Forma: Kurtosis
Miden si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra (zona central de la distribución). Se definen tres tipos de distribución según su grado de Kurtosis: Tema 2. Estadística Descriptiva

89 Medidas de Forma: Kurtosis
Mesocúrtica: grado de concentración medio alrededor de los valores centrales de la variable. Leptocúrtica: grado de concentración elevado. Platicúrtica: grado de concentración reducido. Tema 2. Estadística Descriptiva

90 Medidas de Forma: Kurtosis
Datos No Agrupados Datos Agrupados Interpretación: CK =0 Mesocúrtica >0 Leptocúrtica <0 Platicúrtica Tema 2. Estadística Descriptiva

91 Referencias: Wikipedia(http://es.wikipedia.org/wiki/Wikipedia:Portada)
Walpole y Myers. Probabilidad y Estadística. Mc Graw-Hill. Triola, Mario F. Estadística. Pearson.


Descargar ppt "Unidad I. Conceptos Básicos y Estadística Descriptiva"

Presentaciones similares


Anuncios Google