La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Francisco de Paula Santander

Presentaciones similares


Presentación del tema: "Francisco de Paula Santander"— Transcripción de la presentación:

1 Francisco de Paula Santander
Universidad Francisco de Paula Santander Especialización en Estadística Aplicada La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

2 Introducción La UFPS soy yo, eres tú, somos todos

3 Especialización en Estadística Aplicada Estadística Inferencial
Objetivos Identificar las propiedades de los estimadores y aplicarlas en la solución de problemas Utilizar métodos formales para realizar estimaciones y pruebas de hipótesis Establecer criterios de evaluación, especificación y verificación del modelo estadístico Establecer fundamentos básicos para la toma de decisiones con base en las inferencias obtenidas a partir del modelo

4 Especialización en Estadística Aplicada Estadística Inferencial
Contenidos Temáticos Introducción Población y Muestra Estimación Estimadores Estimación puntual Estimación por intervalo Pruebas de Hipótesis Pruebas paramétricas Pruebas no paramétricas

5 Especialización en Estadística Aplicada Estadística Inferencial
Bibliografía PEÑA SANCHEZ DE RIVERA, DANIEL. Estadística Modelos y Métodos, 1. Fundamentos, Alianza Editorial, Madrid BICKEL, PETER. Matematical Statistics, Prentice Hall, New Jersey MENDENHALL, W., SCHEAFFER, WACKERLY. Estadísica Matemática con Aplicaciones, Editorial Iberoamérica, México WALPOLE, R., R. MYERS, S. MIERS. Probabilidad y Estadística para Ingenieros, Pearson, Ed.

6 Especialización en Estadística Aplicada Estadística Inferencial
¿Para qué sirve la Estadística? La Ciencia se ocupa en general de fenómenos observables La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocástico) La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza

7 Especialización en Estadística Aplicada Estadística Inferencial
¿Para qué sirve la Estadística? La Estadística es la Ciencia de la Sistematización, recolección, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de deducir las leyes que rigen esos fenómenos, y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones. Descriptiva Probabilidad Inferencia

8 Especialización en Estadística Aplicada Estadística Inferencial
Definición Estadística es la ciencia de: Recolectar Describir Organizar Interpretar para transformarlos en información, para la toma mas eficiente de decisiones. Datos

9 Especialización en Estadística Aplicada Estadística Inferencial
Tipos de Estadística Estadística Descriptiva: Método de recolectar, organizar, resumir y presentar los datos en forma informativa. Estadística inferencial: Métodos usados para determinar algo acerca de la población, basado en una muestra.

10 Especialización en Estadística Aplicada Estadística Inferencial
Método Científico y Estadística Teoría o Conocimiento Actual Observaciones Resultados Conclusiones Hipótesis operativa Hipótesis conceptual Identificación de un problema Diseño Recolección de datos Análisis Interpreta- ción Generalización

11 Especialización en Estadística Aplicada Estadística Inferencial
Método Científico y Estadística

12 Especialización en Estadística Aplicada Estadística Inferencial
Problema real Planteamiento del problema Objetos y medios Modelos Estadísticos (Cálculo de probabilidades) Recolección de información muestral (Técnicas de muestreo ; diseño de experimentos) Depuración de los datos (Análisis de datos) Estimación de los parámetros (Teoría de la estimación)

13 Especialización en Estadística Aplicada Estadística Inferencial
Contrastes de Simplificación (Contrastes de hipótesis) Crítica y Diagnosis del Modelo (Análisis de datos) ¿ Es un modelo adecuado ? Nuevo Conocimiento Previsiones Decisiones

14 Universo, Población y Muestra
La UFPS soy yo, eres tú, somos todos

15 Especialización en Estadística Aplicada Estadística Inferencial
Universo de Estudio Universo Ideal: Conjunto sobre el cual el investigador, pretende obtener alguna información. Sobre el cual recaerán las consecuencias de las decisiones basadas en los resultados de la encuesta

16 Especialización en Estadística Aplicada Estadística Inferencial
Universo de Estudio Población Objetivo: Conjunto de elementos que partiendo del universo ideal puede realmente ser alcanzado por el investigador. Se obtiene de los ajustes y/o recortes por operatividad, razones políticas, económicas o sociales

17 Especialización en Estadística Aplicada Estadística Inferencial
Universo de Estudio Marco de Muestreo: Dispositivo que permite identificar y ubicar los sujetos que toman parte en los diferentes procesos de selección al azar. Tipos de Marco: Lista o área.

18 Especialización en Estadística Aplicada Estadística Inferencial
Universo de Estudio Población susceptible de encuesta: Conjunto de elementos del marco muestral con probabilidad mayor a cero de ser incluidos en la muestra. Esto, porque el hecho de ubicar los elementos no implica tener acceso a ellos.

19 Especialización en Estadística Aplicada Estadística Inferencial
Universo de Estudio La meta del muestrista es encontrar mecanismos que cierren la brecha entre el universo ideal del investigador y la población susceptible de encuesta. Considerar diferentes marcos de muestreo y planear formas de acceso adecuadas para diversos subconjuntos del universo

20 Especialización en Estadística Aplicada Estadística Inferencial
Población y Muestra Población: Conjunto de todas las unidades de análisis de interés para una investigación Muestra: Subconjunto de la población Una muestra es representativa si es de un tamaño suficientemente grande y mantiene una estructura similar a la de la población

21 Especialización en Estadística Aplicada Estadística Inferencial
Población y Muestra Población Muestra

22 Especialización en Estadística Aplicada Estadística Inferencial
Criterios de Inclusión y de exclusión Criterios de inclusión: son las características necesarias para que las unidades de análisis formen parte de la población de estudio. Criterios de exclusión: son las características no necesarias o excluyentes para que las unidades de análisis formen parte de la población de estudio.

23 Especialización en Estadística Aplicada Estadística Inferencial
Parámetro y Estadística Parámetro: Es un indicador de la población calculado con base en la información de todas las unidades de análisis Estadística: Indicador de la población calculado con base en la información suministrada por la muestra

24 Especialización en Estadística Aplicada Estadística Inferencial
Muestra Representativa Reúne las características principales de la población en relación a la variable o condición particular que se estudia, por lo tanto, los resultados y conclusiones obtenidos en esta muestra se pueden generalizar a la población de la cual fue extraída. La representatividad de una muestra está dada por: Su tamaño El tipo de muestreo que garantiza la inclusión de las variables relevantes presentes en la población

25 Especialización en Estadística Aplicada Estadística Inferencial
Plan de Muestreo Definición concreta y clara de los objetivos de la encuesta o estudio. Traducción de los objetivos del estudio en resultados estadísticos. Especificación de la Población Objetivo. Construcción, revisión del marco muestral. Inventario de Recursos disponibles.

26 Especialización en Estadística Aplicada Estadística Inferencial
Plan de Muestreo Especificaciones de los acuerdos necesarios con el usuario. Especificaciones de los métodos de recolección de Información, elaboración de los instrumentos de recolección, cuestionarios, manuales, capacitación, mapas. Especificación del diseño muestral, mecanismos de selección, varianza de los estimadores.

27 Especialización en Estadística Aplicada Estadística Inferencial
Plan de Muestreo Determinación del tipo de procesamiento a realizar, critica e imputación. Especificación de las fórmulas de estimación y de las medidas de calidad. Planear el trabajo de campo Diseño del plan de control y evaluación.

28 Especialización en Estadística Aplicada Estadística Inferencial
Investigación Total y Parcial Dependiendo del objetivo que se persiga, puede realizarse una investigación exhaustiva o una parcial. EXHAUSTIVA: Se observan todas las unidades que constituyen la población o universo, objeto de investigación. La enumeración total de toda la población en un tiempo dado, recibe el nombre de CENSO (censo de población, de industria manufacturera de tiendas del sector agropecuario, de establecimientos educativos, etc.)

29 Especialización en Estadística Aplicada Estadística Inferencial
Cuándo no se recomienda un censo Cuando la población sea infinita. Cuando aún siendo finita es muy numerosa Por motivos de tiempo Cuando el costo es superior a los recursos disponibles Cuando la observación implique destrucción de los elementos. Cuando se desea obtener información especializada. Cuando la característica sea homogénea

30 Especialización en Estadística Aplicada Estadística Inferencial
Error en la Investigación

31 Especialización en Estadística Aplicada Estadística Inferencial
Variables Una variable es un aspecto, rasgo, cualidad o característica de un sujeto, objeto o fenómeno que, por su misma naturaleza, tiende a variar o a adoptar distintas magnitudes, medibles cuantitativamente o cualitativamente Son manifestaciones de la realidad. Por intermedio de ellas podemos conocer y medir la realidad, el hecho o fenómeno. La información que disponemos de cada individuo es resumida en variables

32 Especialización en Estadística Aplicada Estadística Inferencial
Variables de Interés Existe una diferencia importante entre la variable ideal del investigador y la variable operacional, es decir aquella que está en condiciones de ser observada y ser objeto de medición. Encontrar la forma en que la variable operacional refleje lo más cercanamente posible el concepto que el investigador pretende estudiar.

33 Especialización en Estadística Aplicada Estadística Inferencial
Operacionalización de Variables

34 Especialización en Estadística Aplicada Estadística Inferencial
Características de las Variables Ser parte de un todo: El conjunto de variables constituye el todo objeto de la investigación; o el todo, con fines de análisis investigativo, se descompone en variables, cuya estructura y evolución hay que estudiar. Ser observable.- directa o indirectamente. Ser susceptibles de variación cuantitativa o cualitativa: ser una magnitud en proceso.

35 Especialización en Estadística Aplicada Estadística Inferencial
Funciones de las Variables en el Proceso de Investigación Analiza la realidad objeto de investigación. Para conocer la realidad, hay que seguir un proceso analítico, descomponiéndola en variables. Un esfuerzo de síntesis posterior será restituir el todo.

36 Especialización en Estadística Aplicada Estadística Inferencial
Funciones de las Variables en el Proceso de Investigación Orienta el establecimiento de indicadores. Un riesgo que constantemente se vive en el proceso de investigación es el de dudar. Este riesgo se supera si se tienen establecidas las variables, las que provienen de un marco teórico bien fundamentado. De las variables determinadas provienen las indicaciones, que nos señalan cual es la información que necesitamos para llegar a conclusiones científicas.

37 Especialización en Estadística Aplicada Estadística Inferencial
Funciones de las Variables en el Proceso de Investigación Permiten descubrir las fuentes de información. Las variables e indicadores nos señalan cuál es la información que necesitamos y donde podemos encontrarla.

38 Especialización en Estadística Aplicada Estadística Inferencial
Funciones de las Variables en el Proceso de Investigación Miden el grado de variabilidad del problema de investigación. Todo está en permanente movimiento, al momento de investigar se debe identificar el ritmo de este movimiento en el fenómeno o hecho de investigación.

39 Especialización en Estadística Aplicada Estadística Inferencial
Clases de Variables Existen innumerables tipos de variables, vamos a describir las más útiles: I.- Según como se expresan los valores o por naturaleza de su medición pueden ser: a) Categórica – cualitativa b) Cuantitativa – numérica Variable discreta o discontinua Variable continua

40 Especialización en Estadística Aplicada Estadística Inferencial
Clases de Variables II.- Según la búsqueda de obtener explicación causal del problema o fenómeno estudiado o la relación entre las mismas variables. a) Variable independiente b) Variable dependiente. c) Variable interviniente d) Variable de control e) Variables de confusión

41 Especialización en Estadística Aplicada Estadística Inferencial
Escalas de Medición Escalas de medición de variables: Escala nominal Escala ordinal. Escala de intervalo. Escala de razón

42 Especialización en Estadística Aplicada Estadística Inferencial
Escalas de Medición Escala Nominal: Es la escala más rudimentaria donde los objetos se distinguen con base en su nombre, en ocasiones dado por un número Escala Ordinal: Las mediciones sólo indican orden (“ranking”). Los objetos se distinguen con base en una cantidad relativa de una característica que poseen Escala de Intervalo: Cuando las diferencias entre objetos tiene sentido, es decir que la unidad de medida es fija. Generalmente tienen un cero, aunque este es arbitrario Escala de Razón: Cuando; además de los anterior, los cocientes (razones) de valores tienen sentido, la escala es racional. El cero es absoluto en esta escala.

43 Especialización en Estadística Aplicada Estadística Inferencial
Tipos de Variables y Escalas de Medición

44 Inferencia Estadística
La UFPS soy yo, eres tú, somos todos

45 Especialización en Estadística Aplicada Estadística Inferencial
Inferencia Estadística Estimación: Aproximación del valor del parámetro poblacional a partir de la estadística calculada con base en la información de la muestra Prueba de Hipótesis: Con base en los resultados obtenidos a partir de la información de la muestra se acepta o rechaza una afirmación acerca de uno o varios parámetros o sobre la forma de la distribución

46 Especialización en Estadística Aplicada Estadística Inferencial
Características de un Buen Estimador Insesgado: Si el valor esperado del mismo es igual al parámetro poblacional. Eficiente: Se refiere a lo cerca que se encuentre el valor estimado del parámetro. Consistente: Se obtiene cuando el tamaño de la muestra se incrementa en tal forma que la varianza disminuya. Suficiente: Es un estimador que utiliza toda la información que posee una muestra para estimar el parámetro.

47 Especialización en Estadística Aplicada Estadística Inferencial
Hipótesis Hipótesis: Afirmación o conjetura acerca de una o más poblaciones Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla El rechazo implica que la evidencia de la muestra refuta la hipótesis

48 Estimación La UFPS soy yo, eres tú, somos todos

49 Especialización en Estadística Aplicada Estadística Inferencial
Estimador Regla que establece cómo calcular una estimación basada en las mediciones contenidas en la muestra. Cualesquier estadística (función de variables aleatorias) observable, que es también una variable aleatoria, cuyos valores se usan para estimar un parámetro θ o una función del parámetro θ.

50 Especialización en Estadística Aplicada Estadística Inferencial
Propiedades: 1. Insesgamiento es estimador insesgado de si En caso contrario, es sesgado Ejemplos

51 Especialización en Estadística Aplicada Estadística Inferencial
Cuadrado Medio del Error

52 Especialización en Estadística Aplicada Estadística Inferencial
Propiedades: 2. Consistencia Si se aumenta el tamaño de la muestra, se espera que el valor del estimador se acerque al verdadero valor Un estimador es un estimador consistente de si converge estocásticamente a cuando

53 Especialización en Estadística Aplicada Estadística Inferencial
Propiedades: 2. Consistencia converge estocásticamente a cuando si para dos números positivos arbitrariamente pequeños, se puede tomar una muestra suficientemente grande tal que es estimador consistente de

54 Especialización en Estadística Aplicada Estadística Inferencial
Desigualdad de Chebyshev Sea X una variable aleatoria continua con función de densidad de probabilidad , media , varianza Para dado:

55 Especialización en Estadística Aplicada Estadística Inferencial
Propiedades: 3. Eficiencia (precisión) es un estimador eficiente de si: se aproxima a la normal cuando Para cualesquier otro estimador para el cual se aproxime a la normal se cumple que La eficiencia de respecto a está dada por

56 Especialización en Estadística Aplicada Estadística Inferencial
Propiedades: 4. Suficiencia es un estimador suficiente de : Si aporta toda la posible información que le provee la muestra Si y sólo si la distribución condicional de dado no depende de Si se conoce ya se tiene toda la información de

57 Especialización en Estadística Aplicada Estadística Inferencial
Criterio de factorización Se emplea para encontrar estimadores suficientes Sea una muestra aleatoria de tamaño n de una densidad , donde el parámetro puede ser un vector Una estadística es suficiente si y sólo si la densidad conjunta de (la cual es, ) se puede escribir así:

58 Especialización en Estadística Aplicada Estadística Inferencial
Criterio de factorización donde es no negativa y no envuelve el parámetro y la función es no negativa y depende de y la estadística

59 Especialización en Estadística Aplicada Estadística Inferencial
Propiedades: 5. Robustez (resistencia) es un estimador robusto de : si continúa siendo razonablemente bueno como estimador de si el modelo experimenta una pequeña modificación Los estimadores robustos no son tan eficientes como los óptimos cuando el modelo es correcto, pero el cambio en sus propiedades es leve ante contaminaciones o alteraciones en la función de densidad de la variable

60 Especialización en Estadística Aplicada Estadística Inferencial
Función de verosimilitud La función de verosimilitud de n variables aleatorias se define como la densidad conjunta de las n variables, esto es: , la cual se considera como una función de En particular, si es una muestra aleatoria de , entonces la función de verosimilitud es

61 Especialización en Estadística Aplicada Estadística Inferencial
Método de máxima verosimilitud Un estimador máximo verosímil satisface

62 Modelos Probabilísticos
La UFPS soy yo, eres tú, somos todos

63 Especialización en Estadística Aplicada Estadística Inferencial
Modelos Probabilísticos El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica. En estos casos aparece la noción de variable aleatoria: Función que asigna a cada suceso un número. Las variables aleatorias pueden ser discretas o continuas.

64 Especialización en Estadística Aplicada Estadística Inferencial
Modelos Probabilísticos Función de masa (v. a. discreta) Asigna a cada posible valor de una variable discreta su probabilidad. Ejemplo Número de caras al lanzar 3 monedas.

65 Especialización en Estadística Aplicada Estadística Inferencial
Modelos Probabilísticos Función de densidad (v. a. continua) Definición Es una función no negativa Su integral (el área bajo la curva) es 1. Puede verse como la generalización del histograma de frecuencias relativas para variables continuas.

66 Especialización en Estadística Aplicada Estadística Inferencial
Modelos Probabilísticos ¿para qué sirve la función de densidad? Muchos procesos aleatorios vienen descritos por variables de forma que son conocidas sus funciones de densidad de probabilidad Identificamos la probabilidad de que la v. a. tome valores en un intervalo con el área bajo la función de densidad.

67 Especialización en Estadística Aplicada Estadística Inferencial
Modelos Probabilísticos Función de Distribución Es la función que asocia a cada valor de una variable, la probabilidad acumulada de los valores inferiores o iguales. La generalización de las frecuencias acumuladas. A los valores extremadamente bajos les corresponden valores de la función de distribución cercanos a cero. A los valores extremadamente altos les corresponden valores de la función de distribución cercanos a uno. La encontraremos en los artículos y aplicaciones en forma de “p-valor”, significación,…

68 Especialización en Estadística Aplicada Estadística Inferencial
Modelos Probabilísticos Distribución Normal o de Gauss Aparece de manera natural: Errores de medida. Distancia de frenado. Altura, peso, CI, Pruebas de estado, … Distribuciones binomiales con n grande (n>30) y ‘p ni pequeño’ (np>5) ‘ni grande’ (nq>5). Está caracterizada por dos parámetros: La media, μ, y la desviación típica, σ. Su función de densidad es:

69 Especialización en Estadística Aplicada Estadística Inferencial
Modelos Probabilísticos N(μ, σ2): Interpretación Geométrica La media se interpreta como un factor de traslación. La desviación estándar como un factor de escala, grado de dispersión,

70 Especialización en Estadística Aplicada Estadística Inferencial
Modelos Probabilísticos N(μ, σ2): Interpretación Probabilística Entre la media y una desviación estándar tenemos siempre la misma probabilidad: aprox. 68% Entre la media y dos desviaciones estándar aprox. 95%

71 Especialización en Estadística Aplicada Estadística Inferencial
Modelos Probabilísticos Algunas características de N(μ, σ2) La función de densidad es simétrica, mesocúrtica y unimodal. Media, mediana y moda coinciden. Los puntos de inflexión de la función de densidad están a distancia σ de μ. Si tomamos intervalos centrados en μ, y cuyos extremos están… a distancia σ,  tenemos probabilidad 68,26% a distancia 2 σ,  tenemos probabilidad 95,45% a distancia 3 σ  tenemos probabilidad 99,73% No es posible calcular la probabilidad de un intervalo simplemente usando la primitiva de la función de densidad, ya que no tiene primitiva expresable en términos de funciones ‘comunes’. Todas las distribuciones normales N(μ, σ2), pueden ponerse mediante una traslación μ, y un cambio de escala σ, como N(0,1). Esta distribución especial se llama normal estandarizada o tipificada.

72 Especialización en Estadística Aplicada Estadística Inferencial
Modelos Probabilísticos Estandarización o Tipificación Dada una variable de media μ y desviación estándar σ, se denomina valor tipificado o valor estandarizado, z, de una observación x, a la distancia (con signo) con respecto a la media, medida en desviaciones estándar, es decir En el caso de variable X normal, la interpretación es clara: Asigna a todo valor de N(μ, σ2), un valor de N(0,1) que deja exáctamente la misma probabilidad por debajo (acumulada). Nos permite así comparar entre valores de distribuciones normales diferentes

73 Especialización en Estadística Aplicada Estadística Inferencial
Ejemplo Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes. Se asignará al que tenga mejor expediente académico. El estudiante A tiene una calificación de 8 en un sistema donde la calificación de los alumnos se comporta como N(6,1). El estudiante B tiene una calificación de 80 en un sistema donde la calificación de los alumnos se comporta como N(70,102). Solución No podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos estandarizar y observar las puntuaciones sobre una distribución de referencia N(0,1) Como ZA>ZB, podemos decir que el porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación el estudiante A es mayor que el que ha superado B. Podríamos pensar en principio que A es mejor candidato para la beca.

74 Especialización en Estadística Aplicada Estadística Inferencial
Distribución Normal

75 Especialización en Estadística Aplicada Estadística Inferencial
Distribución Normal Resultados ECAES Ingeniería de Sistemas, Año 2003 Resultados ECAES Ingeniería de Sistemas, Año 2004

76 Especialización en Estadística Aplicada Estadística Inferencial
¿Por qué es importante la distribución normal? Las propiedades que tiene la distribución normal son interesantes, pero todavía no hemos hablado de por qué es una distribución especialmente importante. La razón es que aunque una v.a. no posea distribución normal, ciertos estadísticos/estimadores calculados sobre muestras elegidas al azar es posible que posean una distribución normal. Es decir, tengan las distribución que tengan nuestros datos, los ‘objetos’ que resumen la información de una muestra, posiblemente pueden tener distribución normal (o una distribución asociada).

77 Especialización en Estadística Aplicada Estadística Inferencial
La distribución de la Media Aritmética Muestral Como ilustración mostramos una variable que presenta valores distribuidos más o menos uniformemente sobre el intervalo Como es de esperar la media es cercana a 170. El histograma no se parece en nada a una distribución normal con la misma media y desviación estándar.

78 Especialización en Estadística Aplicada Estadística Inferencial
La distribución de la Media Aritmética Muestral A continuación elegimos aleatoriamente grupos de 10 observaciones de las anteriores y calculamos el promedio. Para cada grupo de 10 obtenemos entonces una nueva medición, que vamos a llamar promedio muestral. Observemos que las nuevas cantidades están más o menos cerca de la media de la variable original. Repitamos el proceso un número elevado de veces. En la siguiente transparencia estudiamos la distribución de la nueva variable. Muestra 185 190 179 174 169 163 167 170 160 159 152 172 178 183 175 188 155 165 173 169 168

79 Especialización en Estadística Aplicada Estadística Inferencial
La distribución de la Media Aritmética Muestral La distribución de los promedios muestrales tiene distribución aproximadamente normal. La media de esta nueva variable (promedio de la distribución muestral) es muy parecida a la de la variable original. Las observaciones de la nueva variable están menos dispersas. (Observar el rango). La desviación estándar es aproximadamente ‘raiz de 10’ veces más pequeña. Llamamos error estándar a la desviación estándar de esta nueva variable.

80 Especialización en Estadística Aplicada Estadística Inferencial
Teorema del Límite Central Dada una v.a. cualquiera, si extraemos muestras de tamaño n, y calculamos los promedios muestrales, entonces: dichos promedios tienen distribución aproximadamente normal; La media de los promedios muestrales es la misma que la de la variable original. La desviación estándar de los promedios disminuye en un factor “raíz de n” (error estándar). Las aproximaciones anteriores se hacen exactas cuando n tiende a infinito.

81 Especialización en Estadística Aplicada Estadística Inferencial
Teorema del Límite Central A medida que n aumenta, la distribución de la media se aproxima más a la normal

82 Especialización en Estadística Aplicada Estadística Inferencial
Distribuciones asociadas a la Normal Al hacer inferencia estadística, la distribución normal aparece de forma casi inevitable. Dependiendo del problema, podemos encontrar otras (asociadas): X2 (chi cuadrado) t - student F de Fisher Estas distribuciones resultan directamente de operar con distribuciones normales. Típicamente aparecen como distribuciones de ciertos estadísticos.

83 Especialización en Estadística Aplicada Estadística Inferencial
La distribución chi cuadrado Tiene un sólo parámetro denominado grados de libertad. La función de densidad es asimétrica positiva. Sólo tienen densidad los valores positivos. La función de densidad se hace más simétrica incluso casi gausiana cuando aumenta el número de grados de libertad. Consideraremos atípicos aquellos valores de la variable de la “cola de la derecha”.

84 Especialización en Estadística Aplicada Estadística Inferencial
La distribución t - student Tiene un parámetro denominado grados de libertad. Cuando aumentan los grados de libertad, más se acerca a N(0,1). Es simétrica con respecto al cero. Se consideran valores atípicos los que se alejan de cero (positivos o negativos).

85 Especialización en Estadística Aplicada Estadística Inferencial
La distribución Fisher Tiene dos parámetros denominados grados de libertad. Sólo toma valores positivos. Es asimétrica positiva. Se consideran valores atípicos los de la cola de la derecha.

86 Estimación Por intervalos La UFPS soy yo, eres tú, somos todos

87 Especialización en Estadística Aplicada Estadística Inferencial
Estimación por Intervalo Una muestra aleatoria de una densidad Dos estadísticas y que satisfacen Tal que Entonces, el intervalo aleatorio: se llama un intervalo de confianza para

88 Especialización en Estadística Aplicada Estadística Inferencial
Estimación por Intervalo Alrededor del estimador se construye un intervalo dentro del cual se afirma que está el parámetro, con una cierta probabilidad Nivel de confianza: (1-α) Probabilidad de que el parámetro esté dentro del intervalo construido alrededor del estimador

89 Especialización en Estadística Aplicada Estadística Inferencial
Nivel de Confianza 1 - α

90 Especialización en Estadística Aplicada Estadística Inferencial
Intervalo de Confianza para estimar la Media Aritmética Poblacional: µ (σ conocida) Confiabilidad (1-α) Intervalo de Confianza: Si el tamaño de la población es muy grande o no se conoce o el muestreo se realiza con reposición:

91 Especialización en Estadística Aplicada Estadística Inferencial
Intervalo de Confianza para estimar la Media Aritmética Poblacional: µ (σ desconocida) Confiabilidad (1-α) Intervalo de Confianza: Si el tamaño de la población es muy grande o no se conoce o el muestreo se realiza con reposición:

92 Especialización en Estadística Aplicada Estadística Inferencial
Ejemplo 1 Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión). Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con varianza poblacional desconocida.

93 Especialización en Estadística Aplicada Estadística Inferencial
Ejemplo 1 Como σ2 es desconocido, lo estimamos por S2=18,7. Luego, un intervalo de confianza aproximado es: En consecuencia, el intervalo de confianza para µ es (13,2 , 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.

94 Especialización en Estadística Aplicada Estadística Inferencial
Ejemplo 2 Una muestra de ocho cigarrillos de cierta marca, arroja los siguientes contenidos de alquitrán: 20, 17, 21, 19, 22, 21, 20 y 16 mg. Se desea estimar el contenido promedio de alquitrán en los cigarrillos de esta marca, con una confiabilidad de 95%

95 Especialización en Estadística Aplicada Estadística Inferencial
Ejemplo 2

96 Especialización en Estadística Aplicada Estadística Inferencial
Estimación de la diferencia entre dos promedios Intervalo para µ1-µ2; σ12, σ22 conocidas Intervalo para µ1-µ2; σ12=σ22 desconocidas (poblaciones normales)

97 Especialización en Estadística Aplicada Estadística Inferencial
Estimación de la diferencia entre dos promedios Intervalo para µ1-µ2 σ12≠σ22 desconocidas (poblaciones normales)

98 Especialización en Estadística Aplicada Estadística Inferencial
Ejemplo 3 Los siguientes datos corresponden a los resultados en una prueba diagnóstica de una muestra de estudiantes de los cursos 7ºA y 7ºB 7ºA: 83, 64, 87, 75 7ºB: 78, 86, 85, 68, 89, 94 Estime la diferencia entre los promedios para ambos grupos

99 Especialización en Estadística Aplicada Estadística Inferencial
Observaciones pareadas Cada unidad experimental tiene un par de observaciones, una para cada población

100 Especialización en Estadística Aplicada Estadística Inferencial
Ejemplo 4 Un proyecto de investigación pretende establecer el avance de los estudiantes en manejo de operaciones matemáticas básicas. Para ello se seleccionan 12 estudiantes de 4º grado, se les aplica una prueba diagnóstica y los resultados se comparan con los obtenidos en una prueba similar aplicada al final.

101 Especialización en Estadística Aplicada Estadística Inferencial
Ejemplo 4 Los resultados fueron: Ini 34 25 35 27 31 33 28 29 Fin 38 42 44 36 30 24 40

102 Especialización en Estadística Aplicada Estadística Inferencial
Estimación de una proporción Un estimador puntual de la proporción P en un experimento binomial es p=x/n, donde x es el número de éxitos en n ensayos Intervalo de confianza para estimar P de una muestra grande

103 Especialización en Estadística Aplicada Estadística Inferencial
Estimación de la diferencia entre dos proporciones

104 Especialización en Estadística Aplicada Estadística Inferencial
Estimación de la varianza

105 Especialización en Estadística Aplicada Estadística Inferencial
Estimación de la razón de dos varianzas

106 Especialización en Estadística Aplicada Estadística Inferencial
Tamaño de la muestra (n) Es la decisión mas importante que se debe tomar en una investigación por muestreo. Una muestra debe ser pequeña a un costo bajo y bastante grande para que el error de muestreo sea admisible. Algunos creen que el tamaño de la muestra crece indefinidamente a medida que aumenta el tamaño poblacional pero eso no es cierto, ya que existe un punto en el cual el tamaño de la muestra permanece constante, así el tamaño poblacional aumente.

107 Especialización en Estadística Aplicada Estadística Inferencial
Tamaño de la muestra (n) En el calculo del tamaño óptimo se debe tener en cuenta los siguientes componentes: El error máximo admisible. El nivel de confianza. El error de muestreo. El error de no-muestreo. La varianza, grado de variabilidad de la característica principal.

108 Especialización en Estadística Aplicada Estadística Inferencial
Error de Muestreo Es la diferencia entre el valor poblacional (Parámetro) y la estimación misma (Estadística) obtenida por medio de una muestra aleatoria. El tamaño óptimo solo se puede conseguir a partir del conocimiento de la población (variabilidad); se debe prefijar el error máximo admisible que representa la precisión mínima a exigir de los resultados y el coeficiente de seguridad ó confianza.

109 Especialización en Estadística Aplicada Estadística Inferencial
Error no de muestreo Son los errores ajenos al muestreo que no se pueden medir, se consideran como el resultado de instrumentos de medición incorrectos o mal aplicados, cuestionarios mal definidos, errores que comete el entrevistador al efectuar las preguntas o al interpretar las respuestas, preguntas vagas o ambiguas, en otros casos son una mala planeación del trabajo de campo y falta de definición en los estándares de calidad del trabajo de campo.

110 Especialización en Estadística Aplicada Estadística Inferencial
Fuentes potenciales de error Estimación de la varianza Población Carencia de Marco de Muestreo Poblaciones con características Heterogéneas, alta variabilidad.

111 Especialización en Estadística Aplicada Estadística Inferencial
Error total Variación entre el valor real de la medida en la población de la variable que se estudia y el valor de la medida observada en la investigación.

112 Especialización en Estadística Aplicada Estadística Inferencial
Tamaño de muestra para estimar la media aritmética Cuando se conoce el tamaño poblacional Cuando el tamaño de la población es desconocido

113 Especialización en Estadística Aplicada Estadística Inferencial
Tamaño de muestra para estimar la media aritmética Para obtener una estimación inicial de la desviación estándar se puede recurrir a cualesquiera de las siguientes tres alternativas: Usar la desviación estándar obtenida en un estudio anterior Estimar inicialmente la desviación estándar a partir de una muestra piloto Asumir inicialmente: S=Rango/4 , esto es, asumir que la desviación estándar es aproximadamente igual a la cuarta parte del rango de los datos

114 Especialización en Estadística Aplicada Estadística Inferencial
Tamaño de muestra para estimar la proporción Cuando se conoce el tamaño poblacional Cuando el tamaño de la población es desconocido

115 Especialización en Estadística Aplicada Estadística Inferencial
Tamaño de muestra para estimar la proporción Para obtener una estimación inicial de la proporción se puede recurrir a cualesquiera de las siguientes tres alternativas: Usar la proporción obtenida en un estudio anterior Estimar inicialmente la proporción a partir de una muestra piloto Asumir inicialmente: P=0.5 , esto es, asumir que la proporción, o probabilidad de observar el suceso, es del 50%. Con este supuesto se obtiene el máximo valor de p(1-p), lo cual garantiza que se toma una muestra de tamaño ligeramente mayor de lo necesario.

116 Prueba de Hipótesis La UFPS soy yo, eres tú, somos todos

117 Especialización en Estadística Aplicada Estadística Inferencial
Hipótesis ¿Qué son las Hipótesis? Son conjeturas lógicas acerca de la solución de un problema. Son explicaciones tentativas del fenómeno investigado formuladas a manera de proposiciones. Nos indican lo que estamos buscando o tratando de probar.

118 Especialización en Estadística Aplicada Estadística Inferencial
Hipótesis ¿Qué características debe tener una hipótesis? Las hipótesis deben referirse a una situación real. La relación entre las variables debe de ser clara y verosímil. Deben ser medibles y observables. Deben estar relacionadas con técnicas disponibles para probarlas.

119 Especialización en Estadística Aplicada Estadística Inferencial
Hipótesis Las hipótesis pueden ser o no verdaderas. Por eso están sujetas a comprobación. Son proposiciones tentativas acerca de las relaciones entre dos o más variables y se apoyan en conocimientos organizados y sistematizados Una investigación puede tener una, dos o varias hipótesis; como también no tenerla.

120 Especialización en Estadística Aplicada Estadística Inferencial
Hipótesis Hipótesis: Afirmación o conjetura acerca de una o más poblaciones Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla El rechazo implica que la evidencia de la muestra refuta la hipótesis

121 Especialización en Estadística Aplicada Estadística Inferencial
Tipos de Hipótesis Hipótesis Nula (H0): Es la hipótesis que se desea probar. Se formula para indicar la estructura de la población Hipótesis Alternativa (H1): Es la hipótesis que se acepta en caso de rechazar H0

122 Especialización en Estadística Aplicada Estadística Inferencial
Formulación de Hipótesis Partes de una Hipótesis Variable 1 y variable 2 o variable independiente y variable dependiente. Unidad de análisis. Conectores lógicos

123 Especialización en Estadística Aplicada Estadística Inferencial
Formulación de Hipótesis ¿Qué tipos de hipótesis hay? Hipótesis de Investigación. Hipótesis nula. Hipótesis alternativas. Hipótesis “estadísticas”.

124 Especialización en Estadística Aplicada Estadística Inferencial
Formulación de Hipótesis Hipótesis de Investigación (Hi) Hipótesis descriptiva del valor de una variable o variables. Hipótesis de asociación Hipótesis Correlacionales Hipótesis que establecen relaciones de causalidad Hipótesis de la diferencia entre grupos

125 Especialización en Estadística Aplicada Estadística Inferencial
Formulación de Hipótesis Hipótesis Nula (H0) Sirven para refutar o negar lo que afirma la hipótesis de investigación. Hay tantos tipos de hipótesis nulas como de investigación. Establecen que no existe diferencia entre el valor del parámetro y el valor supuesto a investigar.

126 Especialización en Estadística Aplicada Estadística Inferencial
Formulación de Hipótesis Hipótesis alternativas (Ha o H1) Son posibilidades “alternas” ante las hipótesis de investigación y nula. Pueden ser más de una. Son las hipótesis que se aceptan en caso de rechazar la hipótesis nula

127 Especialización en Estadística Aplicada Estadística Inferencial
Formulación de Hipótesis Hipótesis “Estadísticas”. Son las transformaciones de las hipótesis de investigación, nulas y alternativas en símbolos estadísticos. • Del valor de una variable • De asociación. • De correlación. • De relaciones causales. • De diferencia de grupos.

128 Especialización en Estadística Aplicada Estadística Inferencial
Prueba de Hipótesis Prueba Estadística: Con base en el resultado de una muestra se acepta o se rechaza la hipótesis nula Errores Error tipo I: Rechazar afirmaciones (H0) verdaderas Error tipo II: Aceptar afirmaciones (H1) falsas

129 Prueba de Hipótesis Estado de la Naturaleza Decisión Aceptar Ho
Especialización en Estadística Aplicada Estadística Inferencial Prueba de Hipótesis Estado de la Naturaleza Decisión Aceptar Ho Rechazar Ho Ho verdadera Decisión correcta Error tipo I Ho falsa Error tipo II

130 Especialización en Estadística Aplicada Estadística Inferencial
Prueba de Hipótesis Nivel de Significación (α): Probabilidad de rechazar una hipótesis nula verdadera Potencia de la prueba (1-β): Probabilidad de rechazar H0 dado que H1 es verdadera α = P(E.T.I) β = p(E.T.II) Valor p: Nivel más bajo (de significación) en el cual el valor observado del estadístico de prueba es significativo

131 Especialización en Estadística Aplicada Estadística Inferencial
Proceso para Prueba de Hipótesis Establecer H0: θ = θ0 Seleccionar H1: H1: θ ≠ θ0 ; H1: θ < θ0 ; H1: θ > θ0 Seleccionar el nivel de significación: α Seleccionar el estadístico de prueba apropiado y establecer la región crítica Calcular el valor del estadístico de prueba con los datos muestrales Tomar la decisión

132 Especialización en Estadística Aplicada Estadística Inferencial
Razonamiento Básico Si supongo que H0 es cierta... ¿qué hace un científico cuando su teoría no coincide con sus predicciones? ... el resultado del experimento sería improbable. Sin embargo ocurrió.

133 Especialización en Estadística Aplicada Estadística Inferencial
Razonamiento Básico Si supongo que H0 es cierta... Rechazo que H0 sea cierta. ... el resultado del experimento sería improbable. Sin embargo ocurrió.

134 Especialización en Estadística Aplicada Estadística Inferencial
Razonamiento Básico No hay evidencia contra H0 No se rechaza H0 El experimento no es concluyente El contraste no es significativo Si supongo que H0 es cierta... ¿Si una teoría hace predicciones con éxito, queda probado que es cierta? ... el resultado del experimento es coherente.

135 Especialización en Estadística Aplicada Estadística Inferencial
Región crítica y nivel de significación Región crítica Valores ‘improbables’ si... Es conocida antes de realizar el experimento: resultados experimentales que refutarían H0 Nivel de significación: a Número pequeño: 1% , 5% Fijado de antemano por el investigador Es la probabilidad de rechazar H0 cuando es cierta a=5% Reg. Crit. Reg. Crit. No rechazo H0 H0: m=40

136 Especialización en Estadística Aplicada Estadística Inferencial
Contrastes unilateral y bilateral La posición de la región crítica depende de la hipótesis alternativa Bilateral H1: m¹40 Unilateral Unilateral H1: m<40 H1: m>40

137 Especialización en Estadística Aplicada Estadística Inferencial
Significación p a H0: m=40

138 Especialización en Estadística Aplicada Estadística Inferencial
Significación p No se rechaza H0: m=40 a H0: m=40

139 Especialización en Estadística Aplicada Estadística Inferencial
Significación p Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida. p es conocido después de realizar el experimento aleatorio El contraste es no significativo cuando p>a P a No se rechaza H0: m=40 P a

140 Especialización en Estadística Aplicada Estadística Inferencial
Significación p Se rechaza H0: m=40 Se acepta H1: m>40 a

141 Especialización en Estadística Aplicada Estadística Inferencial
Significación p El contraste es estadísticamente significativo cuando p<a Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori. a P Se rechaza H0: m=40 Se acepta H1: m>40 a P


Descargar ppt "Francisco de Paula Santander"

Presentaciones similares


Anuncios Google