Francisco de Paula Santander

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

1 Estadística Unidad I DuocUC Conceptos básicos y más.. Sigla: EST400 Nombre Asignatura: Estadística 1 Material de apoyo Nº 1/Unidad 1.
Estadística Unidad III
Variable Aleatoria Continua. Principales Distribuciones
De la muestra a la población
Introducción al tema El único método científico para validar conclusiones sobre un grupo de individuos a partir de la información que nos proporciona un.
FRANCISCO JAVIER RODRÍGUEZ
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Tema 5: Modelos probabilísticos
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Estimación por Intervalos de confianza
GRADO DE CONFIANZA DE LA INFERENCIA
Muestra: Recolección de Datos: Análisis de Datos:
ESCUELA PROFERSIONAL DE INGENIERÍA EMPRESARIAL.
Conceptos básicos de inferencia
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
Tema 5: Modelos probabilísticos
Unidad VI: PRUEBAS DE HIPOTESIS
Población y Muestra.
Unidad V: Estimación de
Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.
VARIABLE ALEATORIA Y DISTRIBUCION DE PROBABILIDAD
DISTRIBUCIONES DE MUESTREO
Unidad V: Estimación de
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
1 M. en C. Gal Vargas Neri. 2 Planeación del curso TEMACAP.TITULODÍASSEMFEC FIN TEMA 00MOTIVACION Y PLANEACION1111/01 TEMA I1-2ESTADISTICA Y MEDICION2115/01.
MODELOS PROBABILÍSTICOS
Unidad III: Distribuciones Especiales
Datos: Estadística.
Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
ESTADÍSTICAS DESCRIPTIVA
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Coeficiente de Variación
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO FACULTAD DE INFORMATICA Y ELECTRONICA ESCUELA DE DISEÑO GRAFICO ESTADISTICA TEMA: estadista, entendimiento.
Capítulo 7 Estimación de Parámetros Estadística Computacional
ESTIMACION POR INTERVALOS
Medidas de Posición y Centralización Estadística E.S.O.
Titular: Agustín Salvia
Inferencia Estadística
Estadística para administradores
ESTADÍSTICA DESCRIPTIVA
Unidad II: Variables Aleatorias Concepto Discreta y Continua Fun. de densidad Fun. de probabilidad F. de distribución Esperanza y Varianza Propiedades.
Unidad V: Estimación de
Capítulo 1. Conceptos básicos de la Estadística
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Métodos Cuantitativos
Estadística Descriptiva
Estimación y contraste de hipótesis
Fundamentos Básicos de Estadística
Análisis de los Datos Cuantitativos
Aplicaciones Estadísticas a las Finanzas Clase 1
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
ESTIMACIÓN DE PARÁMETROS
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Aspectos generales de la investigación educativa en el SNIT
INFERENCIA ESTADÍSTICA
UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE CIENCIAS ECONOMICAS INFERENCIA ESTADISTICA TEMA: ESTIMACION PUNTUAL, PROPIEDADES DE LAS ESTIMACIONES;
Variable aleatoria El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica. En estos casos aparece la noción.
Aplicaciones Estadísticas a las Finanzas Clase 1
7. Distribución normal Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones.
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
Estimación Estadística Tares # 3. Estimación Estadística Conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Estimación estadística
Transcripción de la presentación:

Francisco de Paula Santander Universidad Francisco de Paula Santander Especialización en Estadística Aplicada La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Introducción La UFPS soy yo, eres tú, somos todos

Especialización en Estadística Aplicada Estadística Inferencial Objetivos Identificar las propiedades de los estimadores y aplicarlas en la solución de problemas Utilizar métodos formales para realizar estimaciones y pruebas de hipótesis Establecer criterios de evaluación, especificación y verificación del modelo estadístico Establecer fundamentos básicos para la toma de decisiones con base en las inferencias obtenidas a partir del modelo

Especialización en Estadística Aplicada Estadística Inferencial Contenidos Temáticos Introducción Población y Muestra Estimación Estimadores Estimación puntual Estimación por intervalo Pruebas de Hipótesis Pruebas paramétricas Pruebas no paramétricas

Especialización en Estadística Aplicada Estadística Inferencial Bibliografía PEÑA SANCHEZ DE RIVERA, DANIEL. Estadística Modelos y Métodos, 1. Fundamentos, Alianza Editorial, Madrid BICKEL, PETER. Matematical Statistics, Prentice Hall, New Jersey MENDENHALL, W., SCHEAFFER, WACKERLY. Estadísica Matemática con Aplicaciones, Editorial Iberoamérica, México WALPOLE, R., R. MYERS, S. MIERS. Probabilidad y Estadística para Ingenieros, Pearson, Ed.

Especialización en Estadística Aplicada Estadística Inferencial ¿Para qué sirve la Estadística? La Ciencia se ocupa en general de fenómenos observables La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocástico) La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza

Especialización en Estadística Aplicada Estadística Inferencial ¿Para qué sirve la Estadística? La Estadística es la Ciencia de la Sistematización, recolección, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de deducir las leyes que rigen esos fenómenos, y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones. Descriptiva Probabilidad Inferencia

Especialización en Estadística Aplicada Estadística Inferencial Definición Estadística es la ciencia de: Recolectar Describir Organizar Interpretar para transformarlos en información, para la toma mas eficiente de decisiones. Datos

Especialización en Estadística Aplicada Estadística Inferencial Tipos de Estadística Estadística Descriptiva: Método de recolectar, organizar, resumir y presentar los datos en forma informativa. Estadística inferencial: Métodos usados para determinar algo acerca de la población, basado en una muestra.

Especialización en Estadística Aplicada Estadística Inferencial Método Científico y Estadística Teoría o Conocimiento Actual Observaciones Resultados Conclusiones Hipótesis operativa Hipótesis conceptual Identificación de un problema Diseño Recolección de datos Análisis Interpreta- ción Generalización

Especialización en Estadística Aplicada Estadística Inferencial Método Científico y Estadística

Especialización en Estadística Aplicada Estadística Inferencial Problema real Planteamiento del problema Objetos y medios Modelos Estadísticos (Cálculo de probabilidades) Recolección de información muestral (Técnicas de muestreo ; diseño de experimentos) Depuración de los datos (Análisis de datos) Estimación de los parámetros (Teoría de la estimación)

Especialización en Estadística Aplicada Estadística Inferencial Contrastes de Simplificación (Contrastes de hipótesis) Crítica y Diagnosis del Modelo (Análisis de datos) ¿ Es un modelo adecuado ? Nuevo Conocimiento Previsiones Decisiones

Universo, Población y Muestra La UFPS soy yo, eres tú, somos todos

Especialización en Estadística Aplicada Estadística Inferencial Universo de Estudio Universo Ideal: Conjunto sobre el cual el investigador, pretende obtener alguna información. Sobre el cual recaerán las consecuencias de las decisiones basadas en los resultados de la encuesta

Especialización en Estadística Aplicada Estadística Inferencial Universo de Estudio Población Objetivo: Conjunto de elementos que partiendo del universo ideal puede realmente ser alcanzado por el investigador. Se obtiene de los ajustes y/o recortes por operatividad, razones políticas, económicas o sociales

Especialización en Estadística Aplicada Estadística Inferencial Universo de Estudio Marco de Muestreo: Dispositivo que permite identificar y ubicar los sujetos que toman parte en los diferentes procesos de selección al azar. Tipos de Marco: Lista o área.

Especialización en Estadística Aplicada Estadística Inferencial Universo de Estudio Población susceptible de encuesta: Conjunto de elementos del marco muestral con probabilidad mayor a cero de ser incluidos en la muestra. Esto, porque el hecho de ubicar los elementos no implica tener acceso a ellos.

Especialización en Estadística Aplicada Estadística Inferencial Universo de Estudio La meta del muestrista es encontrar mecanismos que cierren la brecha entre el universo ideal del investigador y la población susceptible de encuesta. Considerar diferentes marcos de muestreo y planear formas de acceso adecuadas para diversos subconjuntos del universo

Especialización en Estadística Aplicada Estadística Inferencial Población y Muestra Población: Conjunto de todas las unidades de análisis de interés para una investigación Muestra: Subconjunto de la población Una muestra es representativa si es de un tamaño suficientemente grande y mantiene una estructura similar a la de la población

Especialización en Estadística Aplicada Estadística Inferencial Población y Muestra Población Muestra

Especialización en Estadística Aplicada Estadística Inferencial Criterios de Inclusión y de exclusión Criterios de inclusión: son las características necesarias para que las unidades de análisis formen parte de la población de estudio. Criterios de exclusión: son las características no necesarias o excluyentes para que las unidades de análisis formen parte de la población de estudio.

Especialización en Estadística Aplicada Estadística Inferencial Parámetro y Estadística Parámetro: Es un indicador de la población calculado con base en la información de todas las unidades de análisis Estadística: Indicador de la población calculado con base en la información suministrada por la muestra

Especialización en Estadística Aplicada Estadística Inferencial Muestra Representativa Reúne las características principales de la población en relación a la variable o condición particular que se estudia, por lo tanto, los resultados y conclusiones obtenidos en esta muestra se pueden generalizar a la población de la cual fue extraída. La representatividad de una muestra está dada por: Su tamaño El tipo de muestreo que garantiza la inclusión de las variables relevantes presentes en la población

Especialización en Estadística Aplicada Estadística Inferencial Plan de Muestreo Definición concreta y clara de los objetivos de la encuesta o estudio. Traducción de los objetivos del estudio en resultados estadísticos. Especificación de la Población Objetivo. Construcción, revisión del marco muestral. Inventario de Recursos disponibles.

Especialización en Estadística Aplicada Estadística Inferencial Plan de Muestreo Especificaciones de los acuerdos necesarios con el usuario. Especificaciones de los métodos de recolección de Información, elaboración de los instrumentos de recolección, cuestionarios, manuales, capacitación, mapas. Especificación del diseño muestral, mecanismos de selección, varianza de los estimadores.

Especialización en Estadística Aplicada Estadística Inferencial Plan de Muestreo Determinación del tipo de procesamiento a realizar, critica e imputación. Especificación de las fórmulas de estimación y de las medidas de calidad. Planear el trabajo de campo Diseño del plan de control y evaluación.

Especialización en Estadística Aplicada Estadística Inferencial Investigación Total y Parcial Dependiendo del objetivo que se persiga, puede realizarse una investigación exhaustiva o una parcial. EXHAUSTIVA: Se observan todas las unidades que constituyen la población o universo, objeto de investigación. La enumeración total de toda la población en un tiempo dado, recibe el nombre de CENSO (censo de población, de industria manufacturera de tiendas del sector agropecuario, de establecimientos educativos, etc.)

Especialización en Estadística Aplicada Estadística Inferencial Cuándo no se recomienda un censo Cuando la población sea infinita. Cuando aún siendo finita es muy numerosa Por motivos de tiempo Cuando el costo es superior a los recursos disponibles Cuando la observación implique destrucción de los elementos. Cuando se desea obtener información especializada. Cuando la característica sea homogénea

Especialización en Estadística Aplicada Estadística Inferencial Error en la Investigación

Especialización en Estadística Aplicada Estadística Inferencial Variables Una variable es un aspecto, rasgo, cualidad o característica de un sujeto, objeto o fenómeno que, por su misma naturaleza, tiende a variar o a adoptar distintas magnitudes, medibles cuantitativamente o cualitativamente Son manifestaciones de la realidad. Por intermedio de ellas podemos conocer y medir la realidad, el hecho o fenómeno. La información que disponemos de cada individuo es resumida en variables

Especialización en Estadística Aplicada Estadística Inferencial Variables de Interés Existe una diferencia importante entre la variable ideal del investigador y la variable operacional, es decir aquella que está en condiciones de ser observada y ser objeto de medición. Encontrar la forma en que la variable operacional refleje lo más cercanamente posible el concepto que el investigador pretende estudiar.

Especialización en Estadística Aplicada Estadística Inferencial Operacionalización de Variables

Especialización en Estadística Aplicada Estadística Inferencial Características de las Variables Ser parte de un todo: El conjunto de variables constituye el todo objeto de la investigación; o el todo, con fines de análisis investigativo, se descompone en variables, cuya estructura y evolución hay que estudiar. Ser observable.- directa o indirectamente. Ser susceptibles de variación cuantitativa o cualitativa: ser una magnitud en proceso.

Especialización en Estadística Aplicada Estadística Inferencial Funciones de las Variables en el Proceso de Investigación Analiza la realidad objeto de investigación. Para conocer la realidad, hay que seguir un proceso analítico, descomponiéndola en variables. Un esfuerzo de síntesis posterior será restituir el todo.

Especialización en Estadística Aplicada Estadística Inferencial Funciones de las Variables en el Proceso de Investigación Orienta el establecimiento de indicadores. Un riesgo que constantemente se vive en el proceso de investigación es el de dudar. Este riesgo se supera si se tienen establecidas las variables, las que provienen de un marco teórico bien fundamentado. De las variables determinadas provienen las indicaciones, que nos señalan cual es la información que necesitamos para llegar a conclusiones científicas.

Especialización en Estadística Aplicada Estadística Inferencial Funciones de las Variables en el Proceso de Investigación Permiten descubrir las fuentes de información. Las variables e indicadores nos señalan cuál es la información que necesitamos y donde podemos encontrarla.

Especialización en Estadística Aplicada Estadística Inferencial Funciones de las Variables en el Proceso de Investigación Miden el grado de variabilidad del problema de investigación. Todo está en permanente movimiento, al momento de investigar se debe identificar el ritmo de este movimiento en el fenómeno o hecho de investigación.

Especialización en Estadística Aplicada Estadística Inferencial Clases de Variables Existen innumerables tipos de variables, vamos a describir las más útiles: I.- Según como se expresan los valores o por naturaleza de su medición pueden ser: a) Categórica – cualitativa b) Cuantitativa – numérica Variable discreta o discontinua Variable continua

Especialización en Estadística Aplicada Estadística Inferencial Clases de Variables II.- Según la búsqueda de obtener explicación causal del problema o fenómeno estudiado o la relación entre las mismas variables. a) Variable independiente b) Variable dependiente. c) Variable interviniente d) Variable de control e) Variables de confusión

Especialización en Estadística Aplicada Estadística Inferencial Escalas de Medición Escalas de medición de variables: Escala nominal Escala ordinal. Escala de intervalo. Escala de razón

Especialización en Estadística Aplicada Estadística Inferencial Escalas de Medición Escala Nominal: Es la escala más rudimentaria donde los objetos se distinguen con base en su nombre, en ocasiones dado por un número Escala Ordinal: Las mediciones sólo indican orden (“ranking”). Los objetos se distinguen con base en una cantidad relativa de una característica que poseen Escala de Intervalo: Cuando las diferencias entre objetos tiene sentido, es decir que la unidad de medida es fija. Generalmente tienen un cero, aunque este es arbitrario Escala de Razón: Cuando; además de los anterior, los cocientes (razones) de valores tienen sentido, la escala es racional. El cero es absoluto en esta escala.

Especialización en Estadística Aplicada Estadística Inferencial Tipos de Variables y Escalas de Medición

Inferencia Estadística La UFPS soy yo, eres tú, somos todos

Especialización en Estadística Aplicada Estadística Inferencial Inferencia Estadística Estimación: Aproximación del valor del parámetro poblacional a partir de la estadística calculada con base en la información de la muestra Prueba de Hipótesis: Con base en los resultados obtenidos a partir de la información de la muestra se acepta o rechaza una afirmación acerca de uno o varios parámetros o sobre la forma de la distribución

Especialización en Estadística Aplicada Estadística Inferencial Características de un Buen Estimador Insesgado: Si el valor esperado del mismo es igual al parámetro poblacional. Eficiente: Se refiere a lo cerca que se encuentre el valor estimado del parámetro. Consistente: Se obtiene cuando el tamaño de la muestra se incrementa en tal forma que la varianza disminuya. Suficiente: Es un estimador que utiliza toda la información que posee una muestra para estimar el parámetro.

Especialización en Estadística Aplicada Estadística Inferencial Hipótesis Hipótesis: Afirmación o conjetura acerca de una o más poblaciones Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla El rechazo implica que la evidencia de la muestra refuta la hipótesis

Estimación La UFPS soy yo, eres tú, somos todos

Especialización en Estadística Aplicada Estadística Inferencial Estimador Regla que establece cómo calcular una estimación basada en las mediciones contenidas en la muestra. Cualesquier estadística (función de variables aleatorias) observable, que es también una variable aleatoria, cuyos valores se usan para estimar un parámetro θ o una función del parámetro θ.

Especialización en Estadística Aplicada Estadística Inferencial Propiedades: 1. Insesgamiento es estimador insesgado de si En caso contrario, es sesgado Ejemplos

Especialización en Estadística Aplicada Estadística Inferencial Cuadrado Medio del Error

Especialización en Estadística Aplicada Estadística Inferencial Propiedades: 2. Consistencia Si se aumenta el tamaño de la muestra, se espera que el valor del estimador se acerque al verdadero valor Un estimador es un estimador consistente de si converge estocásticamente a cuando

Especialización en Estadística Aplicada Estadística Inferencial Propiedades: 2. Consistencia converge estocásticamente a cuando si para dos números positivos arbitrariamente pequeños, se puede tomar una muestra suficientemente grande tal que es estimador consistente de

Especialización en Estadística Aplicada Estadística Inferencial Desigualdad de Chebyshev Sea X una variable aleatoria continua con función de densidad de probabilidad , media , varianza Para dado:

Especialización en Estadística Aplicada Estadística Inferencial Propiedades: 3. Eficiencia (precisión) es un estimador eficiente de si: se aproxima a la normal cuando Para cualesquier otro estimador para el cual se aproxime a la normal se cumple que La eficiencia de respecto a está dada por

Especialización en Estadística Aplicada Estadística Inferencial Propiedades: 4. Suficiencia es un estimador suficiente de : Si aporta toda la posible información que le provee la muestra Si y sólo si la distribución condicional de dado no depende de Si se conoce ya se tiene toda la información de

Especialización en Estadística Aplicada Estadística Inferencial Criterio de factorización Se emplea para encontrar estimadores suficientes Sea una muestra aleatoria de tamaño n de una densidad , donde el parámetro puede ser un vector Una estadística es suficiente si y sólo si la densidad conjunta de (la cual es, ) se puede escribir así:

Especialización en Estadística Aplicada Estadística Inferencial Criterio de factorización donde es no negativa y no envuelve el parámetro y la función es no negativa y depende de y la estadística

Especialización en Estadística Aplicada Estadística Inferencial Propiedades: 5. Robustez (resistencia) es un estimador robusto de : si continúa siendo razonablemente bueno como estimador de si el modelo experimenta una pequeña modificación Los estimadores robustos no son tan eficientes como los óptimos cuando el modelo es correcto, pero el cambio en sus propiedades es leve ante contaminaciones o alteraciones en la función de densidad de la variable

Especialización en Estadística Aplicada Estadística Inferencial Función de verosimilitud La función de verosimilitud de n variables aleatorias se define como la densidad conjunta de las n variables, esto es: , la cual se considera como una función de En particular, si es una muestra aleatoria de , entonces la función de verosimilitud es

Especialización en Estadística Aplicada Estadística Inferencial Método de máxima verosimilitud Un estimador máximo verosímil satisface

Modelos Probabilísticos La UFPS soy yo, eres tú, somos todos

Especialización en Estadística Aplicada Estadística Inferencial Modelos Probabilísticos El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica. En estos casos aparece la noción de variable aleatoria: Función que asigna a cada suceso un número. Las variables aleatorias pueden ser discretas o continuas.

Especialización en Estadística Aplicada Estadística Inferencial Modelos Probabilísticos Función de masa (v. a. discreta) Asigna a cada posible valor de una variable discreta su probabilidad. Ejemplo Número de caras al lanzar 3 monedas.

Especialización en Estadística Aplicada Estadística Inferencial Modelos Probabilísticos Función de densidad (v. a. continua) Definición Es una función no negativa Su integral (el área bajo la curva) es 1. Puede verse como la generalización del histograma de frecuencias relativas para variables continuas.

Especialización en Estadística Aplicada Estadística Inferencial Modelos Probabilísticos ¿para qué sirve la función de densidad? Muchos procesos aleatorios vienen descritos por variables de forma que son conocidas sus funciones de densidad de probabilidad Identificamos la probabilidad de que la v. a. tome valores en un intervalo con el área bajo la función de densidad.

Especialización en Estadística Aplicada Estadística Inferencial Modelos Probabilísticos Función de Distribución Es la función que asocia a cada valor de una variable, la probabilidad acumulada de los valores inferiores o iguales. La generalización de las frecuencias acumuladas. A los valores extremadamente bajos les corresponden valores de la función de distribución cercanos a cero. A los valores extremadamente altos les corresponden valores de la función de distribución cercanos a uno. La encontraremos en los artículos y aplicaciones en forma de “p-valor”, significación,…

Especialización en Estadística Aplicada Estadística Inferencial Modelos Probabilísticos Distribución Normal o de Gauss Aparece de manera natural: Errores de medida. Distancia de frenado. Altura, peso, CI, Pruebas de estado, … Distribuciones binomiales con n grande (n>30) y ‘p ni pequeño’ (np>5) ‘ni grande’ (nq>5). Está caracterizada por dos parámetros: La media, μ, y la desviación típica, σ. Su función de densidad es:

Especialización en Estadística Aplicada Estadística Inferencial Modelos Probabilísticos N(μ, σ2): Interpretación Geométrica La media se interpreta como un factor de traslación. La desviación estándar como un factor de escala, grado de dispersión,

Especialización en Estadística Aplicada Estadística Inferencial Modelos Probabilísticos N(μ, σ2): Interpretación Probabilística Entre la media y una desviación estándar tenemos siempre la misma probabilidad: aprox. 68% Entre la media y dos desviaciones estándar aprox. 95%

Especialización en Estadística Aplicada Estadística Inferencial Modelos Probabilísticos Algunas características de N(μ, σ2) La función de densidad es simétrica, mesocúrtica y unimodal. Media, mediana y moda coinciden. Los puntos de inflexión de la función de densidad están a distancia σ de μ. Si tomamos intervalos centrados en μ, y cuyos extremos están… a distancia σ,  tenemos probabilidad 68,26% a distancia 2 σ,  tenemos probabilidad 95,45% a distancia 3 σ  tenemos probabilidad 99,73% No es posible calcular la probabilidad de un intervalo simplemente usando la primitiva de la función de densidad, ya que no tiene primitiva expresable en términos de funciones ‘comunes’. Todas las distribuciones normales N(μ, σ2), pueden ponerse mediante una traslación μ, y un cambio de escala σ, como N(0,1). Esta distribución especial se llama normal estandarizada o tipificada.

Especialización en Estadística Aplicada Estadística Inferencial Modelos Probabilísticos Estandarización o Tipificación Dada una variable de media μ y desviación estándar σ, se denomina valor tipificado o valor estandarizado, z, de una observación x, a la distancia (con signo) con respecto a la media, medida en desviaciones estándar, es decir En el caso de variable X normal, la interpretación es clara: Asigna a todo valor de N(μ, σ2), un valor de N(0,1) que deja exáctamente la misma probabilidad por debajo (acumulada). Nos permite así comparar entre valores de distribuciones normales diferentes

Especialización en Estadística Aplicada Estadística Inferencial Ejemplo Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes. Se asignará al que tenga mejor expediente académico. El estudiante A tiene una calificación de 8 en un sistema donde la calificación de los alumnos se comporta como N(6,1). El estudiante B tiene una calificación de 80 en un sistema donde la calificación de los alumnos se comporta como N(70,102). Solución No podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos estandarizar y observar las puntuaciones sobre una distribución de referencia N(0,1) Como ZA>ZB, podemos decir que el porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación el estudiante A es mayor que el que ha superado B. Podríamos pensar en principio que A es mejor candidato para la beca.

Especialización en Estadística Aplicada Estadística Inferencial Distribución Normal

Especialización en Estadística Aplicada Estadística Inferencial Distribución Normal Resultados ECAES Ingeniería de Sistemas, Año 2003 Resultados ECAES Ingeniería de Sistemas, Año 2004

Especialización en Estadística Aplicada Estadística Inferencial ¿Por qué es importante la distribución normal? Las propiedades que tiene la distribución normal son interesantes, pero todavía no hemos hablado de por qué es una distribución especialmente importante. La razón es que aunque una v.a. no posea distribución normal, ciertos estadísticos/estimadores calculados sobre muestras elegidas al azar es posible que posean una distribución normal. Es decir, tengan las distribución que tengan nuestros datos, los ‘objetos’ que resumen la información de una muestra, posiblemente pueden tener distribución normal (o una distribución asociada).

Especialización en Estadística Aplicada Estadística Inferencial La distribución de la Media Aritmética Muestral Como ilustración mostramos una variable que presenta valores distribuidos más o menos uniformemente sobre el intervalo 150-190. Como es de esperar la media es cercana a 170. El histograma no se parece en nada a una distribución normal con la misma media y desviación estándar.

Especialización en Estadística Aplicada Estadística Inferencial La distribución de la Media Aritmética Muestral A continuación elegimos aleatoriamente grupos de 10 observaciones de las anteriores y calculamos el promedio. Para cada grupo de 10 obtenemos entonces una nueva medición, que vamos a llamar promedio muestral. Observemos que las nuevas cantidades están más o menos cerca de la media de la variable original. Repitamos el proceso un número elevado de veces. En la siguiente transparencia estudiamos la distribución de la nueva variable. Muestra 1ª 2ª 3ª 185 190 179 174 169 163 167 170 160 159 152 172 178 183 175 188 155 165 … 173 169 168

Especialización en Estadística Aplicada Estadística Inferencial La distribución de la Media Aritmética Muestral La distribución de los promedios muestrales tiene distribución aproximadamente normal. La media de esta nueva variable (promedio de la distribución muestral) es muy parecida a la de la variable original. Las observaciones de la nueva variable están menos dispersas. (Observar el rango). La desviación estándar es aproximadamente ‘raiz de 10’ veces más pequeña. Llamamos error estándar a la desviación estándar de esta nueva variable. …

Especialización en Estadística Aplicada Estadística Inferencial Teorema del Límite Central Dada una v.a. cualquiera, si extraemos muestras de tamaño n, y calculamos los promedios muestrales, entonces: dichos promedios tienen distribución aproximadamente normal; La media de los promedios muestrales es la misma que la de la variable original. La desviación estándar de los promedios disminuye en un factor “raíz de n” (error estándar). Las aproximaciones anteriores se hacen exactas cuando n tiende a infinito.

Especialización en Estadística Aplicada Estadística Inferencial Teorema del Límite Central A medida que n aumenta, la distribución de la media se aproxima más a la normal

Especialización en Estadística Aplicada Estadística Inferencial Distribuciones asociadas a la Normal Al hacer inferencia estadística, la distribución normal aparece de forma casi inevitable. Dependiendo del problema, podemos encontrar otras (asociadas): X2 (chi cuadrado) t - student F de Fisher Estas distribuciones resultan directamente de operar con distribuciones normales. Típicamente aparecen como distribuciones de ciertos estadísticos.

Especialización en Estadística Aplicada Estadística Inferencial La distribución chi cuadrado Tiene un sólo parámetro denominado grados de libertad. La función de densidad es asimétrica positiva. Sólo tienen densidad los valores positivos. La función de densidad se hace más simétrica incluso casi gausiana cuando aumenta el número de grados de libertad. Consideraremos atípicos aquellos valores de la variable de la “cola de la derecha”. …

Especialización en Estadística Aplicada Estadística Inferencial La distribución t - student Tiene un parámetro denominado grados de libertad. Cuando aumentan los grados de libertad, más se acerca a N(0,1). Es simétrica con respecto al cero. Se consideran valores atípicos los que se alejan de cero (positivos o negativos). …

Especialización en Estadística Aplicada Estadística Inferencial La distribución Fisher Tiene dos parámetros denominados grados de libertad. Sólo toma valores positivos. Es asimétrica positiva. Se consideran valores atípicos los de la cola de la derecha. …

Estimación Por intervalos La UFPS soy yo, eres tú, somos todos

Especialización en Estadística Aplicada Estadística Inferencial Estimación por Intervalo Una muestra aleatoria de una densidad Dos estadísticas y que satisfacen Tal que Entonces, el intervalo aleatorio: se llama un intervalo de confianza para

Especialización en Estadística Aplicada Estadística Inferencial Estimación por Intervalo Alrededor del estimador se construye un intervalo dentro del cual se afirma que está el parámetro, con una cierta probabilidad Nivel de confianza: (1-α) Probabilidad de que el parámetro esté dentro del intervalo construido alrededor del estimador

Especialización en Estadística Aplicada Estadística Inferencial Nivel de Confianza 1 - α

Especialización en Estadística Aplicada Estadística Inferencial Intervalo de Confianza para estimar la Media Aritmética Poblacional: µ (σ conocida) Confiabilidad (1-α) Intervalo de Confianza: Si el tamaño de la población es muy grande o no se conoce o el muestreo se realiza con reposición:

Especialización en Estadística Aplicada Estadística Inferencial Intervalo de Confianza para estimar la Media Aritmética Poblacional: µ (σ desconocida) Confiabilidad (1-α) Intervalo de Confianza: Si el tamaño de la población es muy grande o no se conoce o el muestreo se realiza con reposición:

Especialización en Estadística Aplicada Estadística Inferencial Ejemplo 1 Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión). 2 5 6 8 8 9 9 10 11 11 11 13 13 14 14 14 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 18 18 18 19 19 19 19 19 19 19 19 20 20 Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con varianza poblacional desconocida.

Especialización en Estadística Aplicada Estadística Inferencial Ejemplo 1 Como σ2 es desconocido, lo estimamos por S2=18,7. Luego, un intervalo de confianza aproximado es: En consecuencia, el intervalo de confianza para µ es (13,2 , 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.

Especialización en Estadística Aplicada Estadística Inferencial Ejemplo 2 Una muestra de ocho cigarrillos de cierta marca, arroja los siguientes contenidos de alquitrán: 20, 17, 21, 19, 22, 21, 20 y 16 mg. Se desea estimar el contenido promedio de alquitrán en los cigarrillos de esta marca, con una confiabilidad de 95%

Especialización en Estadística Aplicada Estadística Inferencial Ejemplo 2

Especialización en Estadística Aplicada Estadística Inferencial Estimación de la diferencia entre dos promedios Intervalo para µ1-µ2; σ12, σ22 conocidas Intervalo para µ1-µ2; σ12=σ22 desconocidas (poblaciones normales)

Especialización en Estadística Aplicada Estadística Inferencial Estimación de la diferencia entre dos promedios Intervalo para µ1-µ2 σ12≠σ22 desconocidas (poblaciones normales)

Especialización en Estadística Aplicada Estadística Inferencial Ejemplo 3 Los siguientes datos corresponden a los resultados en una prueba diagnóstica de una muestra de estudiantes de los cursos 7ºA y 7ºB 7ºA: 83, 64, 87, 75 7ºB: 78, 86, 85, 68, 89, 94 Estime la diferencia entre los promedios para ambos grupos

Especialización en Estadística Aplicada Estadística Inferencial Observaciones pareadas Cada unidad experimental tiene un par de observaciones, una para cada población

Especialización en Estadística Aplicada Estadística Inferencial Ejemplo 4 Un proyecto de investigación pretende establecer el avance de los estudiantes en manejo de operaciones matemáticas básicas. Para ello se seleccionan 12 estudiantes de 4º grado, se les aplica una prueba diagnóstica y los resultados se comparan con los obtenidos en una prueba similar aplicada al final.

Especialización en Estadística Aplicada Estadística Inferencial Ejemplo 4 Los resultados fueron: Ini 34 25 35 27 31 33 28 29 Fin 38 42 44 36 30 24 40

Especialización en Estadística Aplicada Estadística Inferencial Estimación de una proporción Un estimador puntual de la proporción P en un experimento binomial es p=x/n, donde x es el número de éxitos en n ensayos Intervalo de confianza para estimar P de una muestra grande

Especialización en Estadística Aplicada Estadística Inferencial Estimación de la diferencia entre dos proporciones

Especialización en Estadística Aplicada Estadística Inferencial Estimación de la varianza

Especialización en Estadística Aplicada Estadística Inferencial Estimación de la razón de dos varianzas

Especialización en Estadística Aplicada Estadística Inferencial Tamaño de la muestra (n) Es la decisión mas importante que se debe tomar en una investigación por muestreo. Una muestra debe ser pequeña a un costo bajo y bastante grande para que el error de muestreo sea admisible. Algunos creen que el tamaño de la muestra crece indefinidamente a medida que aumenta el tamaño poblacional pero eso no es cierto, ya que existe un punto en el cual el tamaño de la muestra permanece constante, así el tamaño poblacional aumente.

Especialización en Estadística Aplicada Estadística Inferencial Tamaño de la muestra (n) En el calculo del tamaño óptimo se debe tener en cuenta los siguientes componentes: El error máximo admisible. El nivel de confianza. El error de muestreo. El error de no-muestreo. La varianza, grado de variabilidad de la característica principal.

Especialización en Estadística Aplicada Estadística Inferencial Error de Muestreo Es la diferencia entre el valor poblacional (Parámetro) y la estimación misma (Estadística) obtenida por medio de una muestra aleatoria. El tamaño óptimo solo se puede conseguir a partir del conocimiento de la población (variabilidad); se debe prefijar el error máximo admisible que representa la precisión mínima a exigir de los resultados y el coeficiente de seguridad ó confianza.

Especialización en Estadística Aplicada Estadística Inferencial Error no de muestreo Son los errores ajenos al muestreo que no se pueden medir, se consideran como el resultado de instrumentos de medición incorrectos o mal aplicados, cuestionarios mal definidos, errores que comete el entrevistador al efectuar las preguntas o al interpretar las respuestas, preguntas vagas o ambiguas, en otros casos son una mala planeación del trabajo de campo y falta de definición en los estándares de calidad del trabajo de campo.

Especialización en Estadística Aplicada Estadística Inferencial Fuentes potenciales de error Estimación de la varianza Población Carencia de Marco de Muestreo Poblaciones con características Heterogéneas, alta variabilidad.

Especialización en Estadística Aplicada Estadística Inferencial Error total Variación entre el valor real de la medida en la población de la variable que se estudia y el valor de la medida observada en la investigación.

Especialización en Estadística Aplicada Estadística Inferencial Tamaño de muestra para estimar la media aritmética Cuando se conoce el tamaño poblacional Cuando el tamaño de la población es desconocido

Especialización en Estadística Aplicada Estadística Inferencial Tamaño de muestra para estimar la media aritmética Para obtener una estimación inicial de la desviación estándar se puede recurrir a cualesquiera de las siguientes tres alternativas: Usar la desviación estándar obtenida en un estudio anterior Estimar inicialmente la desviación estándar a partir de una muestra piloto Asumir inicialmente: S=Rango/4 , esto es, asumir que la desviación estándar es aproximadamente igual a la cuarta parte del rango de los datos

Especialización en Estadística Aplicada Estadística Inferencial Tamaño de muestra para estimar la proporción Cuando se conoce el tamaño poblacional Cuando el tamaño de la población es desconocido

Especialización en Estadística Aplicada Estadística Inferencial Tamaño de muestra para estimar la proporción Para obtener una estimación inicial de la proporción se puede recurrir a cualesquiera de las siguientes tres alternativas: Usar la proporción obtenida en un estudio anterior Estimar inicialmente la proporción a partir de una muestra piloto Asumir inicialmente: P=0.5 , esto es, asumir que la proporción, o probabilidad de observar el suceso, es del 50%. Con este supuesto se obtiene el máximo valor de p(1-p), lo cual garantiza que se toma una muestra de tamaño ligeramente mayor de lo necesario.

Prueba de Hipótesis La UFPS soy yo, eres tú, somos todos

Especialización en Estadística Aplicada Estadística Inferencial Hipótesis ¿Qué son las Hipótesis? Son conjeturas lógicas acerca de la solución de un problema. Son explicaciones tentativas del fenómeno investigado formuladas a manera de proposiciones. Nos indican lo que estamos buscando o tratando de probar.

Especialización en Estadística Aplicada Estadística Inferencial Hipótesis ¿Qué características debe tener una hipótesis? Las hipótesis deben referirse a una situación real. La relación entre las variables debe de ser clara y verosímil. Deben ser medibles y observables. Deben estar relacionadas con técnicas disponibles para probarlas.

Especialización en Estadística Aplicada Estadística Inferencial Hipótesis Las hipótesis pueden ser o no verdaderas. Por eso están sujetas a comprobación. Son proposiciones tentativas acerca de las relaciones entre dos o más variables y se apoyan en conocimientos organizados y sistematizados Una investigación puede tener una, dos o varias hipótesis; como también no tenerla.

Especialización en Estadística Aplicada Estadística Inferencial Hipótesis Hipótesis: Afirmación o conjetura acerca de una o más poblaciones Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla El rechazo implica que la evidencia de la muestra refuta la hipótesis

Especialización en Estadística Aplicada Estadística Inferencial Tipos de Hipótesis Hipótesis Nula (H0): Es la hipótesis que se desea probar. Se formula para indicar la estructura de la población Hipótesis Alternativa (H1): Es la hipótesis que se acepta en caso de rechazar H0

Especialización en Estadística Aplicada Estadística Inferencial Formulación de Hipótesis Partes de una Hipótesis Variable 1 y variable 2 o variable independiente y variable dependiente. Unidad de análisis. Conectores lógicos

Especialización en Estadística Aplicada Estadística Inferencial Formulación de Hipótesis ¿Qué tipos de hipótesis hay? Hipótesis de Investigación. Hipótesis nula. Hipótesis alternativas. Hipótesis “estadísticas”.

Especialización en Estadística Aplicada Estadística Inferencial Formulación de Hipótesis Hipótesis de Investigación (Hi) Hipótesis descriptiva del valor de una variable o variables. Hipótesis de asociación Hipótesis Correlacionales Hipótesis que establecen relaciones de causalidad Hipótesis de la diferencia entre grupos

Especialización en Estadística Aplicada Estadística Inferencial Formulación de Hipótesis Hipótesis Nula (H0) Sirven para refutar o negar lo que afirma la hipótesis de investigación. Hay tantos tipos de hipótesis nulas como de investigación. Establecen que no existe diferencia entre el valor del parámetro y el valor supuesto a investigar.

Especialización en Estadística Aplicada Estadística Inferencial Formulación de Hipótesis Hipótesis alternativas (Ha o H1) Son posibilidades “alternas” ante las hipótesis de investigación y nula. Pueden ser más de una. Son las hipótesis que se aceptan en caso de rechazar la hipótesis nula

Especialización en Estadística Aplicada Estadística Inferencial Formulación de Hipótesis Hipótesis “Estadísticas”. Son las transformaciones de las hipótesis de investigación, nulas y alternativas en símbolos estadísticos. • Del valor de una variable • De asociación. • De correlación. • De relaciones causales. • De diferencia de grupos.

Especialización en Estadística Aplicada Estadística Inferencial Prueba de Hipótesis Prueba Estadística: Con base en el resultado de una muestra se acepta o se rechaza la hipótesis nula Errores Error tipo I: Rechazar afirmaciones (H0) verdaderas Error tipo II: Aceptar afirmaciones (H1) falsas

Prueba de Hipótesis Estado de la Naturaleza Decisión Aceptar Ho Especialización en Estadística Aplicada Estadística Inferencial Prueba de Hipótesis Estado de la Naturaleza Decisión Aceptar Ho Rechazar Ho Ho verdadera Decisión correcta Error tipo I Ho falsa Error tipo II

Especialización en Estadística Aplicada Estadística Inferencial Prueba de Hipótesis Nivel de Significación (α): Probabilidad de rechazar una hipótesis nula verdadera Potencia de la prueba (1-β): Probabilidad de rechazar H0 dado que H1 es verdadera α = P(E.T.I) β = p(E.T.II) Valor p: Nivel más bajo (de significación) en el cual el valor observado del estadístico de prueba es significativo

Especialización en Estadística Aplicada Estadística Inferencial Proceso para Prueba de Hipótesis Establecer H0: θ = θ0 Seleccionar H1: H1: θ ≠ θ0 ; H1: θ < θ0 ; H1: θ > θ0 Seleccionar el nivel de significación: α Seleccionar el estadístico de prueba apropiado y establecer la región crítica Calcular el valor del estadístico de prueba con los datos muestrales Tomar la decisión

Especialización en Estadística Aplicada Estadística Inferencial Razonamiento Básico Si supongo que H0 es cierta... ¿qué hace un científico cuando su teoría no coincide con sus predicciones? ... el resultado del experimento sería improbable. Sin embargo ocurrió.

Especialización en Estadística Aplicada Estadística Inferencial Razonamiento Básico Si supongo que H0 es cierta... Rechazo que H0 sea cierta. ... el resultado del experimento sería improbable. Sin embargo ocurrió.

Especialización en Estadística Aplicada Estadística Inferencial Razonamiento Básico No hay evidencia contra H0 No se rechaza H0 El experimento no es concluyente El contraste no es significativo Si supongo que H0 es cierta... ¿Si una teoría hace predicciones con éxito, queda probado que es cierta? ... el resultado del experimento es coherente.

Especialización en Estadística Aplicada Estadística Inferencial Región crítica y nivel de significación Región crítica Valores ‘improbables’ si... Es conocida antes de realizar el experimento: resultados experimentales que refutarían H0 Nivel de significación: a Número pequeño: 1% , 5% Fijado de antemano por el investigador Es la probabilidad de rechazar H0 cuando es cierta a=5% Reg. Crit. Reg. Crit. No rechazo H0 H0: m=40

Especialización en Estadística Aplicada Estadística Inferencial Contrastes unilateral y bilateral La posición de la región crítica depende de la hipótesis alternativa Bilateral H1: m¹40 Unilateral Unilateral H1: m<40 H1: m>40

Especialización en Estadística Aplicada Estadística Inferencial Significación p a H0: m=40

Especialización en Estadística Aplicada Estadística Inferencial Significación p No se rechaza H0: m=40 a H0: m=40

Especialización en Estadística Aplicada Estadística Inferencial Significación p Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida. p es conocido después de realizar el experimento aleatorio El contraste es no significativo cuando p>a P a No se rechaza H0: m=40 P a

Especialización en Estadística Aplicada Estadística Inferencial Significación p Se rechaza H0: m=40 Se acepta H1: m>40 a

Especialización en Estadística Aplicada Estadística Inferencial Significación p El contraste es estadísticamente significativo cuando p<a Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori. a P Se rechaza H0: m=40 Se acepta H1: m>40 a P