INTERVALO DE CONFIANZA

Slides:



Advertisements
Presentaciones similares
INFERENCIA ESTADÍSTICA
Advertisements

Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
INTERVALO DE CONFIANZA
Presentado por Karina Yuliet Preciado Mosquera Estadística II.
T – Student teoria de las muestras pequeñas Paola Andrea Palacio Montero Estadística.
PRINCIPIOS DE ESTADÍSTICAS INFERENCIALES PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS.
INACS / PG1 Curso Estadística y Diseño de Análisis de Experimentos Dr. Porfirio Gutiérrez González Correo:
@ Angel Prieto BenitoMatemáticas 2º Bachillerato CS1 INFERENCIA ESTADÍSTICA U.D. 14 * 2º BCS.
Estimación e intervalos de confianza. Estimaciones puntuales e intervalos de confianza Estimación puntual: Estadístico calculado a partir de la información.
República Bolivariana de Venezuela Instituto Universitario Politécnico “Santiago Mariño" Estadísticas I - OV Estadística Profesor : Bachiller: Pedro Beltrán.
ESTADÍSTICA Mercedes de la Oliva ESTADÍSTICA INFERENCIAL Teorema Central del límite Distribución de media y proporción muestral.
INFERENCIA ESTADÍSTICA
DISEÑO EXPERIMENTAL Ma44D Mayo 2006.
INFERENCIA ESTADÍSTICA
ESTADÍSTICAS INFERENCIALES
DISTRIBUCION F DE FISHER.
PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS
PRUEBAS DE BONDAD DE AJUSTE estas pruebas permiten verificar que la población de la cual proviene una muestra tiene una distribución especificada o supuesta.
Intervalos de Confianza
Qué es la Econometría No hay acuerdo en la definición ya que:
DISTRIBUCIONES EN EL MUESTREO
Inferencia estadística.
Bioestadística Inferencia estadística y tamaños de muestra para una y dos o más medias.
El modelo simple de regresión
Introducción al Muestreo Msc Edwin Giron Amaya
ESTADISTICA II UNIDAD I 3RA PARTE.
Análisis de Varianza Permite probar la significancia de las diferencias entre más de dos medias muestrales. Usando el análisis de varianza, se puede hacer.
Cálculo de la Muestra ¿De qué depende el tamaño muestral?
ESTADÍSTICA INFERENCIAL
ESTIMACION DEL TAMAÑO DE LA MUESTRA.
TEMA 6 : DISTRIBUCIONES ESTADÍSTICAS.
La precisión en las encuestas electorales
Distribuciones muestrales e Intervalos de Confianza
Estimación de parámetros: Estimación puntual y por intervalos
Distribución normal o de Gauss
GRÁFICOS EN ESTADÍSTICA
PRUEBA DE HIPÓTESIS DE MEDIAS DE UNA MUESTRA ÚNICA GRANDE
DISTRIBUCIÓN MUESTRAL DE UNA MEDIA.
Matemáticas 2º Bachillerato CS
Conceptos básicos de MUESTREO
CONTENIDO Teoría del muestreo ¿Cómo seleccionar una muestra?
Intervalos de confianza Muestras pequeñas
Aplicaciones Estadísticas a las Finanzas
COMPRENDES Y DESCRIBES LA VARIABILIDAD ESTADISTICA Y SUS APLICACIONES
ESTADÍSTICA BÁSICA.
Más allá de la regresión lineal de medias
Tamaño de muestra Ecología Marina. Una población se define como un conjunto de individuos de una especie que habita un área determinada. Los métodos disponibles.
ESTIMACIÓN (Inferencia Estadística) Intervalos de Confianza
VARIABLE ALEATORIA TIPIFICADA
Distribución en variable continua
TEMA 1.- INTRODUCCIÓN A LA INFERENCIA
TEMA 1.- INTRODUCCIÓN A LA INFERENCIA
Inferencia Estadística
Universidad Nacional del Litoral
METODOS PARA ANALISIS DE TALUDES
Estadística Administrativa II
Dr. Carlomagno Araya Alpízar
TEMA 3: MUESTREO Y ESTIMACIÓN
Elementos Básicos de Probabilidad y Estadística
DETERMINACIÓN DE LA MUESTRA Dr. Carlos Portocarrero Ramos Dr. Ambrosio Tomás Rojas.
ESTADISTICA DESCRIPTIVA
“Medidas de dispersión”
CARTA CONTROL DE MEDIAS INDIVIDUALES Y RANGOS MOVILES
ESTADISTICOS Y DISTRIBUCIONES MUESTRALES
BIOESTADISTICA I UNIDAD: INFERENCIA ESTADISTICA EJERCICIOS Y PROBLEMAS
Tamaño de la muestra. En una muestra probabilística cada individuo de la población a estudiar tiene una probabilidad conocida y no nula de ser seleccionado.
1 Estimación por Intervalo. 2 Hasta ahora los estimadores estudiados son puntuales, es decir, exhiben un valor como estimación del parámetro de interés.
ANALISIS DE REGRESION SIMPLE
REGRESION LINEAL SIMPLE
Transcripción de la presentación:

INTERVALO DE CONFIANZA PEDRO GODOY G.

INTERVALO DE CONFIANZA Un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada. La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota 1-  probabilidad de equivocarnos se llama nivel de significancia y se simboliza  Nótese que el nivel de confianza y la significancia son probabilidades de sucesos complementarios, por lo que ambas probabilidades suman 1.

Intervalo de confianza para µ con σ2 conocido Para construir un intervalo de confianza para µ, se puede comprobar que la Distribución Normal Estándar cumple:

Y al despejar µ en la desigualdad al interior de la probabilidad, se tiene Nótese que lo que se obtiene es un rango de valores en el que se encuentra µ con probabilidad 1-α=0.95. Es decir, el resultado es un intervalo de confianza al 95% para la media  cuando la variable x es normal y 2 conocido . Si no conocemos la varianza poblacional 2, podemos estimarla con la varianza muestral S2. Sin embargo, hay un aspecto teórico que necesitamos conocer antes de hacer esta sustitución: la distribución de probabilidad t de Student.

Por ejemplo, si n es suficiente -mente grande (n ≥ 30), los intervalos de confianza para µ toman la forma

Ejemplo : Distribución de los niveles de colesterol en sangre de todos los varones que son hipertensos y que fuman. Esta distribución es: aproximadamente normal, con una media desconocida:  = ?, y una desviación estándar  = 46 mg / 100 ml.

Ejemplo: En el caso de tomar una muestra tamaño 12 de la población de fumadores hipertensos y que además poseen un nivel medio de colesterol en sangre de x = 217 mg / 100 ml. El intervalo de confianza es de 95% para  es

Interpretación 2: en términos de frecuencia. Interpretación 1 Este intervalo contiene el valor de 211 mg /100 ml, el nivel medio de colesterol en la sangre de todos los hombres de 20 a 74 años de edad sin importar si son hipertensos o fumadores. Se está 95 % seguro de que los límites 191 y 243 cubren la verdadera media . Interpretación 2: en términos de frecuencia. Si se tomaran 100 muestras aleatorias de tamaño 12 de esta población y utilizaran cada muestra para construir un intervalo de confianza de 95 %, se espera que en promedio 95 de los intervalos cubrieran la verdadera media poblacional  = 211 y 5% no.

Para calcular un intervalo de confianza Intervalos de Confianza Para calcular un intervalo de confianza de 99% para . Con la misma muestra de 12 hipertensos, se encuentra que los límites son

Interpretación: Un 99% de confianza de este intervalo cubre el verdadero nivel medio de colesterol en sangre de la población. La amplitud de intervalo de confianza de 99% es de 251-183=68 mg/ 100 ml. Este intervalo es más amplio que el correspondiente intervalo de confianza de 95%.

Reflexionando en el sentido del tamaño muestral: ¿Qué dimensiones debe tener una muestra para que la amplitud del intervalo se reduzca a solo 20 mg/100 ml? Consideraciones: Ya que el intervalo se centra en la media de muestreo x=217 mg/ 100 ml, interesa el tamaño de la muestra necesario para generar el intervalo ]217-10, 217+10[ ó ]207, 227[ 𝑍 𝛼 × 𝜎 𝑛

Para determinar el tamaño n que se requiere de la muestra, se debe resolver la ecuación

Se necesita una muestra de 141 hombres para reducir la amplitud del intervalo de confianza de 99% a 20 mg/100 ml. Aunque la media de muestreo de 217 mg/100 ml se ubica en el centro del intervalo, no desempeña ningún papel en la determinación de su amplitud; la amplitud es función de , n y el nivel de confianza.

SELECCIÓN DEL TAMAÑO MUESTRAL Diseñar un experimento es en esencia un plan para adquirir cierta cantidad de información. Es lo mismo que comprar un TV, la calidad de el dependerá de la marca, donde se compra, como se hace e incluso a quien.

¿Cuántas mediciones deben incluirse en la muestra? ¿Cuánta información desea adquirir el investigador? La cantidad total de información de la muestra afectará la confiabilidad o bondad de las inferencias hechas por el investigador y es esta confiabilidad la que debe él especificar. En un problema de estimación estadística, la precisión de la estimación es medida por el margen de error o el ancho del intervalo de confianza. Como estas dos mediciones son una función del tamaño muestral, especificar la precisión determina el tamaño muestral necesario

2) La precisión que deseamos para nuestro estudio. Estimar una proporción: Si deseamos estimar una proporción, debemos saber: 1) El nivel de confianza o seguridad (1-  ). El nivel de confianza prefijado da lugar a un coeficiente (Z). Para una seguridad del 95% es 1.96, para una seguridad del 99% se usa 2.58. 2) La precisión que deseamos para nuestro estudio.

3) Una idea del valor aproximado del parámetro que queremos medir (en este caso una proporción). Esta idea se puede obtener revisando la literatura, por estudio pilotos previos. En caso de no tener dicha información utilizaremos el valor p = 0.5 (50%).

Ejemplo: ¿A cuantas personas tendríamos que estudiar para conocer la prevalencia de diabetes? Seguridad = 95% Precisión = 3%: Proporción esperada = asumamos que puede ser próxima al 5% si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p = 0,5 (50%) que maximiza el tamaño muestral:

donde: Za 2 = 1.962 (ya que la seguridad es del 95%) p = proporción esperada (en este caso 5% = 0.05) q = 1 – p (en este caso 1 – 0.05 = 0.95) d = precisión (en este caso deseamos un 3%) 𝑛= 1,96 2 ∙0,05∙0,95 0,03 2 =203

Si la población es finita, es decir conocemos el total de la población y deseásemos saber cuántos del total tendremos que estudiar la respuesta seria: 𝑛= 𝑁∙ 𝑍 𝛼 2 ∙𝑝∙𝑞 𝑑 2 ∙ 𝑁−1 + 𝑍 𝛼 2 ∙𝑝∙𝑞 donde: N = Total de la población Z2 = 1.962 (si la seguridad es del 95%) p = proporción esperada (en este caso 5% = 0.05) q = 1 – p (en este caso 1-0.05 = 0.95) d = precisión (en este caso deseamos un 3%).

¿A cuántas personas tendría que estudiar de una población de 15 ¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para conocer la prevalencia de diabetes? Seguridad = 95%; Precisión = 3 proporción esperada = asumamos que puede ser próxima al 5% ; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el tamaño muestral. 𝑛= 15.000∙ 1,96 2 ∙0,05∙0,95 0,03 2 ∙ 15.000−1 + 1,96 2 ∙0,05∙0,95 =200

Según diferentes seguridades el coeficiente de Z   varía, así: Si la seguridad Z fuese del 90% el coeficiente sería 1.645 Si la seguridad Z fuese del 95% el coeficiente sería 1.96 Si la seguridad Z   fuese del 97.5% el coeficiente sería 2.24 Si la seguridad Z   fuese del 99% el coeficiente sería 2.576

Estimar una media: Si deseamos estimar una media: debemos saber: El nivel de confianza o seguridad (1-  ). El nivel de confianza prefijado da lugar a un coeficiente (Z ). Para una seguridad del 95% = 1.96; para una seguridad del 99% = 2.58. La precisión con que se desea estimar el parámetro (2 d es la amplitud del intervalo de confianza). Una idea de la varianza S2 de la distribución de la variable cuantitativa que se supone existe en la población.

Ejemplo: Si deseamos conocer la media de la glucemia basal de una población, con una seguridad del 95 % y una precisión de ± 3 mg/dl y tenemos información por un estudio piloto o revisión bibliográfica que la varianza es de 250 mg/dl

Si la población es finita, como previamente se señaló, es decir conocemos el total de la población y desearíamos saber cuantos del total tendríamos que estudiar, la respuesta sería: