Estimacion de intervalos de confianza. PARAMETRO ESTIMADOR INTERVALO  El parámetro poblacional es frecuentemente un valor desconocido que solo puede.

Slides:



Advertisements
Presentaciones similares
INTERVALO DE CONFIANZA
Advertisements

ESTIMACION POR INTERVALOS
Estimación y contraste de hipótesis
INTERVALOS DE CONFIANZA
INTERVALO DE CONFIANZA
Intervalos de Confianza
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
LEONARDO LÓPEZ C. ECONOMIA ESTADISTICA COMPUTARIZADA PARALELO: 261.
ESTADÍSTICA II Ing. Danmelys Perozo MSc. Blog:
Distribuciones estadísticas 1.- Variable aleatoria discreta. 2.- Función de probabilidad de variable discreta. Propiedades 3.- Parámetros en distribuciones.
Las distribuciones de probabilidad son idealizaciones de los polígonos de frecuencias. En el caso de una variable estadística continua consideramos el.
PPTCEG049EM32-A16V1 Distribución normal EM-32. Recordemos… -¿Cómo se calcula el valor esperado para una determinada variable aleatoria? -¿Cómo es posible.
Bioestadística Distribuciones muestrales para variables cuantitativas.
PRUEBA DE HIPÓTESIS. 1. Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca.
REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA.
1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.
ESTADÍSTICA Mercedes de la Oliva ESTADÍSTICA INFERENCIAL Teorema Central del límite Distribución de media y proporción muestral.
Control estadístico de procesos. Francisco Javier Miranda González CAPÍTULO 5.
DISTRIBUCIONES DE Probabilidad
Valor que toma la variable aleatoria
Capitulo 3 Análisis descriptivo inferencial: comparaciones de muestras
TEMA 6: DISTRIBUCIONES ESTADÍTISCAS
ESTADÍSTICAS INFERENCIALES
Muestreo PRUEBAS Y VALIDACION DE HIPOTESIS Carlos Willian Rincón Pérez
ESTADISTICA APLICADA I UNIDAD: INFERENCIA ESTADISTICA
Curso de Elaboración de Pruebas Prof. Gerardo A. Valderrama M
Intervalos de Confianza
puede o no ser verdadero, relativo a una o más poblaciones.
7.1 Procedimientos paramétricos para datos cuantitativos
Continuación DE MCO.
“Bootstrap” Jaime Mojica Cuevas
INFERENCIA ESTADÍSTICA
ESTADÍSTICA II Ing. Danmelys Perozo MSc.
INFERENCIA ESTADÍSTICA PARA DOS POBLACIONES
Clase 8: Contraste de Hipótesis
CONCEPTOS BASICOS ESTADISTICA.-Conjunto de métodos que nos permiten tomar decisiones en momentos de incertidumbre (duda). Tiene como objetivo que la información.
CHI CUADRADO  2 OBJETIVOS –Describir situaciones donde es adecuado la utilización de la prueba de Chi Cuadrado (  2 ) –Formular Hipótesis para diferentes.
¿Cuándo usar esta distribución?
DISTRIBUCIÓN DE PROBABILIDAD PARA VARIABLES CONTÍNUAS.
Modelos de probabilidad Distribuciones continuas
Unidad 6. Capítulo IV. Puntos ordinarios y puntos singulares.
REGRESÍON LINEAL SIMPLE
Estimación de parámetros: Estimación puntual y por intervalos
puede o no ser verdadero, relativo a una o más poblaciones.
INTERVALO DE CONFIANZA
DISTRIBUCIÓN MUESTRAL DE UNA MEDIA.
“Formulación de Hipótesis Estadística”
Principios de Estadística
Kriging Consideremos información de determinada propiedad en el yacimiento y puntos en los cuales se tiene la estimación dea partir de los puntos.
Tamaño de muestra Ecología Marina. Una población se define como un conjunto de individuos de una especie que habita un área determinada. Los métodos disponibles.
La mayoría de las variables aleatorias que se presentan en los estudios relacionados con las ciencias sociales, físicas y biológicas, por ejemplo, el peso.
La mayoría de las variables aleatorias que se presentan en los estudios relacionados con las ciencias sociales, físicas y biológicas, por ejemplo, el peso.
ESTIMACIÓN (Inferencia Estadística) Intervalos de Confianza
Ensayo de Rendimiento DISTRIBUCIÓN DE ESTADÍSTICOS MUESTRALES.
ANALISIS DE VARIANZA
ICPM050 – ECONOMETRÍA tema 03: ESTIMACIÓN MODELO LINEAL SIMPLE
ESTADISTICA MEDIDAS DE DISPERSIÓN Cristian Gómez Coordinar Técnico Calidad Laboratorio Labsai.
Intervalos de confianza Muestras pequeñas
CONCEPTO DE ESTIMADOR ES UNA REGLA O MÉTODO QUE DICE COMO CALCULAR LA ESTIMACIÓN DE UN PARÁMETRO BASÁNDOSE EN LA INFORMACIÓN DE UNA MUESTRA, GENERALMENTE.
ESTADISTICOS Y DISTRIBUCIONES MUESTRALES
MEDIDAS DE DISPERSIÓN “Medidas de dispersión”. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Tamaño de muestra.
Tema 5: Distribuciones continuas. Recordamos que una variable aleatoria continua es una variable cuyo valor no puede predecirse con exactitud (aunque.
1 Estimación por Intervalo. 2 Hasta ahora los estimadores estudiados son puntuales, es decir, exhiben un valor como estimación del parámetro de interés.
1 Afectados de cierto grado de INCERTIDUMBRE SIEMPRE HAY UN ERROR EN SU MEDIDA ESTABLECER LA FIABILIDAD DE LOS DATOS ¿Podemos evaluar la magnitud del error.
ESTADÍSTICA APLICADA  ZEUS DE JESÚS RODRÍGUEZ BUDA  GABRIELA MÁRQUEZ TORRES  MARÍA ENRIQUETA GIL CÓRDOVA  ELIÁN ANTONIO GONZALEZ GARCÍA  CRISTELL.
Prueba de Hipótesis Concepto Asignar Probabilidades de ocurrencia a un evento basado en la suposición (hipótesis) de un evento o distribución.
Distribución Normal. La Normal Estándar El modelo normal estándar es el de una variable aleatoria continua cuya imagen son todos los números reales.
Transcripción de la presentación:

Estimacion de intervalos de confianza

PARAMETRO ESTIMADOR INTERVALO  El parámetro poblacional es frecuentemente un valor desconocido que solo puede ser estimado usando los datas obtenidos de una Muestra.  De ahí que resulta necesario determinar con cierto grado de certeza cual puede ser el verdadero parámetro. 3.1 Definicion de estimador y estimacion

Estimación de Parámetros Parámetros poblacionales y Estadísticos Muestrales Datos (Población de Interés) Muestras Parámetros: Media (  ) Varianza(  2 ) Desv. Est. (  ) Etc. Estadísticos: Promedio ( ) Varianza muestral(S 2 ) Desv. Est. muestral(S) Etc. Inferencias MuestreoX

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Estimador: La media muestral ( ) X Población de interés : El conjunto de datos obtenidos al lanzar un dado legal en diversas ocasiones Parámetro de interés : La media (µ) de la población Experimento aleatorio : Lanzar un dado Variable aleatoria X= número obtenido en la cara superior Espacio muestral = {1, 2, 3, 4, 5, 6} Distribución de la variable aleatoria X: Uniforme Media teórica: µ=3.5

Estimación de Parámetros Ejemplo: Estimación de la media de una población Estimador: La media muestral ( ) que se calcula a partir de una muestra de N datos como sigue: X Parámetro que se pretende estimar : La media de la población ( µ ) que en general no se conoce, no se puede conocer, o se conoce sólo un valor teórico: El estimador (en el ejemplo la media muestral) puede tomar diferentes valores (aleatorios) dependiendo de la muestra (aleatoria) considerada, es decir, el estimador es una variable aleatoria Es natural preguntarse : ¿Cuál será la distribución de probabilidad del estimador? De hecho ¿cuáles serán sus parámetros? ¿tendrán que ver con los de la población?

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Distribución de la variable aleatoria (X) del experimento Función de Probabilidad: f(x) = P(X=x) x f(x)1/61/61/61/61/61/ x f(x) Función de Probabilidad

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Distribución del estadístico. Muestra x1x1x1x1 x2x2x2x2 x3x3x3x3 x4x4x4x4 x5x5x5x5 x6x6x6x6 x7x7x7x7 x8x8x8x8 x9x9x9x9 x X X X Cada muestra puede considerarse como:  10 valores de la variable aleatoria X,  1 sólo valor para 10 variables aleatorias X 1,X 2,...,X 10 Diferentes cálculos de para N=10:

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Distribución del estadístico. X X Si obtenemos 1000 muestras, obtendremos 1000 valores de, para estos 1000 valores realizamos el histograma: X frecuencia relativa Distribución de la media muestral

Estimación de Parámetros En general: un estadístico que pretende estimar un parámetro  es una v. a. Que depende de las N variables aleatorias que forman una muestra, es decir ^ ^ = f(X 1,X 2,...,X N ) Así, una muestra es un conjunto de valores (x 1,x 2,...,x N ) tomados por las variables aleatorias (X 1,X 2,...,X N ). ^^^ Es natural suponer que la distribución f(X i )=P(X i =x i ) de cada variable de la muestra es igual a la de la población Sin embargo, la distribución f( ) = P( = ) del estadístico como se vió en el ejemplo del dado es otra cosa.

3.1 Definicion  Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la muestra, que posiblemente incluya el valor de un parámetro de población desconocido.  Debido a su naturaleza aleatoria, es poco probable que dos muestras de una población en particular produzcan intervalos de confianza idénticos. Sin embargo, si usted repitiera muchas veces su muestra, un determinado porcentaje de los intervalos de confianza resultantes incluiría el parámetro de población desconocido.

Definición  Se llama intervalo de confianza en estadística a un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa por 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.estadísticaintervalomuestraparámetro poblacionalerror aleatorio  Wikipedia ???

Intervalo de confianza

Estimación de Intervalos En la explicación previa, un estimador produce un valor que pretende aproximar a un parámetro . A este enfoque se le llama estimación puntual ^ En el enfoque de estimación de intervalos, para un parámetro  no se estima un valor, sino un intervalo de la forma l   u, donde los valores extremos l, u dependen del valor numérico del estadístico para una muestra en particular y de la distribución de muestreo de ^ ^ ^ Es decir, l,u dependen de la muestra, por lo tanto son valores de variables aleatorias L, U

Estimación de Intervalos Partiendo de la distribución de muestreo para, es posible determinar valores de L,U tales que se cumpla lo siguiente: P(L    U) =1 –  Donde 0 <  < 1 Es decir, se puede garantizar con una probabilidad de 1-  que la muestra elegida contendrá el valor verdadero de  ^ Al intervalo resultante l    u se le conoce como el intervalo de confianza del 100(1–  para el parámetro desconocido 

Estimación de Intervalos Ejemplo: Construcción repetida de un intervalo de confianza para la media  Si los intervalos de confianza mostrados son del 95% significa que si se construye un gran número de ellos, el 95% de ellos contendrá a la media 

Estimación de Intervalos En la práctica se obtiene solamente una muestra y se calcula con ella un intervalo de confianza dicho intervalo contiene o no contiene a , no es razonable asignar una probabilidad a este evento. La proposición a decuada es que el intervalo contiene a  “con una confianza” del 95% La longitud del intervalo de confianza (u-l) es una medida de la calidad de la información obtenida en la muestra, al semi intervalo u- , o  -l se le llama Precisión del estimador. ¿Qué significado tiene un intervalo grande? ¿És deseable que sea grande o que sea pequeño? ¿Qué relación tiene con el valor de 1-  ?

Estimación de Intervalos Intervalo para la Media (Varianza conocida) Situación: Se tiene una población con media desconocida , pero se supone conocida la varianza  2. Se toma una muestra aleatoria (X 1,X 2,...,X N ). Con esta muestra se calcula el estadístico el cual es un estimador puntual insesgado para la media  desconocida. Se puede obtener un intervalo de confianza del 100(1-  ) % para  si consideramos los siguientes hechos acerca de la distribución de : X X

Intervalo para la media Intervalo para la Media (Varianza conocida) 1. Si la población es Normal, la distribución de es Normal 2. Si la población no es Normal, el Teorema del límite central nos garantiza una distribución de aproximadamente normal cuando N  3. La media de es  ( es insesgado) 4. La varianza de es  2 /N Teorema del Límite Central: Afirma que la media muestral tiene una distribución Normal aunque la población original no la tenga, siempre y cuando la muestra sea muy grande (de manera práctica N>30) X X X X X

Intervalo para la media Intervalo para la Media (Varianza conocida) De acuerdo a lo anterior, podemos suponer que la variable Tiene una distribución N(0,1) de la figura: P{-z  /2  Z  z  /2 }=1- . Con lo cual el intervalo de confianza del 100(1-  )% para la media es -z  /2 z  /2 Z  /2  /2

Intervalo para la media Intervalo para la Media (Varianza conocida) Ejemplo: Los siguientes son datos de conductividad térmica de cierto tipo de hierro (en BTU/hr-ft-°F): Una estimación puntual para la media, es = Hallar un intervalo de confianza del 95 % y uno del 99% para la media. Se supone que la población tiene una distribución Normal con  =0.3 Usamos la expresión para encontrar el intervalo de confianza para la media: Usando Matlab para calcular z  /2 = norminv(0.025,0,1) l = (0.3)/  10 = , u = (0.3)/  10 = Entonces el intervalo de confianza del 95% es    Y la longitud de este intervalo es 3.92  /  N X

Intervalo para la media Intervalo para la Media (Varianza conocida) Selección del tamaño de la muestra: La precisión del intervalo de confianza es z  /2  /  N esto significa que al usar para estimar , el error de estimación, dado por E=| -  | es menor o igual que z  /2  /  N, con una confianza de 100(1-  )%. El problema inverso consiste en calcular N para obtener un error E con una confianza del 100(1-  )% previamente especificado: N 1/2 = z  /2  /E X X Ejercicio: Calcular el tamaño adecuado de la muestra para lograr que el error de estimación de conductividad del hierro sea menor de 0.05 Btu/hr-ft-°F con una confianza del 95%

Intervalo para la media Intervalo para la Media (Varianza desconocida) Si no se conoce la varianza  2 de la población, una posibilidad es utilizar la varianza muestral S 2 en las ecuaciones obtenidas para estimar intervalos en el caso de varianza conocida Este procedimiento funciona para muestras grandes (N>30), por ello los intervalos de confianza anteriores se les suele llamar intervalos de confianza para muestras grandes. Si las muestras son pequeñas el enfoque anterior no funciona y para lograr un procedimiento válido se supondrá que la población tiene una distribución Normal

Intervalo para la media Intervalo para la Media (Varianza desconocida) Si la población es Normal, la siguiente estadística Tiene una distribución t con N-1 grados de libertad -t  /2,N-1 t  /2,N-1 T  /2  /2

Intervalo para la media Intervalo para la Media (Varianza desconocida) de la figura: P{-t  /2,N-1  T  t  /2,N-1 }=1- . Con lo cual el intervalo de confianza del 100(1-  )% para la media es -t  /2,N-1 t  /2,N-1 T  /2  /2 Ejercicio: Repetir el ejemplo de la conductividad del hierro suponiendo que no se conoce la varianza

Intervalo para la Varianza Intervalo para la Varianza de una distribución Normal Si la Población es Normal, la distribución muestral del estadístico siguiente Donde S 2 es la varianza muestral usada como estimador puntual de  2 Es de tipo Ji-cuadrada con N-1 grados de libertad 0  2  /2,N-1  2  /2,N-1 X  /2  /2

Intervalo para la Varianza Intervalo para la Varianza de una distribución Normal De acuerdo a la figura, P(  2 1-  /2,N-1  X   2  /2,N-1 ) = 1-  Por lo tanto, el intervalo de confianza del 100(1-  )% buscado para la varianza es 0  2  /2,N-1  2  /2,N-1 X  /2  /2 Ejercicio: Hallar el intervalo de confianza del 95% para la varianza en el ejemplo de la conductividad del hierro

Intervalo para la Varianza Intervalo para la Varianza de una distribución Normal Intervalos de confianza unilaterales.- En el caso de la varianza es más común buscar cotas inferiores o superiores que ambas a la vez Intervalo de confianza inferior.- Se obtiene reemplazando el límite superior por  y  2   /2,N-1 por  2 ,N-1, obteniendo: Intervalo de confianza superior.- En forma similar, se reemplaza el límite inferior por 0 y  2  /2,N-1 por  2 ,N-1, obteniendo:

Intervalo para la Varianza Intervalo para la Varianza de una distribución Normal Ejercicio: Un fabricante de detergente líquido está interesado en la efectividad de su proceso para llenar envases de detergente. La norma dice que no se debe tener una desviación estándar  en el proceso mayor de 0.15, ya que de lo contrario habrá envases más vacíos de lo permitido. Se toma una muestra aleatoria de 20 envases y se obtiene una varianza muestral s 2 = onzas 2. ¿Es esta medición una evidencia de que se está cumpliendo la norma con una confianza del 95% ? Sugerencia: se puede usar la función chi2inv

Otros intervalos de Confianza Intervalo de confianza para una Proporción Se toma una muestra de tamaño N de una población muy grande y resulta que X datos de la muestra pertenecen a alguna clase de interés. Entonces un estimador puntual de la proporción p de los datos de la población que pertenecen a la clase en cuestión es: Nótese que N y p son los parámetros de una distribución binomial La distribución de muestreo de se puede considerar aproximadamente Normal con media p y varianza p(1-p)/N, siempre que p no esté muy cerca de 0 o de 1 y si N es relativamente grande P^ P=X/N^

Otros intervalos de Confianza Intervalo de confianza para una Proporción De lo anterior, la distribución de la variable Es aproximadamente N(0,1) Entonces, partiendo de P{-z  /2  Z  z  /2 }=1-  Obtenemos el siguiente intervalo de confianza aproximado del 100(1-  )% para la proporción p de la población que pertenece a la clase dada:

Otros intervalos de Confianza Intervalo de confianza para una Proporción Ejemplo: De 1000 casos de cáncer pulmonar seleccionados al azar, 823 son de pacientes que fallecieron. Construya un intervalo de confianza del 95% para la tasa de mortalidad del cáncer pulmonar Solución: La tasa de mortalidad es la proporción de los que mueren a los que contraen el cáncer pulmonar, de la muestra tenemos que = Por otro lado z =1.96, entonces: Es decir,  p  p^

Otros intervalos de Confianza Intervalo de confianza para el cociente de varianzas de dos distribuciones Normales Situación: Se tienen dos poblaciones normales e independientes con varianzas desconocidas  1 2,  2 2 respectivamente. Se tienen disponibles dos muestras aleatorias de tamaños N 1, N 2 una de cada población respectivamente. Sean S 1 2 S 2 2 las varianzas muestrales respectivas. Se busca un intervalo de confianza del 100(1-  )% del cociente de varianzas  1 2 /  2 2 Para hallar el intervalo de confianza se debe recordar que la distribución de muestreo del estadístico siguiente Es de tipo F con N 2 -1 y N 1 -1 grados de libertad en el numerador y denominador respectivamente. (Ver la figura siguiente)

Otros intervalos de Confianza Intervalo de confianza para el cociente de varianzas de dos distribuciones Normales Así, de la figura: P{f  /2,N2-1,N1-1  F  f  /2,N2-1,N1-1 }=1-  Por lo tanto, el intervalo de confianza buscado es: 0 f  /2,N2-1,N1-1 f  /2,N2-1,N1-1 F  /2  /2

Otros intervalos de Confianza Intervalo de confianza para el cociente de varianzas de dos distribuciones Normales Ejemplo: Una compañía fabrica piezas para turbinas. Tiene dos procesos distintos para hacer el esmerilado de las piezas y ambos procesos producen terminados con la misma rugosidad promedio. El ingeniero del proceso desea seleccionar el proceso con la menor variabilidad en la rugosidad de la superficie. Para ello toma una muestra de 12 piezas del primer proceso, obteniendo una desviación estándar muestral s 1 = 5.1 micropulgadas, luego toma una muestra de 15 piezas del segundo proceso, obteniendo s 2 = 4.7. ¿Puede elegir el primer poceso con una confianza del 90% de tener menor variabilidad en la rugosidad? Solución: Suponiendo que los dos procesos son Normales e independientes. Usando la función finv de Matlab, obtenemos f 0.95 = y f 0.05 =0.3898, por lo tanto, Haciendo operaciones:  Como el intervalo incluye la unidad, no se puede concluir que los procesos tengan variabilidad sgnificativamente diferente con una confianza del 90%

Otros intervalos de Confianza Resumen de intervalos de confianza Parámetros de interés Suposiciones La media  Dist. Muestral Normal (o N grande)  2 conocida  2 desconocida (Dist. Muestral T) La varianza  2 Dist. Normal (Dist. Muestral Ji 2 ) Proporción p Dist. Muest. Normal (N grande, p alejado de 0 y de 1) Cociente de varianzas   2 /   2 Dos poblaciones Normales e independientes (Dist. Muestral tipo F) Diferencia de medias     Distribuciones normales,   2 y   2 conocidas   2 =   2 desconocidas (Dist muest T)   2    2 desconocidas (Dist muest T) Diferencia entre dos proporciones p 1 -p 2 Dist. Muestral Normal (N 1 y N 2 grandes, p 1 y p 2 alejados de 0 y de 1) Otras... (Ver libros de estadística)

Intervalos de Tolerancia Concepto En ocasiones no nos interesa estimar algún parámetro, sino establecer un rango en donde se puede esperar que caigan observaciones (datos) individuales en un proceso. La respuesta es muy sencilla si se conoce la distribución y los parámetros de la población, por ejemplo, si se obtuvo una muestra aleatoria de una población Normal con media  y varianza  2 conocidas, se esperará que el 95% de los datos caerán entre los límites   1.96  A este intervalo se le llama intervalo de tolerancia y si  y  son conocidos la cobertura del 95% es exacta

Intervalos de Tolerancia Concepto Si  y  son desconocidos a veces se puede determinar una constante k tal que los límites  k  constituyan un intervalo de tolerancia para una distribución normal En este caso los límites del intervalo son variables aleatorias y la proporción de datos cubierta por el intervalo no es exacta. Entonces se debe introducir un intervalo de confianza para la proposición de los límites del intervalo de tolerancia.  En la bibliografía se pueden consultar tablas para elegir estos límites dada una confianza deseada para el caso Normal. x

Intervalos de Confianza y Regresión Lineal Intervalo de Confianza para la Respuesta Media En la regresión lineal se supone un modelo de la forma y = mx + b Para describir la “respuesta” y del proceso bajo la entrada x Para una muestra de N puntos (valores de x, y) se calculan valores estimados m, b de m, b resolviendo las ecuaciones normales, de manera que se obtiene un modelo estimado y = mx + b Se puede encontrar un intervalo de confianza para la respuesta media  y/xo dado un valor x 0 como se explica a continuación Así, para un dato x 0, se puede estimar una predicción puntual para  y/xo (respuesta media) mediante:  y/xo = mx 0 + b ^^ ^^ ^ ^^ ^

Intervalos de Confianza y Regresión Lineal Intervalo de Confianza para la Respuesta Media Un intervalo de confianza alrededor de la respuesta media  y/xo del 100(1-  )% para el valor de x=x 0 está dado por: Donde  y/xo se calcula a partir del modelo de regresión estimado Además,  2 =  (y i - (m x i +b) ) 2 /(N-2) y S xx =  (x i -x) 2. Obsérvese que el ancho de este intervalo de confianza es mínimo para x 0 = x y crece a medida que |x 0 - x| aumenta. En la siguiente gráfica se muestra un comportamiento típico de este intervalo ^ _ _ _ ^ ^

Observación: Estos límites de intervalo están basados en los puntos experimentales dados, no se pueden usar para predecir intervalos sobre datos nuevos. A los límites para nuevos datos se les llama límites de predicción y son más amplios que los límites para la respuesta media Intervalos de Confianza y Regresión Lineal Intervalo de Confianza para la Respuesta Media Recta de regresión Puntos experimentales Límites del intervalo de confianza para la respuesta media

Resumen  En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.

Que lo hace variar  El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error.

La distribución  Para la construcción de un determinado intervalo de confianza es necesario conocer la distribución teórica que sigue el parámetro a estimar, distribución  Es habitual que el parámetro se distribuya normalmentenormalmente

Intervalo de confianza para la media de una población  De una población de media μ y desviación típica σ se pueden tomar muestras de n elementos. Cada una de estas muestras tiene a su vez una media (). Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional: [2]poblaciónmediadesviación típicamuestras [2]  Pero además, si el tamaño de las muestras es lo suficientemente grande, [3] la distribución de medias muestrales es, prácticamente, una distribución normal (o gaussiana) con media μ y una desviación típica dada por la siguiente expresión:. Esto se representa [3]distribución normal

Distribución del parametro  Esto se representa como sigue

Distribución  De forma estandarizada

Nivel de Confianza  La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota 1-. La probabilidad de equivocarnos se llama nivel de significancia y se simboliza. Generalmente se construyen intervalos con confianza 1- =95% (o significancia =5%). Menos frecuentes son los intervalos con =10% o =1%.

Usando Z  Para construir un intervalo de confianza, se puede comprobar que la distribución Normal Estándar cumple : P(-1.96 < z < 1.96) = 0.95

 Luego, si una variable X tiene distribución N(μ, ), entonces el 95% de las veces se cumple:

Despejando en la ecuación se tiene:

Usando estimadores  Generalmente, cuando se quiere construir un intervalo de confianza para la media poblacional, la varianza poblacional es desconocida, por lo que el intervalo para construido al final de II es muy poco práctico.

Ejemplo:  Los siguientes datos son los puntajes obtenidos para 45 perros de una escala de precisión al capturar un objeto (mayor puntaje significa mayor precisión)

Construcción  Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con media µ y varianza poblacional σ 2 desconocida. El promedio es 14.5 aciertos, como σ 2 es desconocido, lo estimamos por s 2 =18.7. Luego, un intervalo de confianza aproximado es: Recuerda que el 1.96 viene de la Distribución Normal estándar

Conclusión  Luego, el intervalo de confianza para es (13,2, 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.  Por lo tanto con un 95 % de confianza diremos que cualquier perro tendrá una precisión entre 13,2 y 15,8

Intervalo de confianza para la Varianza de Una población  Al igual que para la media se puede elaborar un intervalo de confianza para el otro parámetro importante de la población que es la Varianza σ 2  La única diferencia es que la parte probabilística esta dada por la distribución Chi cuadrada (en lugar dela normal)

Intervalo de confianza para la varianza  S 2 ± χ ϊ∞ (E.S)  El estimador de la varianza  Mas y menos  Chi con ϊ grados de libertad a una alfa (chi no es simétrica) y el error estándar

Uso de Intervalos de Confianza para verificar Hipótesis.  Los intervalos de confianza permiten verificar hipótesis planteadas respecto a parámetros poblacionales.  Tomemos como ejemplo el caso de la remodelación del Zoológico los coyotes,

Planteamiento  En el Zoológico “Los coyotes” hicieron en el encierro de los lobos, cambiando algunos aspectos de la jardinería. Para poder determinar si los cambios les gustaban a los lobos dividieron al encierro en dos, la llamada zona uno permaneció inalterada, la llamada zona dos se añadieron más arbustos. Durante un mes midieron el tiempo de uso de cada área por los dos lobos del encierro. Los datos se reportan en minutos por día por lobo.

DATOS Día Zona 1Zona

Gráficos y Datos Zona 1Zona 2 Media Varianza Desv.Std Error Estd

Intervalos de Confianza PromedioZE.S. Zona ± Zona ± Lim. InferiorLim. Superior Zona Zona

Conclusión  Como los dos intervalos NO se sobreponen en ningún Punto (el límite superior de la zona 1 es menor que el límite Inferior de la zona 2) podemos decir que si hay Diferencia entre las dos zonas siendo mayor el tiempo que pasan los lobos en la zona 2 y por tanto diciendo que si sirvieron los cambios