PRUEBAS DE BONDAD DE AJUSTE estas pruebas permiten verificar que la población de la cual proviene una muestra tiene una distribución especificada o supuesta.

Slides:



Advertisements
Presentaciones similares
La distribución t es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño.
Advertisements

PRESENTADO POR: JOHANNA ANDREA RODRIGUEZ MORENO.  Descubierta por William S. en 1908, la distribución de T normalmente se llama distribución de t de.
DISTRIBUCIONES DE PROBABILIDAD Por Jorge Sánchez.
Presentado por Karina Yuliet Preciado Mosquera Estadística II.
VALORES AGRUPADOS EN INTERVALOS. El consejo académico del colegio aplicó una prueba de conocimientos, entre 70 estudiantes elegidos al azar. El puntaje.
Prueba de hipótesis. Hipótesis estadísticas: Test estadístico: Procedimiento para determinar, a partir de una muestra aleatoria y significativa, extraer.
T – Student teoria de las muestras pequeñas Paola Andrea Palacio Montero Estadística.
PRINCIPIOS DE ESTADÍSTICAS INFERENCIALES PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS.
DISTRIBUCIONES ESTADÍSTICAS Realizado por: Claudia Morales y Denise Muñoz.
El estadístico Chi- cuadrado ING. RAÚL ALVAREZ GUALE, MPC.
Ejemplos de  2 y prueba de contingencia Queremos saber: 1.- Si la diferencia entre los parentales en cuanto al color de la flor se debe a un solo gen.
Introducción a las No-Paramétricas Chi-Cuadrada χ 2 Maestría de Salud Pública Universidad de Xochicalco 2º Semestre 5 de Junio del 2009 Dr Burgos Dra.
Estimación e intervalos de confianza. Estimaciones puntuales e intervalos de confianza Estimación puntual: Estadístico calculado a partir de la información.
Tema: Estadísticos no paramétricos CHI-Cuadrada Curso: Seminario de Estadística ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO FACULTAD DE INFORMATICA Y ELECTRONICA.
Recordatorio Estadística Paramétrica Se basa en el conocimiento que los datos presentan una distribución estadística conocida y cada distribución tiene.
XVII CONIC 2009 Congreso Nacional de Ingeniería Civil Capítulo de Ingeniería Civil Consejo Departamental De Lambayeque Colegio de Ingenieros del Perú.
ESTADÍSTICA INFERENCIAL
Tema 6 Cristhian Lopez..
DISTRIBUCION F DE FISHER.
PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS
PRUEBA DE SIGNIFICANCIA
DISTRIBUCIONES EN EL MUESTREO
Inferencia estadística.
Bioestadística Inferencia estadística y tamaños de muestra para una y dos o más medias.
EjEMPLO de diseños experimentales
ESTADISTICA II UNIDAD I 3RA PARTE.
Análisis de Varianza Permite probar la significancia de las diferencias entre más de dos medias muestrales. Usando el análisis de varianza, se puede hacer.
CHI CUADRADO  2 OBJETIVOS –Describir situaciones donde es adecuado la utilización de la prueba de Chi Cuadrado (  2 ) –Formular Hipótesis para diferentes.
ESTADÍSTICA INFERENCIAL
ESTIMACION DEL TAMAÑO DE LA MUESTRA.
Christian Alave Rosas UNIVERSIDAD JORGE BASADRE GROHMANN BIOLOGÍA - MICROBIOLOGÍA Diseños experimentales Christian Alave Rosas
ELECCIÓN Y USO DE LA PRUEBA ESTADÍSTICA
¿Son nuestros resultados suficientemente confiables para dar soporte a nuestra hipótesis? ¿Podemos rechazar la hipótesis nula?
Algunas distribuciones de Probabilidad discreta
Katherine V. Carrasquillo UPRH Biol marzo 2011
INTERVALO DE CONFIANZA
PRUEBA DE HIPÓTESIS DE MEDIAS DE UNA MUESTRA ÚNICA GRANDE
Análisis of varianza (ANOVA) De un factor o unidireccional
DISTRIBUCIÓN MUESTRAL DE UNA MEDIA.
CONTENIDO Teoría del muestreo ¿Cómo seleccionar una muestra?
ESTADÍSTICA INFERENCIAL. La estadística Inferencial, es el proceso por el cual se deducen (infieren) propiedades o características de una población a.
Aplicaciones Estadísticas a las Finanzas
“Formulación de Hipótesis Estadística”
ESTADÍSTICA BÁSICA.
ANALISIS DE VARIANZA
Distribuciones de Probabilidad DISTRIBUCIÓN BINOMIAL
DISEÑO Y ANALISIS DE EXPERIMENTOS
TEMA 1.- INTRODUCCIÓN A LA INFERENCIA
INTRODUCCION A LA ESTADÍSTICA INFERENCIAL
DISEÑO Y ANALISIS DE EXPERIMENTOS
Universidad Nacional del Litoral
Distribuciones de muestreo con más detalle
Estadística Administrativa II
Dr. Carlomagno Araya Alpízar
DISEÑO Y ANALISIS DE EXPERIMENTOS
INTRODUCCION A LOS CONTRASTES BASADOS EN RANGOS
“Medidas de dispersión”
Resumen Contrastes No Paramétricos. Bondad de Ajuste
"it is necessary to remember the adjective 'random' [in the term 'random sample'] should apply to the method of drawing the sample and not to the sample.
Distribución chi-cuadrado Distribución F de Fisher-Snedecor
MODELOS DE PRONOSTICOS
PROBLEMA TIPO MODELO COMPLETAENTE ALEATORIZADO NO BALANCEADO
COMPARACION DE DOS MEDIAS (POBLACIONES O PROCESOS)
ESTADISTICOS Y DISTRIBUCIONES MUESTRALES
PRUEBA DE HIPOTESIS ESTADISTICA
ANALISIS DE REGRESION SIMPLE
DISEÑO Y ANALISIS DE EXPERIMENTOS
REGRESION LINEAL SIMPLE
Sesión 7 Pruebas de Bondad de ajuste Universidad Javeriana Inferencia Estadística.
PRUEBA DE HIPOTESIS ESTADISTICA
Transcripción de la presentación:

PRUEBAS DE BONDAD DE AJUSTE estas pruebas permiten verificar que la población de la cual proviene una muestra tiene una distribución especificada o supuesta. sea x: variable aleatoria poblacional fo(x) la distribución (o densidad) de probabilidad especificada o supuesta para x . se desea probar la hipótesis: Ho: f(x) = fo(x) . en contraste con la hipótesis alterna: ha: f(x) no= fo(x) (negación de Ho

Tenemos entonces dos valores de frecuencia para cada clase i oi: frecuencia observada (corresponde a los datos de la muestra) ei: frecuencia esperada (corresponde al modelo propuesto) La teoría estadística demuestra que la siguiente variable es apropiada para realizar una prueba de bondad de ajuste

PRUEBA JI-CUADRADO Esta prueba es aplicable para variables aleatorias discretas o continuas. Sea una muestra aleatoria de tamaño n tomada de una población con una distribución especificada fo(x) que es de interés verificar. Suponer que las observaciones de la muestra están agrupadas en k clases, siendo oi la cantidad de observaciones en cada clase i = 1, 2, ..., k Con el modelo especificado fo(x) se puede calcular la probabilidad pi que un dato cualquiera pertenezca a una clase i. Con este valor de probabilidad se puede encontrar la frecuencia esperada ei para la clase i, es decir, la cantidad de datos que según el modelo especificado deberían estar incluidos en la clase i: ei = pi n, i = 1, 2, ..., k

Definición Estadístico para la prueba de bondad de ajuste Ji-cuadrado , distribución Ji-cuadrado con n=k–r–1 grados de libertad donde r es la cantidad de parámetros de la distribución que deben estimarse a partir de la muestra Es una condición necesaria para aplicar esta prueba que "i, ei mayor que 5

Dado un nivel de significancia a se define un valor crítico c2a para el rechazo de la hipótesis propuesta Ho: f(x) = fo(x). Si las frecuencias observadas no difieren significativamente de las frecuencias esperadas calculadas con el modelo propuesto, entonces el valor de estadístico de prueba c2 será cercano a cero, pero si estas diferencias son significativas, entonces el valor del estadístico c2 estará en la región de rechazo de Ho

rechazo H0 Ûc > ca : Región de rechazo de Ho

Ejemplo Se ha tomado una muestra aleatoria de 40 plantas deesparragos chos y se ha registrado su duración en años. Estos resultados se los ha agrupado en 7 clases en el siguiente cuadro i clase (duración) frecuencia observada (oi) 1 1.45 – 1.95 2 2 1.95 – 2.45 1 3 2.45 – 2.95 4 4 2.95 – 3.45 15 5 3.45 – 3.95 10 6 3.95 – 4.45 5 7 4.45 – 4.95 3 Verificar con 5% de significancia que la duración en años de las plantas de espárragos sembrados por un agricultor tiene duración distribuida normalmente con media 3.5 y desviación estándar 0.7

Solución Sea X: duración en años (variable aleatoria continua) 1) Ho: X ~ N(3.5,0.7) (distribución normal, μ=3.5, s=0.7) 2) Ha: no H0 3) a = 0.05 Cálculo de la probabilidad correspondiente a cada intervalo p1 = P(X£1.95) = P(Z£(1.95 – 3.5)/0.7) = 0.0136 p2 = P(1.95£X£2.45) = P((1.95 – 3.5)/0.7 £Z£ (2.45 – 3.5)/0.7) = 0.0532 p3 = P(2.45£X£2.95) = P((2.45 – 3.5)/0.7 £Z£ (2.95 – 3.5)/0.7) = 0.135 ... (etc)

Cálculo de las frecuencias esperadas e1 = p1 n = 0.0136 (40) » 0.5 e2 = p2 n = 0.0532 (40) » 2.1 e3 = p3 n = 0.135 (40) » 5.4 ... (etc)

Resumen de resultados duración (años) frecuencia observada (oi) frecuencia esperada (ei) 1.45 – 1.95 2 0.5 1.95 – 2.45 1 2.1 2.45 – 2.95 4 5.4 2.95 – 3.45 15 10.3 Ojo con el redondeo, 3.45 – 3.95 10 10.7 la suma debe ser n =40 3.95 – 4.45 5 7 4.45 – 4.95 3 3.5 Es necesario que se cumpla la condición "i, ei ³ 5 por lo que se deben agrupar clases adyacentes. Como resultado se tienen cuatro clases k=4

duración (años) frecuencia observada (oi) frecuencia esperada (ei) 1.45 – 2.95 7 8.5 2.95 – 3.45 15 10.3 3.45 – 3.95 10 10.7 3.95 – 4.95 8 10.5 Ahora se puede definir la región de rechazo de Ho Observemos que en este ejemplo la media y la desviación estándar de la distribución normal no se estimaron, sino que están propuestas, de donde r = 0 a = 0.05, n = k – 1 = 3, c 0.05 = 7.815 (Tabla c2) Rechazar Ho si c2 > 7.815

c2 = 3.05 6) Decisión Como 3.05 no es mayor a 7.815, se dice que no hay evidencia suficiente para rechazar el modelo propuesto para la población.

Ejemplo 2 La siguiente tabla presenta información de cantidades sobre el número de plantas Larrea divaricata halladas en cada uno de los 48 cuadrantes de nuestro, como se publica en el el artículo “Some Sampling Characteristics of Plants and Arthropods of the Arizona Desert” (Ecology,1962: 567-571) i Nro. De plantas frecuencia observada (oi) 1 0 9 2 1 9 3 2 10 4 3 14 5 4 2 6 5 2 7 6 2 ¿Podrían estos datos ajustarse a una distribución de Poissón? Utilice un nivel 0,05 de significancia

Solución El valor de l en este caso debe estimarse l = 2.10 1) Ho: X ~ Poisson(2,10) (distribución de Poisson con l = 2,10 ) 2) Ha: no H0 3) a = 0.05 Cálculo de la probabilidad correspondiente a cada intervalo p1 = P(X=0) = 2 .10 = p2 = P(X=1)= 0 25725 p3 = P(X=2)= 0.1225…….

Resumen de resultados i Nro. De plantas frecuencia observada (oi) frecuencia esperada (ei) 1 0 9 5,88 2 1 9 12,34 3 2 10 12,96 4 3 14 9,07 5 >= 4 6 7,75 Es necesario que se cumpla la condición "i, ei ³ 5 por lo que se deben agrupar clases adyacentes. Como resultado se tienen cinco clases k=5

Ahora se puede definir la región de rechazo de Ho Observemos que en este ejemplo se estimó el parámetro de la distribución, de donde r = 1 a = 0.05, n = 5 – 1 - 1 = 3, 2 0.05 c = 7.815 (Tabla c2) Rechazar Ho si c2 > 7.815 5) Cálculo del estadístico de prueba c2 = 6.31 6) Decisión Como 6,31 no es mayor a 7.815, se dice que no hay evidencia suficiente para rechazar el modelo propuesto para la población, de modo que al nivel de 5%, la distribución de Poisson da un ajuste razonable a los datos.