Prof. Rosario Martínez Verdú

Prof. Rosario Martínez Verdú

TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS
1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste de Homogeneidad de Poblaciones Bibliografía específica Tema 5: - NEWBOLD, P. (1997). Estadística para los Negocios y la Economía. Madrid: Prentice Hall. 4ª Edición. Capítulo 11. - NEWBOLD, P. y otros (2008). Estadística para Administración y Economía. Madrid: Pearson-Prentice Hall. 6ª Edición. Capítulo 16. - ESTEBAN GARCÍA, J. y otros: Curso Básico de Inferencia Estadística. Reproexpres Ediciones, Valencia, Tema 7 apartados 1 a 4. - LIND D.A y otros. Estadística Aplicada a los Negocios y la Economía. Ed. McGraw Hill, México, (13ª Edición). Capítulo 17. MURGUI, J.S. y otros (2002). Ejercicios de Estadística. Economía y Ciencias Sociales. Valencia: Tirant lo Blanch. Capítulo 9 apartados 1 a 3.

(Poisson, Normal, Exponencial)
1.- CONTRASTES DE BONDAD DE AJUSTE Ho simple 1) Con Datos Categóricos (Multinomial) a) Ho simple 2) Con Datos No Categóricos b) Ho compuesta (Poisson, Normal, Exponencial)

1.1 Contraste de Bondad de Ajuste para Datos Categóricos
Universo clasificado respecto a k alternativas o categorías: A1,A2,…Ai,…,Ak . La Población representaría la categoría en que estaría clasificada una unidad del universo. Su distribución de probabilidad sería una Multinomial. Es decir: categorías A1 …. Ai Ak probabili-dades p1 pi pk Estas probabilidades de estar clasificado en cada una de las k categorías son desconocidas y por tanto, se pueden formular hipótesis acerca de los valores que pueden tomar: Para resolver el contraste de hipótesis: muestra: m.a.s. de tamaño n clasificada según las k categorías: categorías A1 …. Ai Ak frecuencias observadas n1 ni nk

Test de la Chi-Cuadrado:
Si la Ho fuera cierta, las frecuencias que se esperaría que estuvieran en cada una de las k categorías serían: categorías A1 …. Ai Ak frec. observ. ni n1 ni nk n frec. esper. Este test se basa en un estadístico que calcula, para cada categoría, las diferencias entre ambos tipos de frecuencias (observadas y esperadas): Interpretación valor del estadístico Q: Q valor pequeño → diferencias pequeñas → Aceptar Ho Q valor grande → diferencias grandes → Rechazar Ho Condición que establece el Test: Rechazar H0 si: Q > c Para determinar el valor c: Se fija nivel de significación  P (rechazar H0 / Ho cierta) =  Para resolver esta ecuación es necesario conocer la distribución del estadístico Q cuando Ho es cierta:

Bajo Ho cierta, Pearson demostró que cuando n es grande la distribución de Q se aproxima a una con k-1 grados de libertad. Luego: Rechazar H0 si: Aceptar H0 si: Para poder aplicar este test se exige: - Tamaño de la muestra grande - Todas las frecuencias esperadas (si alguna no lo cumple hay que agrupar categorías).

EJEMPLO 1 En un municipio hay 3 partidos políticos mayoritarios. De cara a las próximas elecciones, el periódico local ha efectuado una encuesta sobre las preferencias por los 3 partidos políticos: A, B y C entre 80 votantes seleccionados al azar. Los resultados han sido: ¿Se puede considerar que las preferencias electorales de los votantes por los 3 partidos políticos son las mismas para un nivel de significación del 5%?

1.2 Contraste de Bondad de Ajuste para Datos No Categóricos
Ahora el universo no está clasificado respecto a k categorías. La Población está representada por una variable aleatoria X que puede ser discreta o continua. Disponemos de una muestra: (x1, x2, …,xn) m.a.s. de tamaño n grande El objetivo es contrastar si los datos de la muestra proceden de una distribución particular (Poisson, Normal). Es un contraste para la distribución de probabilidad de la población. Las hipótesis a contrastar son: Para resolver el contraste de hipótesis, el procedimiento a seguir consiste en: 1) Se divide el conjunto de todos los posibles valores que puede tomar la v.a. poblacional X en k intervalos numéricos: I1, I2, …,Ik 2) Se calcula el nº de observaciones de la muestra que estarían dentro de cada intervalo → se obtienen las frecuencias observadas ni .

Rechazar H0 si: Aceptar H0 si:
3) Se calculan las probabilidades que la distribución propuesta en la Ho asignaría a la probabilidad de que X pertenezca a cada uno de los k intervalos creados. En el caso de que la Ho fuera compuesta, previamente se estimarían los parámetros desconocidos de la distribución de la Ho. 4) Se calculan las frecuencias esperadas para los k intervalos: intervalos I1 …. Ii Ik frec. observ. ni n1 ni nk n frec. esper. 5) Como tenemos las frecuencias observadas y las frecuencias esperadas, se puede aplicar el test de la Chi-cuadrado y calcular el estadístico Q. El contraste se resolvería como en el caso anterior 1.1. Rechazar H0 si: Aceptar H0 si: La única diferencia: grados de libertad se calculan como k-m-1, donde m es el nº de parámetros estimados.

EJEMPLO 2 En una encuesta a una muestra aleatoria de 90 fumadores que manifestaron su intención de dejar de fumar, se les preguntó por el número de veces que hasta el momento lo habían intentado. Los resultados fueron los siguientes: nº de intentos fumadores 12 1 27 2 21 ≥3 30 ¿Se puede aceptar un modelo Poisson de media igual a 2 para la variable aleatoria “número de intentos para dejar de fumar”?

2. CONTRASTE DE INDEPENDENCIA
Sea 1 muestra grande de n individuos clasificados respecto a las categorías de 2 variables categóricas o criterios de clasificación: A y B. Tabla de Contingencia nij  frecuencia observada conjunta. Nº de individuos de la muestra que están clasificados simultáneamente en las categorías Ai y Bj. ni. y n.j  frecuencias marginales observadas. ni.: nº total de individuos clasificados en la categoría Ai n.j: nº total de individuos clasificados en la categoría Bj

pi. y p.j  probabilidades marginales
Podemos suponer que la muestra proviene de una población con la siguiente distribución conjunta de probabilidad: pij  probabilidad conjunta de estar clasificado simultáneamente en las categorías Ai y Bj de la tabla de contingencia. pi. y p.j  probabilidades marginales pi.: probabilidad de estar clasificado en la categoría Ai p.j: probabilidad de estar clasificado en la categoría Bj Todas estas probabilidades son desconocidas y se pueden formular hipótesis acerca de los valores que pueden tomar.

Contraste de Independencia (continuación)
Las hipótesis a contrastar sobre estas probabilidades son: Independencia (no hay relación) No independencia (hay relación) Test de la Chi-Cuadrado: Bajo Ho cierta, Para un nivel de significación  fijado: Rechazar H0 si: Aceptar H0 si: Todas las frec. esperadas:

EJEMPLO 3 Una encuesta efectuada a 120 consumidores de un producto, seleccionados al azar, ha permitido clasificarlos respecto a la marca que prefieren y respecto a la región en la que residen, obteniéndose la siguiente tabla: A partir de esta información, ¿se puede admitir, para un nivel de significación del 5%, que la preferencia por una determinada marca está influida por la región de residencia?

EJEMPLO 1 Una encuesta efectuada a 120 consumidores de un producto, seleccionados al azar, ha permitido clasificarlos respecto a la marca que prefieren y respecto a la región en la que residen, obteniéndose la siguiente tabla: A partir de esta información, ¿se puede admitir, para un nivel de significación del 5%, que la preferencia por una determinada marca está influida por la región de residencia?

3. CONTRASTE DE HOMOGENEIDAD DE POBLACIONES
Sean I muestras grandes independientes de individuos clasificados respecto a las J categorías de 1 variable categórica: A. nij  frecuencia observada. Nº de individuos de la muestra i que están clasificados en la categoría Aj. ni.: tamaño muestra i n.j: nº total de individuos del conjunto de todas las muestras clasificados en la categoría Aj n: suma de todos los tamaños muestrales.

Podemos suponer que cada muestra proviene de una población con la siguiente distribución de probabilidad: pij  probabilidad en la población i de estar clasificado en la categoría Aj Todas estas probabilidades son desconocidas y se pueden formular hipótesis acerca de los valores que pueden tomar.

Contraste de Homogeneidad de Poblaciones (continuación)
La Ho a contrastar es que todas las poblaciones tienen la misma distribución de probabilidad (son homogéneas): Poblaciones Homogéneas Poblaciones no Homogéneas Test de la Chi-Cuadrado: Bajo Ho cierta, Para un nivel de significación  fijado: Rechazar H0 si: Aceptar H0 si: Todas las frec. esperadas:

EJEMPLO 4 La Comisión Europea está interesada en conocer el grado de apoyo de los ciudadanos a la Constitución Europea. Para ello, ha realizado encuestas en cada uno de los países miembros. En la siguiente tabla se muestran los resultados de las encuestas de España y de Reino Unido: A partir de la tabla anterior, ¿puede decirse que la opinión de los ciudadanos respecto a la Constitución Europea es homogénea en los dos países o bien cabe hablar de diferencias significativas? /

Prof. Rosario Martínez Verdú

Presentaciones similares

Presentación del tema: "Prof. Rosario Martínez Verdú"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback

Iniciar la sesión

Autorizarse a través de una red social:

Prof. Rosario Martínez Verdú

Presentaciones similares

Presentación del tema: "Prof. Rosario Martínez Verdú"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback