P Y E 2004 Clase 19Gonzalo Perera1 Propiedades generales del p-valor Repaso de la clase anterior. Tests de aleatoriedad Estadística de datos dependientes.

Slides:



Advertisements
Presentaciones similares
1.1 Contraste de Bondad de Ajuste para Datos Categóricos
Advertisements

TEMA 6: CONTRASTES NO PARAMÉTRICOS
Propiedades de las Funciones Continuas
Modelos de Variable Dependiente Binaria -Logit y Probit-
Bivariadas y Multivariadas
Matemáticas aplicadas a las CCSS II Ana Pola IES Avempace
. Temas FUNCIONES, LÍMITES DE FUNCIONES y CONTINUIDAD
KRIGING.
La ley de los grandes números
PROPIEDADES ESTADÍSTICAS DE LOS ESTIMADORES
Distribuciones de Probabilidad
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Tema 2: Métodos de ajuste
Codificación Distribuida
FUNCIONES DE DENSIDAD DE PROBABILIDAD
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
P Y E 2012 Clase 17Gonzalo Perera1 Repaso de clase anterior En la clase pasada observamos en un primer ejemplo particular de test de hipótesis que: Cuando.
Calcular el cero del polinomio de orden 3 que pasa por los puntos
La Derivada. Ya vimos: los conceptos, métodos ó instrumentos necesarios para establecer el “comportamiento” de una función.  en un entorno de x o [ 
Unidad V: Estimación de
Probabilidad. Variables aleatorias.
Distribuciones derivadas del muestreo
DISTRIBUCIONES DE MUESTREO
Unidad V: Estimación de
1 M. en C. Gal Vargas Neri. 2 Planeación del curso TEMACAP.TITULODÍASSEMFEC FIN TEMA 00MOTIVACION Y PLANEACION1111/01 TEMA I1-2ESTADISTICA Y MEDICION2115/01.
Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.
P y E 2012 Clase 7Gonzalo Perera1 Repaso de clase anterior Distribución Gaussiana, Cauchy, Uniforme y Exponencial.
ESTADÍSTICAS DESCRIPTIVA
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Capítulo 7 Estimación de Parámetros Estadística Computacional
ESTIMACION POR INTERVALOS
Prof. Rosario Martínez Verdú
Titular: Agustín Salvia
Función Densidad Continua (o distribución de probabilidad continua)
Introducción a la Inferencia Estadistica
Unidad V: Estimación de
Repaso de clase anterior
Capítulo 1. Conceptos básicos de la Estadística
Índice: Introducción Conceptos básicos Procesos elementales
P Y E 2012 Clase 11Gonzalo Perera1 Repaso de clase anterior Fórmula del bloqueo de Erlang. LFGN y el problema de la Robustez.
P y E 2012 Clase 6Gonzalo Perera1 Repaso de clase anterior Distribución de Poisson como aproximación de la Bin(n,p) cuando n es muy grande y p es muy chico.
La Distribución Normal.
Pruebas de hipótesis.
P y E 2012 Clase 18Gonzalo Perera1 Repaso de clase anterior Presentación, en un ejemplo, del concepto de p-valor (no llegamos a desarrollarlo completamente,
Herramientas avanzadas. Lo primero: abrir el modelo.
P y E 2012 Clase 5Gonzalo Perera1 Repaso de clase anterior Distribución Binomial (Bin(n,p)) e Hipergeométrica como conteo de artículos defectuosos en muestras.
Clase 9.1 Integrales.
Clase 9.1 Integrales.
Estimación y contraste de hipótesis
P y E 2012 Clase 8Gonzalo Perera1 Repaso de clase anterior Distribuciones multivariadas.
2.1 DEFINICIONES CARACTERÍSTICAS Y SUPOSICIONES.
Regresión Lineal Simple
. Temas FUNCIONES, LÍMITES DE FUNCIONES y CONTINUIDAD
ESTIMACIÓN DE PARÁMETROS
CONTRASTES NO PARAMÉTRICOS
Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…
P y E 2012 Clase 15Gonzalo Perera1 Repaso de la clase anterior. Métodos de estimación.
P y E 2012 Clase 14 Gonzalo Perera 1 Repaso de clase anterior Estimación de parámetros por el método de Máxima Verosimilitud.
. Temas FUNCIONES, LÍMITES DE FUNCIONES y CONTINUIDAD
Aspectos generales de la investigación educativa en el SNIT
Inferencia Estadística Conceptos Previos. Conceptos Previos Población: Es la colección de toda la posible información que caracteriza a un fenómeno aleatorio.
INFERENCIA ESTADÍSTICA
LÍMITE DE UNA FUNCIÓN.
Pruebas paramétricas y no paramétricas
7. Distribución normal Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones.
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
Cálculo de área por medio de la sumas de Riemann Alumnas: Maciel Gisella, Uliambre Sabrina Profesora: Nancy Debárbora Curso: 3er año del prof. En matemáticas.
LOGO Medidas de posición Pedro Godoy G. Media Aritmética Valor representativo de un conjunto de datos Para datos no agrupados 1, x2, x3, x4,…………………………,
4. Métodos psicofísicos de medida en clínica
Transcripción de la presentación:

P Y E 2004 Clase 19Gonzalo Perera1 Propiedades generales del p-valor Repaso de la clase anterior. Tests de aleatoriedad Estadística de datos dependientes.

P Y E 2004 Clase 19Gonzalo Perera2 Tests de ajuste. Dada una muestra X 1,...,X n iid con distribución F, veremos dos tipos de test de ajuste : generales (aplicables para cualquier distribución “candidata”) y específicos (aplicables cuando la distribución candidata es de cierto tipo específico) A) Test de ajuste generales. Veremos dos tests de ajuste generales : el test de Kolmogorov-Smirnov (K-S, para abreviar) y el Test  2 (Ji-cuadrado o Chi-cuadrado). A1) El test de Kolmogorov-Smirnov. Para nuestra muestra dada, definimos su distribución empírica F n por F n (t)= #{i: 1  i  n: X i  t}/n

P Y E 2004 Clase 19Gonzalo Perera3 (Su gráfica es una escalera que salta 1/n en cada uno de los datos obtenidos en la muestra) Por ejemplo, si nuestra muestra es 0.3, 0.6, 0.5, 0.4 la distribución empírica es Sobre esta distribución empírica valen dos teoremas fundamentales de la Estadística que se presentan a continuación. (Referimos al lector al libro por detalles al respecto)

P Y E 2004 Clase 19Gonzalo Perera4 Teorema de Glivenko-Cantelli: Si X 1,...,X n iid con distribución F, cuando n tiende a infinito, sup t  R |F n (t) - F(t)| tiende a cero Para el próximo teorema, digamos previamente que llamaremos proceso estocástico de parámetro continuo a una colección de variables aleatorias indexadas por el intervalo [0,1], (X t ) t  [0,1] (X t puede pensarse de la posición una partícula que se mueve al azar en un eje unidimensional durante el intervalo de tiempo [0,1], o dicho de otro modo, como una función definida en [0,1], elegida al azar).

P Y E 2004 Clase 19Gonzalo Perera5 Llamamos puente browniano (Brownian bridge) al proceso estocástico de parámetro continuo caracterizado por la siguientes propiedades: a) Para cualquier cantidad finita k de valores t 1 < t 2 <... < t k en [0,1], el vector (X t1,...., X tk ) tiene distribución normal multivariada (ver capítulo 9 del libro). b) Para todo t, E(X t ) = 0. c) Para todo par s<t, E(X s X t ) = s(1-t). d) Al mirar X t como una función de t definida en [0,1], la misma es continua en todo punto con probabilidad uno.

P Y E 2004 Clase 19Gonzalo Perera6 La gráfica muestra “cómo luce” una trayectoria de un puente browniano. Puente difícil de cruzar, si los hay!!!

P Y E 2004 Clase 19Gonzalo Perera7 Una propiedad muy importante del puente browniano (que como su nombre lo indica, está relacionado con modelos para el movimiento browniano) es que la distribución de su máximo valor absoluto es conocida y le llamamos K a tal distribución (ver libro por la fórmula de K). Ahora sí podemos enunciar el Teorema de Donsker y un importante corolario del mismo.

P Y E 2004 Clase 19Gonzalo Perera8 Teorema de Donsker: Si X 1,...,X n iid con distribución F, cuando n tiende a infinito,  n (F n (t)-F(t)) tiende a X F(t), donde (X t ) t  [0,1] es un puente browniano. Observemos ahora que si F es continua, al variar F(t) recorre todos los valores entre 0 y 1 y que por lo tanto, llamando u = F(t) se tiene sup t  R |X F(t) |= sup u  R |Xu|, de donde se deduce que sup t  R | X F(t) | tiene distribución K. Como es posible demostrar como corolario del Teorema de Donsker que, para n grande, sup t  R  n |F n (t)-F(t)| se aproxima a sup t  R | X F(t) |

P Y E 2004 Clase 19Gonzalo Perera9 se deduce que: para n grande, la distribución de sup t  R  n |F n (t) - F(t)| se aproxima a K. Observación: Para F no continuas, sup t  R |X F(t) |  sup u  R | X u |, y K es un acotación de la distribución de sup t  R  n |F n (t) - F(t)| para n grande. Para completar la fundamentación teórica de K-S precisamos una última observación: Cuando F es continua, D n = sup t  R |F n (t) - F(t)|

P Y E 2004 Clase 19Gonzalo Perera10 Se puede calcular también del modo siguiente: D n =max{F(X 1* ), A n, B n, 1-F(X n* )}, con A n =max 1  i  n-1 |(i/n)-F(X i* )|, B n =max 1  i  n-1 |(i/n)-F(X i+1* )|. Esta manera de calcular D n, además de ser muy simple de calcular en una planilla de datos, permite probar que (usando que F(X 1 ),..., F(X n ) iid con distribución U[0,1]): D n tiene, para toda distribución F, la misma distribución que cuando F=U[0,1]!!

P Y E 2004 Clase 19Gonzalo Perera11 OPERATIVA DEL TEST K-S. El test de Kolmogorov-Smirnov permite en principio verificar si la muestra se ajusta a una distribución continua y completamente conocida (es decir, sin parámetros indeterminados) F 0 ( no vale decir para F 0 “ es Cauchy”, sino que hay que especificar valores de los parámetros, por ejemplo F 0 =C(1,3)) Se debe calcular primeramente D n = sup t  R |F n (t) - F 0 (t)|

P Y E 2004 Clase 19Gonzalo Perera12 A los efectos prácticos, suele calcularse entonces D n del modo siguiente (basado que en el intervalo [X i *, X i+1 *] la mayor diferencia entre el valor dela empírica en ese intervalo (i/n) y la función creciente F 0 debe hallarse en una de las dos puntas del intervalo

P Y E 2004 Clase 19Gonzalo Perera13 D n =max{F(X 1* ), A n, B n, 1-F(X n* )}, con A n =max 1  i  n-1 |(i/n)-F(X i* )|, B n =max 1  i  n-1 |(i/n)-F(X i+1* )|. Esta manera de calcular D n es muy simple de implementar en una planilla de datos. Luego se busca el p-valor en la tabla de K-S. El test de K-S es exacto y consistente frente a cualquier alternativa fija (no depende de la validez de aproximaciones y con muestras suficientemente grandes, sería capaz de rechazar cualquier ajuste en que se le presente una propuesta errónea).

P Y E 2004 Clase 19Gonzalo Perera14 En la práctica, como casi nunca se tiene una distribución totalmente conocida como distribución a ajustar, suele procederse de esta manera: Se divide la muestra en dos partes. Una primera parte se usa para estimar cuánto valdrían los parámetros si la distribución fuera de la forma supuesta. La segunda parte se usa para implementar K-S para la distribución propuesta con los valores de los parámetros estimados en el paso anterior. Es muy importante la separación de la muestra para no alterar las propiedades del test. Un excepción es el test de exponencialidad de Lilliefors, versión de K-S donde estima y testea con toda la muestra, pero donde se usa una tabla particular distinta a la de K-S y que puede utilizarse SOLO PARA LA NORMAL Y LA EXPONENCIAL ( SE VERA EN EL PRACTICO)