La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas Curso de Elementos de Estadística Prof. María Pilar Sánchez Clase Nº7: Distribuciones.

Presentaciones similares


Presentación del tema: "Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas Curso de Elementos de Estadística Prof. María Pilar Sánchez Clase Nº7: Distribuciones."— Transcripción de la presentación:

1 Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas Curso de Elementos de Estadística Prof. María Pilar Sánchez Clase Nº7: Distribuciones Chi-cuadrado - F de Fisher Introducción a la inferencia. Primavera, 2002

2 Distribución Chi-Cuadrado Esta es una de las distribuciones más usadas en la estadística, ya sea en: la estimación y la estimación y pruebas de hipótesis para el cálculo de los intervalos de confianza para la varianza de una población y pruebas de hipótesis para el cálculo de los intervalos de confianza para la varianza de una población y de probar hipótesis en las pruebas de asociación (tablas de contingencia) y la bondad de ajuste. de probar hipótesis en las pruebas de asociación (tablas de contingencia) y la bondad de ajuste.

3 Requisitos y características Es una distribución asimétrica. Es una distribución asimétrica. Sólo toma valores positivos y es asintótica con respecto al eje de los x positivos (0 < X 2 < ) Sólo toma valores positivos y es asintótica con respecto al eje de los x positivos (0 < X 2 < ) Está caracterizada por el número de desviaciones independientes, es decir, de los grados de libertad que generalmente se designa por "n". Está caracterizada por el número de desviaciones independientes, es decir, de los grados de libertad que generalmente se designa por "n". Se ocupa principalmente en la bondad de ajuste, independencia y homogeneidad. Se ocupa principalmente en la bondad de ajuste, independencia y homogeneidad. El área comprendida entre la curva y el eje de las x es 1 o 100% El área comprendida entre la curva y el eje de las x es 1 o 100%

4 Ejemplo… Es una prueba que se puede emplear en datos de enumeración que resultan de un proceso de conteo, por ejemplo, ser el fruto de una encuesta y en la cual los valores son asignados en categorías específicas y no toman cualquier valor como en el caso de un dato de medición. Es una prueba que se puede emplear en datos de enumeración que resultan de un proceso de conteo, por ejemplo, ser el fruto de una encuesta y en la cual los valores son asignados en categorías específicas y no toman cualquier valor como en el caso de un dato de medición. La magnitud del valor de chi-cuadrado se determina como la suma de los cuadrados de las diferencias absolutas entre cada frecuencia observada y su frecuencia asociada esperada, dividida por la frecuencia esperada. Así se tiene : La magnitud del valor de chi-cuadrado se determina como la suma de los cuadrados de las diferencias absolutas entre cada frecuencia observada y su frecuencia asociada esperada, dividida por la frecuencia esperada. Así se tiene : 2 = [(O i - E i ) 2 /(E)] 2 = [(O i - E i ) 2 /(E)]

5 chi-cuadrado El valor 2 es una medida del grado con el que los pares de frecuencias observadas y esperadas concuerdan en una situación dada, cuando hay una congruencia grande y estrecha, el valor de chi cuadrado es muy pequeño y cuando la congruencia es pobre el valor es muy grande (esto nos indica que ya un valor grande causa rechazo). La frecuencia observada O es aquella que se obtiene de la frecuencia observada sobre el dato experimental, la frecuencia esperada E es aquella que se espera y se basa en una idea preconcebida o hipótesis a priori (se le asigna o supone una probabilidad conocida).

6 Chi-cuadrado… Diferencias grandes producirán un valor grande y mayor de chi-cuadrado; diferencias más pequeñas producirán valores menores de chi-cuadrado y si no hay diferencias entonces chi-cuadrado tomará el valor de cero Diferencias grandes producirán un valor grande y mayor de chi-cuadrado; diferencias más pequeñas producirán valores menores de chi-cuadrado y si no hay diferencias entonces chi-cuadrado tomará el valor de cero.

7 Recordar… La prueba chi-cuadrado se basa en una variable discreta. Es importante recordar y tener siempre en mente que: La prueba chi-cuadrado se basa en una variable discreta. Es importante recordar y tener siempre en mente que: Sólo se pueden analizar datos provenientes de frecuencias, no es posible aplicar esta técnica a datos que existen en forma de porcentajes o proporciones, sin embargo, en algunos casos se puede efectuar un arreglo y convertir proporciones en frecuencias y así entonces aplicar la prueba. Sólo se pueden analizar datos provenientes de frecuencias, no es posible aplicar esta técnica a datos que existen en forma de porcentajes o proporciones, sin embargo, en algunos casos se puede efectuar un arreglo y convertir proporciones en frecuencias y así entonces aplicar la prueba.

8 Ejemplo…

9 Distribución F de Fisher El nombre de esta distribución se debe a R. A. Fisher, quién primero la desarrolló y describió. La prueba f se utiliza principalmente para probar la igualdad entre dos varianzas. El nombre de esta distribución se debe a R. A. Fisher, quién primero la desarrolló y describió. La prueba f se utiliza principalmente para probar la igualdad entre dos varianzas. Se puede observar, que esta prueba para la igualdad de varianzas se utiliza generalmente para probar la igualdad entre tres o más medias. Se puede observar, que esta prueba para la igualdad de varianzas se utiliza generalmente para probar la igualdad entre tres o más medias. Cuando se procede a realizar la inferencia estadística para probar igualdad entre 3 o más medias comúnmente se denomina análisis de varianza. El que implica medir la variabilidad de las medias de las muestras obtenidas a partir de las poblaciones problema. Cuando se procede a realizar la inferencia estadística para probar igualdad entre 3 o más medias comúnmente se denomina análisis de varianza. El que implica medir la variabilidad de las medias de las muestras obtenidas a partir de las poblaciones problema.

10 Distribución F de Fisher Cuando se tiene interés en comparar varianzas, se puede recurrir a la variable aleatoria f, que es la razón de los estimadores insesgados de dos varianzas poblacionales esto es: Cuando se tiene interés en comparar varianzas, se puede recurrir a la variable aleatoria f, que es la razón de los estimadores insesgados de dos varianzas poblacionales esto es: Por ejemplo se pueden dar múltiples problemáticas en que requiere de esta prueba; comparar metodologías, o cualquier variable. Por ejemplo se pueden dar múltiples problemáticas en que requiere de esta prueba; comparar metodologías, o cualquier variable.

11 Distribución F de Fisher La distribución f tiene dos parámetros: los números de grados de libertad que se denotan con el símbolo 1 y 2. La distribución f tiene dos parámetros: los números de grados de libertad que se denotan con el símbolo 1 y 2. El parámetro 1 está asociado con el numerador de la razón f; esto es s 2 1, estimador insesgado de la varianza 2 1 de la población 1. El parámetro 1 está asociado con el numerador de la razón f; esto es s 2 1, estimador insesgado de la varianza 2 1 de la población 1. La varianza s 2 1, se obtiene a partir de una muestra de n 1 observaciones tomadas aleatoriamente a partir de la población 1. La varianza s 2 1, se obtiene a partir de una muestra de n 1 observaciones tomadas aleatoriamente a partir de la población 1.

12 Distribución F de Fisher Puesto que la suma de las desviaciones a partir de la media muestral, al cuadrado, para s 2 1 tiene (n-1) grados de libertad, el parámetro 1 es igual a (n 1 - 1), así también el parámetro 2 es igual a (n 2 - 1), de modo semejante, 2 está asociado con el denominador de la razón f; esto es, s 2 2, estimador insesgado para la varianza 2 2 de la población 2. Puesto que la suma de las desviaciones a partir de la media muestral, al cuadrado, para s 2 1 tiene (n-1) grados de libertad, el parámetro 1 es igual a (n 1 - 1), así también el parámetro 2 es igual a (n 2 - 1), de modo semejante, 2 está asociado con el denominador de la razón f; esto es, s 2 2, estimador insesgado para la varianza 2 2 de la población 2.

13 Distribución F de Fisher La varianza s 2 2 se obtiene a partir de una muestra de n 2 observaciones tomadas aleatoriamente a partir de la población 2. La varianza s 2 2 se obtiene a partir de una muestra de n 2 observaciones tomadas aleatoriamente a partir de la población 2. La distribución f se denota con dos subíndices, el primero corresponde a 1 y el segundo a 2 La distribución f se denota con dos subíndices, el primero corresponde a 1 y el segundo a 2

14 Propiedades El estadístico de prueba toma solamente valores no negativos, debido a que tanto numerador y denominador de la razón f son varianzas, las que NO pueden ser valores negativos. El estadístico de prueba toma solamente valores no negativos, debido a que tanto numerador y denominador de la razón f son varianzas, las que NO pueden ser valores negativos. El valor de F varía de cero a infinito, sin embargo en la practica se considera a 1 como límite inferior del valor F, debido a que siempre es posible utilizar la mayor varianza muestral como numerador de forma que la relación F no sea menor que 1. El límite superior del valor F rara vez es de más de unos cuantos dígitos en la mayor parte de las situaciones. Ejemplo, una f(0.05;20;24) = 2.03 con un alfa =0.05. El valor de F varía de cero a infinito, sin embargo en la practica se considera a 1 como límite inferior del valor F, debido a que siempre es posible utilizar la mayor varianza muestral como numerador de forma que la relación F no sea menor que 1. El límite superior del valor F rara vez es de más de unos cuantos dígitos en la mayor parte de las situaciones. Ejemplo, una f(0.05;20;24) = 2.03 con un alfa =0.05.

15 Propiedades La tabla f se construye en base a que el numerador de la razón F es mayor que el denominador, y luego los valores de f generalmente son mayores que 1 y tienden a 1 cuando tanto 1 y 2 tienden a infinito. La tabla f se construye en base a que el numerador de la razón F es mayor que el denominador, y luego los valores de f generalmente son mayores que 1 y tienden a 1 cuando tanto 1 y 2 tienden a infinito. Bajo la Ho, de que las dos varianzas poblacionales son iguales, se espera que las varianzas de dos muestras cualesquiera tomadas respectivamente a partir de las dos poblaciones sean iguales también. Bajo la Ho, de que las dos varianzas poblacionales son iguales, se espera que las varianzas de dos muestras cualesquiera tomadas respectivamente a partir de las dos poblaciones sean iguales también.

16 Propiedades Sin embargo, a pesar que si la hipótesis nula es verdadera, debido a la naturaleza aleatoria del muestreo las dos varianzas muestrales es muy posible difieran una de otra. Sin embargo, a pesar que si la hipótesis nula es verdadera, debido a la naturaleza aleatoria del muestreo las dos varianzas muestrales es muy posible difieran una de otra. Mientras mayor sea la diferencia entre las dos varianzas muestrales, mayor será la magnitud en que el estadístico de prueba F esté por encima de 1. Mientras mayor sea la diferencia entre las dos varianzas muestrales, mayor será la magnitud en que el estadístico de prueba F esté por encima de 1. La hipótesis nula Ho, se rechaza solamente cuando el valor del estadístico de prueba F es suficientemente mayor que 1. La hipótesis nula Ho, se rechaza solamente cuando el valor del estadístico de prueba F es suficientemente mayor que 1.

17 Ejemplo… Si se quiere determinar las diferencias entre dos metodologías en la educación a pacientes: una basada en la lectura de trípticos y otra basada en el apoyo profesional complementada con trípticos. Si se quiere determinar las diferencias entre dos metodologías en la educación a pacientes: una basada en la lectura de trípticos y otra basada en el apoyo profesional complementada con trípticos. Si asignamos la población 1 a todos aquellos pacientes que aprenden empleando el método de lectura con varianza 2 1 y la población 2 de los pacientes que aprenden con el método asistencia profesional complementaria", con varianza, 2 2. Si asignamos la población 1 a todos aquellos pacientes que aprenden empleando el método de lectura con varianza 2 1 y la población 2 de los pacientes que aprenden con el método asistencia profesional complementaria", con varianza, 2 2. Ho: 2 1 = 2 2 Ho: 2 1 = 2 2

18 Nota: Cuando s 2 1 es mayor que s 2 2, no hay dificultad en probar la hipótesis nula de Ho: 2 1 = 2 2 en contra de H 1 : 2 1 > 2 2, pues sólo se divide la mayor varianza entre la menor y después se compara con el valor de tabla, sin embargo, la practica de considerar a s 2 1 como numerador de la razón es solamente adecuada cuando es la mayor de las dos varianzas muestrales en una prueba de una cola. Cuando se desea probar la hipótesis de igualdad de varianza en contra de que hay diferencias entonces, se divide entre dos, esto es, se utiliza /2 como nivel de significación y se realiza la prueba como si fuera de una cola. Nota: Cuando s 2 1 es mayor que s 2 2, no hay dificultad en probar la hipótesis nula de Ho: 2 1 = 2 2 en contra de H 1 : 2 1 > 2 2, pues sólo se divide la mayor varianza entre la menor y después se compara con el valor de tabla, sin embargo, la practica de considerar a s 2 1 como numerador de la razón es solamente adecuada cuando es la mayor de las dos varianzas muestrales en una prueba de una cola. Cuando se desea probar la hipótesis de igualdad de varianza en contra de que hay diferencias entonces, se divide entre dos, esto es, se utiliza /2 como nivel de significación y se realiza la prueba como si fuera de una cola.

19 Inferencia estadística A continuación veremos algunos conceptos relacionados con el proceso de la inferencia que nos permitirán aplicar todas las distribuciones vistas anteriormente. A continuación veremos algunos conceptos relacionados con el proceso de la inferencia que nos permitirán aplicar todas las distribuciones vistas anteriormente. Todo este ejercicio lo haremos a través de conocer los que es la docimasia de una hipótesis, una hipótesis, los tipos de hipótesis, y como nos ordenamos para seguir una secuencia ordenada en estos procedimientos. Todo este ejercicio lo haremos a través de conocer los que es la docimasia de una hipótesis, una hipótesis, los tipos de hipótesis, y como nos ordenamos para seguir una secuencia ordenada en estos procedimientos.

20 Inferencia estadística Docimasia de Hipótesis Docimasia de Hipótesis La docimasia de hipótesis es uno de los recursos que emplea la estadística para generalizar el conocimiento obtenido en la muestra a toda la población. Su método consiste en suponer valores de parámetros poblacionales y formular normas de decisión que permitan aceptar o rechazar tales valores

21 Hipótesis estadística Hipótesis estadística Los investigadores trabajan con dos tipos de hipótesis, las hipótesis de investigación y las hipótesis estadísticas: la hipótesis de investigación es la conjetura o suposición que motiva la investigación y que conduce en forma directa a la hipótesis estadística, que se establece en forma tal que se puede evaluar a través de diferentes pruebas especializadas. la hipótesis de investigación es la conjetura o suposición que motiva la investigación y que conduce en forma directa a la hipótesis estadística, que se establece en forma tal que se puede evaluar a través de diferentes pruebas especializadas. Como procedimiento didáctico observemos la siguiente secuencia a modo de establecer un ordenamiento que nos sirva para entender mejor estos conceptos:

22 Elementos de la inferencia Datos: Datos: El tipo de dato u observación debe ser conocido y establecida su naturaleza, ya que esto determina la base del procedimiento de la prueba en particular a usarse. Es posible establecer si fueron frutos de conteos o bien de medidas (esto diferencia entre una variable de tipo discreta de una de tipo continua).

23 Elementos de la inferencia Suposiciones : Suposiciones : Las suposiciones tienen importancia tanto en la estimación ya que conduce a modificaciones en el cálculo de los intervalos de confianza como en las pruebas de hipótesis ya que incluyen con gran frecuencia suposiciones acerca de la normalidad de la distribución de la población, la igualdad de las varianzas e independencia de las muestras, lo que determina el procedimiento a usar.

24 Elementos de la inferencia Hipótesis : Hipótesis : En todo tipo de prueba de hipótesis hay dos tipos de hipótesis con las que se trabaja y las que deben enunciarse en forma explícita; la primera es la llamada : hipótesis nula, designada por el símbolo Ho, correspondiente a la hipótesis que debe probarse y que propone diferencia o no respecto de la población, Casi siempre se enuncia de tal forma que tenga que ser rechazada, así el complemento de la conclusión a la que el investigador quiere llegar se transforma en el enunciado de la hipótesis nula, la que podrá ser rechazada o aceptada.

25 Elementos de la inferencia Si la hipótesis nula no se rechaza, se dirá que los datos disponibles no proporcionan evidencia suficiente que provoque el rechazo, En cambio si la hipótesis nula se rechaza se concluye que los datos disponibles no son compatibles con la hipótesis nula pero que se pueden apoyar en la llamada hipóteis alternativa

26 Elementos de la inferencia hipótesis alternativa y que es el segundo tipo de hipótesis, designándose como H 1 o H A. Es bueno considerar que cuando se acepta una hipótesis nula, no debemos decir que es verdadera sino que puede ser verdadera, puesto que lo que probamos sencillamente es si los datos disponibles apoyan o no a las hipótesis planteadas, luego debemos tener siempre presente esta limitación.

27 Elementos de la inferencia Estadística de prueba : Estadística de prueba : La estadística de prueba es alguna estadística que se pueda calcular a partir de los datos de la muestra. Por ejemplo puede ser z, W* (de Wilcoxon), etc. Distribución de la estadística de prueba : Distribución de la estadística de prueba : Es clave fundamental para la inferencia estadística es decir es la base para las pruebas aplicadas. Regla de decisión : Regla de decisión : La estadística de prueba puede tomar distintos valores los que determinan puntos en el eje horizontal de la gráfica y se dividen en dos áreas, una de ellas se conoce como región de aceptación y la otra como región de rechazo.


Descargar ppt "Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas Curso de Elementos de Estadística Prof. María Pilar Sánchez Clase Nº7: Distribuciones."

Presentaciones similares


Anuncios Google