La Distribución Normal.

Slides:



Advertisements
Presentaciones similares
DSITRIBUCION T DE STUDENT.
Advertisements

1.1 Contraste de Bondad de Ajuste para Datos Categóricos
UNIVERSIDAD NACIONAL DE EDUCACIÓN
PATRONES DE DISTRIBUCIÓN ESPACIAL
ESTADISTICA INFERENCIAL
Variable Aleatoria Continua. Principales Distribuciones
Bioestadística Distribución Normal
Matemáticas aplicadas a las CCSS II Ana Pola IES Avempace
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Medidas de tendencia central
FUNCIONES DE DISTRIBUCION NORMAL
MEDIDAS DE DISPERSIÓN:
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
ANALISIS DE DATOS CON EXCEL
CHI-CUADRADO Y DISTRIBUCION NORMAL
25. Distribución normal y pruebas de normalidad
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
ESTADISTICA I CSH M. en C. Gal Vargas Neri.
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
DISTRIBUCIÓN NORMAL La mayoría de las variables aleatorias que se presentan en los estudios relacionados con las ciencias sociales, físicas y biológicas,
Distribución Normal Distribución Normal
Unidad V: Estimación de
Valor que toma la variable aleatoria
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
Tema 2: Parámetros Estadísticos
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
Elaboración de gráficas
ESTADÍSTICAS DESCRIPTIVA
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Coeficiente de Variación
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Análisis Cuantitativo de Datos (Básico)
Inferencia Estadística
Función Densidad Continua (o distribución de probabilidad continua)
Herramientas básicas.
Departamento de Salud Pública Dra. Laura Moreno Altamirano
MEDIDAS DE FORMA DE LA DISTRIBUCION
Qué es una Variable Aleatoria??????????
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Pruebas de hipótesis.
Si comparamos este intervalo con (10.5), vemos que el intervalo de confianza para la Y 0 individual es más amplio que el intervalo para el valor medio.
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
SESION 5: MEDIDAS DE FORMA. Hasta el momento nos hemos enfocado en el análisis de datos a partir de los valores centrales y la variabilidad de las observaciones.
Estimación y contraste de hipótesis
ESTADÍSTICA UNIDIMENSIONAL
La distribución normal
CONTRASTES NO PARAMÉTRICOS
Alicia De Gyves López Licenciatura Tecnologías de la Información y Comunicación 3º. Cuatrimestre Estadística Descriptiva Distribuciones de Probabilidad.
MEDIDAS DE TENDENCIA CENTRAL
Veamos brevemente algunos conceptos…
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
Distribuciones de Probabilidad
La distribución normal
Capítulo 10 Análisis de los datos.
CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.
INFERENCIA ESTADÍSTICA
Estadística descriptiva
DEFINICIÓN DE NORMALIDAD MEDIDAS DE DESCRIPCIÓN DE DATOS
Coeficiente de variación
INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS. Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad.
7. Distribución normal Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones.
DIPLOMADO DE POSTGRADO
Estadística descriptiva
Estimación estadística
Medidas de tendencia central
Viviana Acosta Estadística II. Que es Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida.
PRUEBA DE SIGNIFICANCIA
Transcripción de la presentación:

La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales esperados para la población en estudio. SOLUCIÓN: Medir características de un individuo y, si los valores encontrados son los habituales para otras estimaciones realizadas es posible decir que son valores normales. Estadística Biología Marina 2003

Para establecer los límites entre lo habitual y lo raro, es necesario conocer la distribución de la variable en estudio, en individuos normales. En la Práctica: Si presentamos la distribución de una variable en un histograma de frecuencias, es posible fijar los límites entre los que se encuentra la mayoría de los datos, y fuera de estos límites se encontrarían muy pocos datos (no normales). Estadística Biología Marina 2003

Ejemplo: Frequency Category/class Datos del nivel de glucosa de salmones en un cultivo son comparados con la distribución de ya conocida de esta variable. Fijamos límites donde podemos discriminar individuos sanos, fuera de estos límites se encuentran muy pocos. - Datos Observados - Datos Esperados en base a una distribución normal Estadística Biología Marina 2003

“La distribución Normal, considerarse como modelo adecuado para la distribución de un gran número de variables en el campo biológico “ Estadística Biología Marina 2003

Características: Su grafico semeja una campana simétrica, cuyas colas se extienden hacia el infinito tanto en dirección negativa como en la positiva (es asintótica con respecto al eje horizontal). Estadística Biología Marina 2003

El promedio, la mediana, el la moda de la distribución tienen el mismo valor. Las distribución queda completamente definida por el promedio y la desviación estándar. Cualesquiera sean los valores de μ y σ, el área bajo la curva comprendida entre el promedio más y menos 1, 2 y 3 desviaciones estándar es aproximadamente:   1 = 0.6826   2 = 0.9546   3 = 0.9973 Estadística Biología Marina 2003

Proporciones de la Curva Normal Su una población de 1000 pesos corporales de cangrejos, está distribuida de forma normal, tiene una  de 70 Kg, la mitad de la población (500) es mayor a 70 Kg, y la otra es menor a 70 Kg. Esto es cierto debido a que la distribución normal es SIMÉTRICA. Estadística Biología Marina 2003

Este cálculo es llamado “NORMALIZACIÓN o ESTANDARIZACIÓN” De esta forma para cualquier valor de Xi de una población normal con media  y desviación estándar , el valor de : Nos dice cuantas desviaciones estándar desde la media se encuentra nuestro valor Xi buscado. Este cálculo es llamado “NORMALIZACIÓN o ESTANDARIZACIÓN” Estadística Biología Marina 2003

Así quedan nuestros datos: Probability -3 -2 -1 1 2 3 Z La distribución resultante tiene  = 0, 2 = 1 Normalizados (Z-transformados) no- normalizados Estadística Biología Marina 2003

La media de un set de valores estándares normales es 0 y la varianza en 1. La tabla B.2 (de Zar 1999), nos indica que proporción de una distribución normal cae más allá un valor dado de Z. Ejemplo: para un valor de Z = 0.78. El valor de la tabla es… Estadística Biología Marina 2003

Para un valor de Z = 0.78. El valor de la tabla es 0.2177, valor que representa la proporción de la curva que se encuentra mas “alla” de 0.78.

Otro Ejemplo: Una distribución normal del largo de fémures de leopardo tiene:  = 60mm y  = 10mm. ¿Qué proporción de la población de huesos presenta un largo mayor a 66mm Z = 66mm-60mm = 0.60 10mm Vemos la Tabla… P (Xi>66mm) = P (Z>0.60) = 0.2743 o 27.43 % Estadística Biología Marina 2003

¿Que proporción de la población es menor que 66mm? Si la población esta compuesta por 2000 huesos, ¿cuántos de ellos van a ser mayores que 66mm? (0.2743) (2000) = 549 ¿Que proporción de la población es menor que 66mm? P (Xi < 66mm)= 1.000-P(Xi>66mm) = 1.000 – 0.2743 = 0.7257 Estadística Biología Marina 2003

Test estadístico para la Normalidad ¿ Los valores observados se distribuyen de manera normal? Tiene como objetivo determinar si los datos provienen de una distribución normal. También es llamado “test de bondad de ajuste para Normalidad”. Estadística Biología Marina 2003

Un adelanto… En todo test estadístico se plantean 2 hipótesis: Ho o Hipótesis Nula. Ha o Hipótesis Alternativa. En este caso: Ho: Los datos de la muestra se distribuyen de forma normal Ha: Los datos de la muestra se no distribuyen de forma normal Estadística Biología Marina 2003

Para decidir con que hipótesis nos quedamos, tener en cuenta: Cada test estadístico produce un valor determinado Este valor tiene asociado una probabilidad La probabilidad (P) se compara con un valor prefijado ( = 0.05), de esta forma: Si P   Rechazamos Ho Si P >  Fallamos en rechazar Ho Estadística Biología Marina 2003

Existen diferentes test de normalidad… Test de Kolmogorov-Smirnov: Se fija en la distribución y no en la ubicación con el eje X Convierte Frecuencias Relativas observadas a valores de Z Luego determina si la distribución es normal Es también es conocido como test de Lilliefors Estadística Biología Marina 2003

Veamos como se aplica: Se realizaron mediciones del largo de la lengua (mm) de pumas salvajes capturados en la Pampilla Estadística Biología Marina 2003

Comparar la distribución absoluta con una distribución normal. Pasos a seguir: Inspección de Datos Comparar la distribución absoluta con una distribución normal. La distribución acumulada observada se compara con la distribución acumulada esperada Estadística Biología Marina 2003

Los datos individuales se grafican v/s los valores esperados de la distribución de Z Estadística Biología Marina 2003

2. Test de bondad de ajuste para normalidad Intervalo Xi fi Fi < 62.5 62 62.5 – 63.5 63 2 63.5 – 64.5 64 4 64.5 – 65.5 65 3 7 65.5 – 66.5 66 5 12 66.5 – 67.5 67 16 67.5 – 68.5 68 6 22 68.5 – 69.5 69 27 69.5 – 70.5 70 8 35 70.5 – 71.5 71 42 71.5 – 72.5 72 49 72.5 – 73.5 73 10 59 73.5 – 74.5 74 74.5 – 75.5 75 75.5 – 76.5 76 76.5 – 77.5 77 > 77.5 78 Organizar los datos en una tabla de frecuencia Estadística Biología Marina 2003

Calcular la frecuencia relativa acumulada relFi=(Fi*1)/n Intervalo Xi fi Fi rel Fi < 62.5 62 0.0000 62.5 – 63.5 63 2 0.0286 63.5 – 64.5 64 4 0.0571 64.5 – 65.5 65 3 7 0.1000 65.5 – 66.5 66 5 12 0.1714 66.5 – 67.5 67 16 0.2286 67.5 – 68.5 68 6 22 0.3143 68.5 – 69.5 69 27 0.3857 69.5 – 70.5 70 8 35 0.5000 70.5 – 71.5 71 42 0.6000 71.5 – 72.5 72 49 0.7000 72.5 – 73.5 73 10 59 0.8429 73.5 – 74.5 74 0.9286 74.5 – 75.5 75 0.9714 75.5 – 76.5 76 1.0000 76.5 – 77.5 77 > 77.5 78 Estadística Biología Marina 2003

c) Calcular la frecuencia relativa acumulada esperada relFi (esp): Intervalo Xi fi Fi rel Fi Z P(Z) < 62.5 62 0.0000 -2.32 0.0102 62.5 – 63.5 63 2 0.0286 -2.02 0.0115 0.0217 63.5 – 64.5 64 4 0.0571 -1.71 0.0219 0.0436 64.5 – 65.5 65 3 7 0.1000 -1.41 0.0357 0.0793 65.5 – 66.5 66 5 12 0.1714 -1.11 0.0542 0.1335 66.5 – 67.5 67 16 0.2286 -0.81 0.0755 0.2090 67.5 – 68.5 68 6 22 0.3143 -0.50 0.0995 0.3085 68.5 – 69.5 69 27 0.3857 -0.20 0.1122 0.4207 69.5 – 70.5 70 8 35 0.5000 0.10 0.1191 0.5398 70.5 – 71.5 71 42 0.6000 0.40 0.1156 0.6554 71.5 – 72.5 72 49 0.7000 0.70 0.1026 0.7580 72.5 – 73.5 73 10 59 0.8429 1.01 0.0858 0.8438 73.5 – 74.5 74 0.9286 1.31 0.0611 0.9049 74.5 – 75.5 75 0.9714 1.61 0.0414 0.9463 75.5 – 76.5 76 1.0000 1.91 0.0256 0.9719 76.5 – 77.5 77 2.21 0.0145 0.9864 > 77.5 78 2.52 0.0136 -Calculo de Zi -P asociada a Z -Calculo de la relFi esperada con P(Z) Estadística Biología Marina 2003

d) Calcular las diferencias entre las frecuencias relativas acumuladas. Intervalo Xi fi Fi rel Fi Z P(Z) Di Di' < 62.5 62 0.0000 -2.32 0.0102 62.5 – 63.5 63 2 0.0286 -2.02 0.0115 0.0217 0.0069 63.5 – 64.5 64 4 0.0571 -1.71 0.0219 0.0436 0.0135 0.0150 64.5 – 65.5 65 3 7 0.1000 -1.41 0.0357 0.0793 0.0207 0.0222 65.5 – 66.5 66 5 12 0.1714 -1.11 0.0542 0.1335 0.0379 0.0335 66.5 – 67.5 67 16 0.2286 -0.81 0.0755 0.2090 0.0196 0.0376 67.5 – 68.5 68 6 22 0.3143 -0.50 0.0995 0.3085 0.0058 0.0799 68.5 – 69.5 69 27 0.3857 -0.20 0.1122 0.4207 0.0350 0.1064 69.5 – 70.5 70 8 35 0.5000 0.10 0.1191 0.5398 0.0398 0.1541 70.5 – 71.5 71 42 0.6000 0.40 0.1156 0.6554 0.0554 0.1554 71.5 – 72.5 72 49 0.7000 0.70 0.1026 0.7580 0.0580 0.1580 72.5 – 73.5 73 10 59 0.8429 1.01 0.0858 0.8438 0.0009 0.1438 73.5 – 74.5 74 0.9286 1.31 0.0611 0.9049 0.0237 0.0620 74.5 – 75.5 75 0.9714 1.61 0.0414 0.9463 0.0251 0.0177 75.5 – 76.5 76 1.0000 1.91 0.0256 0.9719 0.0281 0.0005 76.5 – 77.5 77 2.21 0.0145 0.9864 0.0136 > 77.5 78 2.52

El test estadístico es D=max… El valor crítico para este test es D,n y se encuentra en la Tabla B9 de Zar (1999). SI D  D,n entonces se rechaza Ho. En este ejemplo Dmax = 0.1580 D0.05,70=0.15975 “Los datos de largo de lengua de Pumas capturados en la Pampilla se ajustan a una distribución normal (test de lilliefors P >0.05)” Estadística Biología Marina 2003

Presentación gráfica del test K-S Estadística Biología Marina 2003

Concepto de Sesgo y Curtosis Al analizar los polígonos de frecuencia poner atención en dos elementos esenciales: Su Simetría Su apuntamiento Estadística Biología Marina 2003

Sesgo o Asimetría (g1) Nos permite conocer cuanto se parece nuestra distribución a una distribución normal Constituye un indicador del lado de la curva donde se agrupan los datos. Estadística Biología Marina 2003

Si es 0 la curva es simétrica Si es positivo  existen más valores agrupados a la izquierda Si es negativo  existen más valores agrupados a la derecha g1 = 0 g1 > 1 g1 < 1 Estadística Biología Marina 2003

La Curtosis (g2) Es un indicador del grado de apuntamiento de nuestra curva. Estadística Biología Marina 2003

Si es positivo la curva es las levantada o apuntada Si es 0 la curva es normal Si es positivo la curva es las levantada o apuntada Si es negativo la curva es más plana g2 = 0 g2 > 1 g2 < 1 Estadística Biología Marina 2003

Utilidad del Sesgo y la Curtosis Generalmente estos estadísticos no son informados. Pero en ecología, en estudios de depredación, competencia y efectos de factores físicos o químicos, pueden ser útiles Veamos el siguiente caso: Estadística Biología Marina 2003

La distribución se vuelve asimétrica aumentado el sesgo Distribución de tallas de anfípodos Hyale sp La tallas se distribuyen de forma normal Media = 75.5mm g1 = - 0.03 n = 5000 Llegada de nuevo depredador que come selectivamente individuos de talla superior a 140mm. La distribución se vuelve asimétrica aumentado el sesgo Media = 125.5mm g1 = - 0.27 n = 4330 Estadística Biología Marina 2003

La curtosis declina y la distribución se hace más plana Distribución de tallas de anfípodos Hyale sp La tallas se distribuyen de forma normal Media = 75.5mm g2 = - 0.02 n = 5000 El nuevo depredador come selectivamente individuos de tallas entre 45 a 120mm. Los anfípodos mas chicos y grandes no son afectados. La curtosis declina y la distribución se hace más plana Media = 75.5mm g2 = - 1.15 n = 1800 Estadística Biología Marina 2003