La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

MODELOS O DISTRIBUCIONES

Presentaciones similares


Presentación del tema: "MODELOS O DISTRIBUCIONES"— Transcripción de la presentación:

1 MODELOS O DISTRIBUCIONES
DE PROBABILIDAD

2 EXPERIMENTOS ALEATORIOS
Considere las siguientes situaciones: Se cuenta el número de naves que arriban a un puerto, por día. Se le pregunta a un consumidor su marca preferida de leche. Un fiscalizador examina declaraciones de impuesto y cuenta cuántas son erróneas.

3 Se observa el cambio mensual de un índice de precios.
5. Un investigador cuenta el número de partículas atómicas captadas por un instrumento. 6. Se toman los tiempos entre llegadas de clientes a la fila de una caja bancaria.

4 Se extraen 20 peces de una lago, y se cuenta cuántos superan los 15 c
Se extraen 20 peces de una lago, y se cuenta cuántos superan los 15 c. de largo Se mide el peso de los contenidos de arroz en bolsas a la salida de una empacadora. 9. Un meteorólogo registra las temperaturas máximas diarias.

5 10. Un oftalmólogo registra el color de ojos de sus pacientes.
11. Un inspector registra el número de ítemes de frutas dañada en un cargamento. 12. Una persona compra un número de lotería y espera que sea el ganador.

6 Cada uno de estos ejemplos corresponde a un experimento aleatorio.
Un experimento aleatorio es un proceso que puede concretarse en al menos dos resultados posibles, con incertidumbre en cuanto a cuál de ellos tendrá lugar.

7 Una variable que es el resultado de un experimento, y que toma valores numéricos, es discreta si sólo puede tomar una cantidad numerable de valores. En caso que tome valores en un intervalo de números reales, por lo tanto los valores no pueden enumerarse, se dice que la variable es contínua.

8 En los ejemplos, 2 y 10 no son variables numéricas.
De las restantes, 1, 3, 6, 7, 11 y 12 son discretas. 6 y 12 tienen un rango extremadamente grande. 4, 5, 8 y 9 son continuas, aunque las escalas en que se miden tienen limitaciones, por lo que lo que se registra resulta ser discreto.

9 Si la variable es discreta, cada valor tiene asociado una probabilidad, a nivel poblacional, equivalente a una frecuencia relativa, a nivel muestral. También se puede representar mediante un gráfico de barras, como se muestra en la figura siguiente.

10 Si la variable es continua, en el caso muestral se divide la tabla en intervalos, que pueden representarse mediante un histograma. En el caso poblacional, en cambio, se consideran intervalos infinitamente angostos, de modo que el perfil histograma toma la forma de una curva, como en la siguiente figura.

11 Tanto en el caso discreto como continuo, existen modelos probabilísticos conocidos, que pueden aplicarse a determinados fenómenos, para representar, en forma aproximada, las proporciones de valores existentes en la población, es decir, sus probabilidades. Las funciones de probabilidad asociadas a estos modelos pueden escribirse como una ecuación matemática.

12 Es así como existen los modelos
Binomial, Geométrico, Hipergeométrico, Poisson, Exponencial, Normal, chi-cuadrado, t de Student, F, Gamma, Beta, entre muchísimos otros.

13 Por la forma en que se definieron las probabilidades, como frecuencias relativas, aplicadas a toda la población, resulta que son positivas y la suma de las probabilidades de todos los valores posibles de la variable que estamos describiendo, es igual a 1.

14 En el caso de los modelos de probabilidad continuos, como la variable toma infinitos valores, la probabilidad asociada a un valor puntual es cero. Sólo pueden ser mayores que cero las probabilidades de intervalos de valores. Estas probabilidades pueden encontrarse, para algunos casos de uso común, en tablas, en las que se presentan habitualmente probabilidades de intervalos que parten desde menos infinito hasta una selección de valores de la variable.

15 Ejemplos: Extraer al azar un número n de objetos, de una población en que hay de dos tipos (por ej, hombres y mujeres). El modelo binomial describe las probabilidades de obtener 0, 1, 2, ..., o n de uno de los dos tipos.

16 El número de días de licencias médicas que se producen en una institución, o de fallas de un sistema computacional, en un mes, es aleatorio y podría representarse mediante un modelo Poisson.

17 El número de declaraciones de impuesto que se debe revisar, hasta encontrar a un infractor, puede representarse probabilísticamente mediante un modelo geométrico.

18 La probabilidad de encontrar un ítem defectuoso al inspeccionar un número determinado de ítemes de un lote pequeño, puede representarse mediante un modelo hipergeométrico.

19 Una proporción de medidores de luz domiciliarios, que se encuentra descalibrados, en alguna región, podría representarse por un modelo beta.

20 Los tiempos entre llegadas de clientes a una oficina de atención de público, pueden representarse por un modelo exponencial.

21 El error respecto de una medida especificada, en un objeto producido por un proceso industrial, es una variable continua que puede representarse mediante un modelo normal. También podría representar la dispersión, en torno a un valor promedio, de los puntajes de la prueba de selección universitaria.

22 En el caso de una muestra de valores de una variable podíamos calcular varios descriptores, que nos mostrarán algunas características numéricas de esa variable. De la misma forma, en el caso poblacional, también existirían estos descriptores, aunque, como no observamos toda la población, no podemos conocer sus valores. Estos valores, que son fijos pero desconocidos, se denominan parámetros de la población.

23 Entre ellos destacamos el promedio poblacional, que es el valor esperado de la variable, que ya definimos. Es una medida de centro, poblacional. También está la desviación estándar poblacional, una medida de dispersión de la población. Veremos algunos de estos modelos probabilísticos:

24 EL MODELO DE PROBABILIDAD BINOMIAL
Supongamos que un experimento aleatorio tiene sólo dos resultados posibles mutuamente excluyentes y conjuntamente exhaustivos, "éxito" y "fracaso", y que p es la probabilidad de obtener éxito en cada repetición. Si se realizan n repeticiones independientes, la distribución del número de éxitos, X, resultante se denomina distribución binomial.

25 Su función de probabilidad es
para x= 0,1,2,….,n donde y

26 EJEMPLO 4: Supongamos ahora que un agente de seguros tiene cinco contactos, y piensa que para cada uno la probabilidad de conseguir una venta es 0.4. La distribución del número de ventas, X es, entonces, binomial, con n = 5 y p = 0,4, es decir, para x = 0, 1,..., 5

27 Las probabilidades para el número de éxitos (ventas logradas) son
Prob(0 éxitos) = 5! (0,4)0(0,6)5 = (0,6)5 = 0,078 0! 5! Prob(1 éxitos) = 5! (0,4)1(0,6)4 = (5)(0,4)(0,6)4 = 0,259 1! 4! Prob(2 éxitos) = 5! (0,4)2(0,6)3 = (10)(0,4)2(0,6)3 = 0,346 2! 3!

28 Prob(3 éxitos) = 5! (0,4)3(0,6)2 = (10)(0,4)3(0,6)2 = 0,230
3! 2! Prob(4 éxitos) = 5! (0,4)4(0,6)1 = (5)(0,4)4(0,6) = 0,077 4! 1! Prob(5 éxitos) = 5! (0,4)5(0,6)0 = (0,4)5 = 0,01 5! 0!

29 EJEMPLO 5: Una compañía recibe un gran cargamento de artículos, y decide aceptar el envío si en una muestra aleatoria de veinte artículos no hay más de uno defectuoso. Es decir, se acepta el cargamento si el número de artículos defectuosos es cero o uno, por lo que si Prob(X) es la función de probabilidad del número X de artículos defectuosos en la muestra, tenemos P(aceptar el cargamento) = Prob(0) + Prob(1)

30 Supongamos que la proporción de artículos defectuosos en el cargamento es p = 0,1.
Para n= 20, en la Tabla 1 del Apéndice, encontramos que las probabilidades de cero y un artículos defectuosos en la muestra son, respectivamente, Prob(0) = 0,1216 y Prob(1) = 0,2702. Por tanto, con esta regla de decisión, la probabilidad de que la compañía acepte él envío es

31 Prob(aceptar el cargamento) = 0,1216 + 0,2702 = 0,3918
Análogamente, si el 20% de los artículos del cargamento son defectuosos, es decir, si p=0,2, entonces, Prob(aceptar el cargamento) = 0, ,0576 = 0,0691 y para p= 0,3 Prob(aceptar el cargamento) = 0, ,0068 = 0,0076

32 EL MODELO DE PROBABILIDAD DE POISSON
Supongamos que puede asumirse lo siguiente: Para cada intervalo de tiempo muy pequeño de tiempo, la probabilidad de que ocurra un suceso en ese intervalo es aproximadamente proporcional a la amplitud del intervalo y no puede ocurrir dos o más sucesos en un intervalo.

33 Si lo anterior es cierto, puede probarse que la probabilidad de X ocurrencias en el intervalo de tiempo de 0 a T es donde λ es el número medio de ocurrencias entre 0 y T, y e = 2, es la base de los logaritmos naturales. Este modelo probabilístico se denomina Distribución de Poisson.

34 EJEMPLO 6: Un estudio indica que el número de huelgas anuales en una fábrica británica típica con empleados, se puede representar por una distribución de Poisson con media λ = 0,4. La función de probabilidad del número de huelgas anuales X es, entonces, para x = 0, 1, 2,…..

35 Podemos calcular ahora probabilidades para números concretos de huelgas anuales, usando e-λ = 0,6703. La probabilidad de que no haya huelgas es Prob(0 huelgas) = e-0.4(0.4)0 = (0.6703)(1) = 0!

36 Análogamente Prob(1 huelga) = e-0.4(0.4)1 = (0.6703)(0.4) = 1! Prob(2 huelgas) = e-0.4(0.4)2 = (0.6703)(0.16) = 2! Prob(3 huelgas) = e-0.4(0.4)3 = (0.6703)(0.064) = 3!

37 Prob(4 huelgas) = e-0.4(0.4)4 = (0.6703)(0.0256) = 0.0007
4! Estas probabilidades pueden usarse para hallar la probabilidad de que el número de huelgas esté en un intervalo concreto. Por ejemplo, la probabilidad de que haya más de una huelga en un año es Prob(más de 1 huelga) = 1 – P(0 huelgas) – P(1 huelga) = 1 – – =

38 EJEMPLO 7. La distribución de Poisson ha resultado ser muy útil en problemas de líneas de espera o colas. Los clientes llegan a una maquina fotocopiadora a una tasa media de dos cada cinco minutos. En la práctica, se pueden representar los procesos de llegada de esta clase mediante una distribución de Poisson.

39 Asumiendo que éste es el caso, representaremos por X el número de llegadas de clientes en un periodo de cinco minutos con lo cual X tiene una distribución de poisson con media λ = 2. La función de probabilidad es Prob(x) = e-22x x! para x = 0, 1, 2,...

40 Las probabilidades para el número de llegadas en un período de cinco minutos son
Prob(0 llegadas) = e-2(2)0 = ( )(1) = 0! Prob(1 llegadas) = e-2(2)1 = ( )(2) = 1!

41 Prob(2 llegadas) = e-2(2)2 = (0.135335)(4) = 0.2707
2! y así sucesivamente. Así, por ejemplo, la probabilidad de que se produzcan más de dos llegadas en un periodo de cinco minutos es Prob(X>2) = 1 – Prob(0) – Prob (1) – Prob (2) = 1 – – – =

42 EL MODELO DE PROBABILIDAD NORMAL
La variación existe en todo fenómeno. Cuando tal variación se debe a una multitud de fuentes, que no son identificables, y que cada una aporta una pequeñísima contribución al fenómeno que estamos observando, suele ser apropiado el modelo normal para representar la variabilidad.

43 Su función de probabilidad está definida matemáticamente por la ecuación
en que exp{} significa e elevado a lo que hay dentro del paréntesis, siendo e el número , así como π es el número Los parámetros son m y s. m es el valor medio esperado y s es la desviación estándar poblacional.

44 Un caso especial es el modelo probabilístico normal estándar, que tiene valor medio esperado cero y desviación estándar 1. La ecuación de la función de probabilidad es

45 Distribución normal Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución normal, gaussiana o de Laplace-Gauss. Fue descubierta y publicada por primera vez en 1733 por De Moivre. A la misma llegaron, de forma independiente, Laplace (1812) y Gauss (1809), en relación con la teoría de los errores de observación astronómica y física . Anatoli Timoféyevich Fomenko Gaussian Distributions I and II

46 Caracteres morfológicos de individuos (personas, animales, plantas,
Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie (tallas, pesos, diámetros, perímetros,...). Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen,... Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco. Errores cometidos al medir ciertas magnitudes. Valores estadísticos muestrales, por ejemplo: la media. Y en general cualquier característica que se obtenga como suma de muchos factores.  Otras distribuciones como la binomial o la de Poisson se aproximan a la normal. Distribuciones binomiales con n grande (n >30) y p ‘ni pequeño’ (np > 5) ‘ni grande’ ( n (1-p) > 5 ).

47 Distribución normal o gaussiana
Está caracterizada por dos parámetros: la media, μ y la desviación típica, σ. Su función de densidad es: La curva normal adopta un número infinito de formas, determinadas por sus parámetros μ y σ.

48 Características de la distribución Normal
Tiene forma de campana, es asintótica al eje de las abscisas (para x =  ) Simétrica con respecto a la media () donde coinciden la mediana (Mn) y la moda (Mo). Los puntos de inflexión tienen como abscisas los valores   . Puntos de inflexión   +   -   +  , Mo, Mn

49 Distribución normal con
=0 para varios valores s 1.6 1.2 s=0.25 s=0.5 s=1 p(x) 0.8 0.4 -2.50 -1.50 -0.50 0.50 1.50 2.50 x

50 Curvas normales con distintas medias y desviaciones estándar.
20 30 40 50 60 70 80 90 100 110 120 Curvas normales con distintas medias y desviaciones estándar. 9

51 N(μ, σ): Interpretación probabilista
Entre la media y una desviación típica tenemos siempre la misma probabilidad: aproximadamente el 68%. Entre la media y dos desviaciones típicas aprox. 95% Si tomamos intervalos centrados en μ, y cuyos extremos están… a distancia σ,  tenemos probabilidad 68% a distancia 2 σ,  tenemos probabilidad 95% a distancia 2’5 σ  tenemos probabilidad 99%

52 ¡No podemos calcular analíticamente el valor de la integral!
Podemos obtener la función de distribución F(x) integrando la función de densidad de probabilidad: De modo que la probabilidad de una variable aleatoria normal X en un intervalo a  x  b es: En particular: ¡No podemos calcular analíticamente el valor de la integral! Tabularemos sus valores numéricos...

53 Es una traslación , y un cambio de escala de la variable original.
¿Cómo calcular probabilidades asociadas a una curva normal específica? Dado que tanto  como  pueden asumir infinitos valores, es impracticable tabular las probabilidades para todas las posibles distribuciones normales. Para solucionarlo, se utiliza la distribución normal reducida o tipificada. x -  Se define una variable z = Es una traslación , y un cambio de escala de la variable original.

54 La nueva variable z se distribuye como una NORMAL con media  = 0 y desviación típica  = 1
Recordemos de nuevo que en cualquier distribución normal las probabilidades delimitadas entre :    68 %  2  95 %  3  99 % 68% 99% 95% 68% 95% 99% z

55 Tipificación Dada una variable de media μ y desviación típica σ, se denomina valor tipificado z, de una observación x, a la distancia (con signo) con respecto a la media, medido en desviaciones típicas, es decir: En el caso de variable X normal, la interpretación es clara: asigna a todo valor de N(μ, σ), un valor de N(0,1) que deja exáctamente la misma probabilidad por debajo. Nos permite así comparar entre dos valores de dos distribuciones normales diferentes, para saber cuál de los dos es más extremo.

56

57 Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes y se asignará al que tenga mejor expediente académico: El estudiante A tiene una calificación de 8 en un sistema donde la calificación de los alumnos se comporta como N(6,1). El estudiante B tiene una calificación de 80 en un sistema donde la calificación de los alumnos se comporta como N(70,10). No podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos tipificar y observar las puntuaciones sobre una distribución de referencia N(0,1). Como zA > zB, podemos decir que el porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación al estudiante A es mayor que el que ha superado B. En principio A es mejor candidato para la beca.

58 Apliquemos el cambio de variable tipificada a la función de distribución F(x):
Las probabilidades de la variable tipificada (z) están tabuladas para los diferentes valores de la variable. Para calcular probabilidades, una vez transformada, la variable a valores de z, se busca en una tabla el área correspondiente.

59 Característica de la distribución normal tipificada (reducida o estándar):
No depende de ningún parámetro. Su media es 0, su varianza es 1 y su desviación típica es 1. La curva  f(x)  es simétrica respecto al eje de ordenadas y tiene un máximo en este eje. Tiene dos puntos de inflexión en  z =1 y  z = -1.

60 Hay varios tipos de tablas de la distribución normal
La que se explica aquí representa las áreas para los diferentes valores de z desde 0 hasta +. Los valores negativos de z NO están tabulados, ya que la distribución es simétrica +

61

62 *Margen izquierdo : Los enteros de z y su primer decimal.
La tabla consta de: * Margen superior: segundo decimal * Cuerpo de la tabla: áreas correspondientes, acumuladas, desde 0 hasta 3.99 0.0 0.1 0.2 0.3 0.4 0.5

63 EJEMPLOS: 1.-¿Cuál es la probabilidad de que un
valor de z esté entre 0 y -2.03? 2.-¿Cuál es la probabilidad de que un valor de z esté entre y +2.03? 4. Hallar P ( < z < ) 3. Hallar P( z >1.25 ) 5. Hallar P ( 0.34 < z < 2.30 )

64 ¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?
Ejemplo 1 ¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03? ? Cómo la curva es simétrica P (-2.03 < z < 0) = P (0 < z < 2.03) z

65 ¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?
Ejemplo 1 ¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03? Se busca en la tabla el área correspondiente a z = 2.03 1 2 3 4 1.8 1.9 2.0 2.1 47. 88% z

66 Ejemplo 2 ¿Cuál es la probabilidad de que un valor de z esté entre y 2.03 ? En el ejemplo 1, vimos que la probabilidad de que z estuviera entre 0 y 2.03 = La misma área hay entre 0 y , por lo tanto P ( -2.03< z< 2.03) = 47.88% ? 47.88% 95.76% z

67 ¿Cuál es la probabilidad de que un valor de z sea mayor a 1.25 ?
Ejemplo 3 ¿Cuál es la probabilidad de que un valor de z sea mayor a 1.25 ? 1.- La probabilidad de 0 < z < + = 0.500 2.- La probabilidad de 0 < z < 1.25 = 3.- La probabilidad de z > 1.25 = = 50% 39.44% 10.56% ? z

68 Hallar P( -0.34 < z <  )
Ejemplo 4 Hallar P( < z <  ) 63.31% P(0 < z <0.34) = = P(-0.34 < z < 0) P (0 < z <  ) = P( < z < ) = = 13.31% 50% z

69 Ejemplo 5 Hallar P( 0.34 < z < 2.30)
35.62% z

70 EJEMPLO Sea una variable distribuida normalmente con media  = 4 y desviación típica  = 1.5. ¿Cuál es la probabilidad de encontrar un valor x  6 (P(x  6 ))?

71  =  = 1.5 Hallar P ( x > 6 ) 1.- transformar x en un valor de z z = (6 - 4)/1.5 = 1.33 2.- Hallar P ( 0 < z < 1.33) = = 0.5 ? x 6 z


Descargar ppt "MODELOS O DISTRIBUCIONES"

Presentaciones similares


Anuncios Google