La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

1 6. Variable aleatoria continua Un diálogo entre C3PO y Han Solo, en El Imperio Contraataca, cuando el Halcón Milenario se dispone a entrar en un campo.

Presentaciones similares


Presentación del tema: "1 6. Variable aleatoria continua Un diálogo entre C3PO y Han Solo, en El Imperio Contraataca, cuando el Halcón Milenario se dispone a entrar en un campo."— Transcripción de la presentación:

1 1 6. Variable aleatoria continua Un diálogo entre C3PO y Han Solo, en El Imperio Contraataca, cuando el Halcón Milenario se dispone a entrar en un campo de asteroides: - C3PO: Señor, la probabilidad de sobrevivir al paso por el campo de asteroides es, aproximadamente, de una entre HAN SOLO: ¡No me hables de probabilidades!

2 Variable aleatoria continua versus discreta. Considera el siguiente ejemplo: Tenemos dos dados: el primero es un dado convencional que tiene 6 caras, todas ellas equiprobables. El segundo, es un dado continuo, es decir, al tirar el dado podemos obtener cualquier número real comprendido en el intervalo [0,6]. Todos los números son equiprobables. - Por Laplace, sabemos que en el primer caso, P(X=x)=1/6 - En el segundo caso, P(X=x)=1/ = 0!! En general, para toda v.a. continua X, la probabilidad de que tome un determinado valor, p(X = x), es simpre igual a cero. Este hecho es, junto al uso de la integral en lugar de sumatorios, la diferencia fundamental entre ambos tipos de variables. ¿Cómo calcular entonces probabilidades?

3 Función de densidad de probabilidad f(x) X a b La probabilidad de que X esté entre a y b se puede calcular como el área que queda de- bajo de la curva f(x) El área delimitada por la curva f(x) en el intervalor [a,b] se calcula como la integral de la función en dicho intervalo. Al igual que la función de masa de probabilidad, la función de densidad siempre toma valores positivos. Pero, dado que no es una probabilidad, PUEDE TOMAR VALORES SUPERIORES A 1. La función de densidad per se NO ES UNA PROBABILIDAD Es decir, NO es verdad que f(x) = P(X = x) Recuerda que P(X=x) es siempre igual a cero si X es una v.a. continua.

4 4 Imaginemos una ruleta de la fortuna con un perímetro circular de longitud 1. Como la flecha puede señalar infinitos valores no numerables, todo resultado tiene probabilidad 0. ¿Cómo podemos definir entonces probabilidades? Podemos hacerlo asignando probabilidades a intervalos, p. ej.: la probabilidad de que el resultado esté entre 0 y 0,5 es 1/2, puesto que se trata de la mitad del círculo. ¿Cómo podemos representarlo mediante una gráfica? Área =

5 ab La probabilidad de que obtengamos un valor entre a y b es b - a a El área sobre un punto como a, es cero.

6 6 Función de distribución de una variable aleatoria continua Para una variable aleatoria continua disponemos de un conjunto no numerable de valores. No es posible definir una probabilidad para cada uno. Por eso definimos previamente la función de distribución de probabilidad, que sí tiene un significado inmediato y semejante al caso discreto:

7 7 Donde p(x) se llama función densidad de probabilidad de la distribución F(x), es continua y definida no negativa. Diferenciando tenemos: para cada x donde p(x) es continua. Definimos la función de distribución para la variable aleatoria continua como:

8 8 Función de densidad de probabilidad Es una función no negativa de integral 1. Se puede pensar como la generalización de un histograma de frecuencias relativas para variable continua. a b

9 9 Observa que: De modo que la probabilidad es el área bajo la curva densidad p(x) entre x = a y x = b. A partir de la definición es fácil ver que: Nota: para cualquier par de valores a y b, en el caso de una variable aleatoria continua, las probabilidades correspondientes a los intervalos a < X b, a < X < b, a X < b y a X b son la misma. No así en variable discreta.

10 Un cartero llega cada mañana entre las 8 y las 10. Definimos X = tiempo transcurrido (medido en horas) hasta que llega el cartero. Por tanto, X está entre 0 y 2. Si la función de densidad de X es (a) Calcula el valor de k (b) ¿Cuál es la probabilidad de que el cartero llegue entre las 9 y las 10? (c) ¿Cuál es la probabilidad de que llegue a las 9 en punto? Si X está entre 0 y 2 En caso contrario (a) (b) (c) 0

11 Supongamos que X tiene como función densidad a p(x) = 0.75(1-x 2 ) si -1 x 1 y cero en otro caso. Encuentra la función de distribución y las probabilidades P(-1/2 X 1/2) y P(1/4 X 2). Y x tal que P(X x) = 0.95 F(x) = 0 si x -1 F(x) = 1 si x > )1(75.0)()2()2( dvvFFXP

12

13

14

15 15 Esperanza matemática o media Decimos que una distribución es simétrica si existe un valor c tal que para cada real x: p (c + x) = p(c - x). Observa que si una distribución es simétrica con respecto a c, entonces su media es = c.

16 16 Varianza y desviación típica La desviación típica o estándar es el valor positivo de la raíz cuadrada de 2. Ambas miden la dispersión de la distribución. Observa que la varianza siempre es 2 > 0, excepto para una distribución con p(x) = 1 en un punto y p(x) = 0 en el resto (una delta de Dirac), en cuyo caso 2 = 0.

17 17 Distribución de probabilidad uniforme U(a,b) Área = 1 a b Función de densidad de probabilidad: Recordemos que la función de distribución se define como: Entonces:

18 18 Igualmente, partiendo de la función de distribución: Podemos calcular la función de densidad de probabilidad:

19 19 Area = 0.5 px parax () el resto de valores Ejemplo: Calcula la probabilidad

20 p(x)p(x) x ( 2 =1/12) 01 1 p(x)p(x) x ( 2 =3/4) 2 Nota: Observa que estas distribuciones tienen la misma media pero distinta varianza. Mayor varianza implica mayor dispersión alrededor de la media. Calcula la media, la varianza y la desviación típica de la distribución de probabilidad uniforme.

21

22 22 Momentos de orden k centrados en el origen y en la media. Observa que para k = 2: 2 = E((X - ) 2 ) Momentos de orden k

23

24

25 25 Otras medidas de la anchura de la distribución: Desviación absoluta media, Δ x : Intervalo R x max x min, Nivel de confianza al 68.3% [a,b] tal que: y el intervalo [a,b] es mínimo. Cuartiles [a,b] tal que

26 26 Otros valores típicos o medidas del valor central son: mediana moda x mod : es el valor para el cuál la distribución toma su máximo absoluto. Siguen un orden alfabético Discr. Cont.

27 27 Los momentos de orden superior son menos robustos y, por lo tanto, menos utilizados 3 er momento: describe la asimetría de la distribución. Asimetría (skewness) 4 o momento: describe el aplanamiento de la distribución. Kurtosis (Figs. © Press et al., Numerical Recipes) Se suele medir en una escala que toma 3 como su cero, ya que éste es el valor de la kurtosis de una distribución normal estándar

28 28

29 29

30 30

31 31

32

33 33

34 Our data sets cover 12 different sports, such as tennis, golf, snooker and volleyball, etc. All the data are up-to-date to February 2011: snooker.com, We adopt a cumulative distribution due to small system sizes.

35 Every sport has its own scoring system, hence the orders of magnitude of scores are usually different. In order to make the distributions of scores or prize money comparable for different sports, we rescale the quantities of interest. That is, R S = S/S max, (1) where S denotes the values of quantities considered, e.g. scores or prize money, and S max is the maximum value of S in the sample, which pertains to the no. 1 player in the ranking list by using S.

36 Figure 1. Cumulative distributions of scores and/or prize money for 12 different sports.). All the black solid curves in the figures are the power laws with exponential decay, The evidence of the power laws in the sports ranking indicates that there is still a significant probability having supermen such as Roger Federer in tennis or Tiger Woods in golf. But the prevalent probability is still players who do not play at the top level. Unlike the human height system, it seems there is no typical player who plays at an average level.

37

38

39 A simple toy model of sports ranking systems What is the origin of the universal scaling in different sports systems?

40 The most important parameter in our model is a, the so-called competitiveness parameter. The number of players N p and the number of tournaments N t only have finite-size effects. It is natural to check the dependence of the simulation results on these parameters, which can reflect the resilience of our model.

41

42

43

44

45 Our main point is that a large part of statistics is universal in the sense that it is independent of most details of the game but already determined by the tournament structure. Imagine a tournament with N = 2 m contestants to construct a simple binary tree. Each person is assigned a real number r, which we refer as competitiveness. We can always rescale the highest competitiveness as unity and the lowest one as null without loss of generality, the real number r belongs to a closed interval from zero to one.

46 winning chance for the contestant with r at the first round of the tournament When the first round has been finished, the distribution of their competitiveness is The factor of two in front is needed because the number of survivors has become one half of N.

47

48 The average prize money for this person with r can thus be calculated as

49

50

51

52

53 53


Descargar ppt "1 6. Variable aleatoria continua Un diálogo entre C3PO y Han Solo, en El Imperio Contraataca, cuando el Halcón Milenario se dispone a entrar en un campo."

Presentaciones similares


Anuncios Google