6. Variable aleatoria continua

Slides:



Advertisements
Presentaciones similares
Escuchamos 1 2 hablas 2 3 L o s R e c u a d r o s E s c o n d i d o s Yo/ tomar Ellas/ estudiar Nosotros/ escuchar Tú/ hablar Los Verbos AR.
Advertisements

La mediana La mediana es el valor tal que el 50 % de las observaciones son menores y 50 % de ellas son mayores a dicho valor. En otra palabras, la mediana.
Las distribuciones binomial y normal.
Estadística Unidad III
Descripción de los datos: medidas de dispersión
Medidas de Posición Central:
Métodos Cuantitativos Aplicados a Los Negocios.
Ejemplo A continuación aparecen las tasas de retorno de dos fondos de inversión durante los últimos 10 años. 1. ¿Cuál es más riesgoso? 2. ¿En cuál invertiría.
Unidad de competencia II Estadística descriptiva:
Unidad de competencia II Estadística descriptiva:
Capítulo 4 Otras medidas descriptivas
Estadística Administrativa I
Variable Aleatoria Continua. Principales Distribuciones
Bioestadística Distribución Normal
Capítulo 3: Medidas de posición
Distribuciones de probabilidad bidimensionales o conjuntas
8. Distribuciones continuas
TEORÍA DE CONJUNTOS.
Matemáticas aplicadas a las CCSS II Ana Pola IES Avempace
DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA
MEDIDAS DE DISPERSIÓN.
Introducción a las Señales Aleatorias ISAL
La ley de los grandes números
Tema 5: Modelos probabilísticos
Rango y Rango intercuartil
La transformada de Laplace
Introducción Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto a una medida que indique el valor alrededor del cual.
Distribuciones de Probabilidad
ESTADÍSTICA UNIDIMENSIONAL
Curso de Estadística Básica
Introducción Media y varianza poblacional Sea
WALT: talking about dates and saying when your birthday is WILF: To be able to write & understand months and dates in Spanish to get to a Level 2 To be.
¿Qué hora es? What time is it?. ¿Qué hora es? It’s 1:00 Es la una (notice we do not say uno for time but una) 1:00 is the ONLY time where we say “Es la…”
PROCESAMIENTO DE DATOS DE VIENTO 1º Parte.
Medidas de Dispersión Estadística E.S.O.
ESTADIGRAFOS DE DISPERSION
PROBABILIDAD Y ESTADISTICA
Probabilidad. Variables aleatorias.
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
4.1 Continuidad en un punto 4.2 Tipos de discontinuidades 4.3 Continuidad en intervalos.
Accuracy & Precision. Fundamental principle of measuring: No measurement is exact and the true value is never known Accuracy & Precision.
CPU 8088 vs. Pentium TEEL 4011 Prof. Jaime José Laracuente-Díaz.
The Normal Distribution To calculate the probability of a Normal distribution between a and b:
Valor que toma la variable aleatoria
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
Tema 2: Parámetros Estadísticos
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.
Unidad II: Variables Aleatorias Concepto Discreta y Continua Fun. de densidad Fun. de probabilidad F. de distribución Esperanza y Varianza Propiedades.
Unit 2A: Lesson 2 How to Talk About Your Schedule Gramática- Present tense of –ar verbs.
Distribuciones de probabilidad bidimensionales o conjuntas
DISTRIBUCIONES MUESTRALES
¿Qué haces en la escuela? Question words, objects, yo-go’s.
Distribución de probabilidad conjunta
Talking about weather Discussing the weather is a very human thing to do, and every language has its own way of doing it. If you think about it, the weather.
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
Elementos Básicos de Probabilidad y Estadística
SESION 5: MEDIDAS DE FORMA. Hasta el momento nos hemos enfocado en el análisis de datos a partir de los valores centrales y la variabilidad de las observaciones.
ESTADÍSTICA UNIDIMENSIONAL
Alicia De Gyves López Licenciatura Tecnologías de la Información y Comunicación 3º. Cuatrimestre Estadística Descriptiva Distribuciones de Probabilidad.
Distribuciones de Probabilidad
La distribución normal
Inferencia Estadística Conceptos Previos. Conceptos Previos Población: Es la colección de toda la posible información que caracteriza a un fenómeno aleatorio.
DEFINICIÓN DE NORMALIDAD MEDIDAS DE DESCRIPCIÓN DE DATOS
LOS VERBOS REFLEXIVOS. WRITE: What is a reflexive verb? A reflexive verb describes when a person doing an action is also receiving the action.
7. Distribución normal Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones.
Estadística descriptiva
Medidas de tendencia central
Transcripción de la presentación:

6. Variable aleatoria continua Un diálogo entre C3PO y Han Solo, en El Imperio Contraataca, cuando el Halcón Milenario se dispone a entrar en un campo de asteroides: - C3PO: Señor, la probabilidad de sobrevivir al paso por el campo de asteroides es, aproximadamente, de una entre 3721. - HAN SOLO: ¡No me hables de probabilidades!

Variable aleatoria continua versus discreta. Considera el siguiente ejemplo: Tenemos dos dados: el primero es un dado convencional que tiene 6 caras, todas ellas equiprobables. El segundo, es un dado ‘continuo’, es decir, al tirar el dado podemos obtener cualquier número real comprendido en el intervalo [0,6]. Todos los números son equiprobables. - Por Laplace, sabemos que en el primer caso, P(X=x)=1/6 - En el segundo caso, P(X=x)=1/∞ = 0!! En general, para toda v.a. continua X, la probabilidad de que tome un determinado valor, p(X = x), es simpre igual a cero. Este hecho es, junto al uso de la integral en lugar de sumatorios, la diferencia fundamental entre ambos tipos de variables. ¿Cómo calcular entonces probabilidades?

Función de densidad de probabilidad La probabilidad de que X esté entre a y b se puede calcular como el área que queda de- bajo de la curva f(x)‏ La función de densidad per se NO ES UNA PROBABILIDAD Es decir, NO es verdad que f(x) = P(X = x)‏ Recuerda que P(X=x) es siempre igual a cero si X es una v.a. continua. f(x)‏ Al igual que la función de masa de probabilidad, la función de densidad siempre toma valores positivos. Pero, dado que no es una probabilidad, PUEDE TOMAR VALORES SUPERIORES A 1. El área delimitada por la curva f(x) en el intervalor [a,b] se calcula como la integral de la función en dicho intervalo. a b X

Área = 1 Imaginemos una ruleta de la fortuna con un perímetro circular de longitud 1. Como la flecha puede señalar infinitos valores no numerables, todo resultado tiene probabilidad 0. ¿Cómo podemos definir entonces probabilidades? Podemos hacerlo asignando probabilidades a intervalos, p. ej.: la probabilidad de que el resultado esté entre 0 y 0,5 es 1/2, puesto que se trata de la mitad del círculo. ¿Cómo podemos representarlo mediante una gráfica? Área = 1 1

1 a 1 a b 1 El área sobre un punto como a, es cero. La probabilidad de que obtengamos un valor entre a y b es b - a.

Función de distribución de una variable aleatoria continua Para una variable aleatoria continua disponemos de un conjunto no numerable de valores. No es posible definir una probabilidad para cada uno. Por eso definimos previamente la función de distribución de probabilidad, que sí tiene un significado inmediato y semejante al caso discreto:

Definimos la función de distribución para la variable aleatoria continua como: Donde p(x) se llama función densidad de probabilidad de la distribución F(x), es continua y definida no negativa. Diferenciando tenemos: para cada x donde p(x) es continua.

Función de densidad de probabilidad Es una función no negativa de integral 1. Se puede pensar como la generalización de un histograma de frecuencias relativas para variable continua. b a

A partir de la definición es fácil ver que: Observa que: A partir de la definición es fácil ver que: De modo que la probabilidad es el área bajo la curva densidad p(x) entre x = a y x = b. Nota: para cualquier par de valores a y b, en el caso de una variable aleatoria continua, las probabilidades correspondientes a los intervalos a < X  b, a < X < b, a  X < b y a  X  b son la misma. No así en variable discreta.

entre 0 y 2. Si la función de densidad de X es Un cartero llega cada mañana entre las 8 y las 10. Definimos X = tiempo transcurrido (medido en horas) hasta que llega el cartero. Por tanto, X está entre 0 y 2. Si la función de densidad de X es (a) Calcula el valor de k (b) ¿Cuál es la probabilidad de que el cartero llegue entre las 9 y las 10? (c) ¿Cuál es la probabilidad de que llegue a las 9 en punto? Si X está entre 0 y 2 En caso contrario (a) (b) (c)

ò 3164 . ) ( 75 2 = - £ dv v F X P F(x) = 0 si x  -1 Supongamos que X tiene como función densidad a p(x) = 0.75(1-x2) si -1 x 1 y cero en otro caso. Encuentra la función de distribución y las probabilidades P(-1/2  X  1/2) y P(1/4  X  2). Y x tal que P(X  x) = 0.95 F(x) = 0 si x  -1 F(x) = 1 si x >1. 1 3164 . ) ( 75 2 4 = - £ ò dv v F X P

Esperanza matemática o media Decimos que una distribución es simétrica si existe un valor c tal que para cada real x: p (c + x) = p(c - x). Observa que si una distribución es simétrica con respecto a c, entonces su media  es  = c.

Varianza y desviación típica La desviación típica o estándar es el valor positivo de la raíz cuadrada de 2. Ambas miden la dispersión de la distribución. Observa que la varianza siempre es 2 > 0, excepto para una distribución con p(x) = 1 en un punto y p(x) = 0 en el resto (una delta de Dirac), en cuyo caso 2 = 0.

Distribución de probabilidad uniforme U(a,b) Función de densidad de probabilidad: Área = 1 Recordemos que la función de distribución se define como: a b Entonces:

Igualmente, partiendo de la función de distribución: Podemos calcular la función de densidad de probabilidad:

Calcula la probabilidad Ejemplo: p x para ( ) = - £ ì í ï î 1 47 41 el resto de valores Calcula la probabilidad Area = 0.5 5

Calcula la media, la varianza y la desviación típica de la distribución de probabilidad uniforme. 1 p(x) x (2=1/12) (2=3/4) 2 -1 Nota: Observa que estas distribuciones tienen la misma media pero distinta varianza. Mayor varianza implica mayor dispersión alrededor de la media.

Momentos de orden k centrados en el origen y en la media. Observa que para k = 2: 2 = E((X - )2)

Otras medidas de la anchura de la distribución: − Desviación absoluta media, Δx: − Intervalo R ≡ xmax − xmin, − Nivel de confianza al 68.3% [a,b] tal que: y el intervalo [a,b] es mínimo. − Cuartiles [a,b] tal que

Siguen un orden alfabético Otros valores típicos o medidas del valor central son: mediana moda xmod: es el valor para el cuál la distribución toma su máximo absoluto. Discr. Cont. Siguen un orden alfabético

3er momento: describe la asimetría de la distribución. Los momentos de orden superior son menos robustos y, por lo tanto, menos utilizados 3er momento: describe la asimetría de la distribución. Asimetría (skewness) 4o momento: describe el aplanamiento de la distribución. Kurtosis (Figs. © Press et al., “Numerical Recipes”) Se suele medir en una escala que toma 3 como su cero, ya que éste es el valor de la kurtosis de una distribución normal estándar

We adopt a cumulative distribution due to small system sizes”. “Our data sets cover 12 different sports, such as tennis, golf, snooker and volleyball, etc. All the data are up-to-date to February 2011: www.atpworldtour.com, www.wtatennis.com, www.pga.com, www.lpga.com, www.ittf.com, www.fivb.org, www.fifa.com, www.world snooker.com, www.fie.ch, www.bwfbadminton.org, www.fiba.com, www.ibaf.org, www.fih.ch, www.ihf.info). We adopt a cumulative distribution due to small system sizes”.

Every sport has its own scoring system, hence the orders of magnitude of scores are usually different. In order to make the distributions of scores or prize money comparable for different sports, we rescale the quantities of interest. That is, RS = S/Smax, (1) where S denotes the values of quantities considered, e.g. scores or prize money, and Smax is the maximum value of S in the sample, which pertains to the no. 1 player in the ranking list by using S.

Figure 1. Cumulative distributions of scores and/or prize money for 12 different sports.). All the black solid curves in the figures are the power laws with exponential decay, The evidence of the power laws in the sports ranking indicates that there is still a significant probability having supermen such as Roger Federer in tennis or Tiger Woods in golf. But the prevalent probability is still players who do not play at the top level. Unlike the human height system, it seems there is no typical player who plays at an average level.

A simple toy model of sports ranking systems What is the origin of the universal scaling in different sports systems?

The most important parameter in our model is a, the so-called competitiveness parameter. The number of players Np and the number of tournaments Nt only have finite-size effects. It is natural to check the dependence of the simulation results on these parameters, which can reflect the resilience of our model.

Our main point is that a large part of statistics is universal in the sense that it is independent of most details of the game but already determined by the tournament structure. Imagine a tournament with N = 2m contestants to construct a simple binary tree. Each person is assigned a real number r, which we refer as competitiveness. We can always rescale the highest competitiveness as unity and the lowest one as null without loss of generality, the real number r belongs to a closed interval from zero to one.

winning chance for the contestant with r at the first round of the tournament When the first round has been finished, the distribution of their competitiveness is The factor of two in front is needed because the number of survivors has become one half of N.

The average prize money for this person with r can thus be calculated as