La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

DISTRIBUCIONES BIDIMENSIONALES Estadística www.cursoshomologados.com.

Presentaciones similares


Presentación del tema: "DISTRIBUCIONES BIDIMENSIONALES Estadística www.cursoshomologados.com."— Transcripción de la presentación:

1 DISTRIBUCIONES BIDIMENSIONALES Estadística

2 ¿ Qué es una distribución bidimensional? Es un conjunto de pares de valores (x i,y i ) donde cada uno de los valores representa una magnitud. En la siguiente tabla se observa las características de peso y altura de 14 soldados. Altura Peso Número23522

3 ¿Cuál es el objetivo? Conocer si las magnitudes están relacionadas y si lo están de que manera. Poder prever de manera aproximada el valor de una magnitud conociendo la otra

4 ¿ Cómo se nos presenta? 1. En tablas simples Nota Física Nota Música Numero de alumnos

5 2. En tablas de doble entrada En el ejemplo se ve una tabla donde Y es el numero de hijos y X el numero de hermanos de un individuo Y X

6 3. Nube de puntos, nos dan un grafico con los datos

7 Para saber la distribución de las variables x e y por separado no hay más que sumar filas y columnas Así se obtienen las DISTRIBUCIONES MARGINALES X Y Margin al x Margin al y

8 Parámetros de las distribuciones marginales Ahora que conocemos como calcular las marginales, hay que obtener sus parámetros estadísticos, la media, la desviación típica y la covarianza

9 La media La media se calcula X M = Sumamos todos los datos y los dividimos por el numero total de datos, al punto (X M,Y M ) se le llama centro de gravedad x i /N

10 La desviación típica Se calcula Sx 2 = x i 2 /N - x m 2

11 La covarianza Sxy = x i y i /N – X m Y m

12 ¿Qué relación hay entre las variables? En un estudio de dos variables nos puede interesar saber que relación existe entre las dos variables, por ejemplo, horas de estudio y número de suspensos ó infracción y renta per cápita de un país etc.. Esto se conseguirá mediante el COEFICIENTE DE CORRELACION DE PEARSON: r= S xy / S x *S y

13 El coeficiente de correlación r está entre -1 y 1. Si su valor absoluto es cercano a 1, se dice que existe una CORRELACIÓN FUERTE entre las variables. Si es próximo a 0 se dice que la correlación es débil Si r es positivo quiere decir que cuando una magnitud también lo hace. Si es negativo, mientras una crece la otra disminuye y viceversa Karl Pearson

14 Ejemplo ¿ Qué relación existe entre las notas conseguidas en física (variable x) y las horas que ven la televisión los alumnos de 4ºESO (variable y)? Sx = 1.23 Sy = 3 Sxy=

15 Calculamos el coeficiente de correlación r= /1.23 * 3= Como el valor absoluto de r es próximo a r se dice que las variables tienen una correlación fuerte. Además r es negativo por tanto tienen correlación negativa. Es decir a más horas de televisión menos nota en la asignatura de física

16 ¿Podemos predecir resultados? Como hemos visto antes los datos pueden venir dados en una nube de puntos. El objetivo es encontrar una recta que aproximo de la mejor manera los puntos de la distribución

17 Sabemos que para calcular una recta basta con saber un punto y la pendiente de la misma. El punto que es más próximo a todos los datos de la distribución es (X m,Y m ), por tanto ya tenemos un punto de la recta buscada. Ahora bien, las pendientes dependerán de si queremos predecir un dato de la variable x e y.

18 Rectas de regresión Recta de regresión de Y sobre X Y= Y m + S xy /S x 2 * (X-X m ) Recta de regresión de X sobre Y X= X m + S xy /S y 2 * (Y-Y m )

19 Es decir, si conozco solamente una magnitud y deseo saber la otra de manera aproximada no tengo más que construir su recta de regresión, sustituir su valor en la recta de regresión y obtener así el valor aproximado. Hay que tener en cuenta que cuanto mayor sea el coeficiente de correlación mas fiable será nuestra predicción

20 Ejemplo En la siguiente tabla se muestra el índice de mortalidad y el porcentaje de personas mayores de 64 años de algunos países europeos

21 Esp.Grec.Hol.Ita.Irl.Fra.Din.Belg.Lux. Índice de mortalida d 7,48,28,79,49,41010,811,111,3 Mayores de 64 años 11,311,613,213,610,715,414,413,515,3

22 Ahora calculamos la media y desviación típica de las marginales, y la covarianza: Media Desv. Tipica X9, , Y13, , Covarianza1,

23 Y el coeficiente de correlación es Y el coeficiente de correlación es r = Es decir, un coeficiente de correlación medio, con lo que podemos concluir que la correlación entre índice de mayores de 65 años y mortalidad no es muy alta 0,

24 Y las rectas de regresión que son: Y las rectas de regresión que son: Y= 1.34/1.46(x- 9.59) X= 1.71/1.46(y-13.22)+9.59

25 Si deseáramos conocer el porcentaje de mayores suponiendo que hay un país con un índice de mortalidad del 6%, hay que sustituir en la recta de regresión de y el valor 6, obteniendo 9.95% de mayores. Aunque no presenta mucha fiabilidad por no tener un buen coeficiente de correlación de Pearson Si deseáramos conocer el porcentaje de mayores suponiendo que hay un país con un índice de mortalidad del 6%, hay que sustituir en la recta de regresión de y el valor 6, obteniendo 9.95% de mayores. Aunque no presenta mucha fiabilidad por no tener un buen coeficiente de correlación de Pearson

26 Cuidado al seleccionar variable La estadística bidimensional es un arma eficaz si se utiliza correctamente, un coeficiente r alto no quiere decir que necesariamente las variables tengan relación ya que puede ser debido al azar. El matemático debe seleccionar unas variables lógicas. Por ejemplo si seleccionamos dos variables como, consumo de pollo en EEUU y grado de delincuencia en Chile, podemos obtener por azar un coeficiente alto pero la razón nos dice que nada tienen que ver

27 Fin


Descargar ppt "DISTRIBUCIONES BIDIMENSIONALES Estadística www.cursoshomologados.com."

Presentaciones similares


Anuncios Google