DISTRIBUCIONES BIDIMENSIONALES

Slides:



Advertisements
Presentaciones similares
MSP César Eduardo Luna Gurrola
Advertisements

ESTIMACION DE PARAMETRO
Si la estadística no miente...: ¡Cuánto influyes sobre mi!
Tema 6: Regresión lineal.
Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.
REGRESION Y CORRELACION
Error Estándar de la Media
Estadística Administrativa I
DERIVADA DE UNA FUNCION REAL
Katherine V. Carrasquillo BIOL de Abril de 2011.
Estadística: -Correlación y regresión
Introducción a la Estadística. Modelos de regresión
4ºESO Matemáticas B Colegio Divina Pastora (Toledo)
Econometria 2. Modelo de Regresión Lineal Simple
Regresión y correlación
Estadística Administrativa II
Distribuciones de frecuencias bidimensionales
Estadística Descriptiva: 4. Correlación y Regresión Lineal
بسم الله الرحمن الرحيم.
EJEMPLO COMPLETO Y APLICACIONES Bloque IV * Tema 161.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
9 Regresión Lineal Simple
Estadística bidimensional
MEDIDAS DE DISPERSIÓN:
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Distribuciones bidimensionales
Escuela de Administración
Facultad: Turismo Y Hotelería
UNIVERSIDAD AUTONOMA DEL PERÚ
Distribuciones bidimensionales. Tablas de contingencia
ANALISIS DE DATOS CON EXCEL
REGRESION Y CORRELACION
CORRELACION Y REGRESION LINEAL: Introducción
Tema 7: Regresión Simple y Múltiple. EJEMPLO: Aproxima bien el número de préstamos que efectúa una biblioteca a lo largo de su primer año de vida. Nos.
RECTA DE REGRESIÓN DÍA 55 * 1º BAD CT
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Matemáticas Acceso a CFGS
Introducción a la Inferencia Estadística
ESTADÍSTICA BIDIMENSIONAL
Estadística bidimensional
Previsión de Ventas. Métodos no paramétricos Previsión de Ventas. Tema 2. 1 Antonio Montañés Bernal Curso
CORRELACION Y REGRESION LINEAL: Introducción
Tratamiento de datos y azar
LA RECTA DE REGRESIÓN CONTENIDOS:
D. BIDIMENSIONALES DÍA 53 * 1º BAD CT
Diagramas de dispersión (Nube de puntos)
Variables estadísticas bidimensionales
Estadística I. Finanzas y Contabilidad
Distribuciones de probabilidad bidimensionales o conjuntas
coeficientes de correlación de
Estadística II Regresión Lineal.
DISTRIBUCIONES BIDIMENSIONALES
TABLAS DE DOBLE ENTRADA Anexo * BAD 1º BC
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.
Construcción de modelos con regresión y correlación
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Variables estadísticas bidimensionales
TEMA 3: Estadística Bidimensional.
ANÁLISIS DE LA INFORMACIÓN La relación entre variables.
@ Angel Prieto BenitoMatemáticas Aplicadas CS I1 U.D. 12 * 1º BCS ESTADÍSTICA BIDIMENSIONAL.
TEMA 3: Estadística Bidimensoional.
@ Angel Prieto BenitoMatemáticas Aplicadas CS I1 U.D. 12 * 1º BCS ESTADÍSTICA BIDIMENSIONAL.
UNIDAD IV Regresión y correlación lineal
Tema 2: Estadística bidimensional
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
ESTADÍSTICA BIDIMENSIONAL
Transcripción de la presentación:

DISTRIBUCIONES BIDIMENSIONALES Estadística www.cursoshomologados.com

¿Qué es una distribución bidimensional? Es un conjunto de pares de valores (xi ,yi) donde cada uno de los valores representa una magnitud. En la siguiente tabla se observa las características de peso y altura de 14 soldados. Altura 172 178 181 183 190 Peso 72 80 82 83 90 Número 2 3 5

¿Cuál es el objetivo? Conocer si las magnitudes están relacionadas y si lo están de que manera. Poder prever de manera aproximada el valor de una magnitud conociendo la otra

¿ Cómo se nos presenta? 1. En tablas simples 3 4 5 6 8 9 7 2 10 1 Nota Física 3 4 5 6 8 9 Nota Música 7 2 10 Numero de alumnos 1

1 2 3 4 5 6 10 2. En tablas de doble entrada En el ejemplo se ve una tabla donde Y es el numero de hijos y X el numero de hermanos de un individuo Y X 1 2 3 4 5 6 10

3. Nube de puntos, nos dan un grafico con los datos

Para saber la distribución de las variables x e y por separado no hay más que sumar filas y columnas Así se obtienen las DISTRIBUCIONES MARGINALES X Y 1 2 3 4 5 Marginal x 10 6 18 12 14 Marginal y 11 17 8 58

Parámetros de las distribuciones marginales Ahora que conocemos como calcular las marginales , hay que obtener sus parámetros estadísticos, la media , la desviación típica y la covarianza

∑xi/N La media La media se calcula XM = Sumamos todos los datos y los dividimos por el numero total de datos, al punto (XM,YM) se le llama centro de gravedad ∑xi/N

La desviación típica Se calcula Sx2=√ ∑xi2/N - xm2

La covarianza Sxy = ∑xiyi /N – XmYm

¿Qué relación hay entre las variables? En un estudio de dos variables nos puede interesar saber que relación existe entre las dos variables, por ejemplo, horas de estudio y número de suspensos ó infracción y renta per cápita de un país etc.. Esto se conseguirá mediante el COEFICIENTE DE CORRELACION DE PEARSON: r= Sxy/ Sx*Sy

El coeficiente de correlación r está entre -1 y 1. Si su valor absoluto es cercano a 1 , se dice que existe una CORRELACIÓN FUERTE entre las variables. Si es próximo a 0 se dice que la correlación es débil Si r es positivo quiere decir que cuando una magnitud también lo hace. Si es negativo, mientras una crece la otra disminuye y viceversa Karl Pearson

Ejemplo ¿Qué relación existe entre las notas conseguidas en física (variable x) y las horas que ven la televisión los alumnos de 4ºESO (variable y)? Sx = 1.23 Sy = 3 Sxy= - 3.19

Calculamos el coeficiente de correlación Como el valor absoluto de r es próximo a r se dice que las variables tienen una correlación fuerte. Además r es negativo por tanto tienen correlación negativa. Es decir a más horas de televisión menos nota en la asignatura de física

¿Podemos predecir resultados? Como hemos visto antes los datos pueden venir dados en una nube de puntos. El objetivo es encontrar una recta que aproximo de la mejor manera los puntos de la distribución

Sabemos que para calcular una recta basta con saber un punto y la pendiente de la misma. El punto que es más próximo a todos los datos de la distribución es (Xm,Ym), por tanto ya tenemos un punto de la recta buscada. Ahora bien, las pendientes dependerán de si queremos predecir un dato de la variable x e y.

Rectas de regresión Recta de regresión de Y sobre X Y= Ym + Sxy/Sx2 * (X-Xm) Recta de regresión de X sobre Y X= Xm + Sxy/Sy2 * (Y-Ym)

Es decir, si conozco solamente una magnitud y deseo saber la otra de manera aproximada no tengo más que construir su recta de regresión, sustituir su valor en la recta de regresión y obtener así el valor aproximado. Hay que tener en cuenta que cuanto mayor sea el coeficiente de correlación mas fiable será nuestra predicción

Ejemplo En la siguiente tabla se muestra el índice de mortalidad y el porcentaje de personas mayores de 64 años de algunos países europeos

Esp. Grec. Hol. Ita. Irl. Fra. Din. Belg. Lux. 7,4 8,2 8,7 9,4 10 10,8 Índice de mortalidad 7,4 8,2 8,7 9,4 10 10,8 11,1 11,3 Mayores de 64 años 11,6 13,2 13,6 10,7 15,4 14,4 13,5 15,3

Ahora calculamos la media y desviación típica de las marginales, y la covarianza:   Media Desv . Tipica X 9,58888889 1,34298589 Y 13,2222222 1,70863818 Covarianza 1,46469136

Y el coeficiente de correlación es r = Es decir, un coeficiente de correlación medio, con lo que podemos concluir que la correlación entre índice de mayores de 65 años y mortalidad no es muy alta 0,63829958

Y las rectas de regresión que son: Y= 1.34/1.46(x- 9.59)+13.22 X= 1.71/1.46(y-13.22)+9.59

Si deseáramos conocer el porcentaje de mayores suponiendo que hay un país con un índice de mortalidad del 6%, hay que sustituir en la recta de regresión de y el valor 6, obteniendo 9.95% de mayores. Aunque no presenta mucha fiabilidad por no tener un buen coeficiente de correlación de Pearson

Cuidado al seleccionar variable La estadística bidimensional es un arma eficaz si se utiliza correctamente, un coeficiente r alto no quiere decir que necesariamente las variables tengan relación ya que puede ser debido al azar. El matemático debe seleccionar unas variables lógicas. Por ejemplo si seleccionamos dos variables como, consumo de pollo en EEUU y grado de delincuencia en Chile, podemos obtener por azar un coeficiente alto pero la razón nos dice que nada tienen que ver

Fin