La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Tema 3: Distribuciones bidimensionales: Relación estre dos variables estadísticas. 1. 1. Relación estadísca: Correlación. 2. 2. Diagramas de dispersión.

Presentaciones similares


Presentación del tema: "Tema 3: Distribuciones bidimensionales: Relación estre dos variables estadísticas. 1. 1. Relación estadísca: Correlación. 2. 2. Diagramas de dispersión."— Transcripción de la presentación:

1 Tema 3: Distribuciones bidimensionales: Relación estre dos variables estadísticas. 1. 1. Relación estadísca: Correlación. 2. 2. Diagramas de dispersión o nube de puntos. 3. 3. Tablas de frecuencia: distribuciones marginales y distribuciones condicionada. 4. 4. Parámetros estadísticos bidimensionales: 4.1 4.1 Media y desviación típica marginal. 4.2 4.2 Covarianza. 4.3 4.3 Coeficiente de correlación lineal. 5. 5. Rectas de regresión.

2 1. Relación estadística: Correlación. Dos variables x e y están relacionadas estadísticamente cuando conocida la primera se puede estimar aproximadamente el valor de la segunda. * Ejemplos : * Ingresos y gastos de una familia. * * Producción y ventas de una fabrica. * * Gastos de publicidad y beneficios de una empresa. La correlación estadística determina la relación o la dependencia que existe entre las dos variables que intervienen en una distribución bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra.

3 2. Diagrama de dispersión o nube de puntos. La representación gráfica se realiza mediante un dibujo realizado en un sistema bidimensional de coordenadas cartesianas. En este tipo de diagramas cada punto representa la puntuación que el sujeto obtiene en las dos variables, determinando su puntuación por la lectura de los valores que aparecen en la escala vertical y horizontal. A continuación veremos un ejemplo real, donde la figura representada refleja la covariación entre la inteligencia (CI) y el rendimiento escolar (Nota) de los sujetos estudiados.

4 Estando claro a partir de la observación de los puntos que existe una tendencia general a que los sujetos en la medida que tengan más inteligencia obtendrán también mejor nota académica. A este tipo de relación se le conoce como directa o positiva. Si se observase un proceso contrario, es decir, a medida que aumenta la inteligencia disminuye el rendimiento académico, la correlación sería inversa o negativa.

5 3. Tablas de frecuencia: distribuciones marginales y distribuciones condicionada. Sea una población estudiada simultaneamente según dos caracteres X e Y; que representaremos genéricamente como (xi; yj ; nij), donde xi; yj, son dos valores cualesquiera y nij es la frecuencia absoluta conjunta del valor i de X con el j de Y. Cuando se estudian conjuntamente dos variables, surgen tres tipo de distribuciones: Distribuciones conjuntas, distribuciones marginales y distribuciones condicionadas.

6 - Distribuciones Marginales: son distribuciones unidimensionales del total de los individuos de la población, respecto a cada una de las características, es decir, que en esta distribución se estudia el comportamiento de una variable independientemente de lo que le ocurra la otra. Llamamos ni*, la frecuencia absoluta marginal de xi, al número de veces que ocurre la variable i de X, independientemente de lo que ocurra con Y. Llamaremos n*j, la frecuencia absoluta marginal de x*j, al número de veces que ocurre la variable j de Y, independientemente de lo que ocurra con X. Partiendo de las frecuencias marginales, podemos determinar las medias, varianzas y desviaciones típicas de las variables.

7 - Distribuciones Condicionadas: Sean X e Y dos variables, con p y q variables respectivamente, llamaremos distribución condicionada de Y a que X tome la variable xi al conjunto de valores que toma Y siendo el valor tomado por X= xi y lo notaremos Y | X = xi. De esta forma también se considera la distribución de X condicionada a Y, llamaremos distribución condicionada de X a que Y tome la modalidad yj al conjunto de valores que toma X siendo el valor tomado por Y= yj y lo notaremos X | Y = yj

8 4. Parámetros estadísticos bidimensionales: - Media y desviación típica marginal: La media marginal es la media de las distribuciones marginales tanto de la X como de la Y. Se calcula: sumandos todos los datos y los dividiéndolo por el número total de datos. La desviación típica marginal es la desviación típica de las distribuciones marginales de la X y de la Y. se calcula mediante la fórmula : Sx 2 =√ ∑x i 2 /N - x m 2

9 - Covarianza: La covarianza es una medida que nos permite cuantificar la variabilidad conjunta de las variables X e Y. El signo de la covarianza nos permitirá conocer como interactúan las variables, así: * Si >0, al aumentar los valores de X aumentan los de Y, se dice que hay una relación directa entre las variables. * Si <0, al aumentar los valores de X disminuyen los de Y, se dice que hay una relación inversa entre las variables. * Si =0 las variables están incorreladas, no hay relación lineal entre las variables, eso no quiere decir que no haya relación estadística.

10 - Coeficiente de correlación lineal: El coeficiente de correlación lineal es el cociente entre la covarianza y el producto de las desviaciones típicas de ambas variables. El coeficiente de correlación lineal se expresa mediante la letra r.

11 5. Rectas de Regresión. Si al calcular el coeficiente de correlación lineal obtenemos un número que en valor absoluto está próximo a 1, podemos afirmar que hay alguna recta que “aproxima” la nube de puntos. Al considerar la relación lineal entre X e Y caben dos posibilidades, el estudio del comportamiento de Y en función de los valores que tome X y viceversa. En el primer caso Y será la variable dependiente y X la independiente, a esta recta se le llama recta de regresión de Y sobre X. Al caso contrario se le llama recta de regresión de X sobre Y. Determinaremos la recta de regresión de Y sobre X y por analogía se deducirá la de X sobre Y. Sean X e Y dos variables de las que tenemos n observaciones conjuntas, habrá n pares de la forma. La recta de regresión de Y sobre X será la que aproxime los valores que toman las variables y tendrá la forma. Para cada xi, será una aproximación de y i.

12 El error que se comete es, si hacemos lo mismo con todos los valores habrá una serie de errores donde unos serán por exceso y otros por defecto con lo que se pueden compensar unos con otros. Para evitar la llegada a conclusiones erróneas debido a esa compensación calcularemos los errores al cuadrado.. La recta de regresión de Y sobre X será aquella que minimice la suma de los errores al cuadrado. Este método de determinación de la recta de regresión se llama de mínimos cuadrados.


Descargar ppt "Tema 3: Distribuciones bidimensionales: Relación estre dos variables estadísticas. 1. 1. Relación estadísca: Correlación. 2. 2. Diagramas de dispersión."

Presentaciones similares


Anuncios Google