Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porjuan ali Modificado hace 6 años
1
Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María
2
Estadística Descriptiva Objetivo Obtener información desde una muestra, que permita entender o formular hipótesis acerca del fenómeno que se estudia. Tipos de Análisis: Describir cómo se comporta una variable Describir cómo una variable (digamos explicativa) afecta el comportamiento de a otra (digamos dependiente) Describir cómo interaccionan varias variables
3
Estadística Descriptiva Objetivo Obtener información desde una muestra, que permita entender o formular hipótesis acerca del fenómeno que se estudia. Tipos de Análisis: Análisis Univariado Análisis Bivariado Análisis Multivariado
4
Estadística Descriptiva Ejemplos de Análisis Bivariado
5
Hipotesis Preliminar que Guía el Análisis: La probabilidad de muerte del feto en un embarazo se ve influenciada (aumenta) con el nivel de estrés de la madre. Posible experimento. 1. Tomamos una muestra de casos clínicos. 2. Separamos la muestra en dos grupos: (A) madres con estrés y (B) madres sin estrés. 3.Medimos la frecuencia de muertes en cada grupo 4.Comparamos ambas frecuencias.
6
Estadística Descriptiva Análisis de Muestras Estratificadas Lo anterior es un ejemplo de Análisis Estratificado: Se divide una muestra de acuerdo al valor de una variable que llamaremos variable estratificadora X. Se estudia el comportamiento de otra variable de interés Y en cada subgrupo o estrato. Se da cuenta de cómo cambia el comportamiento de Y al cambiar de estrato X.
7
Estadística Descriptiva Análisis de Muestras Estratificadas El análisis estratificado pretende mostrar cómo cambia una variable (Y) cuando cambia otra (X). En el estudio con las embarazadas: Estratificadora (X): Presencia o ausencia de estrés. Dependiente (Y): Presencia o no de muerte fetal. Se determina cómo cambia el promedio de Y (tasa de muerte) cuando cambiamos de estrato.
8
Estadística Descriptiva Análisis de Muestras Estratificadas ¿Qué tal si la hipótesis fuera?: “La probabilidad de muerte fetal depende del número de sueño de la madre en el período de gestación”. ¿Cómo estratificamos la muestra? El problema es que la variable explicativa (X=horas de sueño) es ahora continua.
9
Estadística Descriptiva Análisis de Muestras Estratificadas Idea: Si la variable explicativa es continua, definir categorías de valores posibles y separar la muestra de acuerdo a ellas. ¿Cómo determinar las categorías?: juicio o conocimiento previo: estrato económico, partido político, niveles normales/anormales. criterio estadístico: como el utilizado construir histogramas (organizar por clases).
10
Estadística Descriptiva Análisis de Muestras Estratificadas Ejemplo: En la muestra se registraron las siguientes horas de sueño promedio durante los últimos 6 meses de gestación: 8.0, 8.5, 11.0, 6.5, 7.2, 6.2, 10.0, 10.5, 9.2, 9.5, 6.0, 7.2, 6.9, 6.4, 12.5, 10.8 con k = 3 R = 12.5 – 6.0 = 6.5 A = (R + 1) / 3 = 2.5 Límites 5.5 - 8.0 8.0 - 10.5 10.5 – 13.0 Marca 6.75 9.25 11.75 Grupo 1 2 3
11
Estadística Descriptiva Análisis de Muestras Estratificadas Una vez que ya hemos estratificado con algún criterio: E2E2 E1E1 EmEm ¿qué medimos?
12
Estadística Descriptiva Análisis de Muestras Estratificadas Una vez que ya hemos estratificado con algún criterio: ¿qué medimos?: frecuencias. ¿Cuántas observaciones caen en cada estrato?: frecuencias absolutas (n 1, n 2, …, n m ) ó relativas (p 1, p 2, …, p m ) Estas últimas dan el peso del estrato en la muestra total p2p2 p1p1 pmpm
13
Estadística Descriptiva Análisis de Muestras Estratificadas Una vez que ya hemos estratificado con algún criterio: ¿qué medimos?: tendencia. ¿Cuál es la tendencia en cada estrato?: media, mediana, etc.
14
Estadística Descriptiva Análisis de Muestras Estratificadas Una vez que ya hemos estratificado con algún criterio: ¿qué medimos?: dispersión. ¿Cuál es la dispersión en cada estrato?: varianza, IQR
15
Estadística Descriptiva Análisis de Muestras Estratificadas Una vez que ya hemos estratificado y analizado el comportamiento de la variables por estrato, es útil presentar las estadísticas de manera gráfica, e.g. box-plots.
16
Estadística Descriptiva Análisis de Muestras Estratificadas Box-plots por cada estrato E1E1 E2E2 E3E3
17
Estadística Descriptiva Análisis de Muestras Estratificadas Una forma de medir el efecto de la variable presuntamente explicativa (X) sobre la explicada (Y) es el Análisis de Varianza. Idea: si la presunta variable estratificadora X explica bien la otra variable Y, ésta última no debiera ser muy variable con X constante en comparación con el cambio observado al cambiar X
18
Estadística Descriptiva Análisis de Muestras Estratificadas Análisis de Varianza: Varianza Intra-Estratos: dentro de los grupos. Varianza no explicada por la variable estratificadora Ponderamos por el peso del estrato!!!
19
Estadística Descriptiva Análisis de Muestras Estratificadas Análisis de Varianza: Varianza Inter-Estratos: entre los grupos. Varianza explicada por la variable estratificadora media de cada grupo inducido por la variable explicativa X media total o promedio ponderado de las medias por grupo.
20
Estadística Descriptiva Análisis de Muestras Estratificadas Análisis de Varianza: Varianza Inter-Estratos: entre los grupos. Varianza explicada por la variable estratificadora Ponderamos por el peso del estrato!!!
21
Estadística Descriptiva Análisis de Muestras Estratificadas Análisis de Varianza: Varianza Muestral Total: Varianza Muestral Sin Estratificar
22
Estadística Descriptiva Análisis de Muestras Estratificadas Análisis de Varianza: Cuociente de Varianza Explicada: Medida de la calidad de la variable estratificadora X como variable explicativa para Y Para todo lo anterior necesitamos que Y sea continua, pero X puede ser continua o discreta, numérica o cualitativa.
23
Estadística Descriptiva Análisis de Muestras Estratificadas Ejemplo de Análisis de Varianza: Consideremos la siguiente hipótesis de estudio: Caminar ayuda a mantener un índice de grasa corporal adecuado.
24
Estadística Descriptiva Análisis de Muestras Estratificadas Ejemplo de Análisis de Varianza: Para validar la hipótesis se tomó una muestra de 16 hombres, encuestándolos acerca del número de horas caminadas a la semana y midiendo su % de grasa corporal. La muestra es la siguiente:
25
Estadística Descriptiva Análisis de Muestras Estratificadas Ejemplo de Análisis de Varianza: horas (H)% grasa (G)horas (H)% grasa (G) 418.9222.5 1.524.86.518.0 517.50.527.2 126.20.925.5 4.218.2320.8 618.4521.8 2.521.4422.6 717.43.521.0
26
Estadística Descriptiva Análisis de Muestras Estratificadas Ejemplo de Análisis de Varianza: Decidimos estratificar la muestra de acuerdo al número de horas caminadas, considerano 3 clases para el conjunto de valores de esta variable: R = (7-0.5) = 6.5 A = (R + 1)/3 = 2.5 claseLímitesfrecuencia 1(0, 2.5]0.3750 2(2.5, 5]0.4375 3(5, 7.5]0.1875
27
Estadística Descriptiva Análisis de Muestras Estratificadas Ejemplo de Análisis de Varianza: Estratificamos por cada clase de valores para la variable “horas caminadas” generandose 3 submuestras 1.524.8 126.2 2.521.4 222.5 0.527.2 0.925.5 Estrato 1 418.9 517.5 4.218.2 320.8 521.8 422.6 3.521.0 Estrato 2 618.4 717.4 6.518.0 Estrato 3
28
Estadística Descriptiva Análisis de Muestras Estratificadas Ejemplo de Análisis de Varianza: Medimos las medias y las varianzas por estrato: claselímitesfrecuenciamediavarianza 1(0, 2.5]0.375024.604.1367 2(2.5, 5]0.437520.113.1784 3(5, 7.5]0.187517.930.1689
29
Estadística Descriptiva Análisis de Muestras Estratificadas Ejemplo de Análisis de Varianza: Calculamos las varianzas intra e inter claselímitesfrecuenciamediavarianza 1(0, 2.5]0.375024.604.1367 2(2.5, 5]0.437520.113.1784 3(5, 7.5]0.187517.930.1689
30
Estadística Descriptiva Análisis de Muestras Estratificadas Ejemplo de Análisis de Varianza: Calculamos las varianzas intra e inter claselímitesfrecuenciamediavarianza 1(0, 2.5]0.375024.604.1367 2(2.5, 5]0.437520.113.1784 3(5, 7.5]0.187517.930.1689
31
Estadística Descriptiva Análisis de Muestras Estratificadas Ejemplo de Análisis de Varianza: Corroboramos la descomposición propuesta: % de varianza explicada (fracción del cambio en el índice de grasa que explica o predice el número de horas caminadas) Hay una relación bien significativa
32
Estadística Descriptiva Análisis de Muestras Estratificadas ¿Es valida la relación entre las varianzas cuando estas se calculan normalizando la suma de cuadrados por n-1 en vez de n?
33
Estadística Descriptiva Análisis de Muestras Estratificadas Cuando entremos en Estadística Inferencial justificaremos porqué es más útil y correcto comparar las sumas de cuadrados Número de observaciones en el estrato k Suma sobre los estratos Suma sobre las observaciones del estrato k
34
Estadística Descriptiva Análisis de Muestras Estratificadas ANOVA (Análisis de Varianza) Comparamos la variabilidad intra versus la inter De acuerdo al valor de F podemos aseverar que la variable estratificadora induce cambios en la otra variable con una significancia estadística α Estadístico F de Fisher (m: número de clases)
35
Análisis de Contingencia o Correspondencia Dadas dos variables X, Y dividir los posibles valores de X en k grupos y los posibles valores de Y en s grupos. Determinar luego las frecuencias conjuntas de cada par formado por uno de los grupos de X y uno de los grupos para Y: con qué frecuencia las observaciones caen en un grupo X y un grupo Y simultáneamente.
36
Análisis de Contingencia o Correspondencia Y: B 1 B 2 … B s X: A 1 A 2 … A r Grupos de valores para Y Grupos de valores para X
37
Análisis de Contingencia o Correspondencia Frecuencia con que en la muestra aparecen observaciones que caen en la categoría i de acuerdo al valor de X y en la categoría j de acuerdo al valor de Y B 1 B 2.....B j.....B s A 1 n 11 n 12.....n 1j.....n 1s A 2 n 21 n 22.....n 2j.....n 2s A i n i1 n i2.....n ij.....n is A r n r1 n r2.....n rj.....n rs
38
Análisis de Contingencia o Correspondencia Frecuencias Marginales: Cuando interesa la frecuencia de una de las variables independiente de lo que pase con la otra hablamos de Frecuencia Marginal de la variable X ó Y
39
Análisis de Contingencia o Correspondencia Frecuencias Marginales por Clases de X B 1 B 2.....B j.....B s Total A 1 n 11 n 12.....n 1j.....n 1s n 1 A 2 n 21 n 22.....n 2j.....n 2s n 2 A i n i1 n i2.....n ij.....n is n i A r n r1 n r2.....n rj.....n rs n r
40
Análisis de Contingencia o Correspondencia Frecuencias Marginales por Clases de Y B 1 B 2.....B j.....B s Total A 1 n 11 n 12.....n 1j.....n 1s n 1 A 2 n 21 n 22.....n 2j.....n 2s n 2 A i n i1 n i2.....n ij.....n is n i A r n r1 n r2.....n rj.....n rs n r Totaln 1 n 2.....n j.....n s n n = n _
41
Análisis de Contingencia o Correspondencia Frecuencias Marginales: s j iji nn 1 Frecuencia Absoluta de la clase A i ; i = 1,,2,...,r Frecuencias Independientes de la clases B j a la que estén asociadas: suma de los valores de la fila i-ésima r i ijj nn 1 Frecuencia Absoluta de la clase B j ; j= 1,,2,...,s Frecuencias Independiente de las clases A i a la que estén asociadas: suma de los valores de la columna j-ésima
42
Análisis de Contingencia o Correspondencia Tabla de Contingencia con Frecuencias Relativas B 1 B 2.....B j.....B s Total A 1 f 11 f 12.....f 1j.....f 1s f 1 A 2 f 21 f 22.....f 2j.....f 2s f 2 A i f i1 f i2.....f ij.....f is f i A r f r1 f r2.....f rj.....f rs f r Totalf 1 f 2.....f j.....f s f f ij n ij n
43
Análisis de Contingencia o Correspondencia Frecuencias Relativas Marginales: Análogo al caso de frecuencias absolutas. s j iji ff 1 Frecuencia Relativa de la clase A i ; i = 1,,2,...,r suma de los valores de la fila i-ésima de la tabla de frecuencias relativas conjuntas r i ijj ff 1 Frecuencia Relativa de la clase B j ; j= 1,,2,...,s suma de los valores de la columna j-ésima de la tabla de frecuencias relativas conjuntas
44
Análisis de Contingencia o Correspondencia Frecuencias Condicionales: Las frecuencias condicionales de una clase A i (asociada a X) dado un grupo B j (asociado a Y) corresponden a la proporción de casos de B j en que se observa A i
45
Análisis de Contingencia o Correspondencia Frecuencias Condicionales: Las frecuencias condicionales de una clase B j (asociada a Y) dado un grupo A i (asociado a X) corresponden a la proporción de casos de A i en que se observa B j
46
Análisis de Contingencia o Correspondencia Ejemplo Se tiene la siguiente sospecha: “El consumo de sal sube la presión arterial”. Para ello se toma una muestra de pacientes a quienes se les hace un seguimiento, midiendo ambas variables X: cucharas de sal consumidas en la semana Y: presión arterial media en la semana Después de un análisis se decide dividir la variable X en 3 intervalos: bajo, medio, alto. Análogamente, la variable Y se divide en tres intervalos que asociamos a: baja, normal, alta.
47
Análisis de Contingencia o Correspondencia Ejemplo Después de un análisis se decide dividir la variable X en 3 intervalos: bajo, medio, alto. Análogamente, la variable Y se divide en tres intervalos que asociamos a: baja, normal, alta. Las frecuencias conjuntas en la muestra son las sgtes: BajaNormalAlta Bajo884 Medio5155 Alto1520 X: Consumo de Sal Y: presión arterial
48
Análisis de Contingencia o Correspondencia Ejemplo Las frecuencias conjuntas en la muestra son las sgtes: BajaNormalAlta Bajo884 Medio5155 Alto1520 X: Consumo de Sal Y: presión arterial
49
Análisis de Contingencia o Correspondencia Ejemplo Las frecuencias marginales son las sgtes: BajaNormalAlta Bajo88420 Medio515525 Alto152026 14282971 X: Consumo de Sal Y: presión arterial
50
Análisis de Contingencia o Correspondencia Ejemplo Las frecuencias relativas son las sgtes: BajaNormalAlta Bajo8/71 4/7120/71 Medio5/7115/715/7125/71 Alto1/715/7120/7126/71 14/7128/7129/711 X: Consumo de Sal Y: presión arterial
51
Análisis de Contingencia o Correspondencia Ejemplo Condicionando a la variable X (consumo de sal) Las frecuencias condicionales son las sgtes: BajaNormalAlta Bajo8/20 4/201 Medio5/2515/255/251 Alto1/265/2620/261 X: Consumo de Sal Y: presión arterial
52
Análisis de Contingencia o Correspondencia Ejemplo Condicionando a la variable X (consumo de sal) 0 0,1 0,2 0,3 0,4 0,5 X: Bajo X: Medio X: Alto 0,6 0,7 Observamos un claro cambio de la distribución de la presión de acuerdo al consumo de sal
53
Análisis de Contingencia o Correspondencia Frecuencias Condicionales: Proporcionan una forma de medir la influencia de la variable X sobre la variable Y (o viceversa) Notar que las frecuencias se normalizan por un número más reducido de casos, que corresponden a los casos en que se observa el condicionante.
54
Análisis de Contingencia o Correspondencia Independencia: Diremos que X es independiente de Y si las frecuencias condicionales de X a las diferentes clases de Y son todas iguales; es decir, no dependen de la clase condicionante
55
Análisis de Contingencia o Correspondencia Independencia: Diremos que Y es independiente de X si las frecuencias condicionales de Y a las diferentes clases de X son todas iguales; es decir, no dependen de la clase condicionante
56
Análisis de Contingencia o Correspondencia Observación 1: Si X es independiente de Y Similarmente, si Y es independiente de X Demostración?
57
Análisis de Contingencia o Correspondencia Demostración: =
58
Análisis de Contingencia o Correspondencia Observación 2: Si X es independiente de Y Demostración
59
Análisis de Contingencia o Correspondencia Observación 3: Si X es independiente de Y entonces Y es independiente de X Demostración
60
Análisis de Contingencia o Correspondencia Información Mutua Si aceptamos la tabla de contingencia como una distribución aproximada podemos computar la información mutua de X e Y
61
Análisis de Contingencia o Correspondencia Información Mutua Si X es independiente de Y, I=0 Si X = Y, I es equivalente a la entropía de X
62
Análisis de Contingencia o Correspondencia Distancia entre las condicionales Una forma intuitiva de cuantificar el cambio que induce una variable en la otra es medir las distancias entre las condicionales considerandolas vectores
63
Análisis de Contingencia o Correspondencia Al igual que antes es útil analizar la relación entre las variables de manera gráfica. Se presentan las frecuencias de una variable (digamos Y), por cada clase de la otra (X) También es posible mostrar las frecuencias condicionales en vez de las frecuencias relativas
64
Estadística Descriptiva Análisis de Muestras Estratificadas Histogramas por clase 0 0,1 0,2 0,3 0,4 0,5 Clase 1 (Y) Clase 2 (Y) Clase 3 (Y) X: Clase 1 X: Clase 2 X: Clase 3 X: Clase 4 Frecuencias Relativas
65
Estadística Descriptiva Análisis de Muestras Estratificadas Histogramas por clase (apilados) 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 X: Clase 1 X: Clase 2 X: Clase 3 X: Clase 4 Clase 1 (Y) Clase 2 (Y) Clase 3 (Y)
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.