REPASO BIOESTADÍSTICA I Dra. Margot Vidal Anzardo Unidad de Epidemiología Clínica Universidad Peruana Cayetano Heredia
Histograma Para varriables numéricas continuas o discretas. El eje vertical describe la frecuencia o la frecuencia relativa. El área suma 100% o 1. Los intevalos pueden ser de diferente amplitud
histogram prn, normal Para variable continuas se utiliza un HISTOGRAMA
swilk prn Shapiro-Wilk W test for normal data Variable | Obs W V z Prob>z prn | Ho: La variable tiene distribución Normal Ha: La variable NO tiene distribución Normal P>0.05 Se acepta la Ho P<=0.05 Se rechaza la Ho comando VariableCONTINUA Prn tiene distribución Normal
Media Sirva para variables discretas y continuas que tienen Distribuciòn Normal. No es adecuado para variables nominales u ordinales Es muy sensible a valores extremos
Mediana Sirve tanto para variables numericas continuas y discretas. Se usa cuando la variable NO tiene distribución Normal No es sensible a valores atípicos
summ prn, d Percentiles Smallest 1% % % Obs % Sum of Wgt % 2977 Mean Largest Std. Dev % % Variance % Skewness % Kurtosis
Al presentar los datos En variables con: Distribución normal: X +/- ds = Distribución no normal: Me (RI)= p25-p75
Moda Es la observación mas frecuente 1,2,3,4,4,5 Moda: 4
Moda Moda : 10 y 16
Variable categórica
summ prn, d Percentiles Smallest 1% % % Obs % Sum of Wgt % 2977 Mean Largest Std. Dev % % Variance % Skewness % Kurtosis
gen edadcat= prn. replace edadcat=1 if prn<2414 (47 real changes made). replace edadcat=2 if prn>=2414 & prn<2977 (45 real changes made). replace edadcat=3 if prn>=2977 & prn<3475 (49 real changes made). replace edadcat=4 if prn>=3475 (48 real changes made)
. tab edadcat edadcat | Freq. Percent Cum | | | | Total | VARIABLE CATEGÓRICA
categóricacontinua dicotómica
categórica
Variable categórica Gráfico de Barras
Para variables categóricas u ordinales Las barras deben ser de igual amplitud Las barras deben estar separadas
Gráfico de Barras : Edad categorizada
Gráfico de Pie Son una alternativa a los gráficos de barra
Polígono de frecuencias Para variables contínuas El polígono se forma al unir los puntos medios de cada intervalo. Sirven para comparar 2 o mas distribuciones
ContinuaDicotómica 2 grupos de comparación
Polígono de Frecuencias
Para saber rápidamente como se distribuyen 2 variables Gráfico de Cajas o BOX PLOT
Gráfico de Cajas Para variables continuas Permite estudiar la simetría de las variables Nos da información sobre: Dispersión Simetría Existencia de valores atípicos
Gráfico de Cajas
Mediana Media
Gráfico de dispersión bidimensional Establece la relación entre 2 variables continuas Cada punto representa un par de valores.
Gráfico de dispersión A mayor fluor menor No de caries
INFERENCIA 1.- Intervalos de confianza 2.- Prueba de Hipótesis
PRUEBA DE HIPÓTESIS Hipótesis nula: Ho Hipótesis alterna: Ha o H1 Ho: U1 = U2 Ha: U1 ≠ U2 Ho: El promedio de peso RN de las mujeres que fuman es igual al promedio de peso RN de las mujeres que no fuman Ho: El promedio de peso RN de las mujeres que fuman es diferente al promedio de peso RN de las mujeres que no fuman
PRUEBA DE HIPÓTESIS BILATERAL: UNILATERAL: Ho: U1 = U2 Ha: U1 ≠ U2 Ho: U1 >= U2 Ha: U1 < U2 Ho: U1 <= U2 Ha: U1 > U2 Ho + Ha Todas las posibilidades
PRUEBA DE HIPÓTESIS 1.- Plateamiento de las hipótesis 2.- Con lo datos de la muestra se calcula el estadístico 3.- Se rechaza o no la Hipótesis Nula (Ho) y se concluye
PRUEBA DE HIPÓTESIS para una media Z = X – Uo σ√n Cuando se conoce la varianza T = X – Uo s√n Cuando no se conoce la varianza
swilk prn Shapiro-Wilk W test for normal data Variable | Obs W V z Prob>z prn | Ho: La variable tiene distribución Normal Ha: La variable NO tiene distribución Normal P>0.05 Se acepta la Ho P<=0.05 Se rechaza la Ho comando VariableCONTINUA Prn tiene distribución Normal
Para saber que prueba utilizar Recordar revisar: Son poblaciones independientes ? Tienen varianzas iguales? SI ?
by fuma: summ prn > fuma = 0 Variable | Obs Mean Std. Dev. Min Max prn | > fuma = 1 Variable | Obs Mean Std. Dev. Min Max prn |
ttest prn, by(fuma) unequal Two-sample t test with unequal variances Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] | | combined | diff | diff = mean(0) - mean(1) t = Ho: diff = 0 Satterthwaite's degrees of freedom = Ha: diff 0 Pr(T |t|) = Pr(T > t) =
PRUEBA DE HIPÓTESIS Hipótesis nula: Ho Hipótesis alterna: Ha o H1 Ho: U1 = U2 Ha: U1 ≠ U2 Ho: El promedio de peso RN de las mujeres que fuman es igual al promedio de peso RN de las mujeres que no fuman Ho: El promedio de peso RN de las mujeres que fuman es diferente al promedio de peso RN de las mujeres que no fuman
ttest prn, by(fuma) unequal Two-sample t test with unequal variances Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] | | combined | diff | diff = mean(0) - mean(1) t = Ho: diff = 0 Satterthwaite's degrees of freedom = Ha: diff 0 Pr(T |t|) = Pr(T > t) =
P= P<0.05 Como el p<0.05 se rechaza la Ho Por lo tanto el peso promedio de los RN de madres fumandoras es diferente al peso promedio de los RN de madres que no fuman
Comparación de mas de 2 medias Análisis de Varianza
tabu centro, sum( edad) | Summary of edad centro | Mean Std. Dev. Freq | | | Total |
oneway edad centro Analysis of Variance Source SS df MS F Prob > F Between groups Within groups Total Bartlett's test for equal variances: chi2(2) = Prob>chi2 = Test de Barlett: Ho: Las varianzas son iguales Ha: Las varianzas no son iguales Las medias de edad de los 3 centros son iguales
Porcentaje de muertos según la edad categorizada. ¿En que edad hay mayor mortalidad? tab edad4 est_vita | est_vita edad4 | 0 1 | Total | 6 2 | 8 2 | 5 5 | 10 3 | | 35 4 | | Total | | 80
| est_vita edad4 | 0 1 | Total | 6 2 | 8 | | | 5 5 | 10 | | | | 35 | | | | 27 | | Total | | 80 | | Porcentaje de muertos según la edad categorizada. ¿En que edad hay mayor mortalidad? Hay un mayor Porcentaje de Muertos en la Categoría 4 (63%)
Muchas Gracias por su atención