Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Estadística descriptiva
Bioestadística
2
Estadística Estadística descriptiva Estadística inferencial
Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos Estadística inferencial Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.
3
Análisis descriptivos
Variables nominales o categóricas: Número de casos en cada categoría Y porcentaje que representen del total Tabla de frecuencias Variables numéricas ¿Alrededor de qué valor se agrupan los datos? ¿Se agrupan muy concentrados? ¿Muy dispersos?
4
Medidas de tendencia central
Responden a la pregunta: ¿Alrededor de qué valor se agrupan los datos?
5
Medidas de tendencia central
Media aritmética Es la medida más evidente Suma de todos los valores de una variable dividida entre el número total de datos n x i å = 1
6
Medidas de tendencia central
Otras medias: Media geométrica xg: Media de los logaritmos de los valores de la variable
7
Medidas de tendencia central
Media armónica: xά El recíproco de la media aritmética de los recíprocos
8
Medidas de tendencia central
Media cuadrática xc: Es la raíz cuadrada de la media aritmética de los cuadrados de los valores.
9
Medidas de tendencia central
Mediana Es la observación equidistante de ambos extremos Valor tal que el 50% de los datos son menores que él y el 50% son mayores Es el percentil 50 Mediana 50% 50%
10
Medidas de tendencia central
Moda El valor que más se repite No tan usual Puede haber varias modas
11
Estadísticos de posición
Percentiles Cuartiles, deciles y terciles 1/2 1/4 1/4
12
Estadísticos de posición
Cuartiles Q1 = P25 Q2 = P50 = Mediana Q3 = P75 Deciles Q1 = P10 Q2 = P20 Q3 = P30 Q4 = P40 Q5 = P50 Q6 = P60 Q7 = P70 Q8 = P80 Q9 = P90
13
Medidas de dispersión Nos indican si los valores están próximos entre sí o muy dispersos
14
Medidas de dispersión Rango Cálculo fácil
Solo utiliza dos valores para el cálculo Se puede ver afectada por una observación muy extrema A mayores observaciones mayor es la probabilidad de que el rango aumente X X X X XX X X X XXX X X Rango
15
Medidas de dispersión Varianza s2: La media de las diferencias cuadráticas de n valores con respecto a su media aritmética: Sus unidades son las del cuadrado de la variable
16
Medidas de dispersión Desviación estándar s : Medida de dispersión que tiene las mismas unidades de los valores evaluados La varianza no tiene la misma magnitud que las observaciones. Ej si las unidades son metros, la varianza se mide en metros cuadrados.
17
Medidas de dispersión Representación gráfica de la desviación estándar
1 2 7 9 10 15 20 22 30 Media = 12.9 Ojo: la desviación estándar NO es la suma de las diferencias de cada observación respecto a la media es solo una representación gráfica
18
Medidas de dispersión Coeficiente de variación, CV:
Facilita la comparación de dispersión o variabilidad entre diferentes muestras. Se debe calcular para variables con todos sus valores positivos No varía en variables con diferente origen Ej Edades de niños vs edades de adultos No varía en variables con diferentes escalas o unidades Ej Talla de niños en centímetros y tallas de adulto en metros
19
Medidas de distribución
Sirven para evaluar la semejanza de la muestra con la distribución normal Asimetría (Skewness) – Indica si la distribución de los datos se encuentra sesgada hacia algún extremo. Curtosis (Kurtosis) – Indica si la distribución está plana o puntiaguda, es decir, si los datos de concentran al centro o están más distribuidos a lo largo del rango.
20
Medidas de dispersión Tipificación o estandarización de valores: Es el proceso de restar la media a un valor y dividir por su desviación estándar. La nueva variable creada con valores estandarizados permite hacer comparables dos medidas que en un principio no lo son. OJO no confundir: El coeficiente de variación: Sirve para comparar la dispersión o variabilidad de dos variables Los valores estandarizados: Sirven para comparar dos observaciones de diferentes variables.
21
Estadística descriptiva
Skewness Kurtosis Desviación Estándar Varianza Error Estándar Media Mediana (Percentil 50) Moda Mínimo Máximo Rango
22
Representaciones gráficas
Histograma de frecuencias
23
Representaciones gráficas
Mismo histograma de frecuencias con diferentes intervalos
24
Representaciones gráficas
Diagrama de tallo y hoja Frequency Stem & Leaf Extremes (=<79) & & & & Stem width: Each leaf: case(s) & denotes fractional leaves.
25
Grafica boxplot
26
Ejemplo - Talla Descriptivos Estadístico Media 141.999 .
Intervalo de conf. para la media al 95% Límite inferior Límite superior Media recortada al 5% Mediana Varianza Desv. típ Mínimo 46.0 Máximo 196.2 Rango 150.2 Amplitud intercuartil 32.6 Asimetría Curtosis .495
27
Ejemplo – Talla en adultos
Descriptivos Estadístico Media Intervalo de conf. para la media al 95% Límite inferior Límite superior Media recortada al 5% Mediana Varianza Desv. típ Mínimo 102.0 Máximo 196.2 Rango 94.2 Amplitud intercuartil 13.9 Asimetría .119 Curtosis .016
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.