ESTADÍSTICA DESCRIPTIVA

Slides:



Advertisements
Presentaciones similares
ANALISIS DE DATOS CUANTITATIVOS
Advertisements

Lic. Cristian R. Arroyo López
Epidemiología Clínica y Estadística Aplicada
ESTADÍSTICA.
ESTADÍSTICA DESCRIPTIVA
MÉTODOS ESTADÍSTICOS.
Capítulo 4: Medidas de dispersión
CLASE 1: Recordando algunos conceptos previos de Estadística
FRANCISCO JAVIER RODRÍGUEZ
UNIVERSIDAD DE DEASARROLLO PROFESIONAL (UNIDEP) I Ciclo 2010 ESTADISTICA Profesor: Ing. Pavel González Reyes.
Metodología De las Ciencias Sociales III
Conceptos Introductorios de Estadística
MATEMÁTICAS 2º ESO UD8 ESTADÍSTICA.
Medidas de Dispersión Estadística E.S.O.
MEDIDAS DE TENDENCIA CENTRAL
Introducción a la estadística
REPASO BLOQUE I: TEMAS 1-4
DEPARTAMENTO DE MATEMÁTICA APLICADA
La Estadística se encarga de dar solución a este y otros problemas.
Estadística Descriptiva continuación
Análisis de Datos.
ESTADÍSTICA DESCRIPTIVA
Datos: Estadística.
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Medidas de Dispersión.
Tema 2: Parámetros Estadísticos
Definición de Estadística
Medidas de resumen.
ESTADÍSTICAS DESCRIPTIVA
Coeficiente de Variación
Fundamentos Matemáticos Medidas de tendencia central
Laboratorio de Estadística administrativa
VARIABLES Descriptores parte I
Medidas de Posición y Centralización Estadística E.S.O.
INTRODUCCIÓN A LA ESTADÍSTICA
Tratamiento de datos y azar
TABLAS DE FRECUENCIAS Una vez recopilados, tendremos un conjunto de datos que será necesario organizar para extraer información. Lo primero que se hace.
Tema 1: Introducción a la estadística
MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.
INFERENCIA ESTADISTICA
Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.
ESTADISTICA PARA RELACIONES LABORALES
Estadística Descriptiva: 2. Medidas de Tendencia y Dispersión
Estadística Al hacer Un sondeo de opinión
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
Qué es una Variable Aleatoria??????????
Describir una variable numérica
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
Estadísticos Asunto de Estado: Estadísticos. Estadísticos Los parámetros estadísticos nos permiten tener una idea global de la población, compararla con.
PARÁMETROS ESTADÍSTICOS
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
Métodos Cuantitativos
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
Sesión 8 Tema: Estadística descriptiva Objetivo:
ESTADÍSTICA UNIDIMENSIONAL
Unidad 1: Generalidades sobre estadística
PRESENTACIÓN DE TRABAJO DE APLICACIÓN DE LA ESTADÍSTICA. Alumno: Manuel Fernández González Profesor: Óscar Vergara Marambio.
Aplicaciones Estadísticas a las Finanzas Clase 1
Características de las distribuciones estadísticas
Aplicaciones Estadísticas a las Finanzas Clase 1
Tema 1: Introdución 1 Estadística Tema 1: Introducción a la estadística.
DIPLOMADO DE POSTGRADO
UNIVERSIDAD DE COSTA RICA Sistema de Estudios de Posgrado Escuela de Salud Pública I Ciclo lectivo 2003 Epidemiología – (SP – 2216) Profesora: Carmen.
Estadística descriptiva
Estadística descriptiva
Estadística y probabilidad aplicada a los negocios
CONCEPTOS BÁSICOS, TABULACIÓN, GRÁFICOS
PROBABILIDAD Y ESTADISTICA.
Medidas de tendencia central
Transcripción de la presentación:

ESTADÍSTICA DESCRIPTIVA de interés para la Epidemiología Dra. Julia Wärnberg Dpto. Medicina Preventiva y Salud Pública Universidad de Málaga Grupo de Epidemiología Nutricional, Actividad Física y Prevención de la Obesidad CIBER de Fisiopatología de la Obesidad y Nutrición Instituto de Salud Carlos III

Método científico y estadística Dra. Julia Wärnberg Dpto. Medicina Preventiva y Salud Pública Universidad de Málaga Grupo de Epidemiología Nutricional, Actividad Física y Prevención de la Obesidad CIBER de Fisiopatología de la Obesidad y Nutrición Instituto de Salud Carlos III

Estadística descriptiva de interés para la epidemiología Todas aquellas características que explican el proceso Salud-Enfermedad CONSTANTES: Nunca cambian. VARIABLES: Cambian entre personas o en una misma persona a lo largo del tiempo.

Variables básicas en Epidemiología Problema de Salud ENFERMEDADES TRAUMATISMOS Y ACCIDENTES FACTORES DE RIESGO EVENTOS VITALES EDAD GENERO OCUPACION ESTILO DE VIDA OTRAS DE EXPOSICION DE OCURRENCIA DE REGISTRO DE OBSERVACION Lugar Persona CAMBIOS ENDEMICOS CAMBIOS CICLICOS CAMBIOS ESTACIONALES CAMBIOS EPIDEMICOS Tiempo

Estadística Conjunto de métodos utilizados para recoger, interpretar y analizar un conjunto de datos cuya característica esencial es la variabilidad, de manera que podamos obtener de ellos ciertos conocimientos

Estadística Estadística Descriptiva: organización, presentación y síntesis de los datos de una manera lógica y científica. Estadística Inferencial o Analítica: bases lógicas mediante las que se establecen conclusiones sobre la población en estudio a partir de los resultados obtenidos en muestras. Trabaja con los datos que le proporciona la Estadística Descriptiva.

Estadística: conceptos Población (“population”): conjunto completo de todos los individuos o elementos que tienen una característica común, y sobre los cuales se referirán las conclusiones del estudio realizado. Muestra (“sample”): subconjunto de la población, a partir del cual se obtendrán resultados que se intentarán generalizar al resto. ¿Debería ser “representativo”? Sujetos de estudio (“subjects”): elementos que componen la población o la muestra.

Estadística: conceptos Variable: característica o propiedad observable que cambia o puede cambiar en un individuo o grupo de individuos, pudiendo tomar diferentes valores. Dato: cada uno de los valores que puede tomar la variable. Medir: asignar valores a la variable en estudio.

Tipos de variables Cualitativas o categóricas: expresan cualidades, y no adoptan valores numéricos. Cuando tienen dos categorías, se denominan dicotómicas. Nominales: los datos se agrupan por categorías en las cuales se está o no incluido. Se clasifica. Ordinales: existe una relación de orden dentro de las categorías. Se jerarquiza.

Tipos de variables Cuantitativas: son cuantificables, toman valores numéricos. Discretas: sus valores son siempre números enteros. Se cuentan. Continuas: la variable puede adoptar cualquier valor numérico. Se miden.

Ejemplos C) Cuantitativa discreta A) Cualitativa nominal B) Cualitativa ordinal D) Cuantitativa continua 1. Número de accidentes con víctimas ocurrido en una ciudad en un día C 2. Colesterol en sangre (mg/dl) D 3. Grado funcional de un paciente cardiópata (I/II/III/IV) B 4. Grupo de tratamiento con 4 fármacos distintos (A/B/C/D) A 5. Grupo de tratamiento para perder peso (control /dieta / dieta + ejercicio / dieta + ejercicio + fármaco) B

Ejemplos C) Cuantitativa discreta A) Cualitativa nominal B) Cualitativa ordinal D) Cuantitativa continua 6. Color de los ojos (marrón/negro/gris/azul/verde, etc) A 7. Número de dientes empastados C 8. Índice de masa corporal (peso en Kg dividido por la talla en metros elevada al cuadrado) D

Se pueden asignar códigos a respuestas especiales como Es buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador. Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué significan los códigos numéricos. Sexo (Cualit: Códigos arbitrarios) 1 = Hombre 2 = Mujer Raza (Cualit: Códigos arbitrarios) 1 = Blanca 2 = Negra,... Felicidad Ordinal: Respetar un orden al codificar. 1 = Muy feliz 2 = Bastante feliz 3 = No demasiado feliz Se pueden asignar códigos a respuestas especiales como 0 = No sabe 99 = No contesta... Estas situaciones deberán ser tenidas en cuentas en el análisis. Datos perdidos (‘missing data’)

Aunque se codifiquen como números, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de cálculo estadístico. No todo está permitido con cualquier tipo de variable.

Presentación ordenada de datos Sexo Frec Frec. relat. porcentaje Hombre 4 4/10=0,4 =40% Mujer 6 6/10=0,6 =60% Total 10 Muestra Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra.

Gráficos para variables cualitativas Diagramas de barras Alturas proporcionales a las frecuencias (abs. o rel.) Se pueden aplicar también a variables discretas Diagramas de sectores (tartas, polares) No usarlo con variables ordinales. El área de cada sector es proporcional a su frecuencia (abs. o rel.)

Gráficos diferenciales para variables numéricas Diagramas barras para variables discretas Se deja un hueco entre barras para indicar los valores que no son posibles Histogramas para variables continuas El área que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo. Valen con frecuencias absolutas o relativas.

Estadística: conceptos Parámetro: índice o valor que resume o caracteriza alguna variable de la población y se calcula a partir de la información obtenida de todos los miembros de esa población. Los parámetros, por lo tanto, son poblacionales. Estadísticos: los mismos índices definidos como parámetros, pero calculados, en lugar de en toda la población, en una muestra de la misma. Estimadores: estadísticos que toman valores próximos a los parámetros de la población de la que proceden.

Parámetros estadísticos Medidas de centralización, dispersión, posición y forma Objetivo: resumir la información que nos proporcionan los datos.

Parámetros estadísticos Medidas de centralización, dispersión, posición y forma

Parámetros estadísticos Centralización Indican valores con respecto a los que los datos parecen agruparse. Media, mediana y moda Dispersión Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Desviación típica, coeficiente de variación, rango, varianza Posición Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. Cuantiles, percentiles, cuartiles, deciles,... Forma Asimetría Apuntamiento o curtosis

Medidas de centralización (o tendencia central) Media aritmética (promedio), “mean” Suma de los valores dividido por el tamaño muestral. Media de 2,2,3,7 es (2+2+3+7)/4=3,5 Conveniente cuando los datos se concentran simétricamente con respecto a ese valor. Muy sensible a valores extremos.

Medidas de centralización Media aritmética TABLA 1 PACIENTE TAS TAD 1 105 60 2 110 70 3 120 75 4 80 5 6 125 7 130 90 8 140 9 150 10 160 95

Medidas de centralización: Mediana Observación equidistante de los extremos. Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos (percentil 50). Si el número de datos es par, se elige la media de los dos datos centrales. Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos. TABLA 1 PACIENTE TAS TAD 1 105 60 2 110 70 3 120 75 4 80 5 6 125 7 130 90 8 140 9 150 10 160 95

Medidas de centralización: Moda Valor de la variable que se presenta con mayor frecuencia. TABLA 1 PACIENTE TAS TAD 1 105 60 2 110 70 3 120 75 4 80 5 6 125 7 130 90 8 140 9 150 10 160 95

Medidas de posición Cuantiles Valores que dividen a la variable en una serie de partes iguales: cuartiles, deciles, percentiles, etc.

Estadísticos de posición Percentil de orden k = cuantil de orden k/100 La mediana es el percentil 50 El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%

Estadísticos de posición Cuartiles: Dividen a la muestra en 4 grupos con frecuencias similares. Primer cuartil = Percentil 25 = Cuantil 0,25 Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana Tercer cuartil = Percentil 75 = cuantil 0,75 Recorrido o rango intercuartílico

Ejemplos El 5% de los recién nacidos tiene un peso demasiado bajo. ¿Qué peso se considera “demasiado bajo”? Percentil 5 o cuantil 0,05

Ejemplos ¿Qué peso es superado sólo por el 25% de los individuos? Percentil 75 o tercer cuartil

Ejemplos El colesterol se distribuye simétricamente en la población. Supongamos que se consideran patológicos los valores extremos. El 90% de los individuos son normales . ¿Entre qué valores se encuentran los individuos normales?

Ejemplos ¿Entre qué valores se encuentran la mitad de los individuos “más normales” de una población? Entre el cuartil 1º y 3º

Desviación estándar o típica y varianza Medidas de dispersión Desviación estándar o típica y varianza Varianza S2 (‘Variance’): Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media. Sus unidades son el cuadrado de las de la variable. Desviación típica S (‘standard deviation’) Es la raíz cuadrada de la varianza. Tiene las misma dimensionalidad (unidades) que la variable.

Desviación estándar o típica y varianza Medidas de dispersión Desviación estándar o típica y varianza TABLA 1 PACIENTE TAS TAD 1 105 60 2 110 70 3 120 75 4 80 5 6 125 7 130 90 8 140 9 150 10 160 95

Coeficiente de variación (o variabilidad relativa) Medidas de dispersión Coeficiente de variación (o variabilidad relativa) Es la razón entre la desviación típica y la media. Mide la desviación típica en forma de “qué tamaño tiene con respecto a la media”. Es una cantidad adimensional (es frecuente mostrarla en porcentajes). Interesante para comparar la variabilidad de diferentes variables.

Coeficiente de variación Medidas de dispersión Coeficiente de variación TABLA 1 PACIENTE TAS TAD 1 105 60 2 110 70 3 120 75 4 80 5 6 125 7 130 90 8 140 9 150 10 160 95