La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

David Cao Carreño Primer Premio de Fotografía (Libre) S.A.E.M. THALES SEVILLA CONCURSO DE FOTOGRAFÍA Y MATEMÁTICAS E IMÁGENES MATEMÁTICAS Epidemiología.

Presentaciones similares


Presentación del tema: "David Cao Carreño Primer Premio de Fotografía (Libre) S.A.E.M. THALES SEVILLA CONCURSO DE FOTOGRAFÍA Y MATEMÁTICAS E IMÁGENES MATEMÁTICAS Epidemiología."— Transcripción de la presentación:

1 David Cao Carreño Primer Premio de Fotografía (Libre) S.A.E.M. THALES SEVILLA CONCURSO DE FOTOGRAFÍA Y MATEMÁTICAS E IMÁGENES MATEMÁTICAS Epidemiología Clínica y Estadística Aplicada Revisión de conceptos básicos en Estadística I. Juan José de la Cruz Troca

2 BIOESTADISTICA Ciencia que estudia la obtención y condiciones de aplicación de determinados procedimientos que resuelvan científicamente el problema de la recogida, organización y análisis de datos que provienen de la observación de los fenómenos biológicos Epidemiología Clínica y Estadística Aplicada Juan José de la Cruz Troca.

3 CONCEPTO COMO CIENCIA Por sus procedimientos es una ciencia matemática. Por su naturaleza es un ciencia aplicada. Por su objetivo es un ciencia metodológica. Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

4 Estadística (Bioestadística) Investigación (en ciencias de la Vida) Formulación de Hipótesis Análisis de Resultados Conclusiones Reglas para Herramienta para Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

5 Análisis de Resultados y Conclusiones 1.Estadística descriptiva 1.Estadística univariante 1.Estadística multivariante Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

6 INTRODUCCIÓN A LA ESTADÍSTICA CONCEPTOS BÁSICOS: Población diana: Conjunto de referencia sobre el que se recogen las observaciones, pueden ser finitas o infinitas, dependiendo de la cantidad de elementos que la compongan. N=Tamaño de la población Unidad muestral o elemento: Cada uno de los componentes de una población. Muestra: Subconjunto de la población total. n=Tamaño de la muestra Carácter (Variable): Cada una de las cualidades que poseen los individuos de la población y que permiten su descripción. Cualitativo o cuantitativo. Ej. Altura, peso, color... Modalidad (categoría): Cada uno de los posibles valores numéricos o descriptivos de un carácter. Ej. color de pelo: moreno, rubio, pelirrojo... Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

7 Tomamos una población y queremos estudiar una determinada característica, para ello seleccionamos una muestra y estudiamos la característica X, después extrapolamos las conclusiones a la población usando estimadores (inferencia estadística). POBLACIÓN MUESTRA Representativa de la población en la característica de estudio Media poblacional (μ) Varianza poblacional (σ 2 ) Media muestral x Varianza muestral S 2 n Cuasivarianza muestral S 2 n-1 Estimación puntual CONSIDERACIONES GENERALES SOBRE MUESTREO Generalizar Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

8 TIPOS DE VARIABLES Y SUS REPRESENTACIONES GRÁFICAS Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. Ej. Sexo Ordinales. Categorías con cierto orden. Ej. Clase Social Diagrama de Barras Gráfico de Sectores (Tartas o quesitos) ESTADÍSTICA DESCRIPTIVA La estadística descriptiva se encarga de estructurar la información referente al fenómeno o experimento estudiado. Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

9 TIPOS DE VARIABLES Y SUS REPRESENTACIONES GRÁFICAS (II) Cuantitativas (numéricas). Devuelven valores numéricos para cada caso. Continuas. Existe un valor intermedio entre dos valores. Ej. Talla Discretas. Toma solo valores determinados. Ej. Nº de hijos Histograma y polígono de frecuencias Polígono de frecuencias acumuladas FiFi Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

10 Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada PICTOGRAMAS

11 Tabla de frecuencias de una variable cualitativa o cuantitativa discreta. Variable x i nini fifi F%NiNi FiFi Frecuencia absoluta (n i ): Número de veces que aparece cada modalidad de la variable. Frecuencia relativa (f i = n i /n): Cociente entre frecuencia absoluta y tamaño muestral. Frecuencia porcentual (F%= f i *100) Frecuencia absoluta acumulada (N i ): Suma de frecuencias absolutas de las modalidades inferiores o iguales a x i. Frecuencia relativa acumulada (F i ): Suma de frecuencias relativas de las modalidades inferiores o iguales a x i. Razón o cociente: Expresa una relación cuando las magnitudes son independientes. Ej. Razón entre varones y mujeres R=V/M. Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

12 Personas EnfermasNúmero Familias XinifiF%iNiFiF% acu /5032 % 1616/5032 % 22020/5040 % 3636/5072 % 399/5018 % 4545/5090 % 455/5010 % 5050/50100 % Total50 * EJEMPLO: Cualitativas y Cuantitativas Discretas. Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada Variable: Nº de personas con gripe en familias de 5 ó más miembros

13 Estadísticos Resumen de Variables Cuantitativas. Medidas de Tendencia Central: Valor al que tienden a agruparse los datos Media Aritmética (X). Suma de valores entre nº de casos. Mediana (Me). Valor Observado que, ordenados los valores de forma creciente, divide el número de casos en dos partes iguales. 50% Me 50% Moda (Mo). Valor observado que tiene mayor n i. (que más se repite) Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

14 Estadísticos Resumen de Variables Cuantitativas. Medidas de Dispersión: Miden la variabilidad o dispersión de los datos. Rango ó Amplitud (R). Diferencia entre el valor máximo observado y el valor mínimo en la muestra. R=Máx-Mín. Cuartiles (Q1, Q2, Q3). Rango intercuartílico (Q3-Q1). Percentiles (Pi). Varianza ( 2 ). Mide la distancia entre los valores y la media estimada. Desviación Típica ( ). Es la raíz cuadrada de la Varianza. Coeficiente de Variación (CV). Se usa para comparar distribuciones. Suele expresarse en %. Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

15 Medidas de forma: Permiten la descripción de la gráfica de la distribución de frecuencias. Medidas de simetría. Para saber si los valores de la variable se concentran en una determinada zona. Coeficiente de Asimetría de Pearson Coeficiente de Asimetría de Fisher Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

16 As<0As=0As>0 Asimetría Negativa a la Izquierda Simétrica Asimetría Positiva a la Derecha. Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

17 Medidas de aplastamiento. El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución. Se definen 3 tipos de distribuciones según su grado de curtosis: Coeficiente de Curtosis: g2 = 0 (distribución mesocúrtica). g2 > 0 (distribución leptocúrtica). g2 < 0 (distribución platicúrtica). Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

18 La mayoría de las variables aleatorias que se presentan en los estudios relacionados con las ciencias sociales, físicas y biológicas, por ejemplo, el peso de niños recién nacidos, talla de jóvenes de 18 años en una determinada región, son continuas y se distribuyen según una función de densidad, que tiene la siguiente expresión analítica : Donde μ es la media de la variable aleatoria y σ es su desviación típica. Este tipo de variables se dice que se distribuye normalmente. El área bajo la función de densidad es 1. La función de densidad, en el caso de la distribución Normal, tiene forma de campana : DISTRIBUCIÓN NORMAL Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

19 Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

20 Estimación de Parámetros. Error Muestral (Error estándar) (ET). Mide la dispersión de los estadísticos de todas las posibles muestras de la población. Intervalos de Confianza (IC). Valores entre los cuáles se encuentra el valor de la población con una probabilidad p. Muestras grandes. Se calcula a partir del ET. Variables Cuantitativas. Si definimos el ET como ET= / n. Calculamos el IC de la Media según el valor p. Para p=0,95 (95%). IC=X 1,96.ET Para p=0,99 (99%). IC=X 2,6.ET ESTADÍSTICA BÁSICA Y BIVARIANTE Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

21 Estimación de Parámetros. Variables Cualitativas. Si definimos el ET como ET= p(1-p)/n. Calculamos el IC del porcentaje según el valor p. Para p=0,95 (95%). IC=% 1,96.ET Para p=0,99 (99%). IC=% 2,6.ET Muestras pequeñas (n<30, n<100). Variables Cuantitativas. Según la tabla de la t de Student. Variables Cualitativas. Según la tabla de la Binomial ESTADÍSTICA BÁSICA Y BIVARIANTE Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

22 ESTADÍSTICA BÁSICA Y BIVARIANTE Tipos de Hipótesis y Errores. Tipos de Hipótesis. Hipótesis Nula (H 0 ). Cualquier Diferencia que observemos al azar. Hipótesis Alternativa (H 1 ). Difiere de H 0, y es la diferencia excesiva no atribuible al azar. Tipos de Error. Error Tipo I (Error ).- Riesgo de equivocarse al rechazar H 0 Error Tipo II (Error ).- Riesgo de rechazar H 1 siendo cierta. Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

23 Situaciones entre Hipótesis y Error. H 0 CiertaH 1 Cierta Rechazo H 0 Error Tipo IDecisión correcta p= (0,05)p=1- (poder o potencia) No rechazo H 0 Decisión correctaError Tipo II p=1- p= (0,2) Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

24 Tests Estadísticos utilizados con mayor frecuencia entre variables cualitativas. Para medir la posible asociación entre dos variables cualitativas se emplea el test ji-cuadrado de Pearson. Si tenemos un 20 % de casillas con una frecuencia esperada menor de 5 se aplica la corrección de Yates. H 0 % x = % y. H 1 % x % y. Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

25 Debemos decidir si existe evidencia significativa de que los porcentajes de cada categoría en cada variable son iguales (aceptamos H 0 ). Si rechazamos H 0 entonces aceptamos H 1 Calculamos el valor 2 Pearson = |O i -E i | 2 /E i donde O i es el valor de frecuencias observadas y E i el valor esperado en cada celda. A partir de este valor estan tabulados los valores p asociados a cada uno de ellos y se decide si se rechaza H o. Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

26 Observadas Esperadas x 1 x 2 y 1 abn y1 y 1 ab n y1 y 2 cdn y2 y 2 cd n y2 n x1 n x2 Nn x1 n x2 N xi= Categoría variable 1, yi=Categoría variable2 ni=nº de casos marginales, N=Muestra total a=número de casos de la categoría x 1 de la variable 1 y con la categoría y 1 de la 2. b=número de casos de la categoría x 2 de la variable 1 y con la categoría y 1 de la 2. c=número de casos de la categoría x 1 de la variable 1 y con la categoría y 2 de la 2. d=número de casos de la categoría x 2 de la variable 1 y con la categoría y 2 de la 2. a=(n x 1. n y 1 )/N; b=(n x 2. n y 1 )/N; c=(n x 1. n y 2 )/N; d=(n x 2. n y 2 )/N Tablas de Frecuencia Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

27 2 Pearson = |O i -E i | 2 /E i = ((a-a) 2 /a) + ((b-b) 2 /b) + ((c-c) 2 /c) + ((d-d) 2 /d) Miramos en la tabla 2 Li< 2

28 Test Exacto de Fisher El contraste de homogeneidad mediante la prueba Chi-Cuadrado entre dos variables cualitativas (o también llamado contraste de independencia entre dos variables cualitativas) se basa en la comparación de las frecuencias obtenidas con las frecuencias esperadas. La prueba exacta de Fisher está basada en la distribución exacta de los datos y no en aproximaciones asintóticas, y presupone que los marginales de la tabla de contingencia están fijos. En general, cuando las frecuencias absolutas esperadas, en la gran mayoría de casillas o celdas son relativamente grandes (más de 5), se utiliza el estadístico Chi- Cuadrado para realizar el contraste mencionado. Cuando en un 20% de las casillas el valor esperado no es superior a 5, el estadístico anterior no es válido y generalmente se utiliza la prueba exacta de Fisher. Habitualmente, la prueba exacta de Fisher es más conservadora que la prueba Chi-Cuadrado. La prueba exacta de Fisher se aplica a variables dicotómicas

29 A continuación, se construyen todas las tablas de contingencia 2x2 posibles con celdas a, b, c, d, siendo 0 < a < mín{c1, f1}, b = f1 –a, c = c1 – a y d = f2 – c. A partir de dichas tablas se calcula: Donde X! indica el factorial de X que se calcula como x·(x-1)·(x-2)·…·2·1, por ejemplo, 5!=5·4·3·2·1=120. Test Exacto de Fisher Para calcular el estadístico de contraste, se construye en primer lugar la tabla de contingencia de dimensiones 2x2 con las frecuencias absolutas observadas, con la notación siguiente: B+- A +abf 1 -cd f 2 c 1 c 2 n El p-valor unilateral-izquierda es = el p-valor unilateral-derecha es = y el p-valor bilateral resultante es:

30 Ejemplo: A partir de la tabla F1F2 C1415 C Calcular el valor p correspondiente al Test de Fisher: 1º Calculamos la tabla para a=0 entonces 2ºº Calculamos la tabla para a=1 entonces F1F2 C1055 C F1F2 C1145 C

31 3º Calculamos la tabla para a=2 entonces 4º Calculamos la tabla para a=3 Entonces Para a=4 p a4 =0,1253 Para a=5 p a5 =0,0182 F1F2 C1235 C F1F2 C1325 C a Pa Los valores de P para cada a El valor p unil-izq.es: El valor p bilateral es El valor p unil-der.es:

32 Prueba Test de Mc Nemar Prueba no paramétrica para dos variables dicotómicas relacionadas. Contrasta los cambios en las respuestas utilizando la distribución de chi-cuadrado. Es útil para detectar cambios en las respuestas debidas a la intervención experimental en los diseños del tipo "antes-después o para comparar dos tipos de tratamiento. Típicamente, un valor de significación menor que 0,05 se considera significativo, pero podemos establecer un nivel de significación distinto (0,01; 0,1….) Matemáticamente el Estadístico de Mc Nemar se define por : En una tabla de contingencia: B+- A +ab -cd Nota: Para el valor p, se utiliza la Tabla de con 1 grado de libertad

33 Ejemplo 1 Se ejecutó la intervención educativa Salud bucal para modificar los conocimientos sobre higiene bucal en alumnos de tercer grado durante el primer semestre de La tabla muestra los resultados obtenidos en conocimientos generales: DespuesInadecuadoAdecuado Antes Inadecuado14102 Adecuado07

34 Tabla de Pruebas para variables cualitativas Variable 1Variable 2Muestra GrandeMuestra pequeña Cualita. (2 cat.)Cualita. (2 cat.) 2 de PearsonTest de Fisher Cualita. (2 ó más cat)Cualita. (2 ó más cat) 2 de PearsonCorreción de Yates Muestras Relacionadas Diseños del tipo "antes-después o para comparar dos tipos de tratamiento. Cualita. (2 cat.)Cualita. (2 cat.) Test de Mc Nemar Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada Si hay más de un 20% de celdas con frecuencia esperada < 5 ó algún valor 0, muestra pequeña.

35 Test Estadístico utilizado con mayor frecuencia entre variables cualitativas y cuantitativas. Para medir la posible asociación entre una variable cualitativa y una variable cuantitativa, decidimos si existe diferencia de medias en la variable cuantitativa según el grupo de la variable cualitativa. Empleamos el test de la t de Student si la variable cualitativa es dicotómica (tiene dos categorías) y el ANOVA si tiene más de 2 categorías. En ambos casos la distribución de la cuantitativa se asume como Normal. Veamos el caso de la T-student H 0 1 = 2. H Si S 2 =((n 1 -1).S 1 2 ) + ((n 2 -1).S 2 2 ) / (n 1 + n 2 -2). S= S 2 t= ( )/ (S. (1/ n 1 ) + (1/ n 2 ). Miramos en las tablas de la distribución t el valor p asociado: Si es de 0,05 rechazo H 0 (no encontramos evidencia de que exista diferencia de medias). Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

36 Tipos de Pruebas Estadísticas. Paramétricas. Para variables cuantitativas normales. No Paramétricas. Para variables cuantitativas no normales. TCL (Teorema Central del Límite). Si n>30 Distribución Normal. Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada Variable 1Variable 2Test ParamétricoTest No Paramétrico Cualita. (2 cat.)Cuantitativat de StudentU de Mann Whitney Cualita. (2 ó más cat)CuantitativaANOVAKruskal-Wallis CuantitativaCuantitativaCorrelación/ RegresiónRho (r) de Spearman Regresión. r de Pearson Tabla de Pruebas para variables cuantitativas

37 Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

38

39 Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

40 Juan José de la Cruz Troca. Epidemiología Clínica y Estadística Aplicada

41 Teorema original de Pitágoras. (Distancias euclídeas) Epidemiología Clínica y Estadística Aplicada


Descargar ppt "David Cao Carreño Primer Premio de Fotografía (Libre) S.A.E.M. THALES SEVILLA CONCURSO DE FOTOGRAFÍA Y MATEMÁTICAS E IMÁGENES MATEMÁTICAS Epidemiología."

Presentaciones similares


Anuncios Google