Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Tabulación y Análisis de Datos
Universidad Nacional Mayor de San Marcos Doctorado en Ciencias de la Salud Seminario Nº 5 Diseño Metodológico : Tabulación y Análisis de Datos
2
Tabulación
3
Tabulación Ordenamiento de la información en filas y columnas (campos y registros) en una BD. Colección de datos puedan consultar, filtrar y analizar de manera sistematizada. Incluye: codificación de las respuestas, la entrada de datos, en un programa Access ó Epiinfo o Epidata, gestión de datos, especificando los procedimientos de recogida, edición y copias de seguridad Este proceso incluye: la codificación de las respuestas en formato, la entrada de datos, de preferencia en un programa de base de datos (Access ó Epiinfo o Epidata), así como la gestión de datos, especificando los procedimientos de recogida, edición y copias de seguridad[1]. Es el ordenamiento de la información en filas y columnas (campos y registros) en una base de datos (BD); que no es otra cosa que una colección de datos medidos en diferentes escalas que se puedan consultar, filtrar y analizar de manera sistematizada. Se puede tener dos tipos de tablas, las simples y las relacionales. [1] Feigal J, Black D, Grady D, Hearst N, Fox C, Newman TB, Hulley SB. Capitulo 15 Planificación de la gestión y Análisis de Datos. En Hulley SB y Cummings SR. Diseño de la Investigación Clínica. Barcelona: Ediciones Doyma. Edición Española Pag Feigal J, Black D, Grady D, Hearst N, Fox C, Newman TB, Hulley SB. Capitulo 15 Planificación de la gestión y Análisis de Datos. En Hulley SB y Cummings SR. Diseño de la Investigación Clínica. Barcelona: Ediciones Doyma. Edición Española Pag
4
Definición de los campos
Nombre a las variables. Tipo de dato (numérico, texto, fecha, lógico (S/N), etc). Reglas de validación. Ejemplo: digitador sólo puede ingresar en el campo sexo los códigos ‘1’,’2’, ‘99’ para hombre, mujer o no hay dato. Declaración de saltos condicionados en preguntas de tipo filtro, lo que permite integridad de la información. Manual de Códigos o Diccionario de variables Almacenamiento electrónico x digitación Gil FA, Rodríguez MN, Rondón MA. Capitulo 27 Recolección, Captura y Procesamiento de datos. En Ruiz A y Morillo LE. Epidemiología Clínica. Editorial Médica Panamericana. Bogotá pp
5
Análisis de Datos Cuantitativos
6
Analisis según Obetivos
INFERENCIAL DESCRIPTIVO Tener presente el tipo de variables
7
Análisis descriptivo Depende del tipo de variables, así como de los objetivos planteados. Variables cualitativas. Frecuencias, porcentaje. La presentación de esta información puede ser en cuadros o tablas con tres columnas o más. Variables cualitativas.[1] Ellas se resumen mediante una distribución de frecuencias, que es el conteo de cada categoría de la variable ya sea nominal u ordinal que estamos analizando, acompañada por el porcentaje. La presentación de esta información puede ser en cuadros o tablas con tres columnas o más en donde la primera columna corresponde al nombre de la categoría, la segunda a la frecuencia y la tercera al porcentaje de la misma. Las distribuciones de frecuencias pueden presentarse en forma de gráficos de sectores o circulares y gráficos de columnas verticales o barras horizontales. [1] Hernandez, Fernández y Baptista. Op cit pag. 419
8
Análisis descriptivo Variables cuantitativas: Medidas de tendencia central (media, mediana) y con sus respectivas medidas de dispersión (desvío estándar e intervalo intercuartílico). También estos datos se pueden presentar como cuadros o como gráficos. Adicionalmente las variables cuantitativas se pueden recodificar o reagrupar de manera que se pueden presentar como intervalos o categorías ordinales. Variables cuantitativas: Estadísticos de resumen. Ellas se pueden resumir como medidas de tendencia central (media, mediana) y con sus respectivas medidas de dispersión (desvío estándar e intervalo inter-cuartílico). También estos datos se pueden presentar como cuadros o como gráficos. 1] Hernandez, Fernández y Baptista. Op cit pag. 419 Adicionalmente las variables cuantitativas se pueden recodificar o reagrupar de manera que se pueden presentar como intervalos o categorías ordinales. Así por ejemplo, la variable Índice de Masa Corporal (Peso,kg/Talla (m)2) que es medida en nivel de razón puede ser recodificar de manera que aquellas personas que tienen un IMC < de 18.5 se las considera adelgazadas, las que están entre 18.5 a 24.9 son normales, las que tienen IMC entre 25 y 29.9 tienen sobrepeso y las que tienen IMC > 30 se las considera como obesas. El tratamiento para la variable recodificada es el mismo que para una variable cualitativa. A las variables cuantitativas también se les puede aplicar la medición de la asimetría y la curtosis, para saber si la distribución de los datos se asemejan a una ‘curva normal’ (campana de Gauss)[1]. [1] Hernández, Fernández y Baptista. Op cit. pag. 432 Hernández R, Fernández C, Baptista P. Metodología de la Investigación. 4ª ed México: McGraw Hill. Pag. 419
9
NO repita la MISMA información
GRÁFICAS NO repita la MISMA información ALTERNATIVAS EXCLUYENTES TEXTO La media del Indice de Masa Corporal fue de 21.1 ± 1.49 TABLAS / CUADROS Presente los datos en el texto, en un cuadro o en una gráfica. No repita Inserte un cuadro (Tabla) sólo si tiene datos reiterativos que deba presentar. Si lo que va poner en el cuadro se puede escribir en el texto de manera sencilla, hágalo. Presente solo las cifras significativas
10
Analisis Inferencial A partir de los datos muestrales aleatorios se llegará a conclusiones que afecten a toda la población. Se pueden clasificar en paramétricas y "no paramétricas”. éstas ultima se utilizan cuando los datos no tienen distribución normal. Se llama así porque a partir de los datos muestrales aleatorios se llegará a conclusiones que afecten a toda la población de las cual fue extraída dicha muestra. La estadística inferencial se utiliza para dos procedimientos, probar hipótesis y estimar parámetros. Si las variables no tienen distribución normal, entonces se utilizarán las pruebas "no paramétricas”.
11
Prueba de Hipótesis Hipótesis proposición respecto a uno o varios parámetros. Si la hipótesis es congruente con los datos obtenidos se la Acepta (no se rechaza) y es rechazada, si no lo son. La Hipótesis nula (Ho) propone la ausencia de la diferencia entre valores supuestos o hipotéticos, es decir la ‘nulidad’ significa ‘no hay diferencia’; Mientras H1 ó Ha es una manifestación de desacuerdo con la hipótesis de nulidad. Prueba de Hipótesis [1] Una hipótesis es una proposición respecto a uno o varios parámetros y el investigador determina si la hipótesis es congruente con los datos obtenidos en la muestra; es decir la acepta (no la rechaza) si son congruentes y la rechaza, si no lo son. Según el análisis inferencial se puede entonces afirmar si se acepta la hipótesis nula, o si se rechaza la hipótesis nula, aceptando la alterna. La Hipótesis nula (Ho) propone la ausencia de la diferencia entre valores supuestos o hipotéticos, es decir la ‘nulidad’ significa ‘no hay diferencia’; mientras que la Hipótesis alterna (H1 ó Ha) es una manifestación de desacuerdo con la hipótesis de nulidad.[1] En la gran mayoría de los casos la hipótesis de la investigación es la hipótesis alterna. [1] Dawson y Trapp. Op Cit pag. 114. Dawson B, Trapp RG. Bioestadística Médica. 3ª edición. El Manual Moderno. México DF; Pag 114
12
Identificación de hipótesis
Hipótesis nula Ho La que contrastamos Los datos pueden refutarla No debería ser rechazada sin una buena razón. Hipótesis Alternativa H1 Niega a H0 Los datos pueden mostrar evidencia a favor No debería ser aceptada sin una gran evidencia a favor.
13
Prueba de Hipótesis Región de rechazo: región nos llevará a rechazar la hipótesis. Región de aceptación: Si el valor evaluado del estadístico pertenece a ella No rechaza-mos la hipótesis. Hipótesis nunca se aceptan de forma definitiva, sólo se aceptan provisionalmente. A continuación presentamos las definiciones que conceptos básicos de la estadística inferencial: Región crítica: Será aquella región del campo de variación del estadístico tal que si contiene al valor evaluado del mismo con los datos muestrales nos llevará a rechazar la hipótesis. Región de aceptación: Es la región complementaria de la anterior. Si el valor evaluado del estadístico pertenece a ella No rechazamos la hipótesis (las hipótesis nunca se aceptan de forma definitiva, sólo se aceptan provisionalmente). [1] Dawson y Trapp. Op Cit pag. 117.
14
Prueba de Hipótesis Región de Aceptación Región de Rechazo.
v a l o r e s t n d i z C u N m E á 4 3 2 1 Región de Rechazo. Región de Aceptación Valor crítico. Un punto
15
Regla de decisión: Estado Real Decisión Tomada
Ho Verdadera Ho Falsa; H1 Verdadera Rechazada Error tipo I () Decisión correcta No Rechazada Error tipo II ( ) Regla de decisión: Teniendo en cuenta lo dicho anteriormente, el problema de rechazar o aceptar una hipótesis puede plantearse como un problema de decisión, en el que evidentemente existe la posibilidad de fracasar o acertar en la elección o decisión a la hora de concluir que la hipótesis, bien nula o bien alternativa, son rechazables o no. El problema de decisión: rechazo/ aceptación, vendría expresado en las siguientes opciones en forma de tabla: Hipótesis/AcciónAceptaciónRechazamosEs ciertaCorrectoError Tipo IEs falsaError Tipo IICorrecto Si la hipótesis nula (H0) es cierta y nuestra decisión es no rechazarla, la decisión ha sido correcta. Si la hipótesis nula (H0) es falsa y nuestra decisión es rechazarla, la decisión ha sido correcta. Si la hipótesis nula (H0) es cierta y nuestra decisión es rechazarla, la decisión provoca un error, denominado ‘error tipo I’ y a [1] es la probabilidad de cometer el error tipo I. También se le conoce como el nivel de significancia, generalmente está en 0.05 o en 0.01. Si la hipótesis nula (H0) es falsa y nuestra decisión es no rechazarla, la decisión provoca un error, denominado error tipo II y b es la probabilidad de cometer el error tipo II. Nivel de confianza: Es el complemento del nivel de significancia (1-a), generalmente toma los valores de 0.95 y 0.99. [1] Pita S, Pértega S. Significancia estadística y relevancia clínica [Metodología de la investigación]. Fisterra.com [Portal de internet]. 2001[último acceso 2009 junio 30]. Disponible Poder de la prueba (1- β): llamado también potencia de la prueba, es la probabilidad de rechazar la Ho cuando en verdad es falsa o de manera equivalente, concluir que la H1 es cierta cuando, en realidad es verdadera.[1] [1] Dawson y Trapp op cit pag. 117. En realidad nunca se sabe si se ha cometido o no uno de esos errores cuando se rechaza o no se rechaza una Ho, por eso sólo podemos hablar de la probabilidad de cometer el error tipo I. Detalles a tener en cuenta y están inversamente relacionadas. Sólo pueden disminuirse las dos, aumentando n. = p (rechazar H0|H0 cierta) = p (aceptar H0|H0 falsa) Potencia =1- = p (rechazar H0|H0 falsa)
16
Procedimiento 5 pasos Paso 1.- Ho ; Ha Paso 5. Con una
Muestra llegar a Decisión Paso 1.- Ho ; Ha Paso 4.- Regla de Decisión Paso 2.- Nivel de Significancia Paso 3.- Estadístico de prueba Acepta Ho Rechazar Ho Y Aceptar Ha Formular la hipótesis nula H0 y la alternativa H1, de acuerdo al problema. Escoger un nivel de significación o riesgos a. Elegir la estadística de prueba apropiada, cuya distribución por muestreo sea conocida en el supuesto de que Ho es cierta. En base a a y H1, determinar el valor (o los valores) críticos y con ello se establecen las regiones de aceptación o rechazo. Calcular los valores de la prueba estadística a partir de una muestra aleatoria de tamaño n, Ho y reemplazarlos en la estadística de prueba elegida en el paso 3, para hallar el valor experimental. Tomar la decisión de aceptar Ho si el valor experimental cae en la región de aceptación y rechazarla si dicho valor cae en la región crítica o de rechazo. Opcional: Si se rechaza H0, se puede hallar un intervalo de confianza para el parámetro de interés. Referencia: Universidad Nacional de Tumbes. Departamento de Matemática e Informática. Estadística General – III Unidad. Inferencia Estadística
17
La Distribución NORMAL Z tiene Media = 0 y Desviación típica = 1
En cualquier distribución normal las probabilidades delimitadas entre : 68 % 2 95 % 3 99 % 68% 99% 95% 68% 95% 99% z
18
Pruebas paramétricas: t, ANVA
Paramétricas, supuesto Distribución Normal de los datos. Muestras sean aleatorias. Ambas sirven para comparar medias. Sólo dos medias ---> prueba t, 2 medias ---> ANVA. [1] Pértega Díaz S., Pita Fernández S. Métodos paramétricos para la comparación de dos medias. t de Student. [Metodología de la investigación]. Fisterra.com [Portal de internet]. 2001[último acceso 2009 junio 30]. Disponible [1] Dawson y Trapp. Op cit pp * Pértega Díaz S., Pita Fernández S. Métodos paramétricos para la comparación de dos medias. t de Student. * Dawson y Trapp. Op cit pp
19
Prueba t Hipótesis. Para determinar si es razonable o no concluir que las dos medias son distintas entre sí se puede formular una de tres hipótesis: A) La hipótesis. Para determinar si es razonable o no concluir que las dos medias son distintas entre sí se puede formular una de tres hipótesis: 1.- Ho: m1= m o lo que es lo mismo: Ho: m1 - m 2 = 0Ha: m1 ≠ m o lo que es lo mismo: Ha: m1- m 2 ≠ 0Llamada también de dos colas porque no se tiene evidencia para suponer que una media sea mayor que la otra.
20
Prueba t Hipótesis. Las otras dos:
A) La hipótesis. Para determinar si es razonable o no concluir que las dos medias son distintas entre sí se puede formular una de tres hipótesis: 1.- Ho: m1= m o lo que es lo mismo: Ho: m1 - m 2 = 0Ha: m1 ≠ m o lo que es lo mismo: Ha: m1- m 2 ≠ 0Llamada también de dos colas porque no se tiene evidencia para suponer que una media sea mayor que la otra.
21
Unilateral y Bilateral
La posición de la región crítica dependerá de las hipótesis. Bilateral H1: ¹20 Unilateral Derecha Unilateral Izquierda H1: <20 H1: >20
22
Prueba no paramétrica
23
Pruebas no paramétricas para comparar medias
Comparación de dos medianas: Muestras independientes. prueba U de Mann-Whitney Muestras apareados. prueba de Wilcoxon. Comparación de varios grupos, Prueba de Kruskal-Wallis Igual que en los casos anteriores se usa la mediana, en lugar de las medias. Comparación de dos medias: 1.- Muestras independientes Se realiza a través de la prueba U de Mann-Whitney. La prueba de Hipotesis, mas que comparar medias, plantea la comparación de medianas. La escala de medición es por lo menos ordinal. 2.- Comparación de dos medias (datos pareados) Se realiza a través de la prueba de Wilcoxon. Se utiliza para evaluar la hipótesis nula que indica que en la población estudiada la mediana de las diferencias entre pares es igual a 0. 3.- La prueba de Kruskal-Wallis para comparar más de dos grupos La prueba de Kruskal-Wallis, es una alternativa a la prueba F del análisis de varianza para diseños de clasificación simple. En este caso se comparan varios grupos pero usando la mediana de cada uno de ellos, en lugar de las medias. Ho: La mediana de las k poblaciones consideradas son iguales y Ha: Al menos una de las poblaciones tiene mediana distinta a las otras.
24
Hipótesis a contrastar Prueba U de Mann-Whitney
25
Pruebas No Paramétricas: Chi2
Para Variables Cualitativas Requisitos: a)Que menos del 20% de los valores esperados sean menores de 5. b) Suma todas frecuencias en tabla > 40. O = Observado ; E = Esperado [1] Pita S, Pértega S. Asociación de variables cualitativas: test de Chi-cuadrado. . [Metodología de la investigación]. Fisterra.com [Portal de internet]. 2001[último acceso 2009 junio 30]. Disponible
26
Cuadro de elección pruebas
OBJETIVOS Tipo de Variable Escala de Medición PRUEBAS Comparar medias Cuantitativa Intervalo / Razón Prueba t (2 grupos ) Prueba ANVA (≥ 2 grupos ) Comparar medianas Cualitativa Ordinal Prueba de U de Mann-Whitney (2 grupos independientes) Prueba de Wilcoxon (2 muestras apareadas) Prueba de Kruskall-Wallis >2grupos
27
Cuadro de elección pruebas
OBJETIVOS Tipo de Variable Escala de Medición PRUEBAS Comprobar asociación entre variables Cuantitativa Intervalo/ Razón Coef. Correlación de Pearson; Coef. Spearman Predicción Regresión Independencia de variables (Asociación) Cualitativa Nominal , Ordinal Chi 2 Fuerza de Asociación Odds Ratio – Riesgo Relativo
28
Análisis de Datos Cualitativos
Carolina Blossiers
29
Referencias Bibliográficas
Ardila J, Rodríguez MN, Gil F. Capítulo 8: Población y Muestreo. En Ruiz AM, Morillo LE. Epidemiología Clínica. Editorial Médica Panamericana. Bogotá. Colombia Dawson B, Trapp RG. Bioestadística Médica. 3ª edición. El Manual Moderno. México DF; pp Feigal J, Black D, Grady D, Hearst N, Fox C, Newman TB, Hulley SB. Capitulo 15 Planificación de la gestión y Análisis de Datos. En Hulley SB y Cummings SR. Diseño de la Investigación Clínica. Barcelona: Ediciones Doyma. Edición Española Pag Gil FA, Rodríguez MN, Rondón MA. Capítulo 27 Recolección, Captura y Procesamiento de datos. En Ruiz A y Morillo LE. Epidemiología Clínica. Editorial Médica Panamericana. Bogotá pp Hernández R, Fernández C, Baptista P. Metodología de la Investigación. 4ª ed México: McGraw Hill. pag. 442 Pértega Díaz S., Pita Fernández S. Métodos paramétricos para la comparación de dos medias. t de Student. [Metodología de la investigación]. Fisterra.com [Portal de internet]. 2001[último acceso 2009 junio 30]. Disponible Pineda EB, de Alvarado EL. Metodología de la Investigación. 3ª edición. Serie Paltex Nº 47. Organización Panamericana de la Salud pp Pita S, Pértega S. Asociación de variables cualitativas: test de Chi-cuadrado. . [Metodología de la investigación]. Fisterra.com [Portal de internet]. 2001[último acceso 2009 junio 30]. Disponible Pita S, Pértega S. Significancia estadística y relevancia clínica [Metodología de la investigación]. Fisterra.com [Portal de internet]. 2001[último acceso 2009 junio 30]. Disponible Pita S. Determinación del tamaño muestral serie [Metodología de la investigación]. Fisterra.com [Portal de internet]. 2001[último acceso 2009 junio 30]. Disponible Venezuela. Red Nacional Escolar RENA. Zubizarreta Armando. La Aventura del Trabajo Intelectual. Buenos Aires da Edición. Duffau T. Gastón. Tamaño muestral en estudios biomédicos. Rev. chil. pediatr. [revista en la Internet]. 1999 Jul [citado 2009 Ago 04] ; 70(4): Disponible en:
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.