La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Análisis de datos Introducción al análisis de datos

Presentaciones similares


Presentación del tema: "Análisis de datos Introducción al análisis de datos"— Transcripción de la presentación:

1 Análisis de datos Introducción al análisis de datos
UNIVERSIDAD INDUSTRIAL DE SANTANDER ESCUELA DE ECONOMÍA Y ADMINISTRACIÓN Maestría en Gestión y Políticas Públicas Análisis de datos Introducción al análisis de datos Prof.: Hector Mauricio Rojas B.

2 APROPIACIÓN SOCIAL DEL CONOCIMIENTO – ASCTI:
“La profunda transformación de los modos de la vida económica, del ejercicio del poder y de la experiencia interpersonal, como resultado del desarrollo científico y tecnológico contemporáneo, ha hecho que la preocupación por la cultura científica y tecnológica alcance unas dimensiones nunca antes registradas. La necesidad de promover una cultura de la ciencia socialmente apropiable y de hacerla accesible a los ciudadanos ha creado nuevos desafíos en el desarrollo de las políticas públicas”. (Revista Iberoamericana de Educación, OEI, 2010)

3 La Maestría en Gestión y Políticas Públicas de la Universidad Industrial de Santander se propone:
Incidir en el mejoramiento de la calidad de la gestión pública. Contribuir en el diseño eficiente de políticas públicas en la región y el país. Aportar en la resolución de los problemas propios de la gestión pública. Participar de la definición de estrategias de planificación, ejecución y seguimiento de proyectos de inversión que aporten al desarrollo regional y nacional. Propiciar la investigación en gestión pública, con miras a aportar en la resolución de problemas de la región y el país. Impulsar el proceso de descentralización en el nivel regional. Generar voluntad política que contribuya a dinamizar verdaderos procesos de desarrollo humano.

4 PROPÓSITO DE LA ASIGNATURA
Distinguir el método adecuado de obtención de los datos. Seleccionar las técnicas adecuadas para la interpretación de la información dependiendo de su origen y características particulares. Indicadores de aprendizaje Conoce la diferencia entre un muestreo y un diseño de experimentos. Propone el método adecuado para la recolección de los datos. Usa correctamente los estadísticos o parámetros de dispersión, posición y tendencia para la interpretación de los datos. Usa las técnicas básicas bivaridas para el análisis conjunto de variables.

5 Estrategias de evaluación
El nivel de aprendizaje de los estudiantes se valorará a partir de talleres, quices y exámenes parciales. Equivalencia cuantitativa Dos talleres tendrán una valoración del 30% cada uno de la calificación total. Se realizará un examen parcial que corresponden 30% de la calificación final. El 10% restante corresponde a la participación de los estudiantes.

6

7 Definiciones de análisis de políticas públicas
“El análisis de políticas públicas es consejo orientado al cliente, relevante para las decisiones públicas e informado por los valores sociales” (Weimery Vining 2011, 24). “El uso de la razón y la evidencia para seleccionar la mejor política entre una serie de alternativas para hacer frente a un problema de política pública en particular” (MacRae y Wilde 1979). “El análisis de políticas públicas es un proceso de sintetización de información que incluye resultados de investigación, útil para producir un formato para las decisiones públicas y para determinar las necesidades futuras de información relevante para las políticas públicas” (Williams, 1971citado en (A. Meltsner 1976, 2–3)). “Un método para estructurar la información y proporcionar oportunidades para el desarrollo de alternativas para el encargado" (Gill y Saunders,1992, citado en (Howlett y Wellstead 2011)

8 En términos generales la matriz criterios/alternativas allana el proceso de esquematización de opciones de política pública en relación a ciertos parámetros, objetivos, metas, criterios, elegidos para ello, lo que en últimas facilita escoger entre las diversas alternativas. Weimer y Vining (2011, p. 359) enmarcan el uso de estas matrices dentro del proceso de análisis de soluciones de problemas compuesto de cinco pasos: I. seleccionando las categorías del impacto para las metas relevantes II. generando un sistema de alternativas de la política III. prediciendo el impacto que cada alternativa tendría en términos de las metas IV. valorando los impactos predichos, con métodos cualitativos, cuantitativos, o de monitoreo ; y V. la determinación de alternativas en términos de metas y recomendaciones

9 “[LA CIENCIA]…ES UN INMENSO APARATO DE CONSTRUCCIÓN COLECTIVA, COLECTIVAMENTE UTILIZADO”
LA REFLEXIVIDAD ES… “EL TRABAJO MEDIANTE EL CUAL LA CIENCIA SOCIAL, TOMÁNDOSE A SÍ MISMA COMO OBJETO, SE SIRVE DE SUS PROPIAS ARMAS PARA COMPRENDERSE Y CONTROLARSE.” PIERRE BOURDIEU. EL OFICIO DEL CIENTÍFICO. CIENCIA DE LA CIENCIA Y REFLEXIVIDAD. Anagrama, Barcelona, 2003.

10 Científico Ciencias Sociales Ontología Naturaleza de la realidad
Epistemología Naturaleza del conocimiento Metodología Enfoques y técnicas Filosofía de la ciencia Lenguaje: Estructura – Lógica - Validez Teoría del Conocimiento Reflexión racional Origen Naturaleza – Alcance Contexto de descubrimiento Contexto de justificación Empírico-ideológico Científico

11 En el nivel metodológico se desarrolla EL INSTRUMENTO, LA INSTRUMENTALIZACIÓN cuyo objeto es perfeccionar los sentidos naturales del hombre (el nuevo Creador) sin ir más allá de su función Robert Boyle, Siglo XVII (La bomba de aire de Boyle, química moderna)

12 DISEÑO DE UNA INVESTIGACIÓN
VERDADES EN EL UNIVERSO Preguntas a investigar PROBLEMAS Universo (Población cotidiana) Hallazgos en el estudio Aplicación Individuos estudiados VERDADES EN EL ESTUDIO Plan de investigación Diseño Muestral Fenómenos Categorías/ Variables Mediciones Inferencia Realización Validez Externa Validez Interna La cuantificación incrementa y facilita la compresión del universo que nos rodea y ya mucho antes de los positivistas lógicos o neopositivistas  Galileo Galilei afirmaba, en este sentido, "mide lo que sea medible y haz medible lo que no lo sea". (Pita & Pértegas, 2002)

13 LA INVESTIGACIÓN COMO PROCESO SOCIAL
Realidad Teoría Investigación Paradigma Ciencia Paradigma: Conjunto articulado y coherente de guías conceptuales que incluye EL CONOCIMIENTO DE FRONTERA Indicadores de CyT, I+D

14 Estadística El término alemán Statistik, introducido originalmente por Gottfried Achenwall en 1749, se refería al análisis de datos del Estado, es decir, la «ciencia del Estado» (o más bien, de la ciudad-estado). También se llamó aritmética política de acuerdo con la traducción literal del inglés. No fue hasta el siglo XIX cuando el término estadística adquirió el significado de recolectar y clasificar datos. Este concepto fue introducido por el militar británico sir John Sinclair ( ).

15 Estadística descriptiva:
Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos: la media y la desviación estándar. Estadística inferencial: Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio: Ejemplos: prueba de hipótesis, estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos.

16 Medición es el proceso de vincular conceptos abstractos con indicadores empíricos, Así, la medición es un tipo de observación que describe los fenómenos de modo que éste pueda ser analizado estadísticamente. Desde el punto de vista empírico el centro de atención es la respuesta observable Desde el punto de vista teórico, el interés se sitúa en el concepto subyacente no observable (constructo) Un instrumento de medición es cualquier vía a través de la cual obtenemos los indicadores empíricos de los conceptos abstractos de interés.

17 “Mide lo que sea medible y haz medible lo que no lo sea". Galileo
MEDICIÓN: DATO Es una representación de la realidad, no la realidad –pero le da sentido, la representa, es una guía para la interacción y representación sociales- “Mide lo que sea medible y haz medible lo que no lo sea". Galileo Normalidad Anormalidad Anormalidad Realidad social Históricamente representada Desviación Social Desviación Social Psicosis Neurosis Psicosis

18 Utilidades de la Medición en Investigación
Requisitos que debe cumplir un instrumento de medición. Evaluación de la confiabilidad y validez 1.Objetividad. Significa independencia de los resultados de quien lo aplica. 2. Confiabilidad. El grado en que se repiten los resultados cuando se aplica al mismo conjunto de objetos o sujetos. 3. Validez. El grado en que un instrumento mide exactamente lo que se quiere medir. Utilidades de la Medición en Investigación Desde este punto de vista, la medición promueve la objetivación del conocimiento y el control de los juicios valorativos. ¿Cómo medir la confiabilidad? Hay varias técnicas para ello, algunas estadísticas y otras no. En forma estadística, la confiabilidad se mide por una magnitud C entre 0 y 1 (Combrach-Kappa). El valor C=0 corresponde a un instrumento nada confiable. El valor C=1 corresponde a la máxima confiabilidad De contenido Evidencias de validez De criterio De constructo ¿Cómo medir la validez?

19 De otra manera, la confiabilidad y validez de un instrumento permite evaluar la calidad de los constructos a través de la precisión y la exactitud: Precisión: Una medición es muy precisa cuando presenta prácticamente el mismo valor cada vez que se mide. Exactitud: Grado con que realmente representa lo que se intenta representar. Buena Precisión Poca Exactitud Poca Precisión Buena Exactitud

20 DISEÑO DE ANÁLISIS PLANTEAMIENTO CONCEPTO DEFINICIÓN
OPERACIONALIZACIÓN NIVEL DE MEDICIÓN CONCRECIÓN MEDICIÓN CATEGORIZACIÓN VARIABLES

21 Variables El concepto de variable siempre está asociado a las hipótesis de investigación. Una variable es una propiedad que puede adquirir diferentes valores en un conjunto determinado y cuya variación es susceptible de ser medida.

22 Variable, Dimensión o Categoría
Características observables de una unidad de análisis, ligadas entre sí en su variación en una relación específica de Asociación, Dependencia (Correlación) o Causalidad. Una investigación, cualitativa o cuantitativa, exige la operacionalización de sus conceptos centrales en variables, de esta definición operativa depende el nivel de medición y potencia de las pruebas realizadas

23 Condiciones-situaciones
Variabilidad de los fenómenos en tiempo espacio (la realidad no tiene un tamaño determinado (dimensión histórica cultural) Dificultad de establecer regularidades y generalizaciones sobre la realidad social Ausencia de instrumentos de observación potentes y precisos Limitaciones de laboratorio/experimentación: restricciones ético/legales y financieros Dificultad para divulgar los resultados de investigación por las consecuencias en todo nivel. La investigación es parte de la sociedad y participa de sus relaciones.

24 CLASIFICACIÓN DE LAS VARIABLES
SEGÚN TIPO Tipos Nominal (discreta): criterio de clasificación Ordinal: jerarquía Continua: numérica

25 Características de Variable
Tipo de Medición Características de Variable Ejemplo Potencia Nominal (cadena) Categorías no ordenadas, mutuamente excluyentes Sexo, municipio, estado de ánimo, orientación religiosa, raza. Baja Ordinal Categorías ordenadas con intervalos no cuantificables Grado de aprendizaje, nivel de escolaridad. Intermedia Continua Intervalos (cero relativo) Razón (cero absoluto) Espectro ordenado con intervalos cuantificables Peso Número de clases al día Horas de TV. a la semana. Talla Elevada

26 CLASIFICACIÓN DE LAS VARIABLES
SEGÚN NIVELES Niveles: Descriptivas (Caracterización) Dependientes (Efectos) Independientes (Causas) Intervinientes (Condicionan)

27 VARIABLES: Niveles Descriptivas: Caracterizan el fenómeno sin relación, profundizan en la característica. Operacionalizan el concepto sin relación con otras EJ., GRADO DE INCERTIDUMBRE POR EL FUTURO DE LOS HABITANTES DE BUCARAMANGA, 2014 EJ., OPINIÓN FAVORABLE O DESFAVORABLE DE LOS HABITANTES DE BUCARAMANGA SOBRE LA CALIDAD DEL AIRE EN LA CIUDAD Dependientes: Efecto (CONSECUENCIA) en estudio expresados en relación EJ., EL GÉNERO Y EL GRADO DE INCERTIDUMBRE POR EL FUTURO ENTRE LOS HABITANTES DE BUCARAMANGA, 2014

28 VARIABLES: Niveles Independientes: Causas asociadas en diferente grado a la relación EJ., EL GÉNERO Y EL GRADO DE INCERTIDUMBRE POR EL FUTURO ENTRE LOS HABITANTES DE BUCARAMANGA, 2014 Intervinientes: Tienen efecto en la relación planteada, aunque no son esenciales en la relación EJ., LAS MUJERES EXPRESAN UN MAYOR GRADO DE INCERTIDUMBRE POR EL FUTURO ENTRE LOS HABITANTES DE BUCARAMANGA, ESPECIALMENTE AQUELLAS CON HIJOS MENORES DE EDAD. EN LOS HOGARES CON MAYOR NÚMERO DE HIJOS, EXISTE MAYOR INCERTIDUMBRE POR EL FUTURO, MÁS AÚN EN AQUELLOS CON PERSONAS DISCAPACITADAS

29 Planteamiento El concepto subjetivo de calidad de vida en Bucaramanga está asociado al género, el nivel socioeconómico y la ocupación de los habitantes. Dependientes El concepto subjetivo de calidad de vida en Bucaramanga Independientes género, el nivel socioeconómico y la ocupación de los habitantes. Intervinientes No hay

30 Planteamiento Los estudiantes de la UIS tienen una alta actitud científica hacia la investigación comparativamente con los estudiantes de otras universidades de Bucaramanga, siendo mayor en los estudiantes más jóvenes. Dependientes Nivel de actitud hacia la investigación Independientes Universidad del estudiante en Bucaramanga Intervinientes Edad del estudiante Extrañas

31 Cuadro de codificación de variables
Ejemplo: Analizar las percepciones de los adolescentes sobre el embarazo precoz en el AMB de Bucaramanga Variables de composición (variables independientes) Variable Ítems Tipo Edad actual (años cumplidos) Número de años _______ Continuo De 12 a 15 De 15 a 19 Ordinal Ocupación principal Ninguna ⃝1 Solo estudio ⃝2 Estudio y Trabajo ⃝3 Solo trabajo ⃝4 Nominal No. De parejas sexuales que ha tenido Parejas ________ Continua Sexo Mujer ⃝1 Hombre ⃝2

32 Variables de análisis o de efecto (variables dependientes)
Cuadro de codificación de variables – TAREA: Realizar el cuadro de codificación del proyecto de clase Ejemplo: Analizar las percepciones de los adolescentes sobre el embarazo precoz en el AMB de Bucaramanga Variables de análisis o de efecto (variables dependientes) Variable Ítems Tipo Influencia de la religión la manera de pensar sobre la sexualidad Sí influye ⃝1 No influye ⃝2 Nominal-dicotómica Nivel de acuerdo sobre la despenalización total del aborto en Colombia Total desacuerdo ⃝1 Indiferente ⃝2 De acuerdo ⃝3 Total acuerdo ⃝4 Ordinal –Tipo Likerts Calificación del estado de salud física Puntuación 0 a 10 Continua Nivel de estado de salud mental Mi estado de salud sexual

33 Análisis y representación de las variables
Datos agrupados 1.- Su propósito es resumir la información de manera técnica 2.- generalmente, los elementos son de mayor tamaño, por lo cual requieren ser agrupados, esto implica: ordenar, clasificar y expresar los en una tabla de frecuencias se agrupa a los datos, si se cuenta con 20 o más elementos. Aunque contemos con más de 20 elementos, debe de verificarse que los datos n sean significativos, Esto es: que la información sea “repetitiva”, también debemos de verificar que los datos puedan clasificarse. Y que dicha clasificación tiene coherencia y lógica (de acuerdo a lo que se nos esta pidiendo) . Una vez que ya hemos ordenado y clasificado, presentaremos la información obtenida mediante una ”tabla de frecuencias” 4.- la agrupación de los datos puede ser simple o mediante intervalos de clase.

34 Distribución según sexo Distribución según actividad principal
Gráfico No. 1 Variables de composición de la población de adolescentes de estudio (n=368) Distribución según sexo Distribución según municipio de residencia Distribución según actividad principal Distribución según dependencia económica Fuente: Investigación propia, 2015

35 Gráfico No. 3 Fuentes principales de información sobre SSR de los adolescentes participantes (n=368)* Fuente: Investigación propia, 2015

36 Variables: Tablas de Frecuencia
Datos no agrupados: Es un conjunto de información si ningún orden más que como fueron tomados en la medición. estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados. Ejemplos Datos no agrupados: X1, X2, X3, X4, X5, X6, X7… Xn Edad de un grupo de niños 5, 6, 5, 4, 3, 5, 6, 7, 8…

37 Ejemplos: Vas a investigar la edad a un grupo de 20 Niños en datos no agrupados (es decir, vienen los 20 niños y así como te dan la edad así la anotas 2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,6 (Total 20 niños) Estos son datos no agrupados por qué no los has clasificado y contado 1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5,6 (Total 20 niños) Los datos no agrupados también los puedes ordenar, por ejemplo de la edad menor a la edad mayor, no están contabilizados ni clasificados solamente están ordenados Para que sean datos agrupados tienes que contarlos y clasificarlos, por ejemplo cuántos niños había de cada año. (y siguen siendo 20 niños) Tabla de frecuencias Edad Frecuencia Total

38 Tabla No.1 Notas de un grupo de estudiantes Xi fi Fi Fa 3 15,0 1 5
3 15,0 1 5 25,0 8 2 13 4 20,0 17 10,0 19 5,0 20 Total 100,0 Fuente: datos ficticios, 2014

39 FÓRMULAS BÁSICAS DE ESTADÍSTICA
Para el cálculo de algunas medidas MEDIDAS DE POSICIÓN Medida Fórmula Observaciones Cuartiles Los cuartiles dividen la serie de datos en cuatro partes iguales. 𝐶 𝑘= 𝐿 𝑖 + 𝐾∗ 𝑁 4 − 𝐹 𝑖−1 𝑓 𝑖 ∗ 𝑎 𝑖 Buscamos 𝐾∗ 𝑁 4 , en la tabla de las frecuencias acumuladas. Dónde: K= 1,2,3 Para datos agrupados por intervalos de igual tamaño Deciles Los deciles dividen la serie de datos en diez partes iguales. 𝐷 𝑘= 𝐿 𝑖 + 𝐾∗ 𝑁 10 − 𝐹 𝑖−1 𝑓 𝑖 ∗ 𝑎 𝑖 Dónde: K= 1,2,3,4,5,6,7,8,9 Percentiles Los percentiles dividen la serie de datos en cien partes iguales. 𝑃 𝑘= 𝐿 𝑖 + 𝐾∗ 𝑁 100 − 𝐹 𝑖−1 𝑓 𝑖 ∗ 𝑎 𝑖 K= 1,2,3… 99

40 𝑀 𝑜= 𝐿 𝑖 + (𝑓 𝑖 − 𝑓 𝑖−1 ) (𝑓 𝑖 − 𝑓 𝑖−1 )+ (𝑓 𝑖 − 𝑓 𝑖+1 ) ∗ 𝑎 𝑖
Medidas de tendencia central Moda: La frecuencia que más se repite en una distribución agrupada. 𝑀 𝑜= 𝐿 𝑖 + (𝑓 𝑖 − 𝑓 𝑖−1 ) (𝑓 𝑖 − 𝑓 𝑖−1 )+ (𝑓 𝑖 − 𝑓 𝑖+1 ) ∗ 𝑎 𝑖 Pueden presentarse distribuciones unimodales, bimodales, multimodales… Mediana: Distribuye los datos en 50% por debajo y 50% por encima. Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. 𝑀 𝑒= 𝐿 𝑖 + 𝑛 2 − 𝐹 𝑖−1 𝑓 𝑖 ∗ 𝑎 𝑖 Me = C2 = D5 = P50 En datos no agrupados deben ordenarse de menor a mayor y establecer el dato medio. Media: Es el promedio, se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. 𝑋= 𝛴 𝑋 𝑖 𝑓 𝑖 𝑛 Sólo se calcula para datos de variables cuantitativas (continuas)

41 𝑆 2 = 𝛴 (𝑋 𝑖 − 𝑋 ) 2 𝑓 𝑖 𝑛 𝑆= 𝑆 2 MEDIDAS DE DISPERSIÓN
Varianza: es el promedio del cuadrado de las distancias entre cada observación y la media aritmética del conjunto de observaciones. 𝑆 2 = 𝛴 (𝑋 𝑖 − 𝑋 ) 2 𝑓 𝑖 𝑛 La varianza siempre se estudia en relación con la media, pero se encuentra en unidades cuadráticas Desviación Típica: La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva de la varianza. 𝑆= 𝑆 2 Permite saber, exactamente y en las mismas unidades de la variable, qué tan heterogéneo u homogéneo es un conjunto de datos.

42 MEDIDAS DE DISPERSIÓN 𝐶𝑉= 𝑆 𝑋 ∗100 𝐴 𝑠 = 𝑋− 𝑀 𝑜 𝑆
Coeficiente de Variación: Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de Pearson que se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética 𝐶𝑉= 𝑆 𝑋 ∗100 Cuando el CV > 30%: Heterogéneo Cuando el CV < 30%: Homogéneo Coeficiente de Asimetría: Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden. Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas) descienden más lentamente por la derecha que por la izquierda. Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la distribución es asimétrica a la izquierda. Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de Asimetría de Pearson: 𝐴 𝑠 = 𝑋− 𝑀 𝑜 𝑆 Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda. De otro modo: As > Me = Positiva As < Me = Negativa

43

44


Descargar ppt "Análisis de datos Introducción al análisis de datos"

Presentaciones similares


Anuncios Google