METODOLOGÍA DE INVESTIGACIÓN SOCIAL

Slides:



Advertisements
Presentaciones similares
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Advertisements

ELEMENTOS DE ESTADÍSTICA DESCRIPTIVA MIE. GRACIELA ROMERO MERCADO.
BIOESTADÍSTICA Y ESTADÍSTICA BÁSICA CHILLÁN, SEGUNDO SEMESTRE PROF. SOC. M© KEVIN VILLEGAS.
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, Decana de América) FACULTAD DE MEDICINA - UPG MAESTRÍA EN NEUROCIENCIAS Curso: Bioestadística.
Presentado por Karina Yuliet Preciado Mosquera Estadística II.
Rodrigo Ferrer Urbina Universidad de Tarapacá.  Una distribución (empírica) son todos los valores que aparecen en la medición realizada (todas las observaciones).
ESTADÍSTICA ÍNDICE 1.Introducción.Introducción. 2.Población y muestra.Población y muestra. 3.Variables estadísticas:Variables estadísticas: Cualitativas.
TEMA 1: TEMA 1: INTRODUCCIÓN A LA ESTADÍSTICA Por: Denise Muñoz Belmonte Claudia Morales Cerezuela.
ANÁLISIS DE VARIABLES. ANÁLISIS DE VARIABLES. ESTADÍSTICA DESCRIPTIVA EVALUACION Y CALIDAD EDUCATIVA Dr. Juan Carlos Farías Bracamontes.
T – Student teoria de las muestras pequeñas Paola Andrea Palacio Montero Estadística.
Bioestadística Escala Cuantitativa.. Trabajadores en una fábrica. RegistroSexoEdad (años)Talla (m)Peso (kg) 1Fem Masc Masc
TEMA 3. ESTADÍSTICA BIDIMENSIONAL. INDICE 1.- Relación estadística: correlación 2.- Diagramas de dispersión o nube de puntos 3.- Tablas de frecuencia.
Estadística inferencial. ¿Qué es? La Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones generales para toda la población.
TEMA 2: PARÁMETROS ESTADÍSTICOS. INDICE 1. Parámetros estadísticos: 1.1 Definición 1.2 Medidas de Centralización: Medias, moda y Mediana 1.3 Medidas de.
Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados.
PPTCES046MT22-A16V1 Clase Medidas de tendencia central y posición MT-22.
Tema 2. Parámetros estadísticos. Indice 1. Parámetros estadísticos. Tipos: 1.1 Medidas de centralización(medias y moda) 1.2 Medidas de posición(mediana,
Estadística Aplicada y Diseño de Experimentos Clase 1 continuación.
República Bolivariana de Venezuela Instituto Universitario Politécnico “Santiago Mariño" Estadísticas I - OV Estadística Profesor : Bachiller: Pedro Beltrán.
PERCENTILES, CUARTILES Y DECILES. Un percentil es una de las llamadas medidas de posición no central (cuartiles, deciles, percentiles, etc) que se puede.
Carrera de Administración Área Recursos Humanos Diseñó: Arturo Corona PeguerosEne-abr 17 Medidas de Medidas de Tendencia Central Tendencia Central Medidas.
Epidemiología y estadística descriptivas e indicadores
ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA CATALINO
Medidas de tendencia central
Clase 4: Medidas de Tendencia Central y Medidas de Variación
DISTRIBUCION F DE FISHER.
Términos básicos en estadística
PRUEBA DE SIGNIFICANCIA
MEDIDAS DE FORMA ASIMETRIA Y CURTOSIS..
UNIVERSIDAD DE COSTA RICA Sistema de Estudios de Posgrado
ESTADÍSTICA UNIDIMENSIONAL
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
ESTADÍSTICA UNIDIMENSIONAL
ANÁLISIS E INTERPRETACIÓN DE DATOS
Percentiles –cuartiles y rango intercuartil
Clase 5: Medidas de Variación
ESTADÍSTICA UNIDIMENSIONAL
ASIMETRÍA.
MEDIDAS DE POSICION NO CENTRALES
Estadística Unidimensional Conceptos básicos.
DISTRIBUCIÓN MUESTRAL DE UNA MEDIA.
Estadística.
Aplicaciones Estadísticas a las Finanzas
ESTADÍSTICA BÁSICA.
Introducción a la Estadística Descriptiva
ESTADÍSTICA DESCRIPTIVA
ADMINISTRACION DE LA PRODUCCION Y CALIDAD
PROBABILIDAD Y ESTADISTICA APLICADA A LOS NEGOCIOS
DISEÑO Y ANALISIS DE EXPERIMENTOS
MEDIDAS DE DISPERSIÓN.
Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva
Estadística Conceptos Básicos.
ESTADÍSTICA.
Estadística descriptiva (estudios con una variable)
Dr. Carlomagno Araya Alpízar
Apuntes de Matemáticas 3º ESO
MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I 1º BTO A
Presentan:. Presentan: Estadística Historia y Conceptos Básicos.
ESTADISTICA DESCRIPTIVA
“Medidas de dispersión”
URBINA GUADARRAMA GILBERTO MORENO CONTRERAS TANGANXOAN ZUANGUA
MODELOS DE PRONOSTICOS
Estadística Descriptiva
Estadística Asignatura obligatoria 5 créditos CBU 2015 Sexto semestre Módulo II. Medidas de tendencia central y de posición Universidad Autónoma del.
CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
ANALISIS DE REGRESION SIMPLE
DISEÑO Y ANALISIS DE EXPERIMENTOS
REGRESION LINEAL SIMPLE
Transcripción de la presentación:

METODOLOGÍA DE INVESTIGACIÓN SOCIAL SEMINARIO DE POSGRADO METODOLOGÍA DE INVESTIGACIÓN SOCIAL Agustín Salvia Julieta Vera MÓDULO 2 ESTADÍSTICA DESCRIPTIVA MÉTODOS DE INVESTIGACIÓN BASADOS EN EL ANÁLISIS DE VARIABLES.

TÉCNICAS DE ANÁLISIS ESTADÍSTICO ESTADÍSTICA DESCRIPTIVA (Medidas de tendencia central y dispersión) TABLA DE CONTINGENCIA Y ANÁLISIS PORCENTUALES (Diferencias porcentuales, perfiles y segmentos) ANALISIS DE ASOCIACIÓN (Correlación y coeficientes de asociación) TECNICAS DE ANALISIS MULTIVARIADO (Modelos Lazarsfeld, regresiones, factoriales, clusters)

VARIABLES: ATRIBUTOS DE LA POBLACIÓN Propiedades o atributos observables de una población o evento objeto de estudio que contenga, al menos, dos atributos en los que pueda clasificarse dicha población o eventos Ej: edad, nivel socio-económico, preferencias, hábitos de consumo, nivel educativo alcanzado, situación ocupacional, condición de pobreza, despidos, ascenso social, etc. Las variables estadísticas pueden ser: explicativas o independientes, intervinientes o de control y explicadas o dependientes. Las categorías de una variable deben ser mutuamente excluyentes y exhaustivas.

VALORES DE LAS VARIABLES Representación conceptual cualitativa o cuantitativa (no necesariamente numérica) de una propiedad o atributo objeto de medición. Ej: 54 años, joven, varón, ocupado, católico, 150$ per cápita, 12 años de instrucción, feliz, etc. MEDIR implica poner en correspondencia una teoría o concepto explicativo y los atributos observables de un objeto a través de un lenguaje estándar cuyas reglas de sintaxis permiten realizar operaciones lógico-matemáticas entre sus valores o categorías. Ej. Masa-Peso / Nivel de Vida-Ingreso.

NOMINAL O DE CLASIFICACIÓN LAS VARIABLES ESTADÍSTICAS Escalas de medida NOMINAL O DE CLASIFICACIÓN DE ORDEN JERÁRQUICO INTERVALOS IGUALES RAZÓN Clase social, nivel educativo, escalas de actitud, etc. Nº de hijos, ingresos, antigüedad, edad, etc. Fecha del calendario, factoriales, test, etc. Sexo, ciudad, situación laboral, religión, etc.

NIVEL DE MEDICIÓN DE LAS VARIABLES LAS VARIABLES ESTADÍSTICAS NIVEL DE MEDICIÓN DE LAS VARIABLES VARIABLES CATEGÓRICAS VARIABLES MÉTRICAS División en clases Discretas Continuas Operaciones básicas: moda, porcentajes, tasas, razones. Medidas de tendencia central y de posición, varianza, etc.

LA ORGANIZACIÓN DE LOS DATOS A TRAVÉS DE VARIABLES Distribución de frecuencias Distribución porcentual Distribución acumulada Proporciones Razones Representaciones gráficas

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS Resume en una tabla la información de la muestra Variable Valores / Categorías frecuencias absolutas :(fi.) representan el número de veces que aparece cada valor de la variable

Tabla de distribución de frecuencias frecuencias relativas: (fr) Representan la relación entre la frecuencia absoluta y el tamaño de la muestra (porcentajes y proporciones)

Tabla de distribución de frecuencias frecuencia relativa acumulada: relación entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra (N)

Otras medidas resumen Razones: es el cociente entre la frecuencia absoluta de un valor y la frecuencia absoluta del otro fi Valor 2 16133702 fi Valor 1 7389959 Proporciones: es el cociente entre la frecuencia absoluta del valor y el N fi Valor (1) 7389959 N 23523661 La proporción de trabajadores pobres es 0,31 2,18 Hay 1 trabajador pobre por cada 2 no pobres

GRÁFICOS ESTADÍSTICOS

HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA INFORMACIÓN RESUMEN DE VARIABLES ALEATORIAS Herramientas que permiten caracterizar distribuciones estadísticas TENDENCIA CENTRAL HETEROGENEIDAD O DESVÍO FORMA DE LA DISTRIBUCIÓN

Unimodal Bimodal

MEDIDAS DE TENDENCIA CENTRAL Moda Valor que presenta la mayor concentración de frecuencia TEMPORARY . SELECT IF (h12>25 AND h12<45) . FREQUENCIES VARIABLES=cdea /STATISTICS=MODE /BARCHART FREQ /ORDER ANALYSIS . Variable nominal

MEDIDAS DE TENDENCIA CENTRAL Mediana Es el punto o valor numérico que deja por debajo (y por encima) a la mitad de las puntuaciones de la de la distribución La mediana se calcula en primer lugar ordenando los datos y luego: - Si el número de datos es impar, la mediana es el dato central - Si el número de datos es par, la mediana se considera como el promedio de los dos datos centrales

Medidas de tendencia central Mediana VARIABLE CUANTITATIVA

Medidas de tendencia central Mediana VARIABLE CUANTITATIVA

MEDIDAS DE TENDENCIA CENTRAL Media La MEDIA ARITMÉTICA O PROMEDIO es una medida estadística de tendencia central. De una cantidad finita de números, es igual a la suma de todos ellos dividida entre el número de sumandos. También la media aritmética puede ser denominada como centro de gravedad de una distribución, el cual no es necesariamente la mitad. NOTA: Dado que cualquier valor extremo distorsiona la media aritmética, no es una buena medida de tendencia central en esas circunstancias. Por ello en presencia de valores extremos, es mas apropiado usar la mediana como medida de tendencia central. La mediana no se afecta con la presencia de valores extremos.

Medidas de posición no centrales Percentiles/cuartiles/deciles/n tiles Percentil 1 1° Cuartil 3° Cuartil Percentil 99 1° decil Decil 10 Percentil 50 2° Cuartil 5° decil

Distribución con baja dispersión Distribución con alta dispersión MEDIDAS DE DISPERSIÓN Las distribuciones del ingreso de dos sociedades con el mismo ingreso medio son muy distintas si una de ellas tiene extremos de pobreza y de riqueza, mientras que la otra tiene poca variación de ingresos entre familias. Estamos interesados en la dispersión o variabilidad de los ingresos, además de estarlo en sus centros. Distribución con baja dispersión Distribución con alta dispersión

Medidas de dispersión / desviación respecto a la media Miden el grado de cercanía o lejanía de las puntuaciones respecto a la media Permiten describir el grado de homogeneidad / heterogeneidad de la distribución de una variable Máximo y Mínimo Rango Amplitud Intercuartílica Varianza Desvío típico Coeficiente de variabilidad

Medidas de dispersión / desviación respecto a la media Mínimo Máximo rango o recorrido y amplitud intercuartílica Mínimo rango o recorrido Distancia entre el máximo valor y el mínimo valor que puede asumir la variable Amplitud intercuartílica Distancia entre el valor del primer cuartil y el valor del tercero Máximo Máximo - Mínimo 2240 - 20 = 2220 3°cuartil - 1°cuartil 800 - 300 = 500

Medidas de dispersión / desviación respecto a la media Varianza y desvío típico La desviación estándar (o desviación típica) y la varianza son medidas de dispersión para variables de razón y de intervalo. Son medidas que informan acerca del promedio de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades de medida que la variable de origen. Ambas medidas están estrechamente relacionadas ya que se define una a partir de la otra. (Xi – u)2 N: 54

Medidas de dispersión / desviación respecto a la media Varianza y desvío típico Expresión de la varianza: Expresión de la desviación estándar: *Nota: ¿por qué al cuadrado? Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar que los números negativos reduzcan la varianza) Y también hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es mucho más grande que 502=2,500. Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo deshacemos (con la raíz cuadrada) y así la desviación estándar es mucho más útil. (Xi – u)2 (Xi – u)2 X (Xi – u)2 (Xi – u)2 (Xi – u)2

Medidas de dispersión / desviación respecto a la media En dos poblaciones con distinta media qué grupo presenta mayor heterogeneidad ???????

Medidas de dispersión / desviación respecto a la media Coeficiente de variabilidad Es de particular utilidad comparar la variabilidad de 2 o mas conjuntos de datos con medias diferentes. El coeficiente de variación mide la dispersión con relación a la media y se calcula dividiendo la desviación estándar por la media, multiplicando este resultado por 100. Si se multiplica por 100 se obtiene el grado de variabilidad respecto de la media S X 4,3 / 21,9= 0,19 Existe una variabilidad estándar de + - 19% respecto de la media

Medidas de dispersión / desviación respecto a la media CV= S/X 1,05 V= 723 / 688,9 1,08 M= 477,6 / 441,7

LA FORMA DE LA DISTRIBUCIÓN Una tercera característica de un conjunto de datos es la forma, es decir, la manera en que están distribuidas las observaciones. La distribución de los datos puede ser o no simétrica. Si la distribución de los datos no es simétrica, se llama asimétrica o sesgada. Para describir la forma se puede comparar la media y la mediana. También puede observarse a través del coeficiente de asimetría Mide el grado de Simetría / Asimetría de la distribución

La Forma de la distribución Mdn Media . Si es + indicará muchos casos en los valores más bajos y pocos en los más altos positivamente asimétrica . Media > Mediana: Positivos o con sesgamiento a la derecha

La Forma de la distribución Mdn Media Si es - indicará muchos casos en los valores más altos y pocos en los más bajos negativamente asimétrica. Media < Mediana: Negativos o con sesgaminto a la izquierda.

La Forma de la distribución Mdn = Media En la distribución Normal es 0 Simétrica Media = Mediana: Simétricos o con sesgamiento cero.

La Forma de la distribución Otra manera de apreciar la forma de una distribución es observar el nivel de apilamiento o llanura de la curva leptocúrtica (menor dispersión) Platicúrtica (mayor dispersión) mesocúrtica . El coeficiente de kurtosis mide el grado de apuntamiento de la curva Si es + indicará un grado de apilamiento mayor que en la normal leptocúrtica (menor dispersión). Si es – indicará que es más aplanada que la normal platicúrtica (mayor dispersión). En la distribución Normal es 0 mesocúrtica

MODELOS DE DISTRIBUCIÓN PARA VARIABLES ALEATORIAS HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA MODELOS DE DISTRIBUCIÓN PARA VARIABLES ALEATORIAS LA CURVA NORMAL T DE STUDENT CHI-CUADRADO F DE FISHER

ESTADÍSTICA DESCRIPTIVA LA DISTRIBUCIÓN NORMAL Es un tipo particular de distribución de frecuencias. En los casos en que los valores que asume una variable depende de múltiples factores sin que ninguno de ellos sesgue la distribución, es de esperar que los valores se distribuyan homogéneamente alrededor de la media la mediana y la moda. Estas variables aleatorias presentan una distribución que es aproximadamente simétrica y cuya gráfica tiene forma de campana (mesocúrtica). Esta distribución es utilizada en aplicaciones estadísticas como modelo o parámetro de comparación dada la frecuencia o normalidad con la que ciertos fenómenos tienden a parecerse a esta distribución.

ESTADÍSTICA DESCRIPTIVA – LA DISTRIBUCIÓN NORMAL La distribución normal queda definida por dos parámetros: LA MEDIA Y EL DESVIACIÓN ESTÁNDAR

-Es simétrica y unimodal Distribución normal -Es simétrica y unimodal -Como cualquier otra distribución, el área bajo la curva es 1 (recordar que la curva es asintótica respecto al eje de abscisas). Distribución normal estandarizada Es aquella que tiene media 0 y varianza 1. Se puede expresar como N(0,1)

ESTADÍSTICA DESCRIPTIVA – LA DISTRIBUCIÓN NORMAL El área total bajo la curva es igual a 100 % o 1.   El área bajo la curva comprendido entre los valores situados a una desviaciones estándar de la media es aproximadamente igual al 68,2%.  El área bajo la curva comprendido entre los valores situados a dos desviaciones estándar de la media es aproximadamente igual al 95,4%. σ= -1 σ =1 σ =2 σ =-2 σ = -3 2,14 2,14 σ =3

ESTADÍSTICA DESCRIPTIVA – LA DISTRIBUCIÓN NORMAL Se puede determinar el área entre dos ordenadas cuales quiera a través del calculo de las unidades de desviación en que se encuentra una porción de la población y su correspondencia en la tabla de áreas bajo la curva normal σ= -1 σ =1 σ =2 σ =-2 σ = -3 σ =3 Refiere al número de unidades de desviación típica que un individuo o caso queda por encima o por debajo de la media de su grupo Puntuaciones Z Z = X – X S 2,14

ESTADÍSTICA DESCRIPTIVA – LA DISTRIBUCIÓN NORMAL Se requiere conocer la porción de población que gana hasta $143 S= 12 2,14 Z = X – X S Cálculo de Z Z= (143 – 168) / 12 Z= -2,08 X= 143 168 b) Correspondencia en la tabla De áreas bajo la curva normal 0,4812 48% 2,14 c) 0,5 – 0,4812 = 0,0188 aprox 1,9%

DISTRIBUCIÓN T DE STUDENT -Es simétrica y unimodal, con media en 0 -Es una familia de curvas, en función de los llamados “grados de libertad”. Es decir, hay una distribución t de Student con 1 gl, una distribución t de Student con 2 gl, etc. -A medida que aumentan los grados de libertad, la distribución tiende más y más a una distribución normal estandarizada. (Empleo: pruebas de contraste de 2 medias, entre otros)

DISTRIBUCIÓN CHI-CUADRADO -Nunca adopta valores menores de 0 -Es asimétrica positiva -Es en realidad una familia de curvas, en función de los llamados “grados de libertad”. Es decir, hay una distribución chi-cuadrado con 1 gl, una distribución chi-cuadrado con 2 gl, etc. (Nota: Los grados de libertad son siempre números positivos.) -A medida que aumentan los grados de libertad, la distribución se hace más y más simétrica. Se usa para pruebas de bondad de ajuste (para comparar las puntuaciones predichas con las observadas), entre otras.

DISTRIBUCIÓN F DE FISHER (“F de Snedecor”) -Nunca adopta valores menores de 0 -Es asimétrica positiva -Es en realidad una familia de curvas, en función de los llamados “grados de libertad” del numerador y del denominador. Es decir, hay una F de Fisher con1 gl en el numerador y 10 gl en el denominador, etc. -(Se puede demostrar que la distribución F equivale a una razón entre dos chi-cuadrados; de ahí que hablemos en el caso de F de grados de libertad en el numerador y en el denominador.) (Empleo: Análisis de Varianza –ANOVA- entre otros)

Pruebas de decisión estadística Prueba T Student Decisión estadística de rechazo o no de H0 Prueba T Student para dos muestras independientes Nivel de significatividad a 0,05 Nivel de sig a: 0,05 valor asociado al estadístico mayor a a

Pruebas de decisión estadística Prueba T Student 4 –Decisión estadística de rechazo o no de H0 Prueba T Student para dos muestras independientes Nivel de sig a: 0,05 valor asociado al estadístico mayor a a

Pruebas de decisión estadística Prueba T Student Decisión estadística de rechazo o no de H0 Prueba T Student para dos muestras independientes Nivel de significatividad a 0,05 Puedo rechazar la H0 ya que las diferencias entre la subpoblación de mujeres y la subpoblación de varones son estadísticamente significativas a nivel de significatividad 0,05 valor asociado al estadístico mayor a a