MÉTODOS DE INVESTIGACIÓN BASADOS EN EL ANÁLISIS DE VARIABLES.

Slides:



Advertisements
Presentaciones similares
Unidad I. Conceptos Básicos y Estadística Descriptiva
Advertisements

Programa Académico de Maestría en Educación para Docentes de la Región Callao ESTADISTICA PARA LA INVESTIGACIÓN PSICOPEDAGÓGICA II José Luis Morón Octubre.
ANALISIS PARAMÉTRICOS
Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.
ANALISIS DE DATOS CUANTITATIVOS
Lic. Cristian R. Arroyo López
Estadística Unidad III
ESTADÍSTICA DESCRIPTIVA
Medidas de Posición Central:
Ejemplo A continuación aparecen las tasas de retorno de dos fondos de inversión durante los últimos 10 años. 1. ¿Cuál es más riesgoso? 2. ¿En cuál invertiría.
MÉTODOS ESTADÍSTICOS.
Capítulo 3 Descripción de datos, medidas de tendencia central
Variable Aleatoria Continua. Principales Distribuciones
UNIVERSIDAD TECNICA DE AMBATO
CLASE 1: Recordando algunos conceptos previos de Estadística
FRANCISCO JAVIER RODRÍGUEZ
4ºESO Matemáticas B Colegio Divina Pastora (Toledo)
Capítulo I. Introducción
Medidas de tendencia central
Unidad I. Conceptos Básicos y Estadística Descriptiva
Metodología De las Ciencias Sociales III
Introducción Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto a una medida que indique el valor alrededor del cual.
ESTADÍSTICA UNIDIMENSIONAL
ESTADISTICA PARA RELACIONES LABORALES
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
METODOLOGÍA DE INVESTIGACIÓN
Medidas de Dispersión Estadística E.S.O.
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Análisis no paramétricos
ANALISIS DE DATOS CON EXCEL
REPASO BLOQUE I: TEMAS 1-4
Mt. Martín Moreyra Navarrete.
La Estadística se encarga de dar solución a este y otros problemas.
ESTADÍSTICAS DESCRIPTIVA
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Coeficiente de Variación
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Clase 2: MÉTODOS DE INVESTIGACIÓN BASADOS EN EL ANÁLISIS DE VARIABLES.
SEMINARIO DE INVESTIGACIÓN IV Y TRABAJO DE GRADO
ESTADÍSTICA DESCRIPTIVA
Herramientas básicas.
ESTADÍSTICA.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Estadística Al hacer Un sondeo de opinión
1 ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia y Coeficientes de Asociación.
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
SEMINARIO DE INVESTIGACION
INTRODUCCIÓN A LA ESTADÍSTICA
LA ESTADÍSTICA.
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
Métodos Cuantitativos
SESION 5: MEDIDAS DE FORMA. Hasta el momento nos hemos enfocado en el análisis de datos a partir de los valores centrales y la variabilidad de las observaciones.
Estimación y contraste de hipótesis
Análisis de los Datos Cuantitativos
ANALISIS DE VARIABLES CUANTITATIVAS EN EL PROCESO DE INVESTIGACIÓN
ESTADÍSTICA UNIDIMENSIONAL
Distribución de frecuencias y gráficos
MEDIDAS DE TENDENCIA CENTRAL
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Conceptos Básicos y Estadística Descriptiva
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
DIPLOMADO DE POSTGRADO
Estadística descriptiva
ELEMENTOS DE ESTADÍSTICA DESCRIPTIVA MIE. GRACIELA ROMERO MERCADO.
CONCEPTOS BÁSICOS, TABULACIÓN, GRÁFICOS
Medidas de tendencia central
ELEMENTOS DE ESTADÍSTICA DESCRIPTIVA MIE. GRACIELA ROMERO MERCADO.
ANÁLISIS DE VARIABLES. ANÁLISIS DE VARIABLES. ESTADÍSTICA DESCRIPTIVA EVALUACION Y CALIDAD EDUCATIVA Dr. Juan Carlos Farías Bracamontes.
Transcripción de la presentación:

MÉTODOS DE INVESTIGACIÓN BASADOS EN EL ANÁLISIS DE VARIABLES. ESTADISTICA APLICADA MÉTODOS DE INVESTIGACIÓN BASADOS EN EL ANÁLISIS DE VARIABLES. ESTADÍSTICA DESCRIPTIVA

Medición de variables Variable: cualidad o característica de un objeto (o evento) que contenga, al menos, dos atributos en los que pueda clasificarse un objeto o evento Medición de una variable: asignar valores o categorías a las distintas características que conforman el objeto de estudio Requisitos básicos: Exhaustividad: debe comprender el mayor número de atributos posible. Toda observación debe ser clasificada Exclusividad: los distintos atributos de la variable deben ser mutuamente excluyentes. Una observación solo puede clasificarse en términos de un solo atributo Precisión: realizar el mayor número de distinciones posibles. Las categorías pueden agruparse más tarde, el camino inverso no es posible...

Tipología según el nivel de medición Variables Nominales: Ejemplos: sexo, nacionalidad, estado ocupacional, grupo sanguíneo, partido político, estado civil, religión, plan social al que pertenece, localidad donde reside, etc. No se puede establecer ningún tipo de relación Análisis estadístico limitado

Tipología según el nivel de medición Variables Ordinales: Ejemplos: estrato social, orden de mérito, nivel educativo, opinión acerca de un hecho/situación/gobierno Los atributos, además de poseer las características mencionadas, tienen la propiedad de poder establecer un orden No puede conocerse la magnitud de la diferencia entre un atributo y otro Son variables no métricas o cualitativas Análisis estadístico limitado

Tipología según el nivel de medición Variables Cuantitativas o métricas: Variables de intervalo: Además de establecer un orden, la diferencia entre dos atributos puede cuantificarse La distancia que separa a personas de 15 y 16 años, es la misma que la existente entre personas de 72 y 73 años Permite realizar la mayoría de las operaciones aritméticas Ejemplos: temperatura en ºC No tiene cero absoluto. El cero no implica la ausencia de atributo

Tipología según el nivel de medición Variables Cuantitativas o métricas: Variables de razón: Además de las características de las variables de intervalo, se suma la posibilidad de contar con un cero absoluto El cero absoluto indica ausencia de la característica Permite cálculo de proporciones Permite realizar cualquier operación aritmética Ejemplos: ingreso, altura, peso, número de habitantes, todas las variables que consideren tiempo y distancia

Tipología según el nivel de medición Variables Cuantitativas o métricas: Variables discretas: Entre dos valores dados, no existen valores intermedios Ejemplos: número de hijos, número de elementos vendidos, número de beneficiarios de un plan Variables continuas: Entre dos valores dados, existen valores intermedios Ejemplos: edad, peso, altura, ingreso

HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA

La organización de los datos Distribución de frecuencias Distribución porcentual Distribución acumulada Proporciones Razones Representaciones gráficas

HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA Cúantos jóvenes de 15 a 29 años del total del país están en hogares en situación de pobreza? Indicador: hogares por debajo de la línea de Pobreza Fuente: EPH Variable : lphogD85 (hogar bajo la línea de pobreza) Valores : 1 SI (hogar pobre) 2 NO (hogar no pobre)

Tabla de distribución de frecuencias Resume en una tabla la información de la muestra N número de casos suma de las respectivas frecuencias de cada dato (N=ΣXi). frecuencia total

Tabla de distribución de frecuencias Variable Valores / Categorías frecuencias absolutas :(fi.) representan el número de veces que aparece cada valor de la variable

Tabla de distribución de frecuencias frecuencias relativas: (fr) Representan la relación entre la frecuencia absoluta y el tamaño de la muestra. (porcentajes y proporciones)

Tabla de distribución de frecuencias frecuencia relativa acumulada: relación entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra (N).

Otras medidas resumen Razones: es el cociente entre la frecuencia absoluta de un valor y la frecuencia absoluta del otro fi Valor 2 16133702 fi Valor 1 7389959 Proporciones: es el cociente entre la frecuencia absoluta del valor y el N fi Valor (1) 7389959 N 23523661 La proporción de jóvenes póbres es de 0,31 2,18 Hay 1 jóven pobre por cada 2 jóvenes no pobres

GRÁFICOS ESTADÍSTICOS Diagrama de barras:   Se utilizan rectángulos separados, que tienen como base a cada uno de los datos y como altura la frecuencia absoluta o relativa de ese dato.    fi fr

GRÁFICOS ESTADÍSTICOS HISTOGRAMA:   es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o la muestra, respecto a una característica, cuantitativa y continua, de la misma y que es de interés para el observador (como la longitud o la masa) Fuente: http://www.disfrutalasmatematicas.com/definiciones/histograma-de-frecuencia.html

GRÁFICOS ESTADÍSTICOS POLIGONO DE FRECUENCIA:   Uniendo los puntos medios del extremo superior de las barras del histograma, se obtiene una imagen que se llama polígono de frecuencias, es decir, éste se construye con las marcas de clases y las frecuencias absolutas de los datos en la tabla de distribución de frecuencias Fuente: http://www.fisterra.com/mbe/investiga/graficos/graficos.asp

GRÁFICOS ESTADÍSTICOS Gráfica de Torta:   Se forma al dividir un círculo en sectores de manera que: a) cada sector equivale al porcentaje correspondiente al dato o grupo que representa; y b)  la unión de los sectores forma el círculo y la suma de sus porcentajes es 100.  

GRÁFICOS ESTADÍSTICOS OJIVAS  es el polígono de frecuencias acumuladas, es decir, que en ella se permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a cada intervalo. Se construye uniendo los puntos de la marca de clase y la frecuencia absoluta acumulada Fuente: http://descriptiva2010.blogspot.com/2010_02_01_archive.html

HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA INFORMACIÓN RESUMEN DE VARIABLES ALEATORIAS Formas más compactas para caracterizar las distribuciones TENDENCIA CENTRAL HETEROGENEIDAD O DESVÍO FORMA DE LA DISTRIBUCIÓN

Medidas de tendencia central Refiere a los valores de las variables que suelen estar en el centro de la distribución. Posición donde se centra una distribución en una escala de valores Moda Mediana Media

Medidas de tendencia central Moda Valor que presenta la mayor concentración de frecuencia TEMPORARY . SELECT IF (h12>25 AND h12<45) . FREQUENCIES VARIABLES=cdea /STATISTICS=MODE /BARCHART FREQ /ORDER ANALYSIS . Variable nominal

Unimodal Bimodal

Medidas de tendencia central Mediana Es el punto o valor numérico que deja por debajo (y por encima) a la mitad de las puntuaciones de la de la distribución La mediana se calcula en primer lugar ordenando los datos y luego: - Si el número de datos es impar, la mediana es el dato central - Si el número de datos es par, la mediana se considera como el promedio de los dos datos centrales

Medidas de tendencia central Mediana

Medidas de tendencia central Mediana VARIABLE CUANTITATIVA

Medidas de tendencia central Media La MEDIA ARITMÉTICA O PROMEDIO es una medida estadística de tendencia central. De una cantidad finita de números, es igual a la suma de todos ellos dividida entre el número de sumandos. También la media aritmética puede ser denominada como centro de gravedad de una distribución, el cual no es necesariamente la mitad.

Propiedades de la media La media es sensible al valor exacto de todos los datos en la distribución La suma de las desviaciones con respecto a la media es cero La media es muy sensible a los datos extremos NOTA: Dado que cualquier valor extremo distorsiona la media aritmética, no es una buena medida de tendencia central en esas circunstancias. Por ello en presencia de valores extremos, es mas apropiado usar la mediana como medida de tendencia central. La mediana no se afecta con la presencia de valores extremos.

Medidas de posición no centrales Percentiles/cuartiles/deciles/n tiles

Medidas de posición no centrales Percentiles/cuartiles/deciles/n tiles Percentil 1 1° Cuartil 3° Cuartil Percentil 99 1° decil Decil 10 Percentil 50 2° Cuartil 5° decil

Medidas de posición. Ejemplo. Ingreso horario

Distribución con baja dispersión Distribución con alta dispersión Medidas de Dispersión Las distribuciones del ingreso de dos provincias con el mismo ingreso medio por hogar son muy distintas si una de ellas tiene extremos de pobreza y de riqueza, mientras que la otra tiene poca variación de ingresos entre familias. Estamos interesados en la dispersión o variabilidad de los ingresos, además de estarlo en sus centros. Distribución con baja dispersión Distribución con alta dispersión

Medidas de Dispersión Los datos también se deben caracterizar en términos de su dispersión o variabilidad. Las medidas de variabilidad cuantifican la extensión de la dispersión La variabilidad tiene que ver con qué tan alejados están los datos de la media.

Medidas de dispersión / desviación respecto a la media Miden el grado de cercanía o lejanía de las puntuaciones respecto a la media Permiten describir el grado de homogeneidad / heterogeneidad de la distribución de una variable Máximo y Mínimo Rango Amplitud Intercuartílica Varianza Desvío típico Coeficiente de variabilidad

Medidas de dispersión / desviación respecto a la media Mínimo Máximo rango o recorrido y amplitud intercuartílica Mínimo rango o recorrido Distancia entre el máximo valor y el mínimo valor que puede asumir la variable Amplitud intercuartílica Distancia entre el valor del primer cuartil y el valor del tercero Máximo Máximo - Mínimo 2240 - 20 = 2220 3°cuartil - 1°cuartil 800 - 300 = 500

Medidas de dispersión / desviación respecto a la media Varianza y desvío típico La desviación estándar (o desviación típica) y la varianza son medidas de dispersión para variables de razón y de intervalo. Son medidas que informan acerca del promedio de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades de medida que la variable de origen. Ambas medidas están estrechamente relacionadas ya que se define una a partir de la otra. (Xi – u)2 N: 54

Medidas de dispersión / desviación respecto a la media Varianza y desvío típico Expresión de la varianza: Expresión de la desviación estándar: (Xi – u)2 (Xi – u)2 X (Xi – u)2 (Xi – u)2 (Xi – u)2 N: 54

Medidas de dispersión / desviación respecto a la media En dos poblaciones con distinta media qué grupo presenta mayor heterogeneidad ???????

Medidas de dispersión / desviación respecto a la media Coeficiente de variabilidad Es de particular utilidad comparar la variabilidad de 2 o mas conjuntos de datos con medias diferentes. El coeficiente de variabilidad es una medida relativa que se expresa en porcentaje en vez de en términos de las unidades de los datos. Es una forma de estandarizar el desvío Indica la relación entre el desvío y la media

Medidas de dispersión / desviación respecto a la media Coeficiente de variabilidad El coeficiente de variación mide la dispersión con relación a la media y se calcula dividiendo la desviación estándar por la media, multiplicando este resultado por 100. Si se multiplica por 100 se obtiene el grado de variabilidad respecto de la media S X 4,3 / 21,9= 0,19 Existe una variabillidad de + - 19% respecto de la media

Medidas de dispersión / desviación respecto a la media CV= S/X 1,05 V= 723 / 688,9 1,08 M= 477,6 / 441,7

La Forma de la distribución Una tercera característica de un conjunto de datos es la forma, es decir, la manera en que están distribuidas las observaciones. La distribución de los datos puede ser o no simétrica. Si la distribución de los datos no es simétrica, se llama asimétrica o sesgada. Para describir la forma se puede comparar la media y la mediana. También puede observarse a través del coeficiente de asimetría Mide el grado de Simetría / Asimetría de la distribución

La Forma de la distribución Mdn Media . Si es + indicará muchos casos en los valores más bajos y pocos en los más altos positivamente asimétrica . Media > Mediana: Positivos o con sesgamiento a la derecha

La Forma de la distribución Mdn Media Si es - indicará muchos casos en los valores más altos y pocos en los más bajos negativamente asimétrica. Media < Mediana: Negativos o con sesgaminto a la izquierda.

La Forma de la distribución Mdn = Media En la distribución Normal es 0 Simétrica Media = Mediana: Simétricos o con sesgamiento cero.

La Forma de la distribución Otra manera de apreciar la forma de una distribución es observar el nivel de apilamiento o llanura de la curva leptocúrtica (menor dispersión) Platicúrtica (mayor dispersión) mesocúrtica . El coeficiente de kurtosis mide el grado de apuntamiento de la curva

La Forma de la distribución El coeficiente de kurtosis Mide el grado de apuntamiento de la curva En la distribución Normal es 0 mesocúrtica Si es + indicará un grado de apilamiento mayor que en la normal leptocúrtica (menor dispersión) Si es – indicará que es más aplanada que la normal platicúrtica (mayor dispersión)

UN TIPO PARTICULAR DE DISTRIBUCIÓN PARA VARIABLES ALEATORIAS MÉTRICAS HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA UN TIPO PARTICULAR DE DISTRIBUCIÓN PARA VARIABLES ALEATORIAS MÉTRICAS LA CURVA NORMAL SUS PROPIEDADES

ESTADÍSTICA DESCRIPTIVA – LA DISTRIBUCIÓN NORMAL Es un tipo particular de distribución de frecuencias. En los casos en que los valores que asume una variable depende de múltiples factores sin que ninguno de ellos sesgue la distribución, es de esperar que los valores se distribuyan homogéneamente alrededor de la media la mediana y la moda. Estas variables aleatorias presentan una distribución que es aproximadamente simétrica y cuya gráfica tiene forma de campana (mesocúrtica). Esta distribución es utilizada en aplicaciones estadísticas como modelo o parámetro de comparación dada la frecuencia o normalidad con la que ciertos fenómenos tienden a parecerse a esta distribución.

ESTADÍSTICA DESCRIPTIVA – LA DISTRIBUCIÓN NORMAL La distribución normal queda definida por dos parámetros: LA MEDIA Y EL DESVIACIÓN ESTÁNDAR

ESTADÍSTICA DESCRIPTIVA – LA DISTRIBUCIÓN NORMAL El área total bajo la curva es igual a 100 % o 1.   El área bajo la curva comprendido entre los valores situados a una desviaciones estándar de la media es aproximadamente igual al 68%.  El área bajo la curva comprendido entre los valores situados a dos desviaciones estándar de la media es aproximadamente igual al 95%. σ= -1 σ =1 σ =2 σ =-2 σ = -3 2,14 2,14 σ =3

ESTADÍSTICA DESCRIPTIVA – LA DISTRIBUCIÓN NORMAL Se puede determinar el área entre dos ordenadas cuales quiera a través del calculo de las unidades de desviación en que se encuentra una porción de la población y su correspondencia en la tabla de áreas bajo la curva normal σ= -1 σ =1 σ =2 σ =-2 σ = -3 σ =3 Refiere al número de unidades de desviación típica que un individuo o caso queda por encima o por debajo de la media de su grupo Puntuaciones Z Z = X – X S 2,14

ESTADÍSTICA DESCRIPTIVA – LA DISTRIBUCIÓN NORMAL Se requiere conocer la porción de población que gana hasta $143 S= 12 2,14 Z = X – X S Cálculo de Z Z= (143 – 168) / 12 Z= -2,08 X= 143 168 b) Correspondencia en la tabla De áreas bajo la curva normal 0,4812 48% 2,14 c) 0,5 – 0,4812 = 0,0188 aprox 1,9%

Análisis de tablas de contingencia TIPO DE ANÁLISIS QUE PERMITE UNA TABLA DE CONTINGENCIA ANÁLISIS DE PERFILES O CARACTERÍSTICAS POBLACIONALES ANÁLISIS DESCRIPTIVO DE GRUPOS O SEGMENTOS DE POBLACIÓN

Componentes Tabla de una contingencia DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONALES UN TOTAL POBLACIONAL O MUESTRAL Pobres No pobres Total Aprobaron 40 No aprobaron 60 100 Marginales (de fila) Celdas condicionales 70 30 N: total poblacional o muestral Marginales (de columna)

Análisis bivariados Tablas de contingencia Función descriptiva Rendimiento educativo/cond. Socioec. Pobres No pobres Total 15 25 40 55 5 60 70 30 100 Aprobaron 37,5 62,5 100 % fila % del total 21,4 15 83,3 40 %Col No aprobaron % fila 91,6 8,4 100 %Col % del total 78,6 16,7 60 % fila 70 30 100 % del total 100 100 100 %Col

Análisis de tablas de contingencia TIPO DE ANÁLISIS QUE PERMITE UNA TABLA DE CONTINGENCIA ANÁLISIS DE ASOCIACIÓN

Análisis bivariados Tablas de contingencia hipótesis Existe una relación entre los logros educativos de los alumnos y su contexto sociofamiliar.

Análisis bivariados Tablas de contingencia Hipótesis Existe una relación entre los logros educativos de los alumnos y su contexto sociofamiliar. categorías Si no aprobó v. Nominal dicotómica Variables: Situación de pobreza Si no v. Nominal dicotómica

Análisis bivariados Tablas de contingencia H1: Los niños que no hayan aprobado el exámen se encontrarán mayoritariamente en situación de pobreza No Pobres Pobres Total Aprobaron XX x No aprobaron XXXXXXXX Hipótesis rinconal

Análisis bivariados Tablas de contingencia H2: Los niños que no hayan aprobado el exámen se encontrarán mayoritariamente en situación de pobreza Mientras que los que lo han aprobado se encontrarán en hogares por encima de la línea de pobreza No Pobres Pobres Total Aprobaron XXXXXXXX XX No Aprobaron Hipótesis Diagonal

Análisis bivariados Tablas de contingencia La idea de asociación / relación entre variables se define por lo general en oposición al de independencia estadística y se evalúa examinando el sentido y la fuerza de las regularidades empíricas

Análisis bivariados Tablas de contingencia Pobres No pobres Total Aprobaron 25 50 No aprobaron 100 XXX XXX XXX XXX Si conozco la distribución esperada bajo el supuesto de independencia estadística lo puedo contrastar con la distribución real y ver si las diferencias son estadísticamente significativas

Análisis bivariados Tablas de contingencia “Las variables X e Y (situación de pobreza y aprobación del exámen ) son estadísticamente independientes si el porcentaje o número de de observaciones que poseen el atributo Y1 ( no aprobó) es el mismo entre X1 (pobres) que entre X2 (no pobres)”. Pobres No pobres Total Aprobaron (Y1) (40 * 70) / 100 28 (40 * 30) / 100 12 40 No aprobaron (Y2) (60 * 70) / 100 42 (60 * 30) / 100 18 60 70 30 100

Análisis bivariados Tablas de contingencia “Las variables X e Y (situación de pobreza y aprobación del exámen ) son estadísticamente independientes si el porcentaje o número de de observaciones que poseen el atributo Y1 ( no aprobó) es el mismo entre X1 (pobres) que entre X2 (no pobres)”. Pobres No pobres Total Aprobaron (Y1) 28 15 12 25 40 No aprobaron (Y2) 42 55 18 5 60 70 30 100

Análisis bivariados Tablas de contingencia La relación encontrada ¿es estadísticamente significativa o se debe al azar? TEST DE HIPÓTESIS Si existe ¿cúal es la fuerza y el sentido de dicha relación? COEFICIENTES DE ASOCIACIÓN

Si existe la relación ¿cúal es la fuerza y el sentido de dicha relación? Para medir el grado de dependencia o asociación entre las variables X e Y se utillizan medidas de asociación Existen diferentes medidas según las características de la tabla, el tipo de hipótesis y las características de las variables

Medidas de asociación para dos variables de escala nominal Coeficiente phi Coeficiente V de Cramer Medida de asociación para dos variables dicotómicas Basada en el coeficiente ji cuadrado Asume valores entre 0 y 1 Extensión de PHI Variables nominales de más de 2 categ Asume valores entre 0 y 1 Coeficiente Kappa Coeficientes Lambdas Compara los valores de dos variables nominales tales que sus valores pueden ser los mismos Tablas cuadradas Mide el grado de acuerdo entre las dos variables Asume valores entre -1y 1 Valores próximos a 1 : total acuerdo. Valores próximos a -1 : total desacuerdo Basada en reducción del error Interpretación distinta de los anteriores Asume valores entre 0 y 1 Proporción en que se reduce el error al predecir los valores de una variable a partir de los de la otra

Medidas de asociación para dos variables de escala ordinal Coeficiente Gamma Medida de asociación para dos variables cualitativas de escala ordinal Asume valores entre -1 y 1 Valores próximos a 1 : fuerte asociación positiva: a medida que aumentan los valores de una variable aumentan los de la otra Valores próximos a -1 : fuerte asociación negativa: a medida que aumentan los valores de una variable disminuyen los de la otra 0 indica que no hay relación ni positiva ni negativa aunque puede haber otro tipo de relación. Puede alcanzar valores extremos cuando la asociación no es total

Medidas de asociación para dos variables de escala ordinal Coeficiente Tau-b de Kendall Extensión del GammaAsume valores entre -1 y 1 Alcanza valores extremos (-1 y 1) cuando la asociación es total Alcanza valores extremos (-1 y 1) sólo cuando las dos variables tienen el mismo número de categorías (la tabla es cuadrada) Coeficiente Tau-c de Kendall Corrección del tau-b para variables con distinto tipo de categorías Puede subestimar el grado de asociación.

MEDIDAS DE ASOCIACIÓN Medida de asociación Tabla Escala de Medida Observaciones Phi V de Cramer 2 x 2 f x c Nominales Medidas basadas en chi cuadrado. Toman valores comprendidos entre 0 y 1. Evalúa hipótesis lineales (diagonal principal). Son útiles para estimar grados de asociación entre pares de variables, sobre un mismo conjunto de individuos para n filas y columnas. Lambda Toma valores entre 0 y 1. Disponen versión asimétrica. Es fácil de interpretar en términos de la proporción que se reduce le error de predicción del valor de una variable a partir de los valores de la otra (pero puede tomar valores muy bajos en tablas con asociación). Gamma Tau b / c de Kendall Ordinales Toma valores entre -1 y 1, pasando por 0. Gamma es más fácil de interpretar. Asume relaciones curvilineales. Tau b sólo alcanza valores extremos cuando hay asociación total y f y c son iguales. Tau c tiende a subestimar la relación.