Regresión logística.

Slides:



Advertisements
Presentaciones similares
Técnicas de análisis multivariante
Advertisements

Objetivo Disponemos de estimaciones de la probabilidad de un suceso en dos muestras independientes. Queremos calcular qué tamaño muestral deberíamos utilizar.
¿Cómo se interpreta un odds ratio?
VARIABLES Una de las etapas fundamentales de toda investigación es la identificación de variables, entendiendo como variable la medida de una característica.
Correlación y Regresión Lineal Simple Modelo lineal
REGRESION LINEAL SIMPLE
Modelos de Variable Dependiente Binaria -Logit y Probit-
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Bivariadas y Multivariadas
Algoritmo de Regresión Logística
León Darío Bello Parias
KRIGING.
Covarianza muestral Sean x1, x2, ..., xn e y1, y2, ..., yn dos muestras aleatorias independientes de observaciones de X e Y respectivamente. La covarianza.
Modelado y simulación en Ingeniería Química. Manuel Rodríguez
Regresión Lineal y Regresión Polinomial
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
RIESGOS FINANCIEROS FACULTAD DE CIENCIAS CARRERA: ING. EN CIENCIAS ECONÓMICAS Y FINANCIERAS PERIODO: Ing. Marcela Guachamín.
Regresión y correlación
Funciones y gráficas 3º de ESO.
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Regresión Lineal Simple
Análisis de Correlación y de Regresión lineal simple
Licenciatura en Administración Pública
Técnicas estadísticas paramétricas univariantes: regresión
Población y Muestra.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
BIOMETRIA II TEMA 2 El Modelo de Regresión.
Este procedimiento mide la relación entre la intensidad de un estímulo y la proporción de casos que presentan una cierta respuesta a dicho estímulo. Es.
Análisis de datos El diseño estadístico.
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
1.Introducción 2.Casos simples de reducción del orden 3.Ecuaciones lineales homogéneas con coeficientes constantes 4.Ecuaciones lineales no homogéneas.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
Departamento de Física
Análisis de Varianza (I)
Métodos de calibración: regresión y correlación
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Regresión No- lineal y Múltiple
Inferencia Estadística
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL Titular: Agustín Salvia MÓDULO 3 D ANÁLISIS DE MODELOS DE REGRESION LOGISTICA SEMINARIO DE POSGRADO.
VARIABLE DEPENDIENTE DICOTOMICA. Hemos estudiados casos donde las variables dicotómicas actuaban como regresores, variables independientes o que explican.
Eva Medina Moral Profesora Economía Aplicada (UAM) Febrero 2007
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
coeficientes de correlación de
Definición del Modelo de Regresión Simple Estimaciones por MCO Método de MCO Valores Esperados y Varianzas por MCO.
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
1.Introducción 2.Casos simples de reducción del orden 3.Ecuaciones lineales homogéneas con coeficientes constantes 4.Ecuaciones lineales no homogéneas.
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
TEMARIO CUARTA Y QUINTA CLASE 1. Metodologías para analizar la probabilidad de Incumplimiento de pagos de créditos Análisis Cuantitativo con Variables.
REGRESION LINEAL SIMPLE. REGRESION LINEAL  En la búsqueda de mejoras o en la solución de problemas es necesario, frecuentemente, investigar la relación.
Unidad 4 Análisis de los Datos.
ESTADÍSTICA DESCRIPTIVA
EPE MA 148 ESTADÍSTICA INFERENCIAL TEMA:
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
Estimación Estadística Tares # 3. Estimación Estadística Conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a.
FUNCIONES EXPONENCIALES Y LOGARÍTMICAS. 1. Funciones exponenciales. Una función exponencial es una función cuya expresión es siendo la base a un número.
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
METODO DE MAXIMA PENDIENTE
METODO DEL PUNTO ALTO Y DEL PUNTO BAJO
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
Regresión logística binomial
PRUEBA DE SIGNIFICANCIA
Regresión logística Tema 6c. En la regresión lineal la variable dependiente es continua En regresión logística se utiliza cuando la variable dependiente.
Transcripción de la presentación:

Regresión logística

Introducción La regresión logística describe la relación entre una variable respuesta (Y) dicotómica, de varias categorías o en escala ordinal, y una variables independiente o un conjunto de ellas. Las variables independientes pueden ser continuas o discretas, o pueden ser factores clasificados con letras o números.

Introducción El objetivo primordial que resuelve la regresión logística es el de modelar cómo influye en la probabilidad de aparición de un suceso (habitualmente dicotómico, o sea con dos categorías, tales como sano o enfermo, contaminado o no), la presencia o no de diversos factores y el valor o nivel de los mismos. También puede usarse para estimar la probabilidad de aparición de cada una de las categorías de un suceso con más de dos categorías, en relación a diversas variables independientes o factores.

Introducción Muchas variables de respuesta categóricas tienen sólo dos valores. Por ejemplo, en un estudio médico, el paciente sobrevive o se muere. En un estudio de alimentos el producto contiene residuos tóxicos o no, está contaminado con ciertos microorganismos o no. En estos problemas, el interés científico está en la identificación de factores que se relacionan con la probabilidad de aparición del tóxico o de contaminación del alimento.

Introducción Para estas situaciones se puede usar la regresión logística para determinar qué variables o factores inciden en la supervivencia o en el cambio. En estos ejemplos la variable dependiente Y estará expresada como: a) 0 y 1 para cada observación, donde el 0 es la ausencia del tóxico en el alimento y el 1 la presencia del tóxico. b) porcentajes (o proporciones) de 0’s o de 1’s de un conjunto de observaciones.

Introducción La regresión logística modela estas proporciones como la función de variables explicativas (independientes) y da resultados respecto a la importancia de la variable en la aparición del tóxico en el alimento o en la supervivencia o muerte del paciente.

Introducción Por ejemplo, podemos calcular la odds ratio (razón de momios) de la presencia de un contaminante en un alimento, lo que determina cuántas veces es más probable que el alimento tenga el contaminante en relación a la probabilidad de que no lo tenga. Si la literatura reporta que la temperatura de almacenamiento puede ser un factor que incide en la contaminación del alimento, se puede establecer un estudio en el cual se almacenan varias muestras del alimento a diferentes temperaturas. Al final del estudio se obtendrán datos como los siguientes: pi 0.02 0.07 0.08 0.10 0.14 0.16 0.27 0.34 0.45 0.61 Ti (°C) -5 5 10 15 20 25 30 35 40

Introducción Para entender los objetivos de la regresión logística debemos conocer algunos conceptos que se relacionan con su cálculo e interpretación. Proporción o probabilidad de ocurrencia de casos de interés: p= (Número de casos de interés/Número total de casos) Se llama odds ratio (razón de momios), al cociente p/(1-p). La odds asociada a un suceso es la probabilidad de ocurrencia del suceso (p). La odds ratio es el cociente entre la probabilidad de que ocurra el suceso sobre la probabilidad de que no ocurra: siendo p la probabilidad del suceso.

Regresión logística simple Con los datos proporcionados en el ejemplo anterior, la regresión logística se calcula con la ecuación: donde la variable dependiente es la probabilidad de que un alimento esté contaminado y la variable independiente es la temperatura.

Ejemplo  estimada es 0.06 con una probabilidad de ser diferente de 0 de p < 0.0001

Ejemplo El parámetro de interés es  o sea el coeficiente de la temperatura. En la salida del Infostat se puede ver que este parámetro es altamente significativo con un valor p de 0.0001. Esto indica que la temperatura incide significativamente sobre la probabilidad de encontrar un alimento contaminado. Uno de los problemas de estas ecuaciones exponenciales es la dificultad de interpretación, por lo que se puede usar una transformación logarítmica para quedarnos con una ecuación lineal (similar a la regresión lineal simple).

Regresión Logística simple La transformación logística es: Li = Logit (pi) = Loge[pi/(1-pi)], denominada logaritmo neperiano de la razón de momios. El modelo de regresión logística simple es: Logit (pi) = b0 + b1Xi + ei donde b0: ordenada al origen, b1: pendiente de la regresión, Xi: variable independiente, y ei : desviación de la regresión.

Regresión logística simple El valor calculado de pi a través de la regresión logística será igual a: El método empleado para estimar la regresión logística es una aproximación del método de máxima-verosimilitud (a diferencia de la regresión lineal simple o múltiple donde se emplea el método de mínimos cuadrados).