Unidad 4 Análisis de los Datos.

Slides:



Advertisements
Presentaciones similares
ANALISIS PARAMÉTRICOS
Advertisements

Tema 6: Regresión lineal.
ANÁLISIS DE REGRESIÓN Y CORRELACIÓN Lic. Oscar Noé López Cordón
Instructor: Lic. Cristian R. Arroyo L.
Lic. Cristian R. Arroyo López
Técnicas para el análisis de datos en el enfoque cuantitativo
Error Estándar de la Media
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
MÉTODOS DE MEDICIÓN DE COSTOS.
Pronósticos, Series de Tiempo y Regresión
ANÁLISIS EXPLORATORIO DE DATOS
Bivariadas y Multivariadas
Ingeniería Industrial II CicloEducativo 2011
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Medidas de dispersión y variabilidad
Modelo básico de regresión Lineal
ALGUNOS CONCEPTOS PREVIOS
Regresión y correlación
Estadística Administrativa II
Estadística Descriptiva: 4. Correlación y Regresión Lineal
بسم الله الرحمن الرحيم.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
9 Regresión Lineal Simple
MEDIDAS DE DISPERSIÓN:
Análisis de Correlación y de Regresión lineal simple
SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES
Facultad: Turismo Y Hotelería
UNIVERSIDAD AUTONOMA DEL PERÚ
Distribuciones bidimensionales. Tablas de contingencia
Técnicas estadísticas paramétricas univariantes: regresión
BIOMETRIA II TEMA 2 El Modelo de Regresión.
Análisis de datos El diseño estadístico.
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
Pronósticos Los pronósticos y la planeación de la capacidad de mantenimiento son dos funciones importantes para el diseño de un sistema de mantenimiento.
Modelo de regresión con dos variables: Estimación
SEMINARIO DE INVESTIGACIÓN IV Y TRABAJO DE GRADO
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
EMA-602 Tema IX: Análisis de datos/Reporte Investigación
CORRELACION Y REGRESION LINEAL: Introducción
RELACIÓN ENTRE VARIABLES
Diseño de EXPERIMENTOS
Ramón Giraldo H MSc. Estadística. Profesor Universidad Nacional
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Titular: Agustín Salvia
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
Aplicaciones Estadísticas a las Finanzas Clase 1
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Construcción de modelos con regresión y correlación
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
PASOS COMPLEMENTARIOS. MUESTRA Lo primero que se tiene que plantear es el quiénes van a ser medidos, lo que corresponde a definir la unidad de análisis.
Regresión lineal simple Nazira Calleja
REGRESIÓN LINEAL SIMPLE
TEMA : ANALISIS DE REGRESION
Capítulo 10 Análisis de los datos.
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
Coeficiente de variación
19. Prueba de hipótesis para promedios Módulo IV: Análisis de datos numéricos Análisis de Datos Aplicado a la Investigación Científica
Estadística Administrativa II
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
14 Introducción al Análisis de Correlación y de Regresión Lineal
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
Transcripción de la presentación:

Unidad 4 Análisis de los Datos

12-3 Análisis exploratorio de los datos: Estadística descriptiva de cada variable por separado. Se obtienen medidas de tendencia central, variabilidad, representaciones gráficas. Se pretende conocer cada variable así como detectar errores, valores extremos, etc. Estadística Bivariable: estudia las relaciones entre pares de variables, utilizando estadísticos como el coeficiente de correlación, chi-cuadrado,t de Student, y representaciones gráficas diversas.

12-4 Análisis Multivariante: analiza simultáneamente dos o más variables. Los métodos pueden ser predictivos cuando existe una variable criterio o independiente que explica o identifica por un conjunto de variables independientes o explicativas.Ej:Regresión lineal, regresión logística, análisis discriminante, árboles de segmentación, análisis de la varianza o reductivos: cuando se estudian las relaciones entre un conjunto de variables sin que exista una variable a identificar. Ej: análisis factorial, correspondencias binarias, correspondencias múltiples, etc.

Análisis Bivariante – relación entre dos variables. 12-10 Análisis Bivariante – relación entre dos variables. Dos variables cuantitativas: Correlación. Regresión lineal simple. Dos variables cualitativas: Tabulación cruzada. Porcentajes. Estadístico Chi-cuadrado y otros. Una cuantitativa y una cualitativa: ANOVA ( análisis de la varianza). Se dividen a su vez en paramétrico para dos grupos (T Student) y más de dos grupos(Test F).

Regresión y correlación lineal simple y múltiple

Análisis de correlación 12-3 Análisis de correlación Análisis de correlación: se usa un grupo de técnicas estadísticas para medir la fuerza de la relación (correlación) entre dos variables. Diagrama de dispersión: gráfica que describe la relación entre las dos variables de interés. Variable dependiente: la variable que se pronostica o estima. Variable independiente: la variable que proporciona la base para la estimación. Es la variable predictora.

Coeficiente de correlación de Pearson, r 12-4 Coeficiente de correlación de Pearson, r El coeficiente de correlación (r) es una medida de la intensidad de la relación entre dos variables. Indica si hay una relación lineal entre las mismas. Requiere datos con escala de intervalo o de razón (variables). Puede tomar valores entre -1.00 y 1.00. Valores de -1.00 o 1.00 indican correlación fuerte y perfecta. Valores cercanos a 0.0 indican correlación débil. Valores negativos indican una relación inversa y valores positivos indican una relación directa.

Correlación negativa perfecta 12-5 Correlación negativa perfecta 10 9 8 7 6 5 4 3 2 1 Y 0 1 2 3 4 5 6 7 8 9 10 X

Correlación positiva perfecta 12-6 Correlación positiva perfecta 10 9 8 7 6 5 4 3 2 1 Y 0 1 2 3 4 5 6 7 8 9 10 X

12-7 Correlación cero 10 9 8 7 6 5 4 3 2 1 Y 0 1 2 3 4 5 6 7 8 9 10 X

Correlación positiva fuerte 12-8 Correlación positiva fuerte 10 9 8 7 6 5 4 3 2 1 Y 0 1 2 3 4 5 6 7 8 9 10 X

Coeficiente de determinación 12-10 Coeficiente de determinación El coeficiente de determinación, r2 - la proporción de la variación total en la variable dependiente Y que está explicada por o se debe a la variación en la variable independiente X. El coeficiente de determinación es el cuadrado del coeficiente de correlación, y toma valores de 0 a 1.

12-15 Análisis de regresión Propósito: determinar la ecuación de regresión; se usa para predecir el valor de la variable dependiente (Y) basado en la variable independiente (X). Procedimiento: seleccionar una muestra de la población y enumerar los datos por pares para cada observación; dibujar un diagrama de dispersión para visualizar la relación; determinar la ecuación de regresión.

Análisis de regresión La ecuación de regresión: Y’= a + bX, donde: 12-16 Análisis de regresión La ecuación de regresión: Y’= a + bX, donde: Y’ es el valor promedio pronosticado de Y para cualquier valor de X. a es la intercepción en Y, o el valor estimado de Y cuando X = 0 b es la pendiente de la recta, o cambio promedio en Y’ por cada cambio de una unidad en X se usa el principio de mínimos cuadrados para obtener a y b:

Error estándar de la estimación 12-18 Error estándar de la estimación El error estándar de la estimación mide la dispersión de los valores observados alrededor de la recta de regresión. Fórmulas usadas para calcular el error estándar:

Regresión y Correlación Múltiples Análisis de Regresión y Correlación Múltiples

Análisis de regresión múltiple 13-3 Análisis de regresión múltiple Para dos variables independientes, la fórmula general de la ecuación de regresión múltiple es: X1 y X2 son las variables independientes. a es la intercepción en Y. b1 es el cambio neto en Y por cada cambio unitario en X1, manteniendo X2 constante. Se denomina coeficiente de regresión parcial, coeficiente de regresión neta o bien coeficiente de regresión.

Análisis de regresión múltiple 13-4 Análisis de regresión múltiple La ecuación general de regresión múltiple con k variables independientes es: El criterio de mínimos cuadrados se usa para el desarrollo de esta ecuación. Como estimar b1, b2, etc. es muy tedioso, existen muchos programas de cómputo que pueden utilizarse para estimarlos.

Error estándar múltiple de la estimación 13-5 Error estándar múltiple de la estimación El error estándar múltiple de la estimación es la medida de la eficiencia de la ecuación de regresión. Está medida en las mismas unidades que la variable dependiente. Es difícil determinar cuál es un valor grande y cuál es uno pequeño para el error estándar.

Error estándar múltiple de la estimación 13-6 Error estándar múltiple de la estimación La fórmula es: donde n es el número de observaciones y k es el número de variables independientes.

13-13 EJEMPLO Un estudio de mercado para la cadena de tiendas autoservicio Super Dollar analiza la cantidad anual que gastan en comida las familias de cuatro o más miembros. Se piensa que tres variables independientes se relacionan con los gastos en comida. Esas variables son: ingreso familiar total, tamaño de la familia y si la familia tiene hijos en la universidad.

EJEMPLO continuación Ingresos ($1000) Tamaño de la familia Gastos en 13-14 EJEMPLO continuación Ingresos ($1000) Tamaño de la familia Gastos en comida Hijos en universidad Familia

13-15 EJEMPLO continuación Use un software, para desarrollar la matriz de correlación. Del análisis proporcionado por el software, la ecuación de regresión es: ¿Qué gastos en comida estima para una familia de 4 integrantes, sin hijos en la universidad y con ingresos de $50,000? Y’= 954 + 10.9*50 +748*4+565*0= 4491