بسم الله الرحمن الرحيم.

Slides:



Advertisements
Presentaciones similares
ANALISIS PARAMÉTRICOS
Advertisements

Curso de Bioestadística Parte 15 Correlación
REGRESION LINEAL SIMPLE
Error Estándar de la Media
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
MÉTODOS DE MEDICIÓN DE COSTOS.
Ingeniería Industrial II CicloEducativo 2011
REGRESION & CORRELACION
Introducción a la Estadística. Modelos de regresión
Regresión y correlación
Correlación 1.
Estadística Administrativa II
Estadística Descriptiva: 4. Correlación y Regresión Lineal
COEFICIENTE DE CORRELACIÓN PRODUCTO-MOMENTO DE PEARSON
Clase 7. Pruebas de hipótesis sobre asociaciones entre variables
CURSO DE ESTADÍSTICA BÁSICA
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Elaborado por: Ricardo Alfonso Marcillo Del Castillo Asistente de Gerencia.
Regresión Lineal Simple
Curso de Estadística Básica
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
9 Regresión Lineal Simple
Regresión Linear Correlación de Pearson, r Regresión Múltiple Regresión Logística Regresión de Poisson.
Regresión y Correlación
Estadística bidimensional
MEDIDAS DE DISPERSIÓN:
Análisis de Correlación y de Regresión lineal simple
UNIVERSIDAD AUTONOMA DEL PERÚ
Distribuciones bidimensionales. Tablas de contingencia
بسم الله الرحمن الرحيم.
Técnicas estadísticas paramétricas univariantes: regresión
REGRESION Y CORRELACION
Prueba para la Bondad de ajuste Validación de Modelo
BIOMETRIA II TEMA 2 El Modelo de Regresión.
Módulo 5 Análisis de Regresión y Series de Tiempo.
Pronósticos, Series de Tiempo y Regresión
Introducción a la Inferencia Estadística
Estadística bidimensional
LA RECTA DE REGRESIÓN CONTENIDOS:
Primerasdefiniciones y conceptos de la regresión El análisis de la regresión es una técnica estadística que se utiliza para estudiar la relación entre.
D. BIDIMENSIONALES DÍA 53 * 1º BAD CT
Variables estadísticas bidimensionales
RELACIÓN ENTRE VARIABLES
Estadística I. Finanzas y Contabilidad
coeficientes de correlación de
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
1 Y MODELO DE REGRESIÓN SIMPLE Suponemos que una variable Y es una función lineal de otra variable X, con parámetros desconocidos  1 y  2 que queremos.
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.
Construcción de modelos con regresión y correlación
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Variables estadísticas bidimensionales
Regresión lineal simple Nazira Calleja
Correlación ρ (rho) r.
Unidad 4 Análisis de los Datos.
ANÁLISIS DE LA INFORMACIÓN La relación entre variables.
TEMA : ANALISIS DE REGRESION
Estadística Administrativa II
REGRESIÓN LINEAL SIMPLE
RELACIÓN ENTRE UNA VARIABLE DEPENDIENTE Y UNA O MAS INDEPENDIENTES.
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
1 ANÁLISIS DE CORRELACIÓN, REGRESIÓN Y CONTRASTE.
METODO DEL PUNTO ALTO Y DEL PUNTO BAJO
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
Regresión lineal Electivo Estadística IV°Medio 2019.
Transcripción de la presentación:

بسم الله الرحمن الرحيم

Correlación y regresión Dr. Moataza Mahmoud Abdel Wahab Conferencista sobre Bioestadística Instituto Superior de Salud Pública Universidad de Alejandría Traducción al Español. Dr. Nicolás Padilla Raygoza, Departamento de Enfermería y Obstetricia, División de Ciencias de la Salud e Ingenierías, Campus Celaya Salvatierra, Universidad de Guanajuato, México raygosan@ugto.mx padillawarm@gmail.com MAE Rosalina Díaz Guerrero, Departamento de Enfermería y Obstetricia, División de Ciencias de la Salud e Ingenierías, Campus Celaya Salvatierra, Universidad de Guanajuato, México rosalina_dg@hotmail.com English version

Correlación Es la relación entre dos variables cuantitativas sin ser capaz de inferir relaciones causales. Correlación es una técnica estadística utilizada para determinar el grado en el que dos variables están relacionadas

Diagrama de dispersión de puntos Dos variables cuantitativas Una variable es llamada independiente (X) y la otra dependiente (Y) Los puntos no se unen No es tabla de frecuencias

Ejemplo

Dispersión de puntos de peso y presión arterial sistólica TAS (mm HG) Peso (Kg) Dispersión de puntos de peso y presión arterial sistólica

Diagrama de puntos dispersos de peso y tensión arterial sistólica TAS (mm HG) Peso (Kg) Diagrama de puntos dispersos de peso y tensión arterial sistólica

Dispersión de puntos El modelo de los datos es indicativo del tipo de relación entre las dos variables: Relación positiva Relación negativa No hay relación

Relación positiva Calificación final del curso Número de horas para estudio

Estatura en cm Edad en semanas

Relación negativa Confiabilidad Edad del Auto

Sin relación Peso (libras) Tasa de pulso (latidos/minuto)

Coeficiente de correlación Estadístico que muestra el grado de relación entre las dos variables

Coeficiente de correlación simple (r) También llamado correlación de Pearson Mide la naturaleza y fuerza entre dos variables cuantitativas.

El signo de r denota la naturaleza de la asociación Mientras que el valor de r denota la fuerza de asociación.

Si el signo es positivo, significa que la relación es directa (un incremento en una variable está asociado con el incremento de la otra variable; una disminución de una variable está asociado con la disminución de la otra variable). Si el signo es negativo, significa una relación inversa o indirecta (significando que el incremento en una variable está asociado con una disminución de la otra variable).

El valor de r está entre ( -1) y ( +1) El valor de r denota la fuerza de la asociación como se ilustra en el siguiente diagrama. fuerte intermedio débil débil intermedio fuerte -1 -0.75 -0.25 0.25 0.75 1 indirecta Directa Correlación perfecta correlación perfecta sin relación

Si r = cero significa que no hay asociación o correlación entre las dos variables. Si 0 < r < 0.25 = débil correlación. Si 0.25 ≤ r < 0.75 = intermedia correlación. Si 0.75 ≤ r < 1 = fuerte correlación. Si r = l = perfecta correlación.

¿Cómo clacular el coeficiente de correlación simple (r)?

Ejemplo: Una muestra de 6 niños fue seleccionada, datos de su edad en años y peso en kilogramos fue registrada como se muestra en la siguiente tabla. Se requiere encontrar la correlación entre edad y peso. Peso (Kg) Edad (años) Nº serial 12 7 1 8 6 2 3 10 5 4 11 13 9

Las dos variables son de tipo cuantitativo, una variable (edad) es llamada independiente y la otra (peso) es llamada dependiente y con notación de variable Y, para encontrar la relación entre edad y peso, calcule el coeficiente de correlación simple, usando la siguiente fórmula:

Y2 X2 xy Peso (Kg) (y) Edad (años) (x) Nº Serial 144 49 84 12 7 1 64 36 48 8 6 2 96 3 100 25 50 10 5 4 121 66 11 169 81 117 13 9 ∑y2= 742 ∑x2= 291 ∑xy= 461 ∑y= ∑x= 41 Total

r = 0.759 Fuerte correlación directa

Ejemplo: Relación entre ansiedad y puntaje de pruebas (X) Puntaje de prueba (Y) X2 Y2 XY 10 2 100 4 20 8 3 64 9 24 81 18 1 7 49 5 6 25 36 30 ∑X = 32 ∑Y = 32 ∑X2 = 230 ∑Y2 = 204 ∑XY=129

Calculando el coeficiente de correlación Fuerte correlación indirecta

Coeficiente de correlación de Rankings de Spearman (rs) No es una prueba no paramétrica de correlación. Este procedimiento usa los dos rankings que puede asignarse a los valores de la muestra en x y en y. Coeficiente de correlación de rankings de Spearman puede calcularse en los siguientes casos: Ambas variables son cuantitativas. Ambas variables son cualitativas ordinales. Una variable es cuantitativa y la otra es cualitativa ordinal.

Ranquee el valor de y de primero a n. Procedimiento: Ranquee los valores de X de primero a n donde n es el número de pares de valores de x y y en la muestra. Ranquee el valor de y de primero a n. Calcule el valor de di para cada par de observaciones restando el ranking de yi del ranking de xi. Eleve al cuadrado cada di y ∑di2 lo cual es la suma de valores al cuadrado.

Aplique la siguiente fórmula: El valor de rs denota la magnitud y naturaleza de la asociación dando la misma interpretación el r simple.

Ejemplo En un estudio de la relación entre el nivel de educación e ingreso, se obtuvieron los siguientes datos. Encuentre la relación entre ellos y comente. Ingreso (Y) Nivel de educación (X) Números de la muestra 25 Preparatoria A 10 Primaria B 8 Universidad C Secundaria D 15 E 50 Analfabeta F 60 G

Respuesta: ∑ di2=64 di2 di (Y) (X) 4 2 3 5 25 A 0.25 0.5 5.5 6 10 B Ranking Y Ranking X (Y) (X) 4 2 3 5 25 Preparatoria A 0.25 0.5 5.5 6 10 Primaria B 30.25 -5.5 7 1.5 8 Universidad C -2 3.5 Secundaria D -0.5 15 E 50 Analfabeta F 1 60 G ∑ di2=64

Comentario: Hay una correlación débil indirecta entre el nivel de educación y el ingreso.

Ejercicio

Análisis de regresión Regresión: técnica enfocada a la predicción de algunas variables conociendo a otras. El proceso de predecir la variable Y usando la variable X.

Regresión Usa la variable (x) para predecir el valor de la variable resultado (y) Nos dice cuanto es el valor de cambio de y en función del cambio en los valores de x.

Correlación y regresión Correlación describe la fuerza de una relación lineal entre dos variables Lineal significa “línea recta” Regresión nos dice como trazar la línea recta descrita en la correlación.

Regresión Calcule la línea que de “el mejor trazo” para un grupo de datos La línea de regresión hace la suma de cuadrados de los residuales, menores a cualquier otra línea Regresión minimiza los residuales TAS(mmHg) Peso Kg

Usando el método de los cuadrados mínimos (un procedimiento que minimiza las desviaciones verticales de puntos trazados alrededor de la línea recta) somos capaces de construir el mejor trazado de la línea recta en la gráfica de puntos dispersos y luego formular la ecuación de regresión en la forma de: b

Ecuación de regresión TAS (mmHg) La ecuación de regresión describe la línea de regresión matemáticamente Intersección Pendiente Peso (Kg)

Ecuación lineal Cambio en Y Cambio en X a = intersección b= pendiente 28

Horas estudiando y calificaciones

Regresión de calificaciones sobre horas de estudio Regresión lineal Calificación final en el curso= 59.95 + 3.17 * horas de estudio R2=0.88 Calificación final en el curso Número de horas empleadas en estudio Calificación final predicha en clase = 59.95 + 3.17*(número de horas de estudio por semana)

Prediga la calificación final de … Calificación final en clases predicha= 59.95 + 3.17*(horas de estudio) Prediga la calificación final de … Alguien quien estudia 12 horas Calificación final = 59.95 + (3.17*12) Calificación final = 97.99 Alguine quien estudia 1 hora: Calificación final = 59.95 + (3.17*1) Calificación final = 63.12

Ejercicio Una muestra de 6 personas fue seleccionada el valor de su edad (variable x) y su peso, mostrados en la siguiente tabla. Encuentre la ecuación de regresión y que se predice del peso cuando la edad es 8.5 años.

Peso (y) Edad (x) Número serial 12 8 10 11 13 7 6 5 9 1 2 3 4

Respuesta Y2 X2 xy Peso (y) Edad (x) Número serial 144 64 100 121 169 49 36 25 81 84 48 96 50 66 117 12 8 10 11 13 7 6 5 9 1 2 3 4 742 291 461 41 Total

Ecuación de regresión

Peso (en Kg) Edad (en años) Creamos una lñínea de regresión trazando dos valores estimados para y contra su componente de x, y luego extendiendo la línea a la derecha y a la izquierda.

Ejercicio 2 PA (y) Edad (x) 128 136 146 124 143 130 121 126 123 46 53 60 20 63 43 26 19 31 23 120 141 134 132 140 144 58 70 Los siguientes son las edades en años y la presión arterial (PA) de 20 adultos aparentemente sanos.

Encuentre la correlación entre edad y presión arterial usando el coeficiente de correlación de Spearman y comente. Encuentre la ecuación de regresión ¿Cual es la presión arterial predecible para un hombre de 25 años?

x2 xy y x Serial 400 2400 120 20 1 1849 5504 128 43 2 3969 8883 141 63 3 676 3276 126 26 4 2809 7102 134 53 5 961 3968 31 6 3364 7888 136 58 7 2116 6072 132 46 8 8120 140 9 4900 10080 144 70 10

x2 xy y x Serial 2116 5888 128 46 11 2809 7208 136 53 12 3600 8760 146 60 13 400 2480 124 20 14 3969 9009 143 63 15 1849 5590 130 43 16 676 3224 26 17 361 2299 121 19 18 961 3906 126 31 529 2829 123 23 41678 114486 2630 852 Total

Presión arterial = 112.13 + 0.4547 * 25=123.49 = 123.5 mm hg =112.13 + 0.4547 x para edad 25 Presión arterial = 112.13 + 0.4547 * 25=123.49 = 123.5 mm hg

Regresión múltiple Análisis de regresión múltiple es una extensión del análisis simple de regresión permitiendo más de una variable independiente.

Gracias