Análisis de componentes principales

Slides:



Advertisements
Presentaciones similares
Riesgo de Mercado Diplomado de Especialización en Riesgo.
Advertisements

Tema 6: Regresión lineal.
REGRESION Y CORRELACION
Instructor: Lic. Cristian R. Arroyo L.
Lic. Cristian R. Arroyo López
Lic. Cristian R. Arroyo López
Técnicas para el análisis de datos en el enfoque cuantitativo
REGRESION LINEAL SIMPLE
Descripción de los datos: medidas de dispersión
Medidas de Posición Central:
Error Estándar de la Media
Ejemplo Grafico.
Ejemplo A continuación aparecen las tasas de retorno de dos fondos de inversión durante los últimos 10 años. 1. ¿Cuál es más riesgoso? 2. ¿En cuál invertiría.
MÉTODOS ESTADÍSTICOS.
Estadísticas Inferenciales Capítulo 10
De la muestra a la población
Ingeniería Industrial II CicloEducativo 2011
REGRESION Y CORRELACION LINEALES. REGRESION LINEAL SIMPLE Finalidad Estimar los valores de y (variable dependiente) a partir de los valores de x (variable.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
ALGUNOS CONCEPTOS PREVIOS
Regresión y correlación
Especies a lo largo de gradientes ambientales Capítulo 5 de McCune y Grace 2002.
Correlación 1.
Estadística Administrativa II
Estadística Administrativa II
Tema 1- Regresión lineal simple.
COEFICIENTE DE CORRELACIÓN PRODUCTO-MOMENTO DE PEARSON
Análisis de componentes principales. Algunas técnicas estadísticas.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
Regresión Linear Correlación de Pearson, r Regresión Múltiple Regresión Logística Regresión de Poisson.
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Análisis de Correlación y de Regresión lineal simple
MEDIDAS DE CORRELACIÓN
Facultad: Turismo Y Hotelería
Distribuciones bidimensionales. Tablas de contingencia
Módulo 5 Análisis de Regresión y Series de Tiempo.
Ajustes de datos: transformación de datos.
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
Estadísticas en ecología de comunidades. Relación entre 2 variables.
Alimento para cerdos Objetivo del experiento:
Ordenación Polar (Bray Curtis)
Métodos de calibración: regresión y correlación
Especies a lo largo de gradientes ambientales Capítulo 5 de McCune y Grace 2002.
Titular: Agustín Salvia
Estadística Descriptiva
Escalamiento Multidimensional No-Métrico Capítulo 16 de McCune y Grace 2002.
Capítulo 4 de McCune y Grace 2002
Análisis de correspondencia canónica (CCA)
Análisis de especies indicadoras Capítulo 25 de McCune y Grace 2002.
Estadísticas en ecología de comunidades Páginas en Ruokolainen et al 2004.
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Modelos lineales: trabajaremos con los siguientes datos Nota: Los datos bájelos del taller 2 de la Web del curso.
Estadísticas en ecología Páginas en Ruokolainen et al 2004.
Análisis de los Datos Cuantitativos
Reducción de dimensionalidad por ordenación Capítulo 13 de McCune y Grace 2002.
Regresión Lineal Simple
Aplicaciones Estadísticas a las Finanzas Clase 1
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Construcción de modelos con regresión y correlación
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Estadísticas en ecología Páginas en Ruokolainen et al 2004.
Regresión lineal simple Nazira Calleja
Capítulo 10 Análisis de los datos.
Anuncio Entregar propuesta en o antes de viernes 30 de marzo.
Aplicaciones Estadísticas a las Finanzas Clase 1
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
Transcripción de la presentación:

Análisis de componentes principales Capítulo 14 de McCune y Grace 2002

Algunas técnicas estadísticas

Relación entre 2 variables

Correlación Examina el grado en que 2 variables varían a la par. Por ejemplo, ¿existe una variación a la par entre el largo de la nariz (x) y el largo de la oreja izquierda (y)? La hipótesis nula sería: H0: x no se correlaciona con y

Correlación

Correlación r = coeficiente de correlación; provee una medida de la dispersión de los valores desde la línea de mejor correlación y = a + bx; define la línea de mejor correlación a = intercepto en y b = pendiente de la línea de correlación

Cuando tratamos con más de 2 variables

Análisis de componentes principales

Reducción de 3 dimensiones a sólo 2 dimensiones

Tamaño

ancho largo

Primer componente resume ambas variables: Tamaño = largo + ancho

centroide

Otro ejemplo con 3 variables en 28 muestras X1, X2, X3 a - z

PCA Ecuación general para uno de los componentes principales: Posición en 1er componente (eje) principal = a1y1 + a2y2 + a3y3 …anyn Donde “a1” = eigenvector de especie 1, y “y1” = valor (abundancia) de especie 1 eigenvalor = porción de la varianza total explicada por un componente

VARIANCE EXTRACTED, FIRST 9 AXES --------------------------------------------------------------- Broken-stick AXIS Eigenvalue %Variance Cum.%Var. Eigenvalue 1 2.806 31.179 31.179 2.829 2 2.009 22.323 53.502 1.829 3 1.456 16.182 69.684 1.329 4 1.070 11.884 81.568 0.996 5 0.650 7.226 88.794 0.746 6 0.593 6.588 95.382 0.546 7 0.268 2.981 98.364 0.379 8 0.147 1.636 100.000 0.236 9 0.000 0.000 100.000 0.111

FIRST 6 EIGENVECTORS -------------------------------------------------------------------------------- Eigenvector Species 1 2 3 4 5 6 Abgr-t 0.3746 0.4312 0.1875 0.0539 -0.1382 0.0486 Acma-t 0.3673 0.3561 0.2293 -0.3022 -0.3680 0.2511 Conu 0.3321 -0.5293 0.0516 0.1086 -0.1865 -0.1157 Frla -0.0186 -0.2620 0.6508 -0.0473 -0.2761 -0.5382 Prav-t 0.3754 -0.4691 -0.2251 0.1103 0.0793 0.2340 Psme-t 0.2895 0.3066 0.0466 0.5199 0.4811 -0.4419 Pyco-t -0.0943 -0.1363 0.6348 -0.0783 0.5731 0.4644 Quga-t -0.5824 0.0749 -0.0112 -0.0208 -0.0808 -0.1369 Rhpu-t 0.2030 -0.0162 -0.1732 -0.7764 0.4022 -0.3836

¿Cuándo es apropiado? Ideal cuando las relaciones entre variables son lineales Las variables tienen distribuciones normales Ausencia de rezagados muy influyentes Pero… Datos de comunidades generalmente no cumplen con esos requisitos

¿Qué informar? Forma de la matriz de productos cruzados: correlación o varianza/covarianza Justificación del modelo lineal Cuántos ejes fueron interpretados y la proporción de la varianza explicada Prueba de significancia para ejes Eigenvectores principales Ayudas para interpretación

Forma de la matriz de productos cruzados Correlación: Estandariza las diferencias según la desviación estándar de cada variable. Da igual peso a variables Apropiada cuando las variables están en escalas distintas o hay mucha diferencia en su variación Varianza/covarianza: Variables de mayor varianza tienen mas efecto en resultados

Justificación del modelo lineal

Cuántos ejes fueron interpretados VARIANCE EXTRACTED, FIRST 9 AXES --------------------------------------------------------------- Broken-stick AXIS Eigenvalue %Variance Cum.%Var. Eigenvalue 1 2.806 31.179 31.179 2.829 2 2.009 22.323 53.502 1.829 3 1.456 16.182 69.684 1.329 4 1.070 11.884 81.568 0.996 5 0.650 7.226 88.794 0.746 6 0.593 6.588 95.382 0.546 7 0.268 2.981 98.364 0.379 8 0.147 1.636 100.000 0.236 9 0.000 0.000 100.000 0.111

Ejercicio Correr un PCA con datos de herbB luego de eliminar especies raras. Examinar resultados y relaciones con especies y variables ambientales.