La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

METABOLOMICS PCA – Principal Component Analysis. Modelos y Datos  Todos los estudios arrojan datos  En cada estudio se miden variables.

Presentaciones similares


Presentación del tema: "METABOLOMICS PCA – Principal Component Analysis. Modelos y Datos  Todos los estudios arrojan datos  En cada estudio se miden variables."— Transcripción de la presentación:

1 METABOLOMICS PCA – Principal Component Analysis

2 vtrevino@itesm.mx Modelos y Datos  Todos los estudios arrojan datos  En cada estudio se miden variables  Pregunta común  Cuales variables están relacionadas a un efecto?  Se desarrolla un modelo que compara los valores de variables  En distintas clases, Lineal o no lineal, etc.  Algunos estudios pueden tener muchas variables  Como genómica funcional !  Se requieren métodos que puedan disminuir la cantidad de variables, filtrándolas o transformándolas

3 vtrevino@itesm.mx Principal Components Analysis – Análisis de Componentes Principales -PCA  PCA es una técinica de TRANSFORMACIÓN LINEAL  Proyecta los datos en direcciones mas convenientes  Al mismo tiempo reduce la cantidad de variables (muy útil)  La tranformación involucra crear Componentes que remplazan a las variables originales

4 vtrevino@itesm.mx PCA –  PCA reduce la cantidad de datos asumiendo que algunas variables pueden estar correlacionadas  Si hay variables correlacionadas, solo es necesaria una de ellas para obtener información  Las componentes principales se diseñan para capturar la máxima varianza  Ejemplo:  Cual es la dirección de la máxima varianza ? Variable 1 Variable 2

5 vtrevino@itesm.mx PCA - Perpendicularidad  Las componentes principales son perpendiculares  Representación gráfica: PC1 PC2 Eliminación de variación capturada en PC1 Siguiente dirección de máxima variabilidad (PC2)

6 vtrevino@itesm.mx PCA – Componentes Ordenadas  La primera componente principal tendrá la mayor variabilidad (por diseño)  La segunda capturará la siguiente mayor variabilidad y perpendicular a la primera  Etc. Importance of components: PC1 PC2 PC3 Standard deviation 2.482 1.486 0.5648 Proportion of Variance 0.709 0.254 0.0367 Cumulative Proportion 0.709 0.963 1.0000 PC3 no explica mucha varianza, podría representar ruido PC1 PC2 PC3 Varianza x Componente

7 vtrevino@itesm.mx PCA - Método X T – data, zero mean (standardized data) Matrix of Weights Matrix of "Principal Components" Matrix of "Principal Components" PC1 = w11*x1 + w12*x2 + w13*x3 + … where xi = vector from sample i PC2 = w21*x1 + w22*x2 + w23*x3 + … … PC’s are orthogonals PCA is an "optimal" linear combination of the original variables PC are SORTED in a way that PC1 captures the major variability of the data, then PC2 captures the next "component" and so on…. The task is then detect the component that is related OUTCOME Wij son usados para seleccionar las variables “importantes” según la PC que este relacionada al efecto deseado

8 vtrevino@itesm.mx PCA – Métodos para encontrar W  Varios métodos  Generalmente usan SVD (Singular Value Decomposition)  Covarianza  Optimización  Todos arrojan los mismos resultados  PCA es ya relativamente fácil de hacer y casi todos los paquetes estadísticos lo implementan

9 vtrevino@itesm.mx  Encontrar los PCs que mejor “separan” a los datos Common Metabolomics Methods - PCA X T – data, zero mean (standardized data) Chronic Uveitis (CU) Lens-induced Uveitis (LIU) PCx PCy Clusters en MeV


Descargar ppt "METABOLOMICS PCA – Principal Component Analysis. Modelos y Datos  Todos los estudios arrojan datos  En cada estudio se miden variables."

Presentaciones similares


Anuncios Google