Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porCaridad Cabrera Modificado hace 9 años
1
METABOLOMICS PCA – Principal Component Analysis
2
vtrevino@itesm.mx Modelos y Datos Todos los estudios arrojan datos En cada estudio se miden variables Pregunta común Cuales variables están relacionadas a un efecto? Se desarrolla un modelo que compara los valores de variables En distintas clases, Lineal o no lineal, etc. Algunos estudios pueden tener muchas variables Como genómica funcional ! Se requieren métodos que puedan disminuir la cantidad de variables, filtrándolas o transformándolas
3
vtrevino@itesm.mx Principal Components Analysis – Análisis de Componentes Principales -PCA PCA es una técinica de TRANSFORMACIÓN LINEAL Proyecta los datos en direcciones mas convenientes Al mismo tiempo reduce la cantidad de variables (muy útil) La tranformación involucra crear Componentes que remplazan a las variables originales
4
vtrevino@itesm.mx PCA – PCA reduce la cantidad de datos asumiendo que algunas variables pueden estar correlacionadas Si hay variables correlacionadas, solo es necesaria una de ellas para obtener información Las componentes principales se diseñan para capturar la máxima varianza Ejemplo: Cual es la dirección de la máxima varianza ? Variable 1 Variable 2
5
vtrevino@itesm.mx PCA - Perpendicularidad Las componentes principales son perpendiculares Representación gráfica: PC1 PC2 Eliminación de variación capturada en PC1 Siguiente dirección de máxima variabilidad (PC2)
6
vtrevino@itesm.mx PCA – Componentes Ordenadas La primera componente principal tendrá la mayor variabilidad (por diseño) La segunda capturará la siguiente mayor variabilidad y perpendicular a la primera Etc. Importance of components: PC1 PC2 PC3 Standard deviation 2.482 1.486 0.5648 Proportion of Variance 0.709 0.254 0.0367 Cumulative Proportion 0.709 0.963 1.0000 PC3 no explica mucha varianza, podría representar ruido PC1 PC2 PC3 Varianza x Componente
7
vtrevino@itesm.mx PCA - Método X T – data, zero mean (standardized data) Matrix of Weights Matrix of "Principal Components" Matrix of "Principal Components" PC1 = w11*x1 + w12*x2 + w13*x3 + … where xi = vector from sample i PC2 = w21*x1 + w22*x2 + w23*x3 + … … PC’s are orthogonals PCA is an "optimal" linear combination of the original variables PC are SORTED in a way that PC1 captures the major variability of the data, then PC2 captures the next "component" and so on…. The task is then detect the component that is related OUTCOME Wij son usados para seleccionar las variables “importantes” según la PC que este relacionada al efecto deseado
8
vtrevino@itesm.mx PCA – Métodos para encontrar W Varios métodos Generalmente usan SVD (Singular Value Decomposition) Covarianza Optimización Todos arrojan los mismos resultados PCA es ya relativamente fácil de hacer y casi todos los paquetes estadísticos lo implementan
9
vtrevino@itesm.mx Encontrar los PCs que mejor “separan” a los datos Common Metabolomics Methods - PCA X T – data, zero mean (standardized data) Chronic Uveitis (CU) Lens-induced Uveitis (LIU) PCx PCy Clusters en MeV
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.