METABOLOMICS PCA – Principal Component Analysis. Modelos y Datos  Todos los estudios arrojan datos  En cada estudio se miden variables.

Slides:



Advertisements
Presentaciones similares
Pedro Concejero Grupo de usuarios R Madrid 31 octubre 2012
Advertisements

ESTUDIO DE MERCADO. MÉTODOS DE PROYECCIÓN
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN
Reducción de datos Por Elizabeth León.
REGISTROS Y ALERTAS DE RENDIMIENTO
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Investigación Operativa
Capitulo 10: La metodología Box-Jenkins
Estimación por Intervalos de confianza
CONTENIDO GENERAL EN UN PROTOCOLO
CONTRASTE Y VALIDACIÓN DE UN MODELO
Análisis de componentes principales. Algunas técnicas estadísticas.
Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Análisis de correlación.
9 Regresión Lineal Simple
LEAN SIGMA – FASE DE ANÁLISIS Propósito y herramientas 1.
David R. González Barreto Universidad de Puerto Rico.
REGRESION LINEAL En la búsqueda de mejoras o en la solución de problemas es necesario, frecuentemente, investigar la relación entre factores (o variables).
Join us on Twitter: #AU2013 Acelerando los flujos de trabajo de simulación dinámica y animaciones a través de la nueva herramienta Joint en Autodesk® Inventor®
2. DISEÑO DE SEÑALES Y FILTROS
Regresión Lineal Múltiple
Cuantificación de la capacidad predictiva de la SST del Atlántico en las temperaturas de Europa S.R. Gámiz-Fortis, M.J. Esteban-Parra, D. Argüeso, J.M.
PROBLEMAS ECONOMETRICOS
Modelos Lineales Julio Di Rienzo
Genomica Funcional y Bioinformática -
Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.
Principios del diseño experimental Maestría Ingeniería Industrial
Curso de Bioestadística. ANOVA
Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Análisis de espectro singular.
PROCESAMIENTO EN EL DOMINIO DEL ESPACIO. Se entiende por procesamiento en el dominio del espacio, la realización de operaciones directamente sobre el valor.
Reconocimiento de Patrones
Alimento para cerdos Objetivo del experiento:
Detectores de Borde. Extracción de Características Detección de Líneas. Detección de Puntos de Borde. Detección de Contornos.
¿Por que estudiar búsquedas? Recordemos que la mayoría de los problemas en inteligencia artificial, involucran como tema central un proceso de búsqueda.
SALIR REINTENTAR De acuerdo a lo presentado en clase hay una cantidad de preguntas que debes resolver a continuación.
Titular: Agustín Salvia
Regresión No- lineal y Múltiple
EMA-602 Tema IX: Análisis de datos/Reporte Investigación
Análisis de datos correlacionados
Modelos Lineales CO Práctica 4 Comparación de Modelos Lineales Se desea comparar dos modelos de la forma: (1) y i =  0 +  1 x 1i  l x li.
LA RECTA DE REGRESIÓN CONTENIDOS:
CLASE 96. Las desigualdades de la forma mx + n > 0 o mx + n < 0 ( mx + n  0 o mx + n  0 ) con m, n  ( m  0) o que se reducen a ella mediante transformaciones.
Tema 3: Filtros.
Solución de problemas que involucran campos aleatorios de conductividad hidráulica.
ANÁLISIS DE COMPONENTES PRINCIPALES. Introducción Partiendo de un conjunto de variables, y mediante transformaciones lineales, queremos llegar a otro.
Método para evaluar valores y cualidades
Cluster by mixtures. The Trace criteria (K-means)
Modelo Lineal Simple con Statgraphics para Windows.
CO-2124 Análisis de Varianza con Un Criterio de Clasificación En clases anteriores se deseaba determinar si existían diferencias entre las medias de dos.
Análisis de componentes principales
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Universidad de Los Andes Facultad de Ingeniería Escuela de Ingeniería Eléctrica Maestría en Ingeniería Biomédica GIBULA Máquinas de Soporte Vectorial.
Identificación de parámetros de sensibilidad.
Regresión Lineal Simple
Desarrollo de lógica algorítmica.
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Unidad 4 Análisis de los Datos.
TEMA : ANALISIS DE REGRESION
DIAGRAMA DE CUERPO LIBRE
OPTIMIZACION DEL DESEMPEÑO DE ERROR
Curso de Análisis Estadístico de Datos Composicionales ICP-Piedecuesta, Santander Marzo-2007 Introducción a la Descomposición en Valores Principales R.
Coeficiente de variación
ANÁLISIS DE COVARIANZA En algunas circunstancias, un experimento está afectado por la intervención de un factor muchas veces imprevisible y que no puede.
Bioestadística Inferencia estadística y tamaño de muestra
Universidad Fermín Toro Vice Rectorado Académico Facultad de Ciencias Económicas y Sociales Escuela de Administración Lizmer, Arrieche C.I. No
RAFAEL MARÍA ROMÁN BRAVO OCTUBRE, 2015 Importancia de la Estadística en la Investigación.
Anova de una via Diseños completamente aleatorios
Youden Analysis. Introduction to W. J. Youden Components of the Youden Graph Calculations Getting the “Circle” What to do with the results.
Anova de una via Diseños completamente aleatorios
LEAN GAMES WHAT IS 5S ? 5S is a Japanese concept using five simple steps to create a conducive work atmosphere. 5S is a series of techniques that provide.
Transcripción de la presentación:

METABOLOMICS PCA – Principal Component Analysis

Modelos y Datos  Todos los estudios arrojan datos  En cada estudio se miden variables  Pregunta común  Cuales variables están relacionadas a un efecto?  Se desarrolla un modelo que compara los valores de variables  En distintas clases, Lineal o no lineal, etc.  Algunos estudios pueden tener muchas variables  Como genómica funcional !  Se requieren métodos que puedan disminuir la cantidad de variables, filtrándolas o transformándolas

Principal Components Analysis – Análisis de Componentes Principales -PCA  PCA es una técinica de TRANSFORMACIÓN LINEAL  Proyecta los datos en direcciones mas convenientes  Al mismo tiempo reduce la cantidad de variables (muy útil)  La tranformación involucra crear Componentes que remplazan a las variables originales

PCA –  PCA reduce la cantidad de datos asumiendo que algunas variables pueden estar correlacionadas  Si hay variables correlacionadas, solo es necesaria una de ellas para obtener información  Las componentes principales se diseñan para capturar la máxima varianza  Ejemplo:  Cual es la dirección de la máxima varianza ? Variable 1 Variable 2

PCA - Perpendicularidad  Las componentes principales son perpendiculares  Representación gráfica: PC1 PC2 Eliminación de variación capturada en PC1 Siguiente dirección de máxima variabilidad (PC2)

PCA – Componentes Ordenadas  La primera componente principal tendrá la mayor variabilidad (por diseño)  La segunda capturará la siguiente mayor variabilidad y perpendicular a la primera  Etc. Importance of components: PC1 PC2 PC3 Standard deviation Proportion of Variance Cumulative Proportion PC3 no explica mucha varianza, podría representar ruido PC1 PC2 PC3 Varianza x Componente

PCA - Método X T – data, zero mean (standardized data) Matrix of Weights Matrix of "Principal Components" Matrix of "Principal Components" PC1 = w11*x1 + w12*x2 + w13*x3 + … where xi = vector from sample i PC2 = w21*x1 + w22*x2 + w23*x3 + … … PC’s are orthogonals PCA is an "optimal" linear combination of the original variables PC are SORTED in a way that PC1 captures the major variability of the data, then PC2 captures the next "component" and so on…. The task is then detect the component that is related OUTCOME Wij son usados para seleccionar las variables “importantes” según la PC que este relacionada al efecto deseado

PCA – Métodos para encontrar W  Varios métodos  Generalmente usan SVD (Singular Value Decomposition)  Covarianza  Optimización  Todos arrojan los mismos resultados  PCA es ya relativamente fácil de hacer y casi todos los paquetes estadísticos lo implementan

 Encontrar los PCs que mejor “separan” a los datos Common Metabolomics Methods - PCA X T – data, zero mean (standardized data) Chronic Uveitis (CU) Lens-induced Uveitis (LIU) PCx PCy Clusters en MeV