Componentes Principales

Slides:



Advertisements
Presentaciones similares
METODOLOGIA DE LA INVESTIGACION
Advertisements

ESTRUCTURA DE DATOS Unidad 01 MATRICES.
ALCANCE DE LA INVESTIGACIÓN
Tipos y Niveles de Investigación
2. ANÁLISIS DE COMPONENTES PRINCIPALES
Tema 3: Introducción a la programación lineal
La observación científica
Notas de metodología. Apellidos y nombre: ___________________________
Expresión de un problema de programación lineal Aplicaciones de la programación lineal Soluciones de un problema lineal Resolución gráfica de un problema.
Análisis de componentes principales María José Nueda Dpto. Estadística e Investigación Operativa Homenaje a Marco A. López. Febrero 2010.
FORTRAN 90 arreglos.
Taller 2. Medición de distancia entre variables y sujetos
2. Análisis de Componentes Principales

Buenas tardes, en primer lugar quisiera agradecer a los miembros del tribunal, a la Dra. Dña. Mª Dolores Prieto Sánchez, a la Dr. Dña. Josefina Hernández.
ESTUDIOS CORRELACIONALES
Clases 5 Pruebas de Hipótesis
Formas canonicas de sistemas LTI
TEMA XXI. ESQUEMA GENERAL DISEÑO LONGITUDINAL DE MEDIDAS REPETIDAS SIMPLE Diseño de una muestra de sujetos. Estudio de las curvas de crecimiento Análisis.
1 Universidad Católica Boliviana “San Pablo” Unidad Regional La Paz Comité Regional de Autoevaluación – Plan de Desarrollo Alejandro Blacutt Elizabeth.
ARREGLOS BIDIMENSIONALES
TABLAS Definición. El tipo tabla permite definir objetos formados por un conjunto de elementos del mismo tipo. Ejemplos. El tipo tabla se utiliza para.
DISEÑO DE AMBIENTES DE APRENDIZAJE
Operacionalización de las variables para la investigación
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
VENTANA 4/14 Problemas que se Encuentran en los Niños y Adolescentes, entre las Edades de 4 a 14 Años, dentro de la Iglesia.
Análisis Multivariado de los productos de la Central de Abastos de Iztapalapa del Distrito Federal a partir de 2002.
3. COMPONENTES PRINCIPALES
Análisis de componentes principales
Modulo03 – Ejercicio13 Asociar categorías: Test de independencia.
ANÁLISIS DE LOS DATOS LOS 10 PASOS DE LA INVESTIGACIÓN
Arreglos de Objetos.
02. Importación y edición de la matriz de datos
 Futuro  Socialización  Proceso  Integración  Construyendo puentes desde la ciencia hacia la política.
DINAMICA DE LA ROTACION; SISTEMAS DE FUERZAS CONCURRENTES DOCENTE:
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
ADMINISTRACION DE EMPRESAS INSTITUTO NACIONAL DE SAN BARTOLO TERCER PERIODO.
OPERACIONALIZACIÓN DE HIPÓTESIS
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
DENISSE SAAVEDRA MIRIAN MORTENSEN.  Las variables cualitativas se enfocan en las actividades, opiniones, actitudes, valores culturales, las motivaciones.
ESTADO DE DEFORMACIÓN EN PUNTO DE UN MEDIO CONTINUO
Dr.Walther,CASIMIRO URCOS
Estudio del movimiento: Movimientos en el plano
Laboratorio de programación
 E Expresión de un problema de programación lineal  A Aplicaciones de la programación lineal  S Soluciones de un problema de programación lineal.
TALLER TÉCNICAS DE PROMOCIÓN DE LA NUTRICIÓN SEGURA Y SALUDABLE.
Programación No Lineal Antonio H. Escobar Z Universidad Tecnológica de Pereira – Colombia.
UNIVERSIDAD INTERAMERICANA DE PUERTO RICO
Escuela de Ciencias Básicas Tecnología e Ingeniería UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA DIRECTORA ING. VIVIAN ALVAREZ ALTAMIRANDA DICIEMBRE 2 DE.
22. Correlación como prueba de hipótesis Módulo IV: Análisis de datos numéricos Análisis de Datos Aplicado a la Investigación Científica
Estadística Historia y Conceptos Básicos.
ALGEBRA DE MATRICES LAS MATRICES SE UTILIZAN EN EL CÁLCULO NUMÉRICO, EN LA RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES, DE LAS ECUACIONES DIFERENCIALES.
Curso de Análisis Estadístico de Datos Composicionales ICP-Piedecuesta, Santander Marzo-2007 Introducción a la Descomposición en Valores Principales R.
16. Asociación estadística y test de independencia
05. Calcular y recodificar variables en la matriz Módulo I: La matriz para el análisis de datos Análisis de Datos Aplicado a.
NOMBRE DEL ALUMNO: KARLA HERNANDEZ HERNANDEZ
Guayaquil, 18 de Septiembre del 2015 Tema : Programación Lineal (Función Objetivo) Destreza: Identificar la función objetivo y escribir una expresión.
En este tema se analizan los movimientos en dos dimensiones, en los que la posición, la velocidad y la aceleración están representados por vectores. Las.
ALGEBRA CON VECTORES Y MATRICES Uso de MatLab.
Escuela de Ciencias Básicas, Tecnologías e Ingenierías Álgebra Lineal – Webconferencia Ing. Vivian Alvarez A. Puerto Colombia, Mayo 04 de 2016.
VECTORES OPERACIONES CON VECTORES MATRICES.
Apuntes 2º Bachillerato C.S.
PREDICCIÓN Y ESTIMACIÓN
COMPONENTE ACADEMICO. GRACIAS.
3. COMPONENTES PRINCIPALES  Introducción  Componentes principales  Componentes principales muestrales  Comportamiento asintótico de autovalores y autovectores.
Componentes del Sistema Solar.
Introducción al uso del Matlab. 1. Componentes Ventana de comandos Carpeta actual Espacio de trabajo Historial Editor.
COMPONENTES RECTANGULARES.
Dimensiones de la moral laboral.
Transcripción de la presentación:

Componentes Principales

Karl Pearson

Objetivo: dada una matriz de datos de dimensiones nxp que representa los valores de p variables en n individuos, investigar si es posible representar los individuos mediante r variables (r<p) con poca (o ninguna si es posible) pérdida de información.

Nos gustaría encontrar nuevas variables Z, combinación lineal de las X originales, tales que: r de ellas contengan toda la información las restantes p-r fuesen irrelevantes

Primera interpretación de componentes principales: Representación gráfica óptima de los datos

Proyección de un punto en una dirección: maximizar la varianza de la proyección equivale a minimizar las distancias ri xi zi xiT xi = riT ri+ zTi zi a

Minimizar las distancias a la recta es lo mismo que maximizar la varianza de los puntos proyectados (estamos suponiendo datos de media cero)

Segunda interpretación de componentes: Predicción óptima de los datos Encontrar una variable zi =a’Xi que sea capaz de prever lo mejor posible el vector de variables Xi en cada individuo. Generalizando, encontrar r variables, zi =Ar Xi , que permitan prever los datos Xi para cada individuo lo mejor posible, en el sentido de los mínimos cuadrados Puede demostrarse que la solución es que zi =a’Xi tenga varianza máxima.

Tercera interpretación: Ejes del elipsoide que contiene a la nube de puntos Recta que minimiza las distancias ortogonales, proporciona los ejes del elipsoide que contiene a la nube de puntos Coincide con la idea de regresión ortogonal de Pearson

Ejemplo. Datos de gastos de familias EPF

Segundo componente

Ejemplo gastos EPF

Propiedades de los CP

Propiedades Conservan la varianza generalizada Conservan la varianza efectiva

Propiedades La variabilidad explicada es la proporción del valor propio a la suma

Propiedades La covarianza entre los componentes y las variables es proporcional al vector propio que define el componente Y como

Propiedades Las covarianzas entre los componentes y las variables son proporcionales al vector propio y el factor de proporcionalidad es el valor propio

Propiedades

Propiedades

CP como predictores óptimos Queremos prever cada fila de la matriz Mediante un conjunto de variables Con el mínimo error

CP como predictores óptimos Dado el vector a el coeficiente c se obtiene por regresión Con lo que Para obtener a tenemos que minimizar

CP como predictores óptimos

CP como predictores óptimos El resultado de la aproximación es

CP como predictores óptimos Y en general, la mejor aproximación de la matriz con otra de Rango r<p es

Los CP son los predictores óptimos de las variables originales La aproximación de CP puede aplicarse a cualquier matriz aunque tengamos más variables que observaciones

Propiedades En lugar de trabajar con la matriz de varianzas podemos hacerlo con la de correlaciones Esto equivale a trabajar con variables estandarizadas

CP sobre correlaciones

Ejemplo Inves

Ejemplo Inves

Ejemplo Medifis

Ejemplo mundodes

Ejemplo Mundodes

Ejemplos para análisis de imagenes

En lugar de tener que transmitir 16 matrices de N2 Pixeles transmitimos un vector 16x3 con los valores de los componentes y una matriz 3xN2 con los vectores propios De esta manera ahorramos: Ahorramos el 70% . Si en lugar de 16 imágenes tenemos 100 el ahorro puede ser del 95%

Generalización Buscar direcciones de proyección interesantes desde algun punto de vista. Esta es la idea de Projection Pursuit. Buscar proyecciones que produzcan distribuciones de los datos tan alejadas de la normalidad como sea posible.