Curso de Análisis Estadístico de Datos Composicionales ICP-Piedecuesta, Santander Marzo-2007 Introducción a la Descomposición en Valores Principales R. Meziat Departamento de Matemáticas, Universidad de los Andes
Contenido 1.Matrices cuadradas, simétricas y definidas positivas 2.Valores propios de una matriz cuadrada y sus vectores propios asociados
PROPIEDADES DE LA SVD
Teorema de Eckart-Young
ANÁLISIS POR COMPONENTES PRINCIPALES Objetivo: Reducir la dimensión en el conjunto de datos y mantener la variabilidad de la collección original.
metodología Supondremos que la matriz A es de dimensiones NXD, de manera que contiene N observaciones para D variables. Fácilmente encontramos la matriz de covarianzas para las variables involucradas Claramente S es DXD simétrica y semidefinida positiva. Procedimiento de cálculo de S sigue a continuación:
metodología
Calculamos los valores propios para la matriz de covarianzas S: Calculamos una base ortonormal de correspondientes vectores propios:
metodología Manteniendo el orden decreciente en los valores propios tenemos fijamos k para los primeros y mayores valores propios de S y sus k correspondientes vectores propios:
metodología Definimos una transformación natural de en como:
Aplicación a la matriz de covarianzas
FIN