Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Análisis de Componentes Principales
2
El análisis de componentes principales (ACP) se emplea cuando deseamos obtener una representación más simple (y en menor dimensión) para un conjunto de variables correlacionadas. Con este método, las variables no se consideran explicativas o de respuesta, sino que todas son tratadas de la misma manera. Para examinar las relaciones entre un conjunto de p variables correlacionadas, transformamos el conjunto original de variables a un nuevo conjunto no correlacionado. Estas nuevas variables se llaman componentes principales y son obtenidas en orden decreciente de importancia, de modo que las primeras componentes principales resumen la mayor cantidad posible de la variabilidad de los datos originales.
3
Propósito: obtener la información esencial
Ejemplo: compresión de imágenes, MP3
4
Si un número pequeño de las componentes resume la mayor parte de la variación de los datos, puede pensarse que la dimensionalidad real de los datos es menor que p. En tal caso, esperamos que estas componentes sean significativas, nos ayuden a entender mejor los datos y sean útiles para simplificar análisis posteriores Si las están poco correlacionadas, no tiene sentido llevar a cabo un PCA
5
Los datos corresponden a los porcentajes de población empleados en variasactividades en Europa para el año Las variables consideradas son Agricultura, Minas, Fábricas, Suministro Eléctrico, Construcción, Industrias de Servicio, Finanzas, Servicios Sociales y Personales y Transporte yComunicaciones. Utilizaremos el método de componentes principales para reducir el número de variables, tratar de determinar grupos de países concomportamientos semejantes en la distribución de su fuerza de trabajo.
6
Matriz de diag. de dispersión
Abrir script “princomp.R”
7
Los ejes más importantes corresponden a los sectores agrícola,manufacturero y de servicios.
El sector de servicios tiene un peso negativo en ambas componentes, el sector agrícola tiene peso positivo en la primera componente y casi cero en la segunda componente principal, y el sector manufacturero tiene peso negativo para la primera componente y positivo para la segunda. Podemos distinguir tres grupos evidentes de países: aquellos con una alto porcentaje de la población dedicada a la agricultura (Turquía, Yugoslavia y Grecia), otro grupo de países con un alto porcentaje de la población dedicado a servicios (Dinamarca, Holanda, Noruega, Suecia, Bélgica) y otro grupo de países con altos porcentajes de población dedicados al sector manufacturero (Suiza, Alemania Oriental, Checoslovaquia, Alemania Occidental) Turquía podría ser considerado como observación atípica, pues está muyalejada del resto de los países considerados, principalmente porque suestructura de empleo se inclina mayoritariamente a la agricultura. Ejercicio: Repita este análisis eliminando Turquía del conjunto de datos. ¿Cuáles son sus conclusiones?
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.