La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

ANALISIS DE COMPONENTES PRINCIPALES. Cuando afrontamos un Análisis Multivariante de datos, el escenario típico suele estar constituido por una masa de.

Presentaciones similares


Presentación del tema: "ANALISIS DE COMPONENTES PRINCIPALES. Cuando afrontamos un Análisis Multivariante de datos, el escenario típico suele estar constituido por una masa de."— Transcripción de la presentación:

1 ANALISIS DE COMPONENTES PRINCIPALES. Cuando afrontamos un Análisis Multivariante de datos, el escenario típico suele estar constituido por una masa de datos generalmente grande no sólo porque suele proceder de muchos individuos (muchos casos), sino también porque sobre cada uno de esos individuos se suele medir un número sustancial de variables. Las técnicas factoriales pretenden, desde sus diferentes enfoques, abordar el problema de simplificar la interpretación del comportamiento observado de los datos

2 El siguiente ejemplo ilustrativo corresponden a 48 candidatos que fueron evaluados sobre 15 criterios para un puesto de trabajo en un Centro Contable. Nivel de estudios, Simpatía, confianza en si mismo, lucidez, honestidad, sentido comercial, experiencia, carisma, y ambición. Ya en una primera aproximación podemos comprobar la dificultad de visualizar esta información de manera completa. Una representación grafica en tres dimensiones.

3 Así, el Análisis de Componentes Principales simplemente se pregunta por cuántas y cuáles serán esas pocas variables que nos permitirían resumir la diversidad de las evalusciones observadas con la menor pérdida de información posible. Por su parte, el Análisis Factorial presupone la existencia de un número pequeño de variables no observables o latentes (factores) que serían la causa de las evaluacones observadas y que trata de identificar

4 Para el autor César Pérez López, el Análisis de Componentes Principales es una técnica de análisis estadístico Multivariante que se clasifica entre los métodos de simplificación o reducción de la dimensión y que se aplica cuando se dispone de un conjunto elevado de variables con datos cuantitativos persiguiendo obtener un menor número de variables, combinación lineal de las primitivas, que se denominan componentes principales o factores, cuya posterior interpretación permitirá un análisis más simple del problema estudiado

5 INTERPRETACIÓN DE LAS COMPONENTES PRINCIPALES La problemática de la interpretación de las componentes principales es, nada más y nada menos, tratar de asignar un significado inteligible y útil a las componentes principales obtenidas. Para ello se recurre a examinar la relación existente entre las componentes principales y las variables originales (u otras auxiliares), para por medio de esta relación tratar de darles un contenido a su significado, para lo que la información básica para esta tarea es la matriz de correlaciones entre las componentes principales y las variables originales, que toman en este ámbito el nombre de matriz de estructura. Ahora pasemos a desarrollar un ejemplo práctico haciendo uso del Programa SPSS.

6 En el SPSS, el procedimiento que permite realizar el análisis factorial se encuentran en el submenú Reducción de datos del menú Analizar FIGURA No. 01

7 En la figura 02 se observan las opciones que nos brinda un ACP. Pasemos a revisar cada una de dichas opciones. FIGURA No. 02

8 Una vez ingresado las variables, y Si damos clic en la opción Descriptivos, se obtiene el siguiente recuadro. FIGURA No. 03

9 La figura 3 muestra los Descriptivos que podemos elegir en nuestro modelo de componentes principales. En dicha opción se pueden solicitar una serie de medidas de resumen para cada variable, la solución inicial (comunalidades, autovalores y porcentaje de varianza explicada por cada factor), así como algunos estadísticos que permiten comprobar la adecuación de la muestra al análisis factorial. Desde un punto de vista práctico, la prueba de esfericidad de Bartlett contrasta si la matriz de correlaciones es una matriz identidad, lo cual indicaría que el modelo factorial es inadecuado.

10 La medida de la adecuación muestral de Kaiser-Meyer- Olkin (Coeficiente KMO) contrasta si las correlaciones parciales entre las variables son pequeñas, toma valores entre 0 y 1, e indica que el análisis factorial es tanto más adecuado cuanto mayor sea su valor. Así, Kaiser propuso en 1974 el siguiente criterio para decidir sobre la adecuación del análisis factorial de un conjunto de datos: 0,9

11 En cuanto al método de extracción (botón Extracción), las opciones que presenta SPSS son las que aparecen en la siguiente figura: FIGURA No. 04

12 Como se observa, los métodos de extracción de factores que realiza el SPSS son los de las componentes principales, máxima verosimilitud, mínimos cuadrados no ponderados, y algunos más que no hemos estudiado Volviendo a las opciones que presenta el método de extracción de factores del análisis factorial, se puede especificar que el análisis se aplique a una matriz de correlaciones o a una matriz de covarianzas. También se puede seleccionar a priori el número de factores que se desea extraer, o especificar alguna condición genérica que permita extraer sólo aquellos que verifiquen una determinada condición (usualmente se eligen aquellos factores cuyos autovalores sean superiores a la unidad). Se puede mostrar la solución factorial sin rotar, así como el gráfico de sedimentación (criterio gráfico para la posterior decisión del número de factores a extraer). Todas estas opciones se seleccionan en el mismo cuadro de opciones que el de la figura anterior, y que se presenta para mayor facilidad en la figura 05

13 FIGURA No.05 Si se pulsa en el botón Puntuaciones del cuadro de diálogo del análisis factorial, se comprueba que se pueden almacenar las puntuaciones factoriales obtenidas a partir del análisis factorial en el área de trabajo del fichero de datos, es decir, se puede añadir m nuevas variables que representen los m factores extraídos. La matriz de coeficientes de las puntuaciones factoriales muestra los coeficientes por los cuales se multiplican las variables para obtener las puntuaciones factoriales. Todo esto se puede ver en la figura 06

14 FIGURA No. 06 Los métodos de rotación que se pueden utilizar para clarificar la interpretación de los factores son los que aparecen en la siguiente figura, que se obtienen al pulsar en el botón de Rotación del cuadro de diálogo del análisis factorial:

15 Se aprecia que se puede elegir no rotar la solución inicial obtenida, o elegir alguno de los métodos de rotación que aparecen en las opciones del SPSS. Además, se pueden representar las variables observadas en función de los factores extraídos, si se solicitan los Gráficos de saturaciones. FIGURA No. 07

16 El SPSS muestra algunas opciones más, que hacen referencia a los posibles valores perdidos, y a la visualización de los resultados en la ventana del Visor de resultados. Esto se aprecia en la figura 08 FIGURA No. 08

17 APLICACAION PRACTICA Con el fichero de datos BASE-DATOS-CONCURSO.SAV, que corresponden a 48 candidatos que fueron evaluados sobre 9 criterios para un puesto en un Centro de Estudios Contables cuyas variables a incluir son: LUCIDEZ,CONFIANZA,NIVEL DE ESTUDIOS, SIMPATIA, HONESTIDAD, EXPERIENCIA, CARISMA, POTENCIAL, MOTIVACION. Dado que las correlaciones entre los criterios son importantes, es posible que la persona que entrevista a los candidatos haya confundido algunos criterios o que algunos sean redundantes, se hacen un análisis factorial de las variables latentes dentro del tema de análisis de componentes principales.

18 La base de datos en el SPSS se observa en el siguiente recuadro: FIGURA No. 09

19 Luego en la siguiente figura 10 procedemos a realizar nuestro análisis de componentes principales mediante el análisis factorial, según el proceso ya conocidos. FIGURA No. 10.

20 En la figura 11 se observan las variables que elegiremos para desarrollar nuestro ACP. Luego de seleccionadas nuestras variables, procedemos a elegir los Descriptivos que podemos ver en la figura 12. FIGURA No. 11

21 Entre los descriptivos que utilizaremos para el ACP se seleccionaron los siguientes: descriptivos univariados, solución inicial, matriz de coeficientes y el test KMO y prueba de esfericidad de Bartlett. Esto puede verse en la figura 12, y una vez elegidos los Descriptivos, basta presionar el botón continuar para proseguir con nuestro análisis. FIGURA No.12.

22 En la Figura 13 nos muestra la extracción de los coeficientes para nuestro ACP Si observamos detenidamente, el método es componentes principales que es uno de los métodos de analisis factorial que se puede emplear.. FIGURA No. 13

23 En la figura 14 presenta la opción Rotación, que básicamente podemos utilizar alguno de los siguientes métodos: Varimax, Oblimin directo, Quartimax, Equamax o Promax, o simplemente omitir dichos métodos con la opción de Ninguno. Cada uno de estos métodos tiene su aplicación, y dependerá del caso en el cuál se encuentre usted, para decidirse por uno u por otro método FIGURA No. 14

24 En el botón de Puntuaciones factoriales nos aparecen las opciones de guardar como variables y seleccionar un método factorial (Regresión,Barlett y Anderson-Rubin). En el caso nuestro, seleccionamos la opción de guardar como variables en nuestra base de datos, a través del método de Regresión. Cuando estamos listos, basta dar un clic en el botón de continuar y todo lo que hemos elegido queda guardado. FIGURA No. 15

25 El botón de opciones nos presenta varias alternativas, como podemos verlo en la figura 16, y presenta la forma de tratar los valores perdidos en nuestra base de datos. Las alternativas más comunes son: Excluir casos según lista, Excluir casos según pareja, y Reemplazar por la media FIGURA No. 16

26 Cuando ya tenemos previsto todo para nuestro ACP, entonces procedemos a dar clic en el botón Aceptar (ver figura 17) para el Programa SPSS comience a desarrollar todos los cálculos y nos presente los resultados en el visor de resultados. FIGURA No. 17

27 Este es el visor de resultados del SPSS, en donde muestra todos los cuadros, gráficos y resultados del análisis que le hemos solicitado efectúe, en nuestro caso, un Análisis Factorial a con el Método de Componentes Principales. El primer cuadro es el que presenta los estadísticos descriptivos, en donde se puede ver la media y desviación típica de cada una de las variables en estudio.

28 Las comunalidades aparecen al principio, y se puede comprobar que son muy altas (cercanas a 1), con lo cual se puede decir que las variables quedan muy bien explicadas a través de las componentes extraídas.

29 En el siguiente cuadro podemos comprobar el porcentaje de varianza explicada cada componente y cuáles son las componentes que han sido extraídas (aquellas cuyos autovalores superan la unidad, como se puede comprobar). Entre las dos componentes extraídas se acumula el 64,091% de la variabilidad de las variables originales. En otras palabras, de la totalidad o 100% del fenómeno estudiado, el componente 1 explica dicho fenómeno en un 48,435% y el componente 2 lo explica en un 15,655 entonces, si unimos los 2 componentes, se obtiene que el porcentaje que explican los dos componentes del fenómeno investigado es de %, o que la varianza total del fenómeno es explicada en un 64,091% por los componentes 1,y 2

30 El gráfico de sedimentación (herramienta gráfica para la decisión del número de componentes que hay que seleccionar) resulta ser: En esta figura se aprecia que la sel ección de dos componentes parece ser adecuada, pues a partir de la tercera componente no es muy acusada la pendiente de la representación gráfica de los autovalores.

31 La matriz de componentes que aparece en la salida del ordenador es la que se denomina matriz de cargas o saturaciones factoriales, y nos indican la carga de cada variable en cada factor, de modo que los factores con unos pesos factoriales más elevados en términos absolutos nos indican una relación estrecha con las variables, comparando las saturaciones relativas de cada variable en cada uno de los dos factores se observa que el primer factor esta constituido por las variables : Potencial, nivel de estudios simpatía, carisma y motivación y el resto de variables en el segundo factor.

32


Descargar ppt "ANALISIS DE COMPONENTES PRINCIPALES. Cuando afrontamos un Análisis Multivariante de datos, el escenario típico suele estar constituido por una masa de."

Presentaciones similares


Anuncios Google