ANALISIS DE COMPONENTES PRINCIPALES.

Slides:



Advertisements
Presentaciones similares
¿ Que es una muestra?.
Advertisements

ANOVA DE UN FACTOR.
Análisis de Correspondencia
BUENAS TARDES.
ANÁLISIS DE CONGLOMERADOS
4. ANÁLISIS FACTORIAL Introducción Modelo factorial ortogonal
Correlaciones bivariadas y correlaciones parciales
Técnicas para el análisis de datos en el enfoque cuantitativo
Introducción En toda investigación, y antes de extraer conclusiones acerca de los objetivos e hipótesis planteados, es necesario llevar a cabo un análisis.
Cluster.
Modelos de Variable Dependiente Binaria -Logit y Probit-
*Estadística: La estadística es una herramienta básica para la investigación empírica que ayuda a conocer la realidad de manera “objetiva”. En la disciplina.
Master en Recursos Humanos
Estimación de los Errores de Muestreo Encuestas de Salud Reproductiva   RHS Usando SPSS 19.
¿Qué alcances puede tener el proceso de investigación cuantitativa:
KRIGING.
TALLER DE TRABAJO FINAL
ANALISIS DE CONGLOMERADOS
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
ANÁLISIS DISCRIMINANTE
TUTORIAL SPSS Comparación de medias con el Paquete Estadístico para las Ciencias Sociales Unidad 4.
Muestra: Recolección de Datos: Análisis de Datos:
Problema de la medición en Psicología
Metodología de la investigación
MUESTRA Implica DEFINIR la unidad de análisis (personas, situaciones, individuos, eventos, fenómeno, ensayo)
Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Análisis de correlación.
CONTRASTE Y VALIDACIÓN DE UN MODELO
Estadística aplicada al análisis financiero
Eficiencia en los diseños factoriales
Tema 8: Análisis Multivariante. Conjunto de técnicas aplicables cuando se registran los valores de muchas variables (esencialmente numéricas, pero también.
Mt. Martín Moreyra Navarrete.
Descomposición Factorial Unidad 5
Caso: Situación de las Comunidades Autónomas españolasen cuanto a indicadores de bienestar En el periódico “El País” del día 17 de enero de 2002 se publicó.
GRÁFICOS ESTADÍSTICOS
Métodos de calibración: regresión y correlación
INTRODUCCIÒN A LA INVESTIGACIÓN TRABAJO No. 3
A NALISIS F ACTORIAL Capitulo 15 spss para windows.
Titular: Agustín Salvia
Enfoque cuantitativo y Enfoque cualitativo
Seminario de Titulación (9) Mtra. Marcela Alvarez.
Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.
ANÁLISIS DE COMPONENTES PRINCIPALES. Introducción Partiendo de un conjunto de variables, y mediante transformaciones lineales, queremos llegar a otro.
Método para evaluar valores y cualidades
Tema 5: Numéricas en varios grupos
Límites y Continuidad.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
 Introducción  Modelo factorial ortogonal  Construcción del modelo factorial: método de componentes principales  Construcción del modelo factorial:
3. COMPONENTES PRINCIPALES
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE QUÍMICA Seminario de investigación en Ciencias de la Administración Formulación de hipótesis y.
Análisis de componentes principales
Research Methods Tipos de investigacion Dra. Millie L. Gonzalez.
Titular: Agustín Salvia
TIPOS DE INVESTIGACION
De constructo, de criterio, de contenido.
Validez Una cosa es que el test mida de manera precisa o estable (esta cualidad se refiere a su fiabilidad), y otra diferente es la cuestión de qué es.
CASO II: Tamaño muestral grande (n > 30) cuando es desconocido Se sabe que para n>30 la distribución t de Student se aproxima a la distribución N(0;1)*.
Análisis de los Datos Cuantitativos
ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS
Regresión Lineal Simple
Aplicaciones Estadísticas a las Finanzas Clase 1
RIESGO, RENDIMIENTO Y VALOR
MEDIDAS DE TENDENCIA CENTRAL
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
Capítulo 10 Análisis de los datos.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Pruebas paramétricas y no paramétricas
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Transcripción de la presentación:

ANALISIS DE COMPONENTES PRINCIPALES. Cuando afrontamos un Análisis Multivariante de datos, el escenario típico suele estar constituido por una masa de datos generalmente grande no sólo porque suele proceder de muchos individuos (muchos casos), sino también porque sobre cada uno de esos individuos se suele medir un número sustancial de variables. Las técnicas factoriales pretenden, desde sus diferentes enfoques, abordar el problema de simplificar la interpretación del comportamiento observado de los datos

El siguiente ejemplo ilustrativo corresponden a 48 candidatos que fueron evaluados sobre 15 criterios para un puesto de trabajo en un Centro Contable. Nivel de estudios , Simpatía, confianza en si mismo, lucidez, honestidad, sentido comercial, experiencia, carisma, y ambición. Ya en una primera aproximación podemos comprobar la dificultad de visualizar esta información de manera completa. Una representación grafica en tres dimensiones.  

Así, el Análisis de Componentes Principales simplemente se pregunta por cuántas y cuáles serán esas pocas variables que nos permitirían resumir la diversidad de las evalusciones observadas con la menor pérdida de información posible. Por su parte, el Análisis Factorial presupone la existencia de un número pequeño de variables no observables o latentes (factores) que serían la causa de las evaluacones observadas y que trata de identificar

  Para el autor César Pérez López, “el Análisis de Componentes Principales es una técnica de análisis estadístico Multivariante que se clasifica entre los métodos de simplificación o reducción de la dimensión y que se aplica cuando se dispone de un conjunto elevado de variables con datos cuantitativos persiguiendo obtener un menor número de variables, combinación lineal de las primitivas, que se denominan componentes principales o factores, cuya posterior interpretación permitirá un análisis más simple del problema estudiado

INTERPRETACIÓN DE LAS COMPONENTES PRINCIPALES La problemática de la interpretación de las componentes principales es, nada más y nada menos, tratar de asignar un significado inteligible y útil a las componentes principales obtenidas. Para ello se recurre a examinar la relación existente entre las componentes principales y las variables originales (u otras auxiliares), para por medio de esta relación tratar de darles un contenido a su significado, para lo que la información básica para esta tarea es la matriz de correlaciones entre las componentes principales y las variables originales, que toman en este ámbito el nombre de matriz de estructura. Ahora pasemos a desarrollar un ejemplo práctico haciendo uso del Programa SPSS.  

En el SPSS, el procedimiento que permite realizar el análisis factorial se encuentran en el submenú Reducción de datos del menú Analizar FIGURA No. 01

En la figura 02 se observan las opciones que nos brinda un ACP En la figura 02 se observan las opciones que nos brinda un ACP. Pasemos a revisar cada una de dichas opciones. FIGURA No. 02  

Una vez ingresado las variables , y Si damos clic en la opción “Descriptivos”, se obtiene el siguiente recuadro. FIGURA No. 03

La figura 3 muestra los Descriptivos que podemos elegir en nuestro modelo de componentes principales. En dicha opción se pueden solicitar una serie de medidas de resumen para cada variable, la solución inicial (comunalidades, autovalores y porcentaje de varianza explicada por cada factor), así como algunos estadísticos que permiten comprobar la adecuación de la muestra al análisis factorial. Desde un punto de vista práctico, la prueba de esfericidad de Bartlett contrasta si la matriz de correlaciones es una matriz identidad, lo cual indicaría que el modelo factorial es inadecuado.

La medida de la adecuación muestral de Kaiser-Meyer-Olkin (Coeficiente KMO) contrasta si las correlaciones parciales entre las variables son pequeñas, toma valores entre 0 y 1, e indica que el análisis factorial es tanto más adecuado cuanto mayor sea su valor. Así, Kaiser propuso en 1974 el siguiente criterio para decidir sobre la adecuación del análisis factorial de un conjunto de datos:   0,9<KMO1,0 = Excelente adecuación muestral. 0,8<KMO0,9 = Buena adecuación muestral. 0,7<KMO0,8 = Aceptable adecuación muestral. 0,6<KMO0,7 = Regular adecuación muestral. 0,5<KMO0,6 = Mala adecuación muestral. 0,0<KMO0,5 = Adecuación muestral inaceptable

En cuanto al método de extracción (botón Extracción), las opciones que presenta SPSS son las que aparecen en la siguiente figura: FIGURA No. 04    

Como se observa, los métodos de extracción de factores que realiza el SPSS son los de las componentes principales, máxima verosimilitud, mínimos cuadrados no ponderados, y algunos más que no hemos estudiado Volviendo a las opciones que presenta el método de extracción de factores del análisis factorial, se puede especificar que el análisis se aplique a una matriz de correlaciones o a una matriz de covarianzas. También se puede seleccionar a priori el número de factores que se desea extraer, o especificar alguna condición genérica que permita extraer sólo aquellos que verifiquen una determinada condición (usualmente se eligen aquellos factores cuyos autovalores sean superiores a la unidad). Se puede mostrar la solución factorial sin rotar, así como el gráfico de sedimentación (criterio gráfico para la posterior decisión del número de factores a extraer). Todas estas opciones se seleccionan en el mismo cuadro de opciones que el de la figura anterior, y que se presenta para mayor facilidad en la figura 05  

FIGURA No.05 Si se pulsa en el botón Puntuaciones del cuadro de diálogo del análisis factorial, se comprueba que se pueden almacenar las puntuaciones factoriales obtenidas a partir del análisis factorial en el área de trabajo del fichero de datos, es decir, se puede añadir m nuevas variables que representen los m factores extraídos. La matriz de coeficientes de las puntuaciones factoriales muestra los coeficientes por los cuales se multiplican las variables para obtener las puntuaciones factoriales. Todo esto se puede ver en la figura 06

FIGURA No. 06 Los métodos de rotación que se pueden utilizar para clarificar la interpretación de los factores son los que aparecen en la siguiente figura, que se obtienen al pulsar en el botón de Rotación del cuadro de diálogo del análisis factorial:

Se aprecia que se puede elegir no rotar la solución inicial obtenida, o elegir alguno de los métodos de rotación que aparecen en las opciones del SPSS. Además, se pueden representar las variables observadas en función de los factores extraídos, si se solicitan los Gráficos de saturaciones. FIGURA No. 07  

El SPSS muestra algunas opciones más, que hacen referencia a los posibles valores perdidos, y a la visualización de los resultados en la ventana del Visor de resultados. Esto se aprecia en la figura 08   FIGURA No. 08

APLICACAION PRACTICA Con el fichero de datos BASE-DATOS-CONCURSO.SAV, que corresponden a 48 candidatos que fueron evaluados sobre 9 criterios para un puesto en un Centro de Estudios Contables cuyas variables a incluir son: LUCIDEZ,CONFIANZA,NIVEL DE ESTUDIOS, SIMPATIA, HONESTIDAD, EXPERIENCIA, CARISMA, POTENCIAL, MOTIVACION. Dado que las correlaciones entre los criterios son importantes , es posible que la persona que entrevista a los candidatos haya confundido algunos criterios o que algunos sean redundantes , se hacen un análisis factorial de las variables latentes dentro del tema de análisis de componentes principales.

La base de datos en el SPSS se observa en el siguiente recuadro: FIGURA No. 09

Luego en la siguiente figura 10 procedemos a realizar nuestro análisis de componentes principales mediante el análisis factorial , según el proceso ya conocidos. FIGURA No. 10.

En la figura 11 se observan las variables que elegiremos para desarrollar nuestro ACP. Luego de seleccionadas nuestras variables, procedemos a elegir los “Descriptivos” que podemos ver en la figura 12. FIGURA No. 11

Entre los descriptivos que utilizaremos para el ACP se seleccionaron los siguientes: descriptivos univariados, solución inicial, matriz de coeficientes y el test KMO y prueba de esfericidad de Bartlett. Esto puede verse en la figura 12, y una vez elegidos los Descriptivos, basta presionar el botón “continuar” para proseguir con nuestro análisis. FIGURA No.12.  

En la Figura 13 nos muestra la extracción de los coeficientes para nuestro ACP Si observamos detenidamente, el método es componentes principales que es uno de los métodos de analisis factorial que se puede emplear.. FIGURA No. 13

En la figura 14 presenta la opción “Rotación”, que básicamente podemos utilizar alguno de los siguientes métodos: Varimax, Oblimin directo, Quartimax, Equamax o Promax, o simplemente omitir dichos métodos con la opción de Ninguno. Cada uno de estos métodos tiene su aplicación, y dependerá del caso en el cuál se encuentre usted, para decidirse por uno u por otro método FIGURA No. 14

En el botón de “Puntuaciones factoriales” nos aparecen las opciones de guardar como variables y seleccionar un método factorial (Regresión,Barlett y Anderson-Rubin). En el caso nuestro, seleccionamos la opción de guardar como variables en nuestra base de datos, a través del método de Regresión. Cuando estamos listos, basta dar un clic en el botón de “continuar” y todo lo que hemos elegido queda guardado . FIGURA No. 15  

El botón de “opciones” nos presenta varias alternativas, como podemos verlo en la figura 16, y presenta la forma de tratar los valores perdidos en nuestra base de datos. Las alternativas más comunes son: Excluir casos según lista, Excluir casos según pareja, y Reemplazar por la media FIGURA No. 16

Cuando ya tenemos previsto todo para nuestro ACP, entonces procedemos a dar clic en el botón “Aceptar” (ver figura 17) para el Programa SPSS comience a desarrollar todos los cálculos y nos presente los resultados en el visor de resultados. FIGURA No. 17

Este es el visor de resultados del SPSS, en donde muestra todos los cuadros, gráficos y resultados del análisis que le hemos solicitado efectúe, en nuestro caso, un Análisis Factorial a con el Método de Componentes Principales. El primer cuadro es el que presenta los estadísticos descriptivos, en donde se puede ver la “media” y “desviación típica” de cada una de las variables en estudio.  

Las comunalidades aparecen al principio, y se puede comprobar que son muy altas (cercanas a 1), con lo cual se puede decir que las variables quedan muy bien explicadas a través de las componentes extraídas.  

En el siguiente cuadro podemos comprobar el porcentaje de varianza explicada cada componente y cuáles son las componentes que han sido extraídas (aquellas cuyos autovalores superan la unidad, como se puede comprobar). Entre las dos componentes extraídas se acumula el 64,091% de la variabilidad de las variables originales. En otras palabras, de la totalidad o 100% del fenómeno estudiado, el componente 1 explica dicho fenómeno en un 48,435% y el componente 2 lo explica en un 15,655 entonces, si unimos los 2 componentes, se obtiene que el porcentaje que explican los dos componentes del fenómeno investigado es de 82.599%, o que la varianza total del fenómeno es explicada en un 64,091% por los componentes 1 ,y 2

En esta figura se aprecia que la sel ección de dos componentes parece ser adecuada, pues a partir de la tercera componente no es muy acusada la pendiente de la representación gráfica de los autovalores. El gráfico de sedimentación (herramienta gráfica para la decisión del número de componentes que hay que seleccionar) resulta ser:    

La matriz de componentes que aparece en la salida del ordenador es la que se denomina matriz de cargas o saturaciones factoriales, y nos indican la carga de cada variable en cada factor, de modo que los factores con unos pesos factoriales más elevados en términos absolutos nos indican una relación estrecha con las variables, comparando las saturaciones relativas de cada variable en cada uno de los dos factores se observa que el primer factor esta constituido por las variables : Potencial, nivel de estudios simpatía, carisma y motivación y el resto de variables en el segundo factor.