La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

ANALISIS MULTIVARIADOS (Definiciones

Presentaciones similares


Presentación del tema: "ANALISIS MULTIVARIADOS (Definiciones"— Transcripción de la presentación:

1 ANALISIS MULTIVARIADOS (Definiciones
Dr. Roberto Mercado Hernández, Laboratorio de Estadística, México

2 ANALISIS MULTIVARIADOS
(Definiciones) Es la relación (función) entre más de dos variables, donde una de ellas se asume como dependiente de las demás. Es el grado de asociación entre más de dos variables, donde no hay una variable dependiente de las otras. Regresión y Correlación Correlación canónica Es una técnica para estudiar las asociaciones entre dos conjuntos de variables. Ccorrelacionar simultaneamente varias variables dependientes y varias var. independientes Consiste en la extracción de relaciones entre categorías y define similaridades o disimilaridades entre ellas, lo que permitirá su agrupamiento si se detecta que se corresponden. Correspondencia (A F C) Es una técnica estadística de síntesis de la información, o reducción de la dimensión (número de variables). Es decir, ante un banco de datos con muchas variables, el objetivo será reducirlas a un menor número, perdiendo la menor cantidad de información posible. Los nuevos componentes principales o factores serán una combinación lineal de las variables originales, y además serán independientes entre sí. Componentes principales R M H Es un conjunto de técnicas que se utilizan para clasificar los objetos o casos en grupos relativamente homogéneos llamados conglomerados (clusters). Los objetos en cada grupo (conglomerado) tienden a ser similares entre sí (alta homogeneidad interna, dentro del cluster) y diferentes a los objetos de los otros grupos (alta heterogeneidad externa, ente clusters) Análisis Cluster Es una técnica multivariante de clasificación de individuos, en la que se presupone la existencia de dos o más grupos bien definidos a priori (por ejemplo, ejemplares de la misma especie en dos localidades diferentes, clientes solventes y no solventes; votantes de uno u otro partido; compradores y no compradores de un producto; etc) Análisis Discriminante

3 ANALISIS MULTIVARIADOS
(Condiciones) Regresión En la relación de las variables independientes (todas con distribución normal), con la variable dependiente (también normal), se establece un error. En este análisis se ordenan los datos en una tabla disyuntiva completa (Z) que consta de un conjunto de individuos I=1,2,…n (filas), unconjunto de variables o caracteres cualitativos JI, …, JK,…, JQ (columnas) y un conjunto de modalidades excluyentes 1, …, mk para cada carácter cualitativo. Correspondencias (A F C) Los únicos requerimientos previos para la aplicación del ACP son: a) Continuidad en las variables. b) El número n de individuos o elementos observados debe ser mayor que el número p de variables originales. Por otra parte, el ACP tiene la ventaja de no exigir supuestos tales como la normalidad u homoscedasticidad. Componentes principales (ACP) R M H El AC es un objetivo metodológico para cuantificar las características de un conjunto de observaciones. Por ello, tiene fuertes propiedades matemáticas, pero no fundamentos estadísticos. Los requisitos de normalidad, linealidad y homocedasticidad (tan relevantes en otras técnicas), tienen poca consistencia en el AC. Análisis Cluster (AC) Es una técnica estadística de la rama del análisis multivariante, en la cual la variable dependiente es indicadora y no numérica como en el análisis de regresión. El modelo se construye basado en un set de observaciones para las cuales se conocen las clases. Este set de observaciones es algunas veces conocido como el training set. Análisis Discriminante

4 ANALISIS MULTIVARIADOS (a considerar)
Regresión Correlación Es importante analizar la magnitud, sigo y significancia de los coeficientes. Su valor indica el grado de asociación entre las variables. Es centrado y el centro de gravedad de las modalidades de una variable coincide con el del conjunto J, y con el origen, las modalidades de cada variable están centradas en torno al origen, no pudiendo tener todas el mismo signo. Correspondencias (A F C) Un aspecto clave en ACP es la interpretación de los factores, ya que ésta no viene dada a priori, sino que será deducida tras observar la relación de los factores con las variables iniciales (habrá, pues, que estudiar tanto el signo como la magnitud de las correlaciones). Componentes Principales Asignan los casos a grupos diferenciados que el propio análisis configura, sin que unos dependan de otros. No jerárquicos R M H Análisis Cluster Aquéllos que configuran grupos con estructura arborescente, de forma que clusters de niveles más bajos van siendo englobados en otros de niveles superiores. Jerárquicos La pertenencia de cada caso del archivo patrón a uno u otro grupo, en función de las variables de su perfil, para comprobar su pertenencia. Explicar Análisis Discriminante A qué grupo más probable habrá de pertenecer un nuevo individuo del que únicamente se conoce su perfil de variables. Predecir

5 ANALISIS MULTIVARIADOS (Inercia = variación explicada)
(Ecuaciones) Regresión Regresión múltiple Y = a0 + a1X1 + a2X2 + …. + apXp +ε Correspondencias (Inercia = variación explicada) Inercia debida a la modalidad J Inercia debida a una variable Inercia total Componentes principales R M H Primer componente principal Z1i = u1iX1i + u2iX2i + …. + u1pXpi Análisis Cluster Fórmula de Lance y Williams Dk(ij) = αiDki + αjDkj + βDij + γ│Dki - Dkj│ Análisis Discriminante Función discriminante de Fisher D1i = u1iX1 + u2iX2 + …. + ukiXk

6 EJEMPLO DE REGRESION Y CORRELACION MULTIPLE
R M H Variables no significativas

7 EJEMPLO DE CORRELACION CANONICA
R M H The canonical correlation measures the association between the discriminant scores and the groups.

8 EJEMPLO DE CORRSPONDENCIAS
Frecuencias de pupas y larvas de dos especies encontradas en cadáveres en dos localidades. Resultados del análisis de correspondencias Cadáver Especie 1 Especie 2 Pupas Larvas Localidad A M. Natural 50 315 24 4012 M. P. Asesinato 9 40 6 459 Localidad B 41 147 14 1594 4 11 1 124 Categorías Coordenada 1 Coordenada 2 Hileras Loc. 1 M. natural (1) Loc. 1 M.P. asesinato (2) Loc. 2 M. natural (3) Loc. 2 M.P. asesinato (4) 0.043 0.070 0.104 0.052 Columnas Sp. 1 pupas (5) Sp. 1 larvas (6) Sp. 2 pupas (7) Sp. 2 larvas (8) 0.350 0.060 0.202 0.180 0.000 R M H X2 = gl = 9 p < 0.05 Inercia total = Los primeros dos eigenvalues comprenden el 95.5% de la inercia

9 Coordenada 2 Coordenada 1 0.2 0.05 0.01 0.0 -0.001 -0.002 -0.01 0.0
7 2 0.05 4 0.01 Coordenada 2 3 0.0 8 R M H 5 -0.001 6 1 -0.002 -0.01 0.0 0.1 0.2 0.3 0.4 Coordenada 1

10 EJEMPLO DE COMPONENTES PRINCIPALES
R M H

11 EJEMPLO DE COMPONENTES PRINCIPALES (Localidad 1)
R M H

12 Localidad 2 Localidad 3 R M H % of Variance = 94.84 in Component 1
l. pico Localidad 2 Localidad 3

13 EJEMPLO DE ANALISIS CLUSTER
R M H

14 EJEMPLO DE ANALISIS DISCRIMINANTE
R M H

15 R M H

16 LITERATURA Everitt, B. S. and Graham Dunn, Applied Multivariate data Analysis, Edt. ARNOLD Gnanadesikan, R., Methods for Statistical Data Analysis of Multivariate Observations, JOHN WILEY & SONS, INC. Johnson R. A. and Dean W. Wichern, Applied Multivariate Statistical Analysis, PRENTICE HALL. Kachigan, S. K., Multivariate Statistical Analysis, RADIUS PRESS, NY. Hair J. F., R. E. Anderson, R. L. Tatham y W. C. Black, PRENTICE HALL. Kleinbaum, D. G., L. L. Kupper, K. E. Muller and A. Nizam, Applied Regression Analysis and Other Multivariate Methods, DUXBURY PRESS.


Descargar ppt "ANALISIS MULTIVARIADOS (Definiciones"

Presentaciones similares


Anuncios Google