ANALISIS MULTIVARIADOS (Definiciones

Slides:



Advertisements
Presentaciones similares
Regresión Lineal Verificación de Supuestos
Advertisements

Análisis de Correspondencia
ANALISIS PARAMÉTRICOS
ESTADISTICA INFERENCIAL
Master en Recursos Humanos
DESCRIPCION DE SISTEMAS
Metodología.
4. Análisis de Correspondencias Múltiples
Elementos del Diseño de Experimentos y Análisis de la Varianza
Clasificación de variables
Bivariadas y Multivariadas
ANALISIS DE CONGLOMERADOS
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Estadística Descriptiva
TEMA III.
DEFINICIONES Y TERMINOLOGÍA
ANÁLISIS DISCRIMINANTE
Sistemas de ecuaciones
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
Distribuciones de frecuencias bidimensionales
FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES N. QUEIPO, S. PINTOS COPYRIGHT 2000 CLASIFICACIÓN NO SUPERVISADA.
Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Análisis de correlación.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
9 Regresión Lineal Simple
Estadística bidimensional
Análisis de Correlación y de Regresión lineal simple
Alumna: Joana Rojas Gallardo
ANALISIS DE DATOS CON EXCEL
ELEMENTOS DE ESTADÍSTICA BIVARIANTE
Clases 4 Pruebas de Hipótesis
Estadística aplicada al análisis financiero
Modelos Lineales Julio Di Rienzo
Especificación de Consultas M
ANÁLISIS DE CONGLOMERADOS
ANALISIS DE DATOS CATEGORICOS
Pronósticos, Series de Tiempo y Regresión
Tema 8: Análisis Multivariante. Conjunto de técnicas aplicables cuando se registran los valores de muchas variables (esencialmente numéricas, pero también.
Estadísticas en ecología de comunidades. Relación entre 2 variables.
Caso: Situación de las Comunidades Autónomas españolasen cuanto a indicadores de bienestar En el periódico “El País” del día 17 de enero de 2002 se publicó.
Tema 7: Regresión Simple y Múltiple. EJEMPLO: Aproxima bien el número de préstamos que efectúa una biblioteca a lo largo de su primer año de vida. Nos.
3. Análisis de Correspondencias Simples
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Método para evaluar valores y cualidades
Variables estadísticas bidimensionales
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Estadísticas en ecología de comunidades Páginas en Ruokolainen et al 2004.
Titular: Agustín Salvia
Estadísticas en ecología Páginas en Ruokolainen et al 2004.
Análisis de los Datos Cuantitativos
ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS
Regresión Lineal Simple
Aplicaciones Estadísticas a las Finanzas Clase 1
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Construcción de modelos con regresión y correlación
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
TEMA 3: Estadística Bidimensional.
TEMA : ANALISIS DE REGRESION
Introducción a la Inferencia Estadistica Dept. of Marine Science and Applied Biology Jose Jacobo Zubcoff.
TEMA 3: Estadística Bidimensoional.
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
Copyright © 2003 by The McGraw-Hill Companies, Inc. All rights reserved.
Tema 2: Estadística bidimensional
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
ESTADÍSTICA BIDIMENSIONAL
Transcripción de la presentación:

ANALISIS MULTIVARIADOS (Definiciones Dr. Roberto Mercado Hernández, Laboratorio de Estadística, México

ANALISIS MULTIVARIADOS (Definiciones) Es la relación (función) entre más de dos variables, donde una de ellas se asume como dependiente de las demás. Es el grado de asociación entre más de dos variables, donde no hay una variable dependiente de las otras. Regresión y Correlación Correlación canónica Es una técnica para estudiar las asociaciones entre dos conjuntos de variables. Ccorrelacionar simultaneamente varias variables dependientes y varias var. independientes Consiste en la extracción de relaciones entre categorías y define similaridades o disimilaridades entre ellas, lo que permitirá su agrupamiento si se detecta que se corresponden. Correspondencia (A F C) Es una técnica estadística de síntesis de la información, o reducción de la dimensión (número de variables). Es decir, ante un banco de datos con muchas variables, el objetivo será reducirlas a un menor número, perdiendo la menor cantidad de información posible. Los nuevos componentes principales o factores serán una combinación lineal de las variables originales, y además serán independientes entre sí. Componentes principales R M H Es un conjunto de técnicas que se utilizan para clasificar los objetos o casos en grupos relativamente homogéneos llamados conglomerados (clusters). Los objetos en cada grupo (conglomerado) tienden a ser similares entre sí (alta homogeneidad interna, dentro del cluster) y diferentes a los objetos de los otros grupos (alta heterogeneidad externa, ente clusters) Análisis Cluster Es una técnica multivariante de clasificación de individuos, en la que se presupone la existencia de dos o más grupos bien definidos a priori (por ejemplo, ejemplares de la misma especie en dos localidades diferentes, clientes solventes y no solventes; votantes de uno u otro partido; compradores y no compradores de un producto; etc) Análisis Discriminante

ANALISIS MULTIVARIADOS (Condiciones) Regresión En la relación de las variables independientes (todas con distribución normal), con la variable dependiente (también normal), se establece un error. En este análisis se ordenan los datos en una tabla disyuntiva completa (Z) que consta de un conjunto de individuos I=1,2,…n (filas), unconjunto de variables o caracteres cualitativos JI, …, JK,…, JQ (columnas) y un conjunto de modalidades excluyentes 1, …, mk para cada carácter cualitativo. Correspondencias (A F C) Los únicos requerimientos previos para la aplicación del ACP son: a) Continuidad en las variables. b) El número n de individuos o elementos observados debe ser mayor que el número p de variables originales. Por otra parte, el ACP tiene la ventaja de no exigir supuestos tales como la normalidad u homoscedasticidad. Componentes principales (ACP) R M H El AC es un objetivo metodológico para cuantificar las características de un conjunto de observaciones. Por ello, tiene fuertes propiedades matemáticas, pero no fundamentos estadísticos. Los requisitos de normalidad, linealidad y homocedasticidad (tan relevantes en otras técnicas), tienen poca consistencia en el AC. Análisis Cluster (AC) Es una técnica estadística de la rama del análisis multivariante, en la cual la variable dependiente es indicadora y no numérica como en el análisis de regresión. El modelo se construye basado en un set de observaciones para las cuales se conocen las clases. Este set de observaciones es algunas veces conocido como el training set. Análisis Discriminante

ANALISIS MULTIVARIADOS (a considerar) Regresión Correlación Es importante analizar la magnitud, sigo y significancia de los coeficientes. Su valor indica el grado de asociación entre las variables. Es centrado y el centro de gravedad de las modalidades de una variable coincide con el del conjunto J, y con el origen, las modalidades de cada variable están centradas en torno al origen, no pudiendo tener todas el mismo signo. Correspondencias (A F C) Un aspecto clave en ACP es la interpretación de los factores, ya que ésta no viene dada a priori, sino que será deducida tras observar la relación de los factores con las variables iniciales (habrá, pues, que estudiar tanto el signo como la magnitud de las correlaciones). Componentes Principales Asignan los casos a grupos diferenciados que el propio análisis configura, sin que unos dependan de otros. No jerárquicos R M H Análisis Cluster Aquéllos que configuran grupos con estructura arborescente, de forma que clusters de niveles más bajos van siendo englobados en otros de niveles superiores. Jerárquicos La pertenencia de cada caso del archivo patrón a uno u otro grupo, en función de las variables de su perfil, para comprobar su pertenencia. Explicar Análisis Discriminante A qué grupo más probable habrá de pertenecer un nuevo individuo del que únicamente se conoce su perfil de variables. Predecir

ANALISIS MULTIVARIADOS (Inercia = variación explicada) (Ecuaciones) Regresión Regresión múltiple Y = a0 + a1X1 + a2X2 + …. + apXp +ε Correspondencias (Inercia = variación explicada) Inercia debida a la modalidad J Inercia debida a una variable Inercia total Componentes principales R M H Primer componente principal Z1i = u1iX1i + u2iX2i + …. + u1pXpi Análisis Cluster Fórmula de Lance y Williams Dk(ij) = αiDki + αjDkj + βDij + γ│Dki - Dkj│ Análisis Discriminante Función discriminante de Fisher D1i = u1iX1 + u2iX2 + …. + ukiXk

EJEMPLO DE REGRESION Y CORRELACION MULTIPLE R M H Variables no significativas

EJEMPLO DE CORRELACION CANONICA R M H The canonical correlation measures the association between the discriminant scores and the groups.

EJEMPLO DE CORRSPONDENCIAS Frecuencias de pupas y larvas de dos especies encontradas en cadáveres en dos localidades. Resultados del análisis de correspondencias Cadáver Especie 1 Especie 2 Pupas Larvas Localidad A M. Natural 50 315 24 4012 M. P. Asesinato 9 40 6 459 Localidad B 41 147 14 1594 4 11 1 124 Categorías Coordenada 1 Coordenada 2 Hileras Loc. 1 M. natural (1) Loc. 1 M.P. asesinato (2) Loc. 2 M. natural (3) Loc. 2 M.P. asesinato (4) - 0.037 0.043 0.070 0.104 - 0.002 0.052 - 0.008 - 0.032 Columnas Sp. 1 pupas (5) Sp. 1 larvas (6) Sp. 2 pupas (7) Sp. 2 larvas (8) 0.350 0.060 0.202 - 0.012 - 0.045 - 0.001 0.180 0.000 R M H X2 = 19.11 gl = 9 p < 0.05 Inercia total = 0.0028 Los primeros dos eigenvalues comprenden el 95.5% de la inercia

Coordenada 2 Coordenada 1 0.2 0.05 0.01 0.0 -0.001 -0.002 -0.01 0.0 7 2 0.05 4 0.01 Coordenada 2 3 0.0 8 R M H 5 -0.001 6 1 -0.002 -0.01 0.0 0.1 0.2 0.3 0.4 Coordenada 1

EJEMPLO DE COMPONENTES PRINCIPALES R M H

EJEMPLO DE COMPONENTES PRINCIPALES (Localidad 1) R M H

Localidad 2 Localidad 3 R M H % of Variance = 94.84 in Component 1 l. pico Localidad 2 Localidad 3

EJEMPLO DE ANALISIS CLUSTER R M H

EJEMPLO DE ANALISIS DISCRIMINANTE R M H

R M H

LITERATURA Everitt, B. S. and Graham Dunn, 2001. Applied Multivariate data Analysis, Edt. ARNOLD Gnanadesikan, R., 1997. Methods for Statistical Data Analysis of Multivariate Observations, JOHN WILEY & SONS, INC. Johnson R. A. and Dean W. Wichern, 2002. Applied Multivariate Statistical Analysis, PRENTICE HALL. Kachigan, S. K., 1991. Multivariate Statistical Analysis, RADIUS PRESS, NY. Hair J. F., R. E. Anderson, R. L. Tatham y W. C. Black, 1999. PRENTICE HALL. Kleinbaum, D. G., L. L. Kupper, K. E. Muller and A. Nizam, 1998. Applied Regression Analysis and Other Multivariate Methods, DUXBURY PRESS.