Taller 2. Medición de distancia entre variables y sujetos

Slides:



Advertisements
Presentaciones similares
Análisis de Correspondencia
Advertisements

ANALISIS PARAMÉTRICOS
Tema 4: Medidas de posición individual.
Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.
U UNIVERSIDAD DE QUINTANA ROO
Lic. Cristian R. Arroyo López
Riesgo de Mercado Diplomado de Especialización en Riesgo.
Regresión mínimo cuadrada (I)
Estadística Unidad III
ESTADISTICA INFERENCIAL
Valores y Vectores Propios
Variable Aleatoria Continua. Principales Distribuciones
4. Análisis de Correspondencias Múltiples
Bivariadas y Multivariadas
Estadística: -Correlación y regresión
KRIGING.
PROPIEDADES ESTADÍSTICAS DE LOS ESTIMADORES
MODELO DE REGRESIÓN MÚLTIPLE
Longitud de arco..
Introducción a la Estadística. Modelos de regresión
MEDICIÓN Hebe Alicia Cadaval.
METODOLOGIA DE LA INVESTIGACION EDUCATIVA I
TEMA III.
ANÁLISIS DISCRIMINANTE
Transformaciones de variables aleatorias
Medidas de Dispersión Estadística E.S.O.
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
Distribuciones de frecuencias bidimensionales
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
La lógica de covarianza
Facultad: Turismo Y Hotelería
PROBLEMAS ECONOMETRICOS
CORRELACION Y REGRESION LINEAL: Introducción
3. Funciones discriminantes para la f.d.p normal.
Vectores Aleatorios 1 Distribución conjunta de un vector aleatorio
Reconocimiento de Patrones
ESTADISTICA. Liney Niño Carvajal Astrid Viviana Montaña Bello.
Caso: Situación de las Comunidades Autónomas españolasen cuanto a indicadores de bienestar En el periódico “El País” del día 17 de enero de 2002 se publicó.
Alimento para cerdos Objetivo del experiento:
Varianza.
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
3. Análisis de Correspondencias Simples
Medidas de Dispersión Varianza
Titular: Agustín Salvia
Estadística bidimensional
INDICADORES Elaborado por: Martha B. Luna Alfaro
Inferencia Estadística
Herramientas básicas.
Estimador de Efectos Fijos
Método para evaluar valores y cualidades
Variables estadísticas bidimensionales
ANÁLISIS MULTIVARIANTE
3. COMPONENTES PRINCIPALES
Análisis de componentes principales
Distribuciones de probabilidad bidimensionales o conjuntas
Medidas de similaridad y distancia Capítulo 6 de McCune y Grace 2002, y páginas de Ruokolainen et al
coeficientes de correlación de
Aplicaciones Estadísticas a las Finanzas Clase 1
Variables estadísticas bidimensionales
Septiembre 2009 Mtra. Laura Myriam Franco Sánchez.
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Medidas de similaridad y distancia
UNIDAD IV Regresión y correlación lineal
DEFINICIÓN DE NORMALIDAD MEDIDAS DE DESCRIPCIÓN DE DATOS
Coeficiente de variación
7. Distribución normal Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
Licenciatura en Psicopedagogía: Métodos, Diseños y Técnicas de Investigación Psicológica Tema 9 Fiabilidad de las puntuaciones.
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Transcripción de la presentación:

Taller 2. Medición de distancia entre variables y sujetos

Analizar la información de una tabla de datos «individuos x variables cuantitativas». Calcular en Excel

Crear la matriz varianza covarianza teniendo en cuenta la base de datos en Excel

Evaluar la semejanza entre los individuos a través de los atributos La comparación de dos individuos i y j es evaluada con la distancia euclidiana clásica entre i y j. Realizar la comparación de Departamento según clasificación por población, en Excel

Relación entre las variables de la Tabla de Datos Las variables k y p es evaluada con el coeficiente de correlación Realizar correlación entre variable. % N.B.I. & Industria, Comercio, Servicios, Otras Act. Económicas, Unidades Auxiliares Tipo Gerencia, Unidades Auxiliares Diferentes de Gerencia, Desocupada, en Excel

Criterios basados en distancias como indicadores de disimilaridad Distancia o disimilaridad entre dos individuos i y j a una medida, indicada por d(i,j) , que mide el grado de semejanza, o a mejor decir de desemejanza, entre ambos objetos o individuos, en relación a un cierto número de características cuantitativa y / o cualitativas. El valor de d(i,j) es siempre un valor no negativo, y cuanto mayor sea este valor mayor será la diferencia entre los individuos i y j.

propiedades: (P.1) d(i,j) > 0 (no negatividad) (P.2) d(i,i) = 0 (P.3) d(i,j) = d(j,i) (simetría)

DISTANCIA EUCLIDEA La distancia "ordinaria" (que se mediría con una regla) entre dos puntos de un espacio euclídeo, la cual se deduce a partir del teorema de Pitágoras. Se utiliza cuando las variables sean homogéneas y estén medidas en unidades similares y/o cuando se desconozca la matriz de varianzas.

Espacio bidimensional , la distancia euclidiana entre dos puntos P1 y P2, de coordenadas (x1, y1) y (x2, y2) respectivamente, es:

la distancia euclidiana entre los puntos y del espacio euclídeo n-dimensional, se define como:

Inconvenientes de la distancia Euclidiana: Es una distancia sensible a las unidades de medida de las variables: las diferencias entre los valores de variables medidas con valores altos contribuirán en mucha mayor medida que las diferencias entre los valores de las variables con valores bajos. Como consecuencia de ello, los cambios de escala determinarán, también, cambios en la distancia entre los individuos. Una posible vía de solución de este problema es la tipificación previa de las variables, o la utilización de la distancia euclídea normalizada.

DISTANCIA EUCLIDEA NORMALIZADA procesar la información para que dos conjuntos diferentes en dimensión de datos sean comparables

Transformación de la Matriz de Datos Matriz X Matriz Z

Si las variables utilizadas están correlacionadas, estas variables nos darán una información, en gran medida redundante. Parte de las diferencias entre los valores individuales de algunas variables podrían explicarse por las diferencias en otras variables. Como consecuencia de ello la distancia euclídea inflará la disimilaridad o divergencia entre los individuos. Solución 1: componentes principales (que están incorrelacionadas) en vez de las variables originales. Solución 2: Utilización de la distancia de Mahalanobis.

DISTANCIA DE MAHALANOBIS es una forma de determinar la similitud entre dos variables aleatorias multidimensionales. la distancia entre dos variables aleatorias con la misma distribución de probabilidad y con matriz de covarianza Σ se define como:

Propiedades como distancia Semipositividad: además La distancia entre dos puntos de las mismas coordenadas es cero, y si tienen coordenadas distintas la distancia es positiva, pero nunca negativa. Simetría: Desigualdad triangular: