Florence Nightingale
Transformaciones univariantes La asimetría y linealidad de las relaciones mejora con frecuencia al transformar las variables en logaritmos ¿Cuál es la métrica más simple: Europa: consumo se mide litros cada 100 KM EEUU: Km (millas) que hacemos con 1 litro (1galón) Es mejor x o 1/x? Decidir por simplicidad: simetría, relaciones lineales
INVEST Este conjunto de datos presenta 21 observaciones de 8 variables. Las observaciones corrsponden a los países de la OCDE y las variables son el número de publicaciones científicas recogidas en el trienio en ocho bases de datos de producción científica. Las variables se han llamado según la orientación de la base de datos: InterA(por interdisciplinaria), Inter F (por interdisciplinaria), Agric., Biolo., Medic., Quimic., Ingen. y Física.
Datos de Invest originales
Datos de invest en logaritmos
Proyecciones Proyectar una observación sobre una direccion definida Por un vector unitario es calcular una combinación lineal mediante el producto escalar: y= x’a = norma(x) norma(a) Coseno(a,x) Si norma(a) =1 entonces: y= x’a =norma(x) Coseno(a,x)=x 1 a 1 +x 2 a x k a k x a x’a
Proyecciones Proyectar sobre un plano definido por los vectores unitarios a 1 y a 2 es proyectar sobre cada uno de ellos Coordenas del punto x sobre el plano y 1 =a 1 ’x y 2 =a 2 ’x
P x =(a 1 ’x) x+ (a 2 ’x)x=[a 1 a 2 ] [a 1 a 2 ]’x=AA’x=Mx Proyectar es multiplicar por la matriz idempotente M que verifica MM=M, ya que A’A=I por la normalización
Transformaciones lineales
Datos Atípicos
Idea del método Buscar direcciones de proyección donde los datos sean tan poco normales como sea posible. Buscar atípicos sobre estas direcciones de proyección.
Kurtosis y heterogeneidad