Análisis Discriminante
Dos problemas principales de clasificación Discriminación (clasificación supervisada) Agrupamiento (Cluster Analysis) (clasificación no supervisada)
El problema estadístico de discriminación Dadas dos poblaciones de elementos con distribución conocida clasificar un nuevo elemento en una de las dos poblaciones
Ejemplos Clasificar: Restos de un cráneo como homínido o no Un solicitante de un crédito como solvente o no Un paciente con cáncer o no Una obra de arte al autor A o B. Diseño de máquinas de clasificación (para cartas, billetes,monedas, etc.)
Datos habituales Matriz de datos Elemento 1 Elemento 1 Elemento n2 Grupo A Grupo B
Análisis de genes
Identificación de rasgos .23 …. Identificar Rostro(pauta) Matriz Clasificar como conocido o no
Problemas de clasificación ? 4 100 euros? 1000 dracmas?
Planteamiento general
Costes
Caso particular: Poblaciones normales Tomando logaritmos, obtenemos la clasificación en P2
Interpretación de la regla: Simplificando lo que es común en ambos miembros quedan solo términos lineales en x
Probab. de error y a posteriori
Interpretación Clasificar en B B Clasificar en A A
Fisher Clasificar en población B Clasificar en A B A
Enfoque de Fisher
Varios grupos
ejemplo
Discriminación cuadrática
Clasificación logística
Problemas del modelo lineal No hay garantía de que las probabilidades estén entre cero y uno, pueden tomar valores negativos o mayores que uno. Es heterocedástico. Si estimamos el modelo lineal con variable de clasificación –1 +1 se obtiene la función lineal discriminante.
Otros enfoques: Redes neuronales Métodos no paramétricos Máquinas de vector soporte
redes neuronales Aproximar la función mediante
Máquinas de vector soporte