Razonamiento basado en memoria Teoría Tema 13 Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Funcionamiento Almacenar los registros pre-clasificados Para un registro nuevo, encontrar los vecinos más cercanos Utilizar los vecinos para decidir qué valor asignarle al nuevo registro Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Vecino Distancia Peso Códigos 1 0.076 0.924 R/FE, R/CA, R/CO 2 0.346 0.654 R/FE, R/JA, R/CA 3 0.369 0.631 R/FE, R/JA, R/MI 4 0.393 0.607 Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Código 1 2 3 4 Score R/CA 0.924 0.645 0.607 2.176 R/CO R/FE 0.654 0.631 2.816 R/JA 1.892 R/MI Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Requerimientos de variables Una variable “target” Binaria, nominal o intervalo Ordinal debe ser convertida a intervalo Variables “input” Numéricas, ortogonales y estandarizadas Utilizar el nodo “Princomp/Dmneural” para obtener una descomposición mediante valores principales Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Creación de un archivo de entrenamiento Número similar de registros para cada clase de la variable “target” Docenas de ejemplos mejor si son cientos o miles Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Pocos registros mejora eficiencia Muchos registros baja efi- ciencia Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Fortalezas Resultados son fácilmente entendibles No son reglas del tipo if-then Sino del tipo se hace esta predicción considerando los resultados de estos registros los cuales son muy parecidos al nuevo Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Fortalezas Funciona bien con cualquier número de variables El rendimiento del razonamiento basado en memoria depende más del conjunto de datos de adiestramiento que en el número de variables Ventaja sobre rede neuronales y regresión Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Debilidades Computacionalmente costoso a la hora del “scoring” Encontrar los vecinos más cercanos es computacionalmente costoso si el conjunto de adiestramiento es muy grande Árboles de decisión y redes neuronales no utilizan el conjunto de adiestramiento a la hora de hacer el “scoring” Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Debilidades Dependencia de la función de distancia, de la función de combinación y del número de vecinos Resultados dependen de estos parámetros Minería de datos Dr. Francisco J. Mata
Razonamiento basado en memoria Cuando utilizarlo Cuando los patrones en los datos son muchos y muy locales y reglas y funciones globales no tienen sentido Ejemplo: ¿Por qué clientes dejan de comprar de un catálogo? Nuevos almacenes se abren en el vecindario Están inundados de otros catálogos Pierden el trabajo, etc. Cuando no utilizarlo Cuando hay pocas razones para algo y reglas son globales Ejemplo: ¿Por qué clientes compran en diciembre? Para dar regalos Minería de datos Dr. Francisco J. Mata