Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.

Slides:



Advertisements
Presentaciones similares
IBD Plan 90 y 2003 Clase 10.
Advertisements

TESTS METODOLOGÍA. 1.- El MÉTODO CIENTÍFICO es: –A) el sujeto de la investigación –B) el objeto de la investigación –C) el nexo de unión entre el sujeto.
SISTEMAS II CICLO DE VIDA.
Data Mining Minería de Datos Universidad Tecnológica Metropolitana
Metodología de Trabajo
ESTUDIOS DE LINEA DE BASE Metodologías Participativas II Reunión Anual de la Red Latinpapa Cochabamba-Bolivia, 25 al 28 Febrero del 2009 Grupo de impacto.
“Planificación de Aplicaciones Web”
“Diseño de páginas Web”
Jacqueline Chávez Cuzcano
Vera Olivera, David Carlos Marín Rosales, Nicolae Harry
Liz Mirian Mayhuay Tarazona
Mariano Alcántara Eduardo
Reconocimiento de Patrones Faciales para la verificar la
SISTEMA PROTOTIPO DE ENTRENAMIENTO PEDIATRA PARA EL PROCESO DE ADAPTACIÓN NEONATAL (Avance Propuesta) Maestría en Ingeniería de Sistemas y Computación.
1 VIII CONGRESO NACIONAL DE CIENCIAS Y ESTUDIOS SOCIALES Universidad Earth Guácimo, Limón, Costa Rica Agosto 25 de 2006 Juan Carlos López G. Editor EDUTEKA.
El estudio de Casos en la Investigación Cualitativa
David Díez, Camino Fernández, Juan Manuel Dodero
TIBERIUS Predictive Modelling Software
Introducción a la minería de datos
Metodología de la Investigación Social
Validación de Requerimientos
DATA MINING MINERIA DE DATOS Gersom Costas.
UNIDAD III: Semana No. 23 MARCO METODOLÓGICO
Ejemplo Grafico.
SISTEMAS II CICLO DE VIDA.
1 MEJORA DE UN ANALIZADOR AUTOMÁTICO DE ESTILOS PARA TEXTOS EN INGLÉS TÉCNICO: DESARROLLO DE LA AYUDA DE USUARIO. Madrid 2001Pilar Santamaría Rebollo.
La Investigación Acción como Método de Investigación para Docentes
Solución de problemas con programación
2. Diseño y Desarrollo del Producto
Obtención de Nuevo Conocimiento Sanitario. Enfoques Innovadores.
Computacion Inteligente
Computacion Inteligente
Una Introducción Básica a Sistemas de Tipos Estáticos
Metodología – Procesos Psicológicos Básicos Prof: Julio Santiago
TMiner Data Mining en Java
Red Neuronal de Contrapropagación
Kernels en reconocimiento de caras de caras Juan M. Enríquez (dc), M.Laura González Silva (df) y Alejo Salles (df). Seminario de Neurociencia Depto. Computación/Física.
La Investigación Acción como Método de Investigación para Docentes
GENERADOR SEMIAUTOMÁTICO DE DIAGRAMAS DE SECUENCIA A PARTIR DE ESCENARIOS REPRESENTADOS COMO GRAFOS DE SOWA Por: CLAUDIA MARÍA GÓMEZ FLÓREZ Director:
Introducción al Diseño de Experimentos para el Reconocimiento de Patrones Capítulo 7: Máquinas de Vectores Soporte Curso de doctorado impartido por Dr.
Curso de doctorado impartido por Dr. Quiliano Isaac Moro
Inteligencia Artificial Adquisición automática del conocimiento
Investigación en acción
RECONOCIMIENTO DE OBJETOS
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
Muestra: Recolección de Datos: Análisis de Datos:
MUESTRA Implica DEFINIR la unidad de análisis (personas, situaciones, individuos, eventos, fenómeno, ensayo)
1 2 Seminario “Gestión del Conocimiento: realidades y perspectivas” Mesa 3: Gestión del Conocimiento en el Sector.
Inteligencia Artificial M.C. Juan Carlos Olivares Rojas.
Optimización de pruebas de mutación con el uso de algoritmos genéticos
MÉTODO DE INVESTIGACIÓN PARA SOLUCIONAR PROBLEMAS DE UNA INDUSTRIA Técnicas Estadísticas.
De la investigación científica El punto de partida  La elección o asignación del tema.  La identificación o determinación del problema.
Ambientes inteligentes de aprendizaje: experiencias de la Universidad de Colima  Pedro César Santana Mancilla de noviembre - Colima, México.
Algoritmos y Programación Paralela Presentación 1 ALGORITMOS Y PROGRAMACIÓN PARALELA curso profesor Domingo Giménez Cánovas dis.um.es/~domingo/app.html.
Programa de Formación del CEDEX – 2007 Curso de TÉCNICAS ESTADÍSTICAS DE ANÁLISIS MULTIVARIANTE TÉCNICAS ESTADÍSTICAS DE ANÁLISIS MULTIVARIANTE Objetivo:
INTELIGENCIA DE NEGOCIOS
Weka.
Rocío A. Lizárraga Morales Raúl E. Sánchez Yáñez
Proceso KDD MSc. Carlos Alberto Cobos Lozada
Curso de Lógica Difusa Prof. José Edinson Aedo Cobo, Msc. Dr. Ing.
IDENTIFICACIÓN PRIORIZADA DE PACIENTES CON ENFERMEDADES CRÓNICAS A TRAVÉS DEL ANÁLISIS DE HISTORIAS CLÍNICAS ELECTRÓNICAS Pontificia Universidad Javeriana.
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
Lógica Difusa Estefania Avendaño Edward Yanquen Cindy Cardenas Jorge Prieto Daniel Lacouture David Contreras Daniela Pérez Juan Vega.
KDD y Técnicas de Minería de Datos en Weka
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
Tópicos en Inteligencia Artificial I Universidad Católica San Pablo.

Support Vector Machines.  Vocabulario básico: ◦ Repositorio de datos ◦ Atributos y Instancias ◦ Aprendizaje supervisado  Clasificación (Clase) ◦ Aprendizaje.
Clustering Pablo Palacios 1.  Introducción  Clasificación de Clustering  Clusters de particionamiento ◦ N-means  Clusters difusos ◦ GFN-means ◦ Gath-Geva.
Vicerrectoría de Docencia Educación y Tecnologías de la Información y la Comunicación CURSO INTEGRACIÓN DE TECNOLOGÍAS DE LA INFORMACIÓN Y LA COMUNICACIÓN.
Transcripción de la presentación:

Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES DE UNA BASE DE DATOS: APLICACIÓN A LA SELECCIÓN DEL OBJETIVO EN MARKETING DIRECTO 23 Julio 2005

Responsables Iván Aquino Morales –Estudiante de Ing. de Sistemas-UNI –6to ciclo Karina Chávez Cuzcano –Estudiante de Ing. De Sistemas –6to ciclo Cesar Pérez Pinche –Estudiante de Ing. de Sistemas-UNI –6to ciclo

PROPUESTA DE LA INVESTIGACIÓN

Título MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES DE UNA BASE DE DATOS: APLICACIÓN A LA SELECCIÓN DEL OBJETIVO EN MARKETING DIRECTO

Problema ¿Hacia que clientes debemos dirigir una campaña de Marketing directo relacionado a un producto? ¿Qué productos ofrecer a cada cliente? ¿Cómo reducir costos en campañas de marketing sin provocar disminución en las ventas ?

Objetivo GENERAL Elaborar un Sistema Difuso de Selección Objetivo para mejorar la eficiencia, en ventas, de una campaña de Marketing Directo. ESPECIFICOS –Determinar la Data a ser usada por el Modelo propuesto. –Determinar las características influyentes en la clasificación de los clientes (respondedores positivos, no respondedores). –Determinar las reglas para la selección de clientes a quienes será dirigida una campaña de marketing.

DISEÑO DEL EXPERIMENTO

Diseño del Experimento Se limpia la Data, eliminando valores nulos. –Esto se hace mediante la el método de Conjuntos Difusos.

Diseño del Experimento Se realiza el agrupamiento difuso por cada característica de la data –Esto se hace mediante el algoritmo del Fuzzy c-means extendido

Diseño del Experimento Se realiza un modelo jerárquico de las características –Esto se hace mediante un árbol de decisión, con la características mas relevante en la raiz, y la menos relevante en el ultimo nodo

Diseño del Experimento Se determina las reglas lingüísticas difusas para selección de clientes objetivos teniendo como entrada los clusters. –Esto se hace mediante un motor de inferencia difuso La eficiencia del Modelo se determina mediante gain-charts.

Hipótesis Ho.La eficiencia, en ventas, de una campaña de Marketing aumenta con el uso de un Modelo Difuso sobre un modelo estadístico.

Antecedentes David J. Stracuzzi y Paul E.Utgoff (2004), Desarrollaron modelo para la selección de características relevantes a un determinado proceso de aprendizaje usando una red neuronal perceptron. Huan Liu (2005), propuso un avance de un metalgoritmo para la elección de algoritmos de selección de características de acuerdo al modelo que se quiere ajustar la data.

ANÁLISIS DE FACTIBILIDAD

Fuente de Datos La data a usar es del KDDCUP98 obtenida de Internet; –La data es de una organización sin fines de lucro cuyo fin es la ayuda a los americanos con enfermedades de parálisis o problemas de la medula ósea. –La data posee una columna TARGET_B que vale 1 si es que el cliente respondió a la campaña de mail, y 0 si no.

Recursos Tiempo. –Dedicación de 3 horas diarias (7:00 PM – 10:00 PM) Bibliografía. –Se requiere acceso a la BD de la IEEE, ACM. Ingles. –Lectura de textos en ingles al 95% Equipos. –Se requiere 3 PC Pentium IV, en todo momento. –Internet. –Se requiere acceso a Internet en todo momento. Herramientas de Software. –Se requiere MatLab, Látex, Clementine, SPSS, Java. Conocimientos. –Análisis de Cluster difusos, Árboles de decisión, K-fold, Diseño experimentos, Sistemas de inferencia Difuso.

Plan de Trabajo S1 3 S4 6 S7 9 S10 12 S13 15 S16 18 S19 21 S21 23 S25 27 Revisión Bibliográfica Preparación del Plan de Trabajo Limpieza de la data Diseño del modelo de solución Diseño del prototipo Pruebas y Corridas Análisis de los resultados Redacción del documento final

MARCO TEORICO

Análisis de Grupos Difusos El agrupamiento de datos de manera difusa se basa en la teoría de conjuntos difusos. Esta teoría plantea que un objeto puede pertenecer a una clase con un determinado grado de pertenencia. Permite construir reglas lingüísticas comprensibles por el experto. Las reglas de inferencia difusa se construyen a partir de conjuntos difusos. La teoría de conjuntos difusos maneja un mayor grado de abstracción de la realidad.

Conjuntos Difusos Es aquel conjunto cuyos elementos pueden pertenecer total o parcialmente a el.

CONCLUSIONES Y BIBLIOGRAFIA

Conclusiones Se pretende desarrollar un experimento para determinar la eficiencia del Modelo Difuso de Selección del Objetivo en Marketing Directo. Se pretende comparar los resultados con resultados arrojados por herramientas estadísticas como el Chaid

Bibliografía [1] M. Setnes and U. Kaymak. Fuzzy modeling of client preference from large data sets: An application to target selection in direct marketing. IEEE Transactions on Fuzzy Systems, 2001; 153(1). [2] Lucio Soibelman, Hyunjoo Kim. Data Preparation Process for Construccion Knowledge Generation through Knowdledge Discovery in DataBases Journal of Computing in Civil Engineering January 2002 ; 40(3). 3 Feature Selection for Unsupervised Learning, Technical Report for the Northeastern University, Jennifer G.Dy, Carla E. Brodley 4 H. Liu and R. Setiono, "Feature Selection and Classification-A Probabilistic Wrapper Approach," Proc. Ninth Int'l Conf. Industrial and Eng. Applications of AI and ES, T. Tanaka, S. Ohsuga, and M. Ali, eds., pp , [5] K.S. Ng and H. Liu, "Customer Retention via Data Mining," AI Rev., vol. 14, no. 6, pp , [6] "Adaptive Intrusión Detection. A data Mining Approach". AI rev, vol 14, no. 6, pp , [7] "Feature Selection for High-Dimensional Genomic Microarray Data". Proc 15th Int'l Conf. Machina Learning, pp , [8] "Redundancy Bases Feature Selection for Microarray Data". Proc. 10th ACM SIGKDD Conf. Knowledge Discovery and Data Mining, [9] "Text Classification from Labeled data and Unlabeled Documents using EM", Machine Learning, vol. 39, , [10] "Efficient Content-Based Image Retrieval Using Automatic Feature Selection". IEEE Int'l Symp. Computer Vision, pp , [11] Y. Rui, T.S. Huang, and S. Chang, "Image Retrieval: Current Techniques, Promising Directions and Open Issues," Visual Comm. and Image Representation, vol. 10, no. 4, pp , [12] N.Wyse, R. Dubes, and A. K. Jain. A critical evaluation of intrinsec dimensionality algorithms, In E.Gelsema and L.N.Kanal, editors, Pattern Recognition, pages Morgan Kaufmann, 1980 [13] Huan Liu, Lei Yu, Toward Integrating Feature Selection Algoritms for Classification and Clustering IEEE Transactions on Knowledge and Data Engeneering Vol 17, No 4, April [14] H.Liu and H.Motorola, Feature Selection for Knowledge Discovery and Data Mining. Boston: Kluwer Academy, [15] David J. Stracuzzi, Paul E. Utgoff, Randomized Variable Elimination, Journal of Machine Learning Research 5 (2004) 1331–1362