La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Copyright © 2007, SAS Institute Inc. All rights reserved. Encuentro Abierto Tesistas Analytics SAS en la Universidad Taller participativo Noviembre 2009.

Presentaciones similares


Presentación del tema: "Copyright © 2007, SAS Institute Inc. All rights reserved. Encuentro Abierto Tesistas Analytics SAS en la Universidad Taller participativo Noviembre 2009."— Transcripción de la presentación:

1 Copyright © 2007, SAS Institute Inc. All rights reserved. Encuentro Abierto Tesistas Analytics SAS en la Universidad Taller participativo Noviembre 2009 Pablo Fondevila – Coordinador Comunidad José Alvarez – Coordinador Capacitación

2 Copyright © 2007, SAS Institute Inc. All rights reserved. Temario  Qué es la Comunidad Analytics Cono Sur?  Objetivos del Encuentro Testimonios de Tesistas Exploración grupal Dificultades Brainstorming de Temas Interesantes  Sorteo de una Beca Curso de SAS!!

3 Copyright © 2007, SAS Institute Inc. All rights reserved. Ronda de Presentación y Expectativas  Nombre  Maestría / dónde?  Qué me interesa de este taller?

4 Copyright © 2007, SAS Institute Inc. All rights reserved. Objetivos: Acelerar crecimiento profesional Promover el uso metódico e inteligente de información

5 Copyright © 2007, SAS Institute Inc. All rights reserved. ¿Qué es “SAS en Universidad”? Performance Measures Comunidad Analytics Cono Sur SAS Universidad... Grupo “Data Mining”

6 Copyright © 2007, SAS Institute Inc. All rights reserved. Qué ofrecemos?

7 Copyright © 2007, SAS Institute Inc. All rights reserved. Dinámica Comunidad Referentes Activos Visitantes Prof.Analytic Esp.SAS Invitados Coord. Apoyo Recursos

8 Copyright © 2007, SAS Institute Inc. All rights reserved. Objetivos del encuentro  Brindar un espacio diálogo abierto para miembros de la comunidad respecto de sus experiencias de tesis  Permitir explorar dificultades y encontrar “puntas para avanzar”  Aclaración: No hablamos en nombre de ninguna universidad, ni decimos cómo deben hacer lo que les pide la universidad donde estén cursando …

9 Copyright © 2007, SAS Institute Inc. All rights reserved. Testimonios de Tesistas Experiencias en la Comunidad?

10 Copyright © 2007, SAS Institute Inc. All rights reserved. Ejemplos de áreas de tesis surgidas de la charla (resumen)  Ana Ahedo (UBA) detalló: Bioinformática aplicado en el INTA (alumno de rosario) Aplicación de Series de Tiempo (con un tutor de canadá) Mejoras de algoritmos (ej: Curvas ROC) Tratamiento de imágenes aplicadas a clasificación de naranjas  Análisis Supervivencia aplicada a una empresa de seguros (??)  Clasificación de tráfico de red en OSDE (miguel Jinez)  Predicción de Reposición Optima de Cajeros Automáticos (innovación en procedimientos) en Banelco (Casandra Mirabelli)

11 Copyright © 2007, SAS Institute Inc. All rights reserved. Exploración Grupal de experiencia de tesis  Reunirse en Grupos de 3 y contestar: 1.Lo que espero de mi tesis es (objetivos propios)… 2.Lo que se espera de mi en la tarea de realizar una tesis es (objetivos educativos)… 3.Las principales estrategias para realizar exitosamente una tesis son… 4.Los recursos necesarios para realizar una tesis son… 5.Mis principales dificultades para avanzar en mi tesis son…

12 Copyright © 2007, SAS Institute Inc. All rights reserved. Opiniones de José Alvarez: Cuestiones importantes en una tesis  Alinear los objetivos propios con los objetivos educativos  Apreciación realista de lo que se espera de una tesis y lo que nos espera Nivel de originalidad Relevancia de la tesis Esfuerzo invertido  Estrategias

13 Copyright © 2007, SAS Institute Inc. All rights reserved. Estrategias  Seleccionar un director  Hacer un uso eficiente de los recursos disponibles  Usar arquetipos de tesis como modelos  Planificar  Empezar lo antes posible  Aprovechar para desarrollar destrezas asociadas: De expresión De búsqueda De organización conceptual De persuasión De manejo de la ansiedad

14 Copyright © 2007, SAS Institute Inc. All rights reserved. Areas temáticas  Teoría (no recomendable)  Teoría de la práctica  Práctica (aplicaciones)

15 Copyright © 2007, SAS Institute Inc. All rights reserved. Teoría (no recomendable)  Data mining (y analytics en general) es una disciplina práctica (interdisciplina)  Los fundamentos (la teoría) se encuentra en diversas áreas científicas  La mayoría de los tesistas no tiene los conocimientos necesarios para hacer investigación teórica  Una maestría está orientada más bien hacia lo práctico  Area más razonable: modificación de algún algoritmo o técnica existente, determinación de su performance y área de aplicación

16 Copyright © 2007, SAS Institute Inc. All rights reserved. Teoría de la práctica  Evolución de Data Mining en función de SOA  Exploración de datos usando técnicas sofisticadas  Aplicación de técnicas de data mining para conjuntos de datos estructurados relacionalmente  Aplicación de teoría de las decisiones en la selección de modelos y en la realización de predicciones  Combinación de modelos  Administración de modelos

17 Copyright © 2007, SAS Institute Inc. All rights reserved. Evolución de Data Mining en función de SOA  El paradigma SOA puede explotarse para la implementación de aplicaciones de datos en ambientes distribuidos.  Es un área incipiente que tendrá un gran desarrollo con la difusión de este paradigma.  Olejnik, R. et al. Webservices oriented data mining in knowledge architecture, Future Generation Computer Systems, Volume 25, Issue 4, April 2009, pp. 436-443.Future Generation Computer SystemsVolume 25, Issue 4  Dubitzky, W. (comp.). Data Mining Techniques in Grid Computing Environments, Wiley, 2009.Data Mining Techniques in Grid Computing Environments  Brooks, T. Principles for Implementing a Service-Oriented Enterprise Architecture. The SOA Magazine (http://www.soamag.com/I29/0509-2.asp)

18 Copyright © 2007, SAS Institute Inc. All rights reserved. Exploración de datos usando técnicas sofisticadas  La exploración de datos en data mining se mantiene a un nivel “artesanal” y relativamente rudimentario, a pesar de su importancia para definir las tareas posteriores de data mining.  Algunas cuestiones: Diagnóstico de tasa de señal/ruido Diagnóstico de problemas heterogéneos Uso de herramientas “independientes de modelos” como técnicas diagnósticas (teoría de información, modelos de partición multipropósito, etc.)  Pyle, D. Data Preparation for Data Mining, 1999.  Han, J. y Kamber, M. Data Mining: Concepts and techniques, 2006  Michie, D.; Spiegelhalter, D.J. y Taylor, C.C. (comps.). Machine Learning, Neural and Statistical Classification. Ellis Horwood, 1994

19 Copyright © 2007, SAS Institute Inc. All rights reserved. Aplicación de técnicas de data mining para conjuntos de datos estructurados relacionalmente  Text mining  Web mining  Data mining espacial  Redes sociales  Data mining relacional  Fortunato, S. Community structure in graphs, 2008 (http://videolectures.net/ephdcs08_fortunato_csig/)Community structure in graphs  Dzeroski, S. y Lavrac, N. Relational Data Mining. Springer, 2001.

20 Copyright © 2007, SAS Institute Inc. All rights reserved. Aplicación de teoría de las decisiones en la selección de modelos y en la realización de predicciones  Utilización de la teoría de las decisiones para una selección apropiada de modelos, para la selección de un punto de corte en predicciones de clasificación, la generación de scorings, para la toma de decisiones sobre las acciones a partir de un modelo. Análisis de escenarios en data mining.  Parmigiani, G. et al. Decision Theory. Principles and Approaches. Wiley, 2009.  Cheong, M-P. et al. Business Intelligence Using Information Gap Decision Theory and Data Mining Approach in Competitive Bidding. 2004. (http://class.ee.iastate.edu/berleant/home/Research/Pdfs/MarketIntera ctionAndMarketPower/EPRC04.pdf)http://class.ee.iastate.edu/berleant/home/Research/Pdfs/MarketIntera ctionAndMarketPower/EPRC04.pdf  Braina, D. et al. Theory of actionable data mining with application to semiconductor manufacturing control, International Journal of Production Research, Volume 45, Issue 13 July 2007, pp. 3059 - 3084International Journal of Production Research45, Issue 13 July 2007, pp. 3059 - 3084

21 Copyright © 2007, SAS Institute Inc. All rights reserved. Combinación de modelos  Determinar áreas o tipos de problemas para los que combinaciones de modelos son una mejor herramienta que modelos individuales, forma de combinar los modelos, medidas apropiadas de evaluación de performance, etc.  Modelos two stage, redes neuronales con target multivariado, redes expertas, ensemble learning, reglas, etc.  Relación entre problemas heterogéneos y combinación de modelos  Reglas de decisión para la combinación de modelos  Zheng, Z. et al. A DEA Approach for Model Combination, Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining. 2004.  Conversano, C. et al. Generalized additive multi-mixture model for data mining, Computational Statistics & Data Analysis, Volume 38, Issue 4 (February 2002).

22 Copyright © 2007, SAS Institute Inc. All rights reserved. Administración de modelos  Ciclo de vida de modelos  Estabilidad, calibración y ajuste de modelos  Ari, I. et al. Management of Data Mining Model Lifecycle to Support Intelligent Business Services. Submitted to ACM Computer Human Interaction for Management of IT (CHIMIT'08), Nov, 2008.  Liu, B. y Tuzhilin, A. Managing large collections of data mining models. Communications of the ACM, Volume 51, Issue 2 (February 2008), pp. 85-89.  Managing SAS Analytical Models Using SAS Model Manager (http://www.sas.com/events/aconf/mmus.html)

23 Copyright © 2007, SAS Institute Inc. All rights reserved. Práctica (aplicaciones)  Problemas no supervisados y especialmente con eventos de muy baja frecuencia (fraude, fallas, etc.)  Problemas que involucran segmentación  Problemas que involucran fenómenos de difusión, contagio, autocorrelación, etc. (fraude, adopción de nuevos servicios o tecnologías, contagio, etc.)  Problemas que involucran ineludiblemente datos estructurados (data mining temporal, data mining espacial, data mining de imágenes, text mining, web mining, etc.): agrupamiento de series temporales cortas, identificación de expresiones faciales, enriquecimiento de conjuntos de datos escasos con información textual, etc.

24 Copyright © 2007, SAS Institute Inc. All rights reserved. Sorteo: Curso Capacitación SAS!!! GANADOR: CARLOS GIL

25 Copyright © 2007, SAS Institute Inc. All rights reserved. Cierre de expectativas, próximos pasos  Presentación y foro de discusión en www.analyticsconosur.com www.analyticsconosur.com  Registrarse (cargar datos de perfil/foto) y unirse a grupo “SAS en la Universidad”  Intereses para próximos encuentros

26 Copyright © 2007, SAS Institute Inc. All rights reserved. Anexo Site: Analytics Cono Sur

27 Copyright © 2007, SAS Institute Inc. All rights reserved.

28

29


Descargar ppt "Copyright © 2007, SAS Institute Inc. All rights reserved. Encuentro Abierto Tesistas Analytics SAS en la Universidad Taller participativo Noviembre 2009."

Presentaciones similares


Anuncios Google