Analytics: 20 Años ± 4 siglos 1990s: CRISP-DM, Machine Learning 2000s: SEMMA, Decision Support 2010s: Business Case, Big Data Ciencias de la Administración 6sigma / Mejora Continua Investigación de Operaciones Investigación de Mercado Operaciones en 2da Guerra Mundial Estadística industrial Decisiones gubernamentales Método científico Juegos de azar
Hoy, una oficina de analytics… Contrata: Director, gerente MBAs, DBAs, OR Analistas, Actuarios, MatAp, Com Sci Programadores DB Generadores de valor: Plataforma (Red + DB + ML) Operaciones (Casos de negocio) Destreza (Entrenamiento + Disposición)
p-values cuestionados American Psychology Association La industria veloz sobre-usó una métrica de significado difuso. p-value
Análisis genético poblacional Efecto de tratamientos Prescripciones óptimas Análisis personalizado Prescripción personalizada Análisis
Análisis genético poblacional Efecto de tratamientos Prescripciones óptimas Análisis personalizado Prescripción personalizada Análisis Irrepetible
He visto …
Modelos útiles Interpretación geométrica Aplicabilidad Simulación de recomendaciones
{ } En el espacio de atributos, clasificar es hallar las fronteras de decisión. Es una simplificación que pierde detalle. Pero nos permite automatizar la acción conveniente. simular anticipar
Tres clases artificialmente distribuidas en tres centros separados
Linear Discriminant Analysis
Quadratic Discriminant Analysis
Quadratic Discriminant Analysis (Mayor incertidumbre)
Regresión Logística
Árbol de Clasificación
Nearest Neighbour (1 voto)
Nearest Neighbour (3 votos)
Red Neuronal 2 Neuronas de salida
Red Neuronal Promediada
Árbol de Clasificación
Paquete R usado: MASS
Paquete R usado: e1071
Tres deberes para el analista Los datos deben representar los hechos. Los modelos deben hallar oportunidades. Se debe respaldar cada acción recomendada. Ejercicios:
© Octavio Ocampo ¿Cómo se refleja la vida real en la “vida digital”? En tiendas-internet, el registro es la transacción. ¿Cuánto de la vida real queda en los registros? Los datos representan hechos
Modelos en el espacio de atributos Algunas regiones representan una oportunidad de actuar. Se aprende del pasado, o de mediciones costosas. (Predicciones, observabilidad.) Se acepta una “calidad” estadística en las afirmaciones.
Decisión Acción ¿Control? ¿Capacidad? ¿Oportuna? ¿Viabilidad? ¿Auditabilidad? ¿Lazo cerrado?
Ejercicios Clustering Red neuronal Text Mining