Machine Learning: Búscandole el sentido a nuestros datos

Slides:



Advertisements
Presentaciones similares
PROGRAMACIÓN Un lenguaje de programación es un idioma artificial, creado y diseñado por el ser humano, para expresar algoritmos que pueden ser llevados.
Advertisements

Jacqueline Chávez Cuzcano
Selección de Características
TIBERIUS Predictive Modelling Software
Introducción a la minería de datos
Trabajo Cooperativo RSS - Google Reader. Concepto RSS - Really Simple Syndication Es una familia de formatos de fuentes Web usados para publicar documentos.
Elaborado Por: Karen Patricia Chinchilla B. RESOLUCION DDI DE 2009.
Tu , un sitio web R e d d e P r o f e s o r e s I n n o v a d o r e s Módulo: Tu , un sitio web.
¿Qué es lo que puedes hacer? 1.Gestiona los jugadores de tu equipo con sus fotos y sus datos. 2.Gestiona las clasificaciones de tu equipo según la fase.
Web Services con C# Dia 1.
• SQL Server Integration Services SSIS
Búsquedas avanzadas en la Wikipedia
Maestría en Bioinformática Bases de Datos y Sistemas de Información Fundamentos de Matemática Ing. Alfonso Vicente, PMP
Minería de Datos con Clementine SPSS 11.1
Especialista en Business Intelligence Analysis Services SSAS (Sesión 14) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Tutorial EDS: Servicio de Búsqueda
INTRODUCCIÓN GENERAL Causalidad e inferencia causal
Ma. Antonieta Rodríguez CED-CELE. Contenido  eXe - Learning  Recursos didácticos para ambientes web.
¿Cómo crear líneas de tiempo? Ingresa a:
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
Weka.
Manual Web BuscaDoc Ingreso al Sitio
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
María Gertrudis López1 Yosly Hernández1 Cira Beleño1 Doris Pernalete2
Mtra. Alma Rosa Muñoz Zepeda Mtro. Domingo Villavicencio Aguilar Mtra. Alma Rosa Muñoz Zepeda Mtro. Domingo Villavicencio Aguilar.
Manual del kardex Tauro.
• SQL Reporting Services
1er Seminario de Ingeniería Informática. Junior Rodriguez Microsoft Student Partner IEEE Computer Society Member Líder de la Comunidad Académica Dev STC.
 Opciones de apertura de archivos Leer los nombres de variable. En las hojas de cálculo, puede leer los nombres de variable de la primera fila del archivo.
Desarrollo y Características de Documentos Electrónicos
Sistema de análisis distribuido de ATLAS (ADA) Farida Fassi / Mª Dolores Jordán IFIC.
Tema: Writer, Calc y Impress Objetivo: Conocer las principales herramientas suministradas por los programas Writer, Impress y Calc para la preparación.
Moodle es un entorno de aprendizaje que está basado en los principios pedagógicos constructivistas, con un diseño modular que hace fácil agregar contenidos.
Casos de Uso  Son una técnica para especificar el comportamiento de un sistema.  Es una secuencia de interacciones de un sistema y alguien que usa alguno.
Excel 2010 Nivel avanzado.
NOMBRE DEL GÉNERO MUSICAL Imagen característica del estilo musical y su nombre en este cuadro de texto. ● Nombre y apellidos del alumno.
DEFINICIÓN DE OBJETO Un objeto es aquello que puede ser observado, estudiado y aprendido CARACTERÍSTICAS nos permiten conocerlos mediante la observación,
MANUAL DE USO DE WORDPRESS NOMBRE: GUIDO GONZALEZ FECHA: 28/03/2015. CURSO: 1RO BACHILLERATO “C”
Reconocimiento de caras usando Histogramas de Gradientes Orientados
Alojar y Compartir Documentos OnLine
Copyright ©2006 Brooks/Cole A division of Thomson Learning, Inc. Probabilidad y Estadística Robert J. Beaver Barbara M. Beaver William Mendenhall Presentación.
Google Talk y Google Docs
SHUTTENBORG ACCESS CONOCE LOS PROGRAMAS. Cortés Gamboa Lizzeth
Elementos básicos.  Una base de datos o banco de datos es un conjunto de datos pertenecientes a un mismo contexto y almacenados sistemáticamente para.
METADATOS Definicion: «datos sobre datos», «informaciones sobre datos», «datos sobre informaciones» e «informaciones sobre informaciones».
Programa Alianza por la Educación Ministerio de Educación y Cultura & Microsoft Paraguay CURSO BÁSICO DE UTILIZACIÓN DE HERRAMIENTAS TIC MÓDULO 3: INTERNET.
COMUNIDAD SHAREPOINT DE COLOMBIA. Sharepoint & Azure … juntos mejor !!!
Colegio de Bachilleres Plantel 13 Xochimilco - Tepepan
SharePoint Day Bogotá Julio 25 de 2015 Workshop BI PowerQuery COMUNIDAD SHAREPOINT DE COLOMBIA.
Aplicación JAVA implementando Arboles de Decisión
Alojar y Compartir Documentos OnLine AUTOR: SARA CHUQUIMIA QUENTA.
Gonzalo Echague Integración de tecnologías.
Reconocimiento de cara basado en “espectrocara”
Objetos de aprendizaje: definición y características fundamentales
Taller de Inteligencia de Negocios SQL Server Analysis Services Semana 8.
Taller de Inteligencia de Negocios SQL Server Analysis Services Data Mining Semana 11.
AYUDANTÍA DE SIMULACIÓN
LMS365 une la tecnología de aprendizaje vanguardista con la autoría, la comunicación social y las capacidades de colaboración de Office 365 para entregar.
Facultad de Ciencias Exactas Universidad Nacional del Centro de la Provincia de Buenos Aires (UNICEN) Nicolás A. Tourné Directora: Dra. Daniela Godoy Tandil,
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Facultad de Ciencias Exactas Universidad Nacional del Centro de la Provincia de Buenos Aires (UNICEN) Nicolás A. Tourné Directora: Dra. Daniela Godoy Tandil,
5.1 En fichas de trabajo registra los resultados de la investigación de las herramientas encontradas, identificando los siguientes elementos:  Nombre.
PROGRAMA DE MAESTRÍA EN REDES DE INFORMACIÓN Y CONECTIVIDAD MRIC-II ANÁLISIS DEL DESEMPEÑO DE ALGORITMOS DE DETECCIÓN DE EVENTOS VULCANOLÓGICOS BASADOS.
FUNDAMENTOS DE COMPUTACIÓN GS3  Conceptos Básicos de Software.
Septiembre 12, 2015 Bogotá, Colombia #sqlsatBogota.
© Área de las Tecnologías de la Información y las Comunicaciones Aplicadas. Generador de informes Birt.
Mindmeister (Mapa Mental) Por: Lucy Esmeralda Franco Franco.
Titulo Sub. Titulo Texto Titulo Texto Titulo Texto.
Esxcvzxcvzxvczxcvpacio para el texto.
Modulo 4.
Transcripción de la presentación:

Machine Learning: Búscandole el sentido a nuestros datos Diego Poza @diegopoza Mariano Vazquez @marianodvazquez

Agenda ¿Qué es Machine Learning? Azure Machine Learning Demo: Creando un Web Service de Machine Learning Demo: Twitter Sentiment Analysis

¿Qué es Machine Learning? Sistemas computacionales que se vuelven más inteligentes con la “experiencia” Experiencia = datos pasados + input humano Son capaces de adaptarse independientemente y “aprender” Utiliza algoritmos que aprenden de los datos sin la necesidad de programar reglas individuales Objetivo: predecir cual sería el resultado mas probable (insights) Útil en casos donde no es factible diseñar o programar algoritmos explícitos Cuando las decisiones tomados en base a grandes cantidades de datos tienden a ser las mejores decisiones

Usos de Machine Learning Se basa en la inducción sobre modelos complejos (no lineales) Útil para Big Data Para descubrir patrones en los datos Para predecir resultados (insights) y ayudar a tomar mejores decisiones de negocio Tres grandes categorías Aprendizaje supervisado Aprendizaje no supervisado Aprendizaje por refuerzo Técnicas: clasificación, clustering, regresión (predicción) Son abstracciones de datos Useful when: Human expertise does not exist or is hard to “explain” (speech recognition, you don’t have to be a “master of backgammon” to create a backgammon game) Solution changes in time Solution needs to be adapted to particular cases Three broad categories Supervised learning: use training data to “map” input and output data (labeled data) Unsupervised learning: data with no labels, the goal is to find relationship in the data Reinforcement learning: the algorithm gets to choose an action in response to each data point. Then it modifies its strategy in order to achieve the highest reward (robotics, IoT).

Ejemplos

Ejemplos de Machine Learning Recomendación de películas en Netflix (“The Netflix price”, ofrecían $1M para mejorar la precisión en un 10%) Filtros de spam, que usan técnicas de clasificación de texto (como Naive Bayes spam filtering) Los vehículos auto-manejados de Google, que usan Computer vision, procesamiento de imágenes y algoritmos de machine learning para aprender del comportamiento de los conductores. Other cases: Image search (similarity Fraud detection (credit card providers) Decision making (bank/insurance sector) Speech understanding (Siri, Cortana) Face detection (Facebook’s photo tagging)

Azure ML Studio (https://studio.azureml.net) Herramienta colaborativa y drag-and-drop, para administrar Experimentos No es necesario programar Se pueden usar datasets de ejemplos o subir uno propio Módulos predefinidos y posibilidad de programar tu propio módulo en R y Python Publicar tus experimentos a un Web Service (API) https://azure.microsoft.com/en-us/documentation/articles/machine-learning-data-science-how-to-create-machine-learning-service/

Demo Creando un Web Service de Machine Learning

Escenario Dataset de la UCI de Tarjetas de crédito de Alemania: 1000 filas de datos. Los clientes del banco solicitan créditos, y el modelo tiene que predecir si la operación es de alto o bajo riesgo. “1” es bajo riesgo “2” es alto riesgo Dataset URL: http://archive.ics.uci.edu/ml/datasets/Statlog+(German+Credit+Data)

Experimento Predictivo Obtener los datos Subir tu dataset (CSV, TSV, texto) Leer un dataset existente (HTTP, Azure SQL/Table/Blob) Usar datasets de ejemplo Pre-procesar los datos Usar módulos de Pre-procesamiento Proyectar Columnas Limpiar Datos faltantes Normalizar Datos Editor de Metadata Definir características Una característica es una propiedad de la entidad. Elegir el subconjunto de todas las características que son relevantes para nuestro escenario. Dataset URL: http://archive.ics.uci.edu/ml/datasets/Statlog+(German+Credit+Data) Entrenar al modelo Elegir el algoritmo predictivo. Los dos tipos de algoritmos mas importantes son clasificación y regresión. Crear experimento de scoring Una vez que el modelo es entrenado se puede crear el experimento de scoring Los elementos usados solo para entrenamiento son eliminados Publicar Web Service Se crea un endpoint para consumir el servicio Un libro de Excel es creado para ver como los valores cambian el resultado en tiempo real

Twitter Sentiment Analysis

Gracias!