Machine Learning para principiantes

Slides:



Advertisements
Presentaciones similares
¿Cuántos estáis en un red social? ¿En cuál? ¿Qué redes sociales conocéis?
Advertisements

1 Introducción a la minería de datos. 2 Temario ¿Qué es minería de datos? ¿Qué es minería de datos? ¿Quién usa minería de datos? ¿Quién usa minería de.
METODO DE INVESTIGACION
Es una plataforma computacional flexible, sencilla e intuitiva, que contiene las funciones necesarias permitiendo crear los documentos para administrar.
Copyright © 2003 by The McGraw-Hill Companies, Inc. Todos los derechos reservados.
¡LOS SERVIDORES DE FTP Y NUBE!
SOLUCIONARIOS. ¿Cómo ingresar a los solucionarios de INSTRUIMOS?
CardSpace. Índice Comprendiendo la identidad digital Comprendiendo la identidad digital Describiendo la identidad digital Describiendo la identidad digital.
COMUNICACIÓN Y TIC Ángela Espinosa Hayler Peñaranda.
« Un gran descubrimiento resuelve un gran problema, pero en todo problema hay un gran descubrimiento» Polya Fue un matemático que nació en Budapest, Hungría.
¿Que es PHP? PHP Hypertext Preprocessor Y solo porque me quiero hacer el profesor cool y meter un chiste: PHP también significa: Para Hacer Páginas.
Primera Forma Normal La regla de la Primera Forma Normal establece que las columnas repetidas deben eliminarse y colocarse en tablas separadas. Poner la.
Conocida también como informática en la nube, del inglés Cloud Computing, es un modelo o paradigma para la utilización de los recursos informáticos,
Google Play Store o Play Store para abreviar, es la aplicación que la gente con tabletas y smartphones Android utiliza para descargar juegos, aplicaciones.
De Negocios Inteligencia para usuarios de Excel.
Ingreso , proceso y salida de datos
Ram Delta Systems We bring you a better future… Co-Med On Line
Ram Delta Systems We bring you a better future… Co-Med On Line
Unidad Descuentos por período y cantidad
Lección de PROGRAMACION PARA PRINCIPIANTEs
RECUERDA INGRESAR A LA PÁGINA POR ESTE BOTÓN!!
INTRODUCCIÓN AL ESTUDIO DE LA ESTADÍSTICA
ADMINISTRACíON DE LA MEMORIA EN SISTEMAS RECIENTES
ARQUITECTURA DE COMPUTADORES
APLICACIONES DE WINDOWS
RECHAZO DE DATOS DE UNA SERIE Gloria María Mejía Z.
Tema 3. Lenguaje unificado de modelado UML
UNIVERSIDAD NACIONAL DE LOJA Área de la Educación, el Arte y la Comunicación Informática Educativa IV INGENIERIA DE SOFTWARE Taller de Análisis y Diseño.
CREATIVIDAD, INNOVACION Y DESCUBRIMIENTO
PROVEEDOR DATA WAREHOUSE TERADATA
PLAN DE MUESTREO.
Búsquedas en Internet ¿Qué es un buscador?
Excel.
Excel.
Migración de una B.D de Excel a Access
En este periodo el analista se esfuerza por comprender la información que necesitan los usuarios para realizar su trabajo de la manera correcta.
HERRAMIENTAS DE MICOSOFT WORD LOS HIPERVINCULOS TECNOLOGÍAS DE LA INFORMACIÓN I YOSIRIS MARTÍNEZ ZAMORANO 1 G M 14/05/18.
HERRAMIENTAS DE MICOSOFT WORD LOS HIPERVINCULOS TECNOLOGÍAS DE LA INFORMACIÓN I YOSIRIS MARTÍNEZ ZAMORANO 1 G M 14/05/18.
HERRAMIENTAS DE MICOSOFT WORD LOS HIPERVINCULOS Profesora: Adriana Ubiarco Alumna: Citlaly Naomi Barrera Valdez Grado Grupo: 1-A Materia: Tecnologías Turno:
Lizbeth Montserrat cerero cedano 1E T/V característica, funciones, tipos y ejemplos de los hipervínculos.
HERRAMIENTAS DE MICOSOFT WORD LOS HIPERVINCULOS Profesora: Adriana Ubiarco Alumna: Citlaly Naomi Barrera Valdez Grado Grupo: 1-A Materia: Tecnologías.
HERRAMIENTAS DE MICOSOFT WORD LOS HIPERVINCULOS Profesora: Adriana Ubiarco Alumna: Citlaly Naomi Barrera Valdez Grado Grupo: 1-A Materia: Tecnologías.
Leticia Medrano Rodríguez Unidad 4, actividad 3 Tecnologías de la información Adriana Ubiarco.
Joselin Elizabeth Raygoza Chávez 1-A T/M Tecnologias de la Información.
HERRAMIENTAS DE MICOSOFT WORD LOS HIPERVINCULOS TABLA DE CONTENIDO 1. Los hipervínculos Como insertar un hipervínculo Sintaxis para insertar.
Actividad 3 Hipervínculos Luis Alejandro Gómez Ramos Maestra: Adriana Ubiarco Tecnologías de la información I 1-A T/M BGC PREPA 10.
CAPÍTULO 3 Oferta y demanda Michael Parkin Economía 11ed.
Muestreo por Conglomerados Muestreo por Conglomerados en etapa 1 y 2.
Manual del usuario - siguiendo las instrucciones
Las aplicaciones que permiten crear “libros electrónicos educativos”.
MUESTREO DE ACEPTACION
HERRAMIENTAS DE MICROSOFT WORD LOS HIPERVINCULOS Los hipervínculos son enlaces o rutas de acceso a otro archivo, pagina Web o una dirección de correo.
FERNANDA DE LA ESPERANZA DE LEÓN ALVAREZ 1°F/M TECNOLOGÍAS DE LA INFORMACIÓN I Actividad 3.
HERRAMIENTAS DE MICROSOFT WORD LOS HIPERVINCULOS SUSANA JANETH ISLAS OBLEDO T/M 1*A BGC ACTIVIDAD 3.
Tecnologías de la Información 1 Paola Noemí Padilla Almejo 1ºA T/M.
HERRAMIENTAS DE MICROSOFT WORD LOS HIPERVINCULOS Ernesto Murillo Pineda 1·G T/M No. 51.
ACTIVIDAD 3 BARAJAS GONZALEZ FATIMA LIZETTE 1.G T-M PREPA 10 TECNOLOGIAS DE LA INFORMACION MAESTRA. ADRIANA UBIARCO.
ACTIVIDAD 3 BARAJAS GONZALEZ FATIMA LIZETTE 1.G T-M PREPA 10 TECNOLOGIAS DE LA INFORMACION MAESTRA. ADRIANA UBIARCO.
Manual de Emisión SOAT Electrónico
MATRICES. ¿QUÉ ES UNA MATRIZ? Una matriz es un espacio bidimensional que se genera en la memoria del computador. Las matrices deben tener un nombre que.
Lenguajes del lado del cliente
Arquitectura Aplicaciones Web
Área de Matemática. Enfoque de Matemática oArgumentar y explicar los procesos utilizados en la resolución de problemas oDesarrollar la capacidad de pensar.
6: Prioricen las estrategias
MELWIN SABIER FORERO RAMÍREZ EPISTEMOLOGIA. Unidad 1: Fase 2 - Identificar las teorías que sustentan las diferentes disciplinas.
Historia del HTML y de Internet Tim Berners-Lee creó la primera versión del lenguaje HTML en 1989, junto con su equipo también desarrollaron el protocolo.
2. PRINCIPIOS BASICOS DE MICROSOFT ACCESS. -Sistema que tiene la capacidad de realizar tareas de distinta índole utilizando herramientas que interactúan.
EXCEL INTERMEDIO FILTROS AVANZADOS – TABLA DINAMICA – AUDITORIA DE FORMULAS JORGE LUIS AGUILAR ALCALDE.
INTERNET: Por medio de este icono podrá conectarse a Internet y podrá acceder a la red de redes. 4-PAPELERA DE RECICLAJE: En este icono.
Transcripción de la presentación:

Machine Learning para principiantes Víctor Hugo Cárdenas Machine Learning para principiantes

Agradecimiento a los patrocinadores Gold Silver Geek

Machine Learning Los datos pueden contener secretos, especialmente si son muchos. Con muchos datos sobre algo, puede examinar esos datos de manera inteligente para encontrar patrones. Pero pueden existir patrones demasiado complejos para detectarlos nosotros mismos y estos padrones pueden indicarnos cómo resolver un problema. Machine Learning examina grandes cantidades de datos buscando patrones, luego genera código que le permite reconocer esos patrones en nuevos datos. Sus aplicaciones pueden usar este código generado para hacer mejores predicciones. En otras palabras, el aprendizaje automático puede ayudarlo a crear aplicaciones más inteligentes.

Ejemplo ¿Cuál es el enfoque correcto para hacer esto? Las aplicaciones de Machine Learning son muy diversas pero por ejemplificar una posible aplicación supongamos que desea crear un software que pueda determinar, con un alto grado de precisión, si una transacción de tarjeta de crédito es fraudulenta. Nombre Cantidad Fraudulento Smith 2,600.45 NO Potter 2,294.58 SI Peter 1,003.30 Adams 8,488,32 ¿Cuál es el enfoque correcto para hacer esto? Una opción es reunir a unas pocas personas inteligentes en una habitación y pensar en ello, luego escribir un código que implemente lo que sea que se les ocurra. Este es probablemente el enfoque más común para crear soluciones de software hoy en día, y ciertamente puede funcionar. Pero si hay datos disponibles sobre el problema que está tratando de resolver, puede utilizar esos datos para encontrar una solución efectiva.

Ejemplo Nombre Cantidad Fraudulento Smith 2,600.45 NO Potter 2,294.58 SI Peter 1,003.30 Adams 8,488,32 Suponga que está tratando de encontrar el mejor enfoque para detectar fraudes con tarjetas de crédito, y todo lo que tiene que trabajar es la información histórica que se muestra en la tabla Lo bueno de tener tan pocos datos es que podrías encontrar un patrón simplemente mirándolo

Ejemplo Nombre Cantidad Fraudulento Smith 2,600.45 NO Potter 2,294.58 SI Peter 1,003.30 Adams 8,488,32 Lo malo al contar con tan pocos datos es que es probable el patrón que encuentres sea incorrecto.

Ejemplo Pero supongamos que tiene no solo diez registros para trabajar, sino diez millones. Y que no tiene seis columnas de datos sino 60 columnas. Probablemente haya un patrón útil oculto en esos datos para determinar qué transacciones pueden ser fraudulentas. Pero buscando manualmente los datos, hay demasiados , nunca lo resolveremos.

¿Cuál es la respuesta correcta? Nombre Monto Donde se creo Donde se uso Edad Fraudulento Smith 2,600.45 USA 22 NO Potter 2,294.58 RUS 29 SI Peter 1,003.30 25 Adams 8,488.32 FRA 64 Pali 200.23 AUS JAP 58 Jones 3,250.11 27 Hanford 8,156.20 Marx 7,475.11 UK GER 32 Norse 540.00 Edson 7,475.22 20 ¿Cuál es la respuesta correcta? En los datos que se muestran aquí, los clientes de entre 20 y 30 años parecen tener una alta tasa de fraude, pero luego observan al cliente Smith: no se ajusta a este patrón. ¿O podrían ser clientes cuya tarjeta de crédito fue emitida en los Estados Unidos pero utilizada en Rusia? Eso también parece sospechoso. Pero no, mira al cliente llamado Jones; ella no encaja en este patrón. De acuerdo, entonces tal vez una combinación de cosas se pueda usar para detectar fraudes. ¿Qué hay de los clientes cuyas tarjetas fueron emitidas en los Estados Unidos, utilizadas en Rusia y tienen más de 20 años? Error de nuevo: el titular de la tarjeta llamado Norse viola esta regla. La verdad es que el patrón que los datos respaldan es el siguiente: una transacción es fraudulenta si el titular de la tarjeta está en sus 20 años, la tarjeta se emitió en los EE. UU. Y se usó en Rusia, y el monto es más de $ 1,000. Con algo de tiempo, probablemente se habrá dado cuenta, ya que los datos con los que debe trabajar no son muy grandes.

¿Cuál es la respuesta correcta? Nombre Monto Donde se creo Donde se uso Edad Fraudulento Smith 2,600.45 USA 22 NO Potter 2,294.58 RUS 29 SI Peter 1,003.30 25 Adams 8,488.32 FRA 64 Pali 200.23 AUS JAP 58 Jones 3,250.11 27 Hanford 8,156.20 Marx 7,475.11 UK GER 32 Norse 540.00 Edson 7,475.22 20 ¿Cuál es la respuesta correcta? En los datos que se muestran aquí, los clientes de entre 20 y 30 años parecen tener una alta tasa de fraude, pero luego observan al cliente Smith: no se ajusta a este patrón. ¿O podrían ser clientes cuya tarjeta de crédito fue emitida en los Estados Unidos pero utilizada en Rusia? Eso también parece sospechoso. Pero no, mira al cliente llamado Jones; ella no encaja en este patrón. De acuerdo, entonces tal vez una combinación de cosas se pueda usar para detectar fraudes. ¿Qué hay de los clientes cuyas tarjetas fueron emitidas en los Estados Unidos, utilizadas en Rusia y tienen más de 20 años? Error de nuevo: el titular de la tarjeta llamado Norse viola esta regla. La verdad es que el patrón que los datos respaldan es el siguiente: una transacción es fraudulenta si el titular de la tarjeta está en sus 20 años, la tarjeta se emitió en los EE. UU. Y se usó en Rusia, y el monto es más de $ 1,000. Con algo de tiempo, probablemente se habrá dado cuenta, ya que los datos con los que debe trabajar no son muy grandes.

¿Cuál es la respuesta correcta? Una transacción es fraudulenta si el titular de la tarjeta está en sus 20 años, la tarjeta se emitió en los EE. UU. Y se usó en Rusia, y el monto es más de $ 1,000. Con algo de tiempo, probablemente se habrá dado cuenta, ya que los datos con los que debe trabajar no son muy grandes.

Machine Learning Lo que hace el proceso de aprendizaje automático es aplicar técnicas estadísticas a grandes cantidades de datos, buscando el mejor patrón para resolver su problema. Luego genera un código de implementación que puede reconocer ese patrón. Este código generado se conoce como modelo y las aplicaciones que necesitan resolver este problema pueden llamarlo.

El aprendizaje automático es aplicable a mucho más que esto Predecir ingresos futuros Determinar si un cliente de telefonía móvil pude cambiar a otro proveedor Recomendar películas para clientes Casi cualquier cosa donde hay datos históricos. el aprendizaje automático es aplicable a mucho más que esto. Esta tecnología puede usarse para predecir los ingresos futuros de una organización, determinar si un cliente de telefonía móvil puede cambiar a otro proveedor, decidir cuándo un motor a reacción necesita mantenimiento, recomendar películas para clientes o cualquier otra cosa donde haya muchos datos históricos disponibles. (Porque el aprendizaje automático ayuda a predecir el En el futuro, a menudo se incluye en la categoría más amplia de análisis predictivos. Todo lo que se necesita es la información, el software de aprendizaje automático para aprender a partir de esos datos y las personas que saben cómo usar ese software. Azure Machine Learning (Azure ML) es un servicio en la nube que ayuda a las personas a ejecutar el proceso de aprendizaje automático. Como su nombre lo sugiere, se ejecuta en Microsoft Azure, una plataforma de nube pública. Debido a esto, Azure ML puede trabajar con grandes cantidades de datos y se puede acceder desde cualquier lugar del mundo. Su uso requiere solo un navegador web y una conexión a Internet. Aún así, comprender lo que hace esta tecnología requiere una mirada más profunda sobre cómo funciona realmente el aprendizaje automático. La siguiente sección ofrece una descripción general del proceso. El proceso de aprendizaje automático Ya sea que una organización use Azure ML u otro enfoque, el proceso básico de aprendizaje automático es muy similar. La Figura 3 muestra cómo se ve normalmente.

Azure Machine Learning (Azure ML) Azure Machine Learning (Azure ML) es un servicio en la nube que ayuda a las personas a ejecutar el proceso de aprendizaje automático. Como su nombre lo sugiere, se ejecuta en Microsoft Azure, una plataforma de nube pública. Debido a esto, Azure ML puede trabajar con grandes cantidades de datos y se puede acceder desde cualquier lugar del mundo. Su uso requiere solo un navegador web y una conexión a Internet.

Demostración En este tutorial se muestran los conceptos básicos de cómo arrastrar y colocar módulos en el experimento, conectarlos, ejecutar el experimento y examinar los resultados. No vamos a explicar el tema general de aprendizaje automático o cómo seleccionar y usar los más de 100 algoritmos integrados y módulos de manipulación de datos incluidos en Studio.

Víctor Hugo Cárdenas www.vhcardenas.blogspot.com www.soportesql.wordpress.com www.youtube.com/visoalgt www.facebook.com/visoalcommunity www.twitter.com/victhorcardenas www.facebook.com/groups/sqlcomunidad www.facebook.com/groups/SQLSERVERLATAM