Una introducción a Deep Learning

Slides:



Advertisements
Presentaciones similares
Procesamiento Digital de Imágenes
Advertisements

Resumen 2014 INTRODUCCIÓN AL SPSS. Algo para recordar… Tres amigos estadísticos se reunieron para cazar patos. Uno apunta y dispara 1 metro más arriba.
LAS CONDICIONES DE KUHN TUCKER Y LAGRANGE Realizado por: Edircely Briceño C.I.:
LEONARDO LÓPEZ C. ECONOMIA ESTADISTICA COMPUTARIZADA PARALELO: 261.
Sistema computacional Por Salvador Aguilar Gómez.
¿Qué es un Diagrama de Flujo? UN DIAGRAMA DE FLUJO, TAMBIÉN LLAMADO FLUJOGRAMA DE PROCESOS O DIAGRAMA DE PROCESOS, REPRESENTA LA SECUENCIA O LOS PASOS.
MÉTODOS NUMÉRICOS 1.2 Aproximación Numérica Gustavo Rocha
Introducción al mundo de las comunicaciones
Ingreso , proceso y salida de datos
Vibraciones en sistemas físicos
REFORZAMIENTO EN MATEMÁTICAS
EDUMOVIL: Cómputo Inteligente Aplicado a la Educación e Ingeniería
Realizar presentaciones en Power Point
Calculo integral. Notación sumatoria.
TEOREMA FUNDAMENTAL DEL CALCULO
“POLIMORFISMO PARAMETRICO”
LICENCIATURA EN SISTEMAS DE COMPUTACIÓN ADMINISTRATIA TEORÍA DE MODELOS
¿QUÉ TIENEN EN COMÚN UN MONO Y UN RATÓN?
La operación inversa de la potenciación
Conceptos Básicos de Programación
Modelos de Simulación.
Fuente:
Grado de Administración y Dirección de Empresas
Tema 6. Conceptos básicos de programación (Clase 2)
Presentado por: Diana Torres Azucena Blagauera
Algunas consideraciones con Redes Neuronales
Unidad 6. Capítulo I. Introducción.
Programación de trayectoria mediante KUKA|prc
Unidad 4 Anexo 3. Capítulo V. Reducción del orden.
CAPÍTULO 7: DETECCIÓN DE BORDES
PREDICCIÓN Y ESTIMACIÓN
Análisis de error en estado estacionario México D.F. a 18 de Septiembre de 2006 Departamento de Control, División de Ingeniería Eléctrica Facultad de Ingeniería.
Sistemas Operativos Ing. Jhonnathan Quintero V.
INTELIGENCIA ARTIFICIAL
Funciones Prof. M. Alonso
Unidad 2 Capítulo II Ecuaciones no lineales
Algoritmo Capitulo Cinco.
una solución. Los algoritmos son objeto de estudio de la algoritmia.
PowerPoint.
UNIDAD 1 APROXIMACIÓN NUMÉRICA Y ERRORES  Aproximación numérica y problema de caja negra.  Sistema numérico de punto flotante.  Error de redondeo. 
Una aproximación a Vectores y Matrices
LENGUAJES DE SIMULACIÓN Y SIMULADORES DE
Computación Nivel Usuario CB-123
1.4 CONCEPTO DE MODELO 1/13.
I N S T R U C O A L D I S E Ñ O MODELO ADDIE.
Universidad Tecnológica de Panamá. Centro Regional de Panamá Oeste. Facultad de Ingeniería Civil. Matemática superior para ingenieros. Sistema de tiempos.
1 Capital Asset Pricing Model (CAPM) Como podemos manejar el riesgo bajo algunos suposiciones sobre el tipo del riesgo.
Bloque III: Herramientas avanzadas de software de aplicación
Predicción de fallos en redes bancarias mediante Machine Learning
Procesamiento de señales Introducción a Matlab 2014
CÁLCULO DIFERENCIAL EN FUNCIONES DE VARIAS VARIABLES
CÓMO RESOLVER LOS PROBLEMAS
Objetivos:  Explicar el concepto de la Investigación de Operaciones mediante análisis del tema.  Describir los pasos del método científico en Investigación.
Francisco García Barrios
Lingüística computacional
MATRICES. ¿QUÉ ES UNA MATRIZ? Una matriz es un espacio bidimensional que se genera en la memoria del computador. Las matrices deben tener un nombre que.
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
Tema 6. Conceptos básicos de programación (Clase 2)
INSTITUTO TECNOLOGICO DE VERACRUZ
METODO TSK (TAKAGI- SUGENO.KANG). En 1985, Takagi y Sugeno aportan a la teoría del control difuso un nuevo método llamado de Takagi-Sugeno-Kang (TSK),
MÉTODOS NUMÉRICOS INGENIERIA EN ELECTRONICA, CONTROL Y REDES INDUSTRIALES INTEGRANTES: FRANKLIN GUAMAN EDISON REMACHE SEMESTRE: 4to “A”
Características de los Sistemas Operativos
Interpolación. Dados n + 1 puntos, hay uno y sólo un polinomio de grado* n que pasa a través de todos los puntos. Por ejemplo, hay sólo una línea recta.
Universidad Laica Eloy Alfaro de Manabí Extensión El Carmen Nombre: Génesis Mishell López Figueroa Ing: Soraida Zambrano Tema: Avance 1 Fecha: 30/04/2019.
MODELADO Y SIMULACIÓN Introducción al Modelado y Simulación.
TRABAJO DE TITULACIÓN PREVIO A LA OBTENCIÓN DEL TÍTULO DE MAGÍSTER EN GERENCIA DE SISTEMAS TEMA: “DISEÑO DE UNA GUÍA CORPORATIVA PARA IMPLEMENTAR APLICACIONES.
EL CALCULO DE AREA BAJO LA CURVA EN EL CONTEXTO DE LAS CIENCIAS EXACTAS, SOCIALES, NATURALES Y ADMINISTRATIVAS. INTEGRANTES: VALDEZ REYES CESAR OTHONIEL.
Investigación de mercado. DEFINICION La Investigación de Mercados es un elemento clave dentro del campo de la información de marketing. Vincula al consumidor,
¿Qué es y para qué sirve el Ajuste de Observaciones?¿Por que es necesario buscar métodos alternativos? Ana Mª Domingo Preciado Profesora Titular de Ajuste.
SIMULACIONES 2019 German Vega Quintero John Farley Paez Santamaria.
Transcripción de la presentación:

Una introducción a Deep Learning

¿Quien soy? Jennifer Barry Hago investigación y gerencia de proyectos

¿Quien soy? David Rostcheck Soy asesor de data science Sigue mis artículos en LinkedIn

Somos los evangelistas de Santiago para Turi GraphLab Create un producto que acelera el desarrollo de aplicaciones inteligentes

también ofrecemos cursos en microcontroladores y robótica

DEEP LEARNING

en algunas pruebas, Deep Learning ya muestra habilidades al mismo nivel de seres humanos

Estos incluyen: computadores que entienden lenguaje natural vehículos autónomos programas que pueden identificar lo que está ocurriendo en un video

Es notable que estas soluciones de problemas diversos en campos muy diferentes usan la misma tecnología poderosa

RED NEURONAL

una abstracción matemática una red neuronal es una simulación del cerebro, una abstracción matemática

en el cerebro real, las neuronas mandan señales con fre cuen ci as no señales discretos

existen herramientas que tratan de simular el cerebro en una manera más fiel al cerebro

Ejemplo: Numenta NuPIC, un tipo de memoria temporal jerárquica [Hierarchical Temporal Memory (HTM)]

pero las técnicas de redes neuronales son suficientes para entregar resultados similar o mejor que seres humanos en pruebas cognitivas especificas

entonces: Deep Learning lo que es?

punto de visto común: una con red distintos neuronal niveles es correcto, pero…

Hay otro punto de visto, tal vez más útil, que vamos a presentar acá

Viene del Vincent Vanhoucke, Principal Research Scientist en Google. Lo que sigue viene de su curso en Deep Learning, en Udacity

Él piensa sobre Deep Learning como un marco para calcular ecuaciones lineal y casi-lineal en manera eficiente

clasificador Para desarrollar este marco, vamos a construir un lo más sencillo (y malo) posible

Pero espera un momento… ¿ por qué un clasificador?

Porque clasificación (o más generalmente predicción) es una técnica central en Machine Learning Con esto, podemos alcanzar a ranking, regresión, detección, reinforcement learning, y más…

Empezamos con ecuación de línea, en forma vectorial…

Piensa en construir un clasificador sencillo para predecir, para cada elemento de X, lo que es:

Para hacerlo, tenemos que aprender los valores del W y b

Funciona bien?

No. Es malísimo.

¿Por qué?

Hay dos problemas…

No. 1: El da valores, y lo que queremos son probabilidades

Lo podemos arreglar con la función “softmax”

Expresamos los valores correctos en un vector de valores 1 (correcto) y 0 (los otros). Esto se llama “one-hot encoding”

para evaluar errores, comparamos las probabilidades con los valores correctas

usando lo que llamamos “cross-entropy”

mejor, pero… Se queda el segundo problema: Nuestra ecuación es lineal y no puede representar bien las ecuaciones no lineal

Este problema mató el perceptron (1-nivel red neuronal)

no ayuda sólo para agregar niveles a la red porque se puede representar cualquiera combinación de operaciones lineales como otro operación lineal – podemos reducir la red nueva al otro WX + b con el mismo problema 

¿Qué hacemos?

tenemos que introducir funciones no lineales Sin otra opción, tenemos que introducir funciones no lineales logistic function

Pero se cuesta calcular – podemos usar una aproximación, la más sencilla. Se llama “Rectified Linear Unit” , o ReLU

Ahora podemos construir nuestra red neuronal, en una manera eficaz para calcular

que se expresa en una manera modular, un serie de operaciones lineales o casi-lineales con matriz .. que nos permite usar el poder de GPU

para mejorar nuesta estimación, minimizamos el error, y está bien, pero nos falta una cosita más… para mejorar nuesta estimación, minimizamos el error, y esto require que calculamos el derivado de la funciona

piensa en la regla de cadena de cálculo: d f(x) = d du f(x) dx du dx

se puede convertir un derivado en un producto (de otro derivados):

Qué cabe en nuestro marco modular 

Ahora lo tenemos! Un marco general y modular que incorpora todo que necesitamos!

…pero espera un momento: y podemos construir redes neuronales profundas, sumando más niveles cómo necesitamos …pero espera un momento: por qué nos gustan redes profundas?

los problemas lo más interesantes, como lenguaje y visión, tienen reglas muy complejos necesitamos muchos parámetros para representarlos

sí, pero por qué no usamos redes más anchas? por qué es mejor profundo?

son más eficaces y capturan mejor la estructura inherente en muchos problemas

CONVNETS

la red convolucional, o convnet, se transforma la entrada en una manera así que no importa el traslado en la entrada se usan para reconocimiento visual

Empezamos con una foto:

usamos una región (kernel) de foto cómo entrada para otra red neuronal chica, con K salidas

deslicemos la ventana a través de la foto

transforma la foto en foto nuevo, con K canales de color, y dimensiones diferentes

esta operación se llama una convolución

? si la región (el “kernel”) tuviera tamaño el mismo como el original, qué obtuviéramos? ?

en eso caso, recuperemos la foto original

Questions? ? Contact: drostcheck@leopardllc.com, twitter: @davidrostcheck Articles: http://linkedin.com/in/davidrostcheck