Introducción Una red neuronal artificial (ANN) es un modelo matemático o un modelo computacional basado en las redes neuronales biológicas Las ANN son.

Slides:



Advertisements
Presentaciones similares
Conocimiento, Uso y Evaluación de Medicamentos Genéricos
Advertisements

Jacqueline Chávez Cuzcano
INTRODUCCION A TECNICAS DE MINERIA DE DATOS
SISTEMAS INTELIGENTES
Complejidad Computacional
Introducción a las Redes neuronales
SIMULACIÓN DE MONTECARLO
MuestraMétodo a prueba Nominal Ejercicio 1. ¿Es exacto el método?
DATA MINING MINERIA DE DATOS Gersom Costas.
MEDIDAS DE TENDENCIA CENTRAL
Administración de Desastre
© Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas UPR Río Piedras Un experimento.
Contraste de Hipótesis
Estimación de parámetros poblacionales
Silvana Arias Carla Espinosa Livia Loaiza INGENIERIA EN SISTEMAS
Marco Matamala Castro Prof. Guía Luis Zamorano Riquelme
7. Máquinas Estocásticas
FUNCIONES DE UNA VARIABLE REAL
MUESTRARIO 2 Del Diseño 62- al diseño 97. Muestrario 2 Diseño 62Diseño 63.
Indicadores CNEP Escuela
PROYECTO DE GRADO CARLOS STALIN ALVARADO SANCHEZ
¡Primero mira fijo a la bruja!
Red Neuronal de Contrapropagación
Definición Machine learning traducido al español significa el aprendizaje automático o también aprendizaje de las maquinas. A partir de esto podemos darle.
Redes neuronales2 José Edinson Aedo Cobo Depto. de Ing. Electrónica.
Representación en espacio de estado
Especialista en Business Intelligence Analysis Services SSAS (Sesión 14) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a
Avalúo y mejoramiento continuo en un curso medular (Econ
By: Nicholas, Rayna, Nathaniel, Calvin
Los números. Del 0 al 100.
“Persuasive argumentation in negotiation” Katia P. Sycara.
El Perceptrón  El psicólogo Frank Ronsenblant desarrolló un modelo simple de neurona basado en el modelo de McCulloch y Pitts que utilizaba.
Autora: MSc. María de los Ángeles Hernández Ruiz

Prof. Rodrigo Silva Zepeda
UNIVERSIDAD CATÓLICA DEL MAULE FACULTAD DE CIENCIAS DE LA INGENIERÍA ESCUELA DE INGENIERÍA CIVIL INFORMÁTICA PROFESOR GUÍA: HUGO ARAYA CARRASCO. ALUMNO.
MINISTERIO DE EDUCACI Ó N NACIONAL COLOMBIA APRENDE HíBRIDO ENTRE UNA RED NEURONAL Y UN MODELO ARIMA PARA LA ESTIMACI Ó N DE PRECIOS DE LOS VEHíCULOS EN.
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Maracaibo, 5 de Noviembre de 2007 Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Universidad del Zulia Facultad de Ingeniería.
Representación del Conocimiento
LENGUAS ELECTRÓNICAS.
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
Introducción Calculabilidad clásica Computación celular
Redes Neuronales Monocapa
Lucila L. Chiarvetto Peralta Aplicaciones de redes neuronales Predicción de PM-10.
Ejemplo de aplicación de las ANN
1 Problema no separable linealmente Se busca obtener un algoritmo más general que permita integrar el aprendizaje entre las dos capas.
Tipos de redes neuronales Perceptrón multicapa Redes de respuesta radial Competitivas Clasificación Mapa topológico.
Integrantes: Daniel Peña Alfredo Zuñiga
Aplicaciones de las Redes Neuronales Artificilaes Dr. Héctor Allende
Contenido Identificación de sistemas con redes neuronales Modelado de dinámica temporal de las manchas solares.
Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.
Modelos Computacionales
REDES NEURONALES.
Introducción a la Inferencia Estadística
Aprendizaje Automatizado
Redes Neuronales BPN - Backpropagation Networks
Redes Neuronales Artificiales Entrenamiento por Retropropagación del Error-Backpropagation Dr. Pedro Ponce Cruz EGIA-MCI.
Redes neuronales feed-forward
Algoritmo de Retropropagación. Conclusiones de Retropropagación n 1. Si la neurona j es un nodo de salida es igual al producto de la derivada y la señal.
Introducción a los Sistemas Inteligentes
Identificacion con redes neuronales
REDES NEURONALES TEORÍA MODERNA DE LA FIRMA 2010.
Taller: Inteligencia Computacional
2.1 DEFINICIONES CARACTERÍSTICAS Y SUPOSICIONES.
Desde el principio de la humanidad se soñó con el desarrollo de máquinas que puedan imitar la capacidad de aprendizaje del hombre. Actualmente es un desafío.
Heurística. Los procesos que se llevan a cabo en el cerebro pueden ser analizados, a un nivel de abstacción dado, como procesos computacionales de algún.
Redes Neuronales.

Unsupervised visual learning of three-dimensional objects using a modular network architecture Ando, Suzuki, Fujita Neural Networks 12 (1999)
Transcripción de la presentación:

Introducción Una red neuronal artificial (ANN) es un modelo matemático o un modelo computacional basado en las redes neuronales biológicas Las ANN son usadas como técnicas estadísticas para modelar complejas relaciones entre entradas y salidas de un sistema Dentro del área de inteligencia artificial, las ANN se las clasifica como un método de aprendizaje automatizado (machine learning)

Composición Las ANN consisten de un grupo de neuronas (nodos, unidades, elementos de procesamiento) interconectadas entre sí Cada una de las interconexiones posee “pesos” diferentes La característica saliente de las ANN, es que son capaces de cambiar los pesos de las conexiones en forma automática durante la fase de aprendizaje

Problemas de los enfoques tradicionales ¿Por qué resulta interesante la propuesta de modelar un sistema con ANN? ¿Por qué construir una ANN para modelar un sistema y no programar un algoritmo que lo modele? Capacidad de modelado sin conocimiento previo de la causa de las relaciones entrada-salida Operación con ruido / Tolerante a fallos Generalizar ante casos no previstos

Analogía para una neurona

Funcionamiento de una neurona aislada Se define el modo en que el nodo: recolecta las entradas, actualiza su nivel de activación y transmite la respuesta a través de su salida Comúnmente ai= oi

Regla de Propagación Determina en qué medida se propagan las activaciones entre las neuronas. Los pesos de las conexiones será lo que determine cuanta activación se transmite. Para un nodo i la activación recibida hi suele escribirse como:

Función de activación (a) Lineal o identidad (b) Escalón o umbral (c) Saturación: Sigmoide o logística

Perceptron El modelo de una neurona sola se lo conoce con el nombre de Perceptron (1958) Es útil solo en casos donde la salida puede tomar 2 valores y el problema admite una separación lineal Existe un hiperplano perteneciente al subespacio definido por el vector  que separa los patrones de entrada en 1 y 2

Redes Neuronales multi-capa Permiten solucionar el problema de separabilidad lineal. Comenzaron a utilizarse con la regla de backpropagation Se utilizan unidades sigmoides o logísticas

Conectividades Se clasifica los nodos en capas Pesos: Entrada Salida Escondidos o interiores. Pesos: Positivos (sinapsis excitatorias) Negativos (sinapsis inhibitorias) Nulos (no hay sinapsis) Tipos que originan los distintos modelos: Fully-connected Feed-forward Recurrent networks. Variantes en el tiempo

¿Cómo aprende una ANN? Supongamos que tenemos una base de datos con información histórica del crecimiento de girasol ante diferentes condiciones de cultivo Existen 2 fases destacables Fase de entrenamiento Fase de testeo   Agua p/dia [cm3] Fertiliz p/día [gr] Tipo suelo Tipo clima Altura Girasol [cm] Caso 1 81.97 86.63 3 1 139.77 Caso 2 1020.24 133.39 4 2 134.15 Caso 3 851.67 127.31 142.59 Caso 4 94.77 206.65 122.52 Caso 5 751.03 267.02 125.07 Caso 6 857.77 254.63 143.90 Caso 7 491.36 244.43 86.51 Caso 8 111.82 186.86 67.69 Caso 9 222.96 45.66 131.17 Caso 10 259.87 166.88 129.74 Caso 11 508.06 185.48 131.94 Caso 12 1025.47 119.63 71.91 Caso 13 599.88 198.00 122.82 Caso 14 950.62 273.03 125.76 Caso 15 148.19 36.67 134.39

Separación de los datos   Agua p/dia [cm3] Fertiliz p/día [gr] Tipo suelo Tipo clima Altura Girasol [cm] Caso 1 81.97 86.63 3 1 139.77 Caso 2 1020.24 133.39 4 2 134.15 Caso 3 851.67 127.31 142.59 Caso 4 94.77 206.65 122.52 Caso 5 751.03 267.02 125.07 Caso 6 857.77 254.63 143.90 Caso 7 491.36 244.43 86.51 Caso 8 111.82 186.86 67.69 Caso 9 222.96 45.66 131.17 Caso 10 259.87 166.88 129.74 Caso 11 508.06 185.48 131.94 Caso 12 1025.47 119.63 71.91 Caso 13 599.88 198.00 122.82 Caso 14 950.62 273.03 125.76 Caso 15 148.19 36.67 134.39 Entrenamiento Testeo

Construcción de la arquitectura Inicialmente la red es construida con pesos aleatorios en sus conexiones Los datos seleccionados para entrenamiento son presentados a la red y ésta calcula su salida

Aprendizaje   Agua p/dia [cm3] Fertiliz p/día [gr] Tipo suelo Tipo clima Salida Red Neuronal Caso 1 81.97 86.63 3 1 98.65 Caso 2 1020.24 133.39 4 2 128.84 Caso 3 851.67 127.31 45.26 Caso 4 94.77 206.65 21.52 Caso 5 751.03 267.02 18.65 Caso 6 857.77 254.63 169.65 Caso 7 491.36 244.43 65.69 Caso 8 111.82 186.86 218.63 Caso 9 222.96 45.66 39.56 Caso 10 259.87 166.88 62.40 Altura Girasol [cm] 139.77 134.15 142.59 122.52 125.07 143.90 86.51 67.69 131.17 129.74 Una vez calculada la salida de la red, se mide la diferencia con la salida esperada Utilizando “algún método de optimización” se modifican los pesos de las conexiones, de manera de poder reducir la diferencia entre la salida de la red con la salida esperada

Aprendizaje La forma en que los pesos se actualizan se puede pensar como un método de optimización sobre una función de error que depende de los valores de los pesos Lo que se busca es encontrar la disposición de pesos que minimice el error producido por la red

Fin de entrenamiento Al cabo de una cierta cantidad de iteraciones se consigue que los pesos de la red se correspondan (exactamente o no) con la especificación de nuestro modelo El criterio de finalización no siempre es una tarea fácil de decidir   Agua p/dia [cm3] Fertiliz p/día [gr] Tipo suelo Tipo clima Salida Red Neuronal Caso 1 81.97 86.63 3 1 138.45 Caso 2 1020.24 133.39 4 2 132.75 Caso 3 851.67 127.31 142.98 Caso 4 94.77 206.65 122.38 Caso 5 751.03 267.02 125.79 Caso 6 857.77 254.63 142.75 Caso 7 491.36 244.43 89.81 Caso 8 111.82 186.86 69.67 Caso 9 222.96 45.66 130.18 Caso 10 259.87 166.88 129.80 Altura Girasol [cm] 139.77 134.15 142.59 122.52 125.07 143.90 86.51 67.69 131.17 129.74

Fase de testeo Con la última disposición de pesos alcanzada, se puede probar el modelo entrenado con nuevos datos Esto permite determinar si la red neuronal es capaz de generalizar o inferir ante casos no especificados en el entrenamiento La capacidad de generalización, representa la medida de desempeño más importante de una red neuronal   Agua p/dia [cm3] Fertiliz p/día [gr] Tipo suelo Tipo clima Salida Red neuronal Altura Girasol [cm] Caso 11 508.06 185.48 3 1 130.85 Caso 12 1025.47 119.63 73.84 Caso 13 599.88 198.00 127.53 Caso 14 950.62 273.03 123.71 Caso 15 148.19 36.67 132.83 131.94 71.91 122.82 125.76 134.39

1º caso de estudio Artificial neural network approach for modelling nitrogen dioxide dispersion from vehicular exhaust emissions S.M. Shiva Nagendra, Mukesh Khare Department of Civil Engineering, Indian Institute of Technology Delhi, New Delhi, India Ecological Modelling 190 (2006) 99–115

1º caso de estudio Los autores plantean el uso de redes neuronales para modelar la concentración de dióxido de nitrógeno por la emisión de gases vehiculares Argumentan a favor de las redes por: no necesitan ninguna suposición sobre la distribución de los datos son capaces de representar funciones altamente no lineales capacidad de generalizar

1º caso de estudio Los datos para los modelos se obtuvieron de dos puntos de la ciudad (un cruce y una autopista) Se tomaron en cuenta como variables influyentes: 10 características meteorológicas (nubosidad, humedad, mixing height, presión, Pasquill stability, horas de sol, temperatura, visibilidad, seno y coseno de la dirección del viento, velocidad del viento) 6 variables de tráfico (vehículos de 2 ruedas, 3 ruedas y 4 ruedas (nafta y diesel), concentración de CO y NO2) Se consideraron los promedios por día durante 2 años para el entrenamiento (1997 y 1998) y otro año para el testeo

1º caso de estudio Se realizaron 3 modelos diferentes: 1) Considerando sólo factores climáticos 2) Considerando sólo factores de tráfico 3) Considerando factores climáticos y de tráfico

1º Caso - Resultados Como resultados se obtuvo que: el modelo 3 se comporta de modo satisfactorio, el modelo 1 empeora levemente con respecto al 3 y el modelo 2 es una representación muy pobre Las características más interesantes del trabajo son: nivel de detalle de las opciones de diseño elegidas (arquitectura, funciones de activación, parámetros de aprendizaje, pesos iniciales, entrenamiento/testeo y criterio de parada) distintas medidas del error en la predicción

2º Caso de estudio Assessment and prediction of tropospheric ozone concentration levels using artificial neural networks S.A. Abdul-Wahab, S.M. Al-Alawi Mechanical and Industrial Engineering Department, Sultan Qaboos University, Muscat, Oman Electrical and Electronics Engineering Department, Sultan Qaboos University, Muscat, Oman Environmental Modelling & Software 17 (2002) 219–228

2º caso de estudio Los autores enfatizan en la dificultad de modelar ozono, dado que éste no es emitido directamente sino que es producto de complejas reacciones químicas en la atmósfera Existen modelos determínisticos que resuelven las interacciones químicas y físicas, pero requieren de la obtención de muchos datos y de una alta cantidad de recursos humanos Modelos estadísticos basados en análisis de correlación o análisis de series de tiempo fallan ante relaciones no lineales

2º caso de estudio El uso de las redes neuronales es justificado por la capacidad de representar funciones no lineales Las variables medidas para el modelo son: Contaminantes: CH4, NMHC, CO, CO2, NO, NO2, SO2 Climáticas: velocidad del viento, temperatura, humedad, energía solar y polvo en suspensión

2º caso de estudio Se plantean 3 modelos con objetivos diferentes: 1) estudiar los factores que afectan las concentraciones de ozono en un período de 24 horas 2) estudiar los factores que afectan las concentraciones de ozono durante las horas solares 3) predecir los niveles máximos de ozono El trabajo presenta buen cuidado en el origen de los datos y en el análisis de la importancia de las variables de entrada Sin embargo, desde el punto de vista de la predicción no es convincente

2º caso de estudio Se obtuvo que el NO, SO2, la humedad, NHMC y el NO2 son las variables más influyentes Las condiciones meteorológicas describen un 33% - 35% de la varianza de la concentración de ozono El 3º modelo fue entrenado con 16 muestras (claramente insuficiente), y sus conclusiones no son representativas

2º Caso - Resultados