La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Introducción Una red neuronal artificial (ANN) es un modelo matemático o un modelo computacional basado en las redes neuronales biológicas Las ANN son.

Presentaciones similares


Presentación del tema: "Introducción Una red neuronal artificial (ANN) es un modelo matemático o un modelo computacional basado en las redes neuronales biológicas Las ANN son."— Transcripción de la presentación:

1

2 Introducción Una red neuronal artificial (ANN) es un modelo matemático o un modelo computacional basado en las redes neuronales biológicas Las ANN son usadas como técnicas estadísticas para modelar complejas relaciones entre entradas y salidas de un sistema Dentro del área de inteligencia artificial, las ANN se las clasifica como un método de aprendizaje automatizado (machine learning)

3 Composición Las ANN consisten de un grupo de neuronas (nodos, unidades, elementos de procesamiento) interconectadas entre sí Cada una de las interconexiones posee pesos diferentes La característica saliente de las ANN, es que son capaces de cambiar los pesos de las conexiones en forma automática durante la fase de aprendizaje

4 Problemas de los enfoques tradicionales ¿Por qué resulta interesante la propuesta de modelar un sistema con ANN? ¿Por qué construir una ANN para modelar un sistema y no programar un algoritmo que lo modele? Capacidad de modelado sin conocimiento previo de la causa de las relaciones entrada- salida Operación con ruido / Tolerante a fallos Generalizar ante casos no previstos

5 Analogía para una neurona

6 Funcionamiento de una neurona aislada Se define el modo en que el nodo: recolecta las entradas, actualiza su nivel de activación y transmite la respuesta a través de su salida Comúnmente a i = o i

7 Regla de Propagación Determina en qué medida se propagan las activaciones entre las neuronas. Los pesos de las conexiones será lo que determine cuanta activación se transmite. Para un nodo i la activación recibida h i suele escribirse como:

8 Función de activación (a) Lineal o identidad (b) Escalón o umbral (c) Saturación: Sigmoide o logística

9 Perceptron El modelo de una neurona sola se lo conoce con el nombre de Perceptron (1958) Es útil solo en casos donde la salida puede tomar 2 valores y el problema admite una separación lineal Existe un hiperplano perteneciente al subespacio definido por el vector que separa los patrones de entrada en 1 y 2

10 Redes Neuronales multi-capa Permiten solucionar el problema de separabilidad lineal. Comenzaron a utilizarse con la regla de backpropagation Se utilizan unidades sigmoides o logísticas

11 Conectividades Se clasifica los nodos en capas Entrada Salida Escondidos o interiores. Pesos: Positivos (sinapsis excitatorias) Negativos (sinapsis inhibitorias) Nulos (no hay sinapsis) Tipos que originan los distintos modelos: Fully-connected Feed-forward Recurrent networks. Variantes en el tiempo

12 ¿Cómo aprende una ANN? Supongamos que tenemos una base de datos con información histórica del crecimiento de girasol ante diferentes condiciones de cultivo Existen 2 fases destacables –Fase de entrenamiento –Fase de testeo Agua p/dia [cm3] Fertiliz p/día [gr]Tipo sueloTipo clima Altura Girasol [cm] Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso

13 Separación de los datos Agua p/dia [cm3] Fertiliz p/día [gr]Tipo sueloTipo clima Altura Girasol [cm] Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso Entrenamiento Testeo

14 Construcción de la arquitectura Inicialmente la red es construida con pesos aleatorios en sus conexiones Los datos seleccionados para entrenamiento son presentados a la red y ésta calcula su salida

15 Aprendizaje Agua p/dia [cm3] Fertiliz p/día [gr] Tipo suelo Tipo clima Salida Red Neuronal Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso Altura Girasol [cm] Una vez calculada la salida de la red, se mide la diferencia con la salida esperada Utilizando algún método de optimización se modifican los pesos de las conexiones, de manera de poder reducir la diferencia entre la salida de la red con la salida esperada

16 Aprendizaje La forma en que los pesos se actualizan se puede pensar como un método de optimización sobre una función de error que depende de los valores de los pesos Lo que se busca es encontrar la disposición de pesos que minimice el error producido por la red

17 Fin de entrenamiento Agua p/dia [cm3] Fertiliz p/día [gr] Tipo suelo Tipo clima Salida Red Neuronal Caso Caso Caso Caso Caso Caso Caso Caso Caso Caso Altura Girasol [cm] Al cabo de una cierta cantidad de iteraciones se consigue que los pesos de la red se correspondan (exactamente o no) con la especificación de nuestro modelo El criterio de finalización no siempre es una tarea fácil de decidir

18 Fase de testeo Con la última disposición de pesos alcanzada, se puede probar el modelo entrenado con nuevos datos Esto permite determinar si la red neuronal es capaz de generalizar o inferir ante casos no especificados en el entrenamiento La capacidad de generalización, representa la medida de desempeño más importante de una red neuronal Caso Caso Caso Caso Caso Agua p/dia [cm3] Fertiliz p/día [gr]Tipo sueloTipo clima Salida Red neuronal Altura Girasol [cm]

19 1º caso de estudio Artificial neural network approach for modelling nitrogen dioxide dispersion from vehicular exhaust emissions S.M. Shiva Nagendra, Mukesh Khare Department of Civil Engineering, Indian Institute of Technology Delhi, New Delhi, India Ecological Modelling 190 (2006) 99–115

20 1º caso de estudio Los autores plantean el uso de redes neuronales para modelar la concentración de dióxido de nitrógeno por la emisión de gases vehiculares Argumentan a favor de las redes por: –no necesitan ninguna suposición sobre la distribución de los datos –son capaces de representar funciones altamente no lineales –capacidad de generalizar

21 1º caso de estudio Los datos para los modelos se obtuvieron de dos puntos de la ciudad (un cruce y una autopista) Se tomaron en cuenta como variables influyentes: –10 características meteorológicas (nubosidad, humedad, mixing height, presión, Pasquill stability, horas de sol, temperatura, visibilidad, seno y coseno de la dirección del viento, velocidad del viento) –6 variables de tráfico (vehículos de 2 ruedas, 3 ruedas y 4 ruedas (nafta y diesel), concentración de CO y NO 2 ) Se consideraron los promedios por día durante 2 años para el entrenamiento (1997 y 1998) y otro año para el testeo

22 1º caso de estudio Se realizaron 3 modelos diferentes: 1) Considerando sólo factores climáticos 2) Considerando sólo factores de tráfico 3) Considerando factores climáticos y de tráfico

23 1º Caso - Resultados Como resultados se obtuvo que: –el modelo 3 se comporta de modo satisfactorio, –el modelo 1 empeora levemente con respecto al 3 –y el modelo 2 es una representación muy pobre Las características más interesantes del trabajo son: –nivel de detalle de las opciones de diseño elegidas (arquitectura, funciones de activación, parámetros de aprendizaje, pesos iniciales, entrenamiento/testeo y criterio de parada) –distintas medidas del error en la predicción

24 2º Caso de estudio Assessment and prediction of tropospheric ozone concentration levels using artificial neural networks S.A. Abdul-Wahab, S.M. Al-Alawi Mechanical and Industrial Engineering Department, Sultan Qaboos University, Muscat, Oman Electrical and Electronics Engineering Department, Sultan Qaboos University, Muscat, Oman Environmental Modelling & Software 17 (2002) 219–228

25 2º caso de estudio Los autores enfatizan en la dificultad de modelar ozono, dado que éste no es emitido directamente sino que es producto de complejas reacciones químicas en la atmósfera Existen modelos determínisticos que resuelven las interacciones químicas y físicas, pero requieren de la obtención de muchos datos y de una alta cantidad de recursos humanos Modelos estadísticos basados en análisis de correlación o análisis de series de tiempo fallan ante relaciones no lineales

26 2º caso de estudio El uso de las redes neuronales es justificado por la capacidad de representar funciones no lineales Las variables medidas para el modelo son: –Contaminantes: CH 4, NMHC, CO, CO 2, NO, NO 2, SO 2 –Climáticas: velocidad del viento, temperatura, humedad, energía solar y polvo en suspensión

27 2º caso de estudio Se plantean 3 modelos con objetivos diferentes: 1) estudiar los factores que afectan las concentraciones de ozono en un período de 24 horas 2) estudiar los factores que afectan las concentraciones de ozono durante las horas solares 3) predecir los niveles máximos de ozono El trabajo presenta buen cuidado en el origen de los datos y en el análisis de la importancia de las variables de entrada Sin embargo, desde el punto de vista de la predicción no es convincente

28 2º caso de estudio Se obtuvo que el NO, SO2, la humedad, NHMC y el NO2 son las variables más influyentes Las condiciones meteorológicas describen un 33% - 35% de la varianza de la concentración de ozono El 3º modelo fue entrenado con 16 muestras (claramente insuficiente), y sus conclusiones no son representativas

29 2º Caso - Resultados

30


Descargar ppt "Introducción Una red neuronal artificial (ANN) es un modelo matemático o un modelo computacional basado en las redes neuronales biológicas Las ANN son."

Presentaciones similares


Anuncios Google