ARQUITECTURAS CELULARES Autómatas Celulares y Redes Neuronales Rafael Gadea Gironés Joaquín Cerdá Boluda Última Actualización 17/09/2018
Temas y Proyectos de investigación Procesami Aplicación de redes Aplicación e implem Metodología Procesamiento de imágenes y video Aplicaciones e implementación de redes neuronales en compresión Aplicaciones e implementación de autómatas celulares Metodología de Diseño de ASIC/FPGA
AUTÓMATAS CELULARES: Perspectiva 1940: von Neumann y Ulam, Sistemas Autorreproducibles 1970: Conway y Gardner, El Juego de la Vida 1980: Wolfram, Autómatas Elementales; Toffoli, Modelado Físico; Margolus, Teoría de la Computación 1990: Reversibilidad, Relatividad, Fenómenos cuánticos, VLSI, BIST, Algoritmos genéticos, Imagen, Criptografía... 2000: ???
AUTÓMATAS CELULARES: Concepto Matriz regular de células en espacio d-dimensional; Variables Φ(r,t)={Φ1(r,t), Φ2(r,t), ..., Φm(r,t)} ligado a cada nodo de la matriz = estado interno de cada célula en el tiempo t=0,1,2...; Regla R={R1, R2, ..., Rm} que especifica evolución temporal: Φj(r,t+1)=Rj(Φ(r,t), Φ(r+δ1,t), Φ(r+δ2,t), ..., Φ(r+δq,t)) r+δk=vecindad de una célula r. Margolus
AUTÓMATAS DE WOLFRAM Unidimensionales, Vecindad de radio 1 256 reglas elementales Notación compacta para las reglas, basada en codificación binaria Clases de Comportamiento: trivial, periódico, caótico y complejo Aplicación: Generación de números aleatorios
VECINDAD DE MARGOLUS Objetivo: Invertibilidad Partición del espacio en bloques disjuntos Mapeo del bloque completo Reglas: BBMCA, HPP, DIAG_Then_Down... Más eficiente en implementación secuencial
VECINDAD DE MARGOLUS: Implementación Versión secuencial Versión Paralela Familia APEXII STRATIX VIRTEX VIRTEXII Dispositivo EP2A25F672C7 EP1S25F780C6 V200BG256-6 XC2V80FG256-4 LCs / Slices 91 68 40 Frecuencia Máxima 111,02MHz 187,86MHz 85,690MHz 143,021MHz Familia 4000 VIRTEX VIRTEXII Dispositivo 4020XLPQ160-09 V200BG256-6 XC2V80FG256-4 CLB/Slices (Célula) 2 CLB/Slices (Matriz 8x8) 96 97 Frecuencia Máxima 40,596MHz 103,082MHz 165,618MHz Tamaño Máximo (Dispositivo) 22x22 39x39 18x18 Tamaño Máximo (Familia) 74x74 90x90 176x176
MODELOS SBM Vecindad de Margolus 1D Modelos: de No Interacción, de Estructuras Estáticas, de Conservación del Impulso... Puertas Lógicas: Puerta de interacción, memoria, Fredkin...
MODELADO FÍSICO: Método BE-PE Enfoque probabilístico. Pasos: (a) Tiempo y espacio continuo retículo discreto. (b) Variables continuas valores binarios. (c) Ecuaciones en Derivadas Parciales Diferencias Finitas. (d) Aplicar ecuaciones discretas a una célula y todas sus posibles configuraciones de vecindad para obtener todos los resultados posibles. (e) Encontrar regla que permita obtener esos resultados. (f) Efectuar evolución del espacio celular completo sometido a condiciones de contorno para comprobar en qué medida los resultados obtenidos se adaptan al comportamiento macroscópico deseado.
AUTÓMATA RNR Resuelve la ecuación de Laplace en un retículo para todas las células en el retículo s=0; para todas las células vecinas s=valor(vecino); fin para s=s/4; v=valor real aleatorio entre 0 y 1; si v<s siguiente valor(célula)=1; si no siguiente valor(célula)=0; fin si
AUTÓMATA RNR: Implementación XILINX XCV800 (speed grade –4) Slices 95 362 1489 Frecuencia Máxima (MHz) 80,85 59,34 48,473 Slices con RNG 128 395 1516 Frec. Max. con RNG (MHz) 74,538 58,05 65,28 Slices con control 281 553 1710 Frec. Max. con control (MHz) 85,34 67,40 57,195 Tamaño 8x8 16x16 32x32 Tiempo de Evolución + Transmisión (ms) 4,167 16,667 66,667
AUTÓMATA RNR: Resultados
CONCLUSIONES INTERÉS RESULTADOS Teórico Práctico Modelado Generación de números aleatorios Práctico Estructuras optimizadas para la aplicación y el soporte RESULTADOS J. Cerdá, R. Gadea, G. Payá. Implementing a Margolus Neighborhood Cellular Automata on a FPGA. En Artificial Neural Nets Problem Solving Methods. Lecture Notes in Computer Science 2687:121-128, 2003. J. Cerdá, R. Gadea, V. Herrero, A. Sebastià. On the Implementation of a Margolus Neighborhood Cellular Autómata on FPGA. En Field-Programmable Logic and Applications. Lecture Notes in Computer Science 2778:776-785, 2003. J. Cerdá, O. Amoraga, R. Torres, R. Gadea, A. Sebastià. FPGA Implementations of the RNR Cellular Automata to model Electrostatic Field. Pendiente de publicación en VECPAR 2004.
Temas y Proyectos de investigación Aplicación de redes neuronales Centrado en compresión Redes autoasociativas Transformada de Karhunen-Loeve Predictores no lineales Redes para la cuantización vectorial Implementación sobre FPGA/ASIC TRANSFORMADA CUANTIFICACIÓN CODIFICACION Video comprimido Fuente de video
TÉCNICAS ELECTRÓNICAS Implementaciones Hardware de redes neuronales NEUROCOMPUTADORAS TÉCNICAS ELECTRÓNICAS OTRAS TÉCNICAS C.I. ESTANDAR NEUROCHIPS TÉCNICAS Un solo secuencial + Múltiples ANALÓGICOS MIXTOS DIGITALES ELECTROQUIMICAS procesador tarjeta aceleradora procesadores OPTOELECTRÓNICAS MOLECULARES
TÉCNICAS ELECTRÓNICAS Implementaciones Hardware de redes neuronales APORTACIONES DESEABLES Velocidad Portabilidad Conectividad Memoria Precisión Tecnología Proceso de diseño NEUROCOMPUTADORAS TÉCNICAS ELECTRÓNICAS Velocidad NEUROCHIPS ASIC Densidad Integración DIGITALES Programación eléctrica:Flexibilidad FPGA Reconfiguración dinámica:evolución
Ejemplo de implementación MULTILAYER PERCEPTRON (MLP) SYNAPSES NEURON THREE LAYERS: two hidden an one output Escaled MLP FEEDFORWARD NE N1O N2O NS
R. Gadea, A. Ramírez, R. colom, J. Cerdá, FPGA Implementation of Adaptive Non-linear Predictors for Video Compression . R. Gadea, A. Ramírez, R. colom, J. Cerdá, Field-Programmable Logic and Applications. Lecture Notes in Computer Science 2778 coder predictor Image Source å + - I c e n h
R. Gadea, A. Ramírez, R. colom, J. Cerdá, FPGA Implementation of Adaptive Non-linear Predictors for Video Compression . R. Gadea, A. Ramírez, R. colom, J. Cerdá, Field-Programmable Logic and Applications. Lecture Notes in Computer Science 2778 coder predictor Image Source å + - I c e n h
R. Gadea, A. Ramírez, R. colom, J. Cerdá, FPGA Implementation of Adaptive Non-linear Predictors for Video Compression . R. Gadea, A. Ramírez, R. colom, J. Cerdá, Field-Programmable Logic and Applications. Lecture Notes in Computer Science 2778 coder predictor Image Source å + - I c e n h
R. Gadea, A. Ramírez, R. colom, J. Cerdá, FPGA Implementation of Adaptive Non-linear Predictors for Video Compression . R. Gadea, A. Ramírez, R. colom, J. Cerdá, Field-Programmable Logic and Applications. Lecture Notes in Computer Science 2778 coder predictor Image Source å + - I c e n h EP1S60B856C7 (STRATIX) Number of Logic Cells:7,362 out of 57,120 12% Number of Flip-Flops: 2,381 out of 59,193 4% Number of DSP blocks: 133 out of 144 92% Number of m512s: 47 out of 574 8% X2V3000BF957-6 (VIRTEX2) Number of Slices: 3,601 out of 14,336 25% Number of Flip-Flops: 2,114 out of 28,672 18% Number of Mult18x18s: 75 out of 96 78% Number of RAMB16s: 48 out of 96 50 %
FPGA Implementation of Adaptive Non-linear Predictors for Video Compression . coder predictor Image Source å + - I c e n h Hidden Neurons 10 20 Context (inputs) 12 4 PSNR 27.8575 27.9511 27.4993 28.5662 28.5537 Entropy of residue 4.9858 4.9763 5.0409 4.855 4.8648 Entropy of original 7.5888 Version Learning Batch line On line
Temas y Proyectos de investigación Metodología de diseño ASIC/FPGA Verificación funcional con lenguajes de verificación (VERA) Síntesis de alto nivel. Optimización aritmética. Sistolización. Retiming. Nuevos lenguajes de diseño: System C Flujo de diseño en ASIC Metodología de bajo consumo Metodología de test
Rafael Gadea Gironés Joaquín Cerdá Boluda Valencia, Febrero de 2004 Rafael Gadea Gironés Joaquín Cerdá Boluda Última Actualización 17/09/2018