La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

J. Troyano, Víctor Díaz, F. Enríquez y J. Barroso Departamento de Lenguajes y Sistemas Informáticos E.T.S. Ingeniería Informática Universidad de Sevilla.

Presentaciones similares


Presentación del tema: "J. Troyano, Víctor Díaz, F. Enríquez y J. Barroso Departamento de Lenguajes y Sistemas Informáticos E.T.S. Ingeniería Informática Universidad de Sevilla."— Transcripción de la presentación:

1 J. Troyano, Víctor Díaz, F. Enríquez y J. Barroso Departamento de Lenguajes y Sistemas Informáticos E.T.S. Ingeniería Informática Universidad de Sevilla La teoría de autómatas y lenguajes formales, en la práctica

2 Contenido La materia Teoría de Lenguajes Formales y Autómatas (TLFA) Una apuesta: Las Cadenas de Markov Propuesta Didáctica Conclusiones

3 Características TLFA Contenidos jóvenes pero muy consolidados Notación rigurosa Bibliografía –[1972] Aho y Ullman –[1979] Hopcroft y Ullman –[1986] Aho, Setti y Ullman –[2001] Hopcroft, Motwani y Ullman Doble justificación –Científica: Límites de la computación –Técnica: Compiladores Materia TLFA Propuesta Didáctica Conclusiones Cadenas de Markov

4 La Materia TLFA en LSI Propuesta Didáctica Conclusiones Cadenas de Markov Materia TLFA LFA Troncal (4.5 Créditos) 2º Curso TeoríaLaboratorio Nociones Básicas Lenguajes Regulares Lenguajes Incontextuales Jerarquía de Chomsky Flex Bison ALFA Obligatoria (4.5 Créditos) 3º Curso TeoríaLaboratorio Extensión de los Autómatas Finitos Límites de los Lenguajes Regulares Límites de los Lenguajes Incontextuales Máquinas de Turing ?

5 Las cadenas de Markov Propuestas por A. Markov (aprox. 1900) para para averiguar la siguiente letra en un texto ruso Procesos estocásticos discretos con una limitada dependencia temporal entre sucesos (O1, O2,......, On) Aplicaciones (Clasificador): –Etiquetado gramatical –Identificación de idiomas –Desambiguación de significados –Reconocimiento de voz –Reconocimiento de imágenes –Bioinformática –.... Propuesta Didáctica Conclusiones Materia TLFA Cadenas de Markov

6 Autómatas Finitos a  q q0 q2 q1 q2 a a a b b b Materia TLFA Propuesta Didáctica Conclusiones Cadenas de Markov

7 Máquinas Secuenciales a // q 1 q0 q2 q1 a a a b b b Materia TLFA Propuesta Didáctica Conclusiones Cadenas de Markov 0 0 1

8 Cadenas de Markov Visibles q0 q2 q1  0.5 0.3 0.5 0.2 0.7 0.8 q Materia TLFA Propuesta Didáctica Conclusiones Cadenas de Markov

9 Cadenas de Markov Ocultas // q a q0 q2 q1 0.5 0.3 0.5 0.2 0.7 0.8 Materia TLFA Propuesta Didáctica Conclusiones Cadenas de Markov a: 0.3 b: 0.7 b: 1.0 b: 0.4 a: 0.6

10 Etiquetado gramatical Materia TLFA Propuesta Didáctica Conclusiones Cadenas de Markov NOM DET 0.67 VER 0.05 0.423 0.47 el la perro agua bebe piensa 0.08 0.09 0.0003 0.00018 0.002 0.0013......... EntradaElperrobebe agua SalidaDETNOMVERNOM

11 Problemática ¿Cómo obtener un modelo de Markov que se ajuste a las relaciones reales entre etiquetas gramaticales y palabras? –Aprendizaje supervisado en base a las frecuencias relativas calculadas a partir de un corpus etiquetado Dada una frase sin etiquetar ¿cuál es la etiqueta más probable para cada palabra de la frase según el modelo de Markov? –Algoritmo de Viterbi (Algoritmo de maximización utilizando técnicas de Programación Dinámica) Materia TLFA Propuesta Didáctica Conclusiones Cadenas de Markov

12 Arquitectura Corpus Modelo Texto Aplicación (Viterbi) Entrenamiento (Cálculo de probabilidades) Texto etiquetado Materia TLFA Propuesta Didáctica Conclusiones Cadenas de Markov

13 Planificación y Desarrollo Duración: 1 hora semanal Recursos: –Corpus etiquetado –Algoritmo de Viterbi –Lenguaje de manipulación textual Sesiones: –Introducción al lenguaje Perl –Expresiones regulares en Perl –Tablas asociativas en Perl –Cálculo de frecuencias de etiquetas y palabras a partir del corpus –Ejecución y prueba de la implementación del modelo de Markov –Obtención del modelo de Markov a partir de las frecuencias –Aplicación del modelo a un texto sin etiquetar Materia TLFA Propuesta Didáctica Conclusiones Cadenas de Markov

14 Conclusiones Las cadenas de Markov –Una materia muy consolidada –Entronca directamente con TLFA (Extensión Probabilística de las Máquinas secuenciales) –Motivación para el alumno: Nuevas perspectivas de aplicación de los autómatas en otras ingenierías –Flexibilidad y enriquecimiento de prácticas de laboratorio –Una herramienta de actualidad utilizada tanto por empresas como por grupos de investigación –Hay un amplio material gratuito en la red (Tutoriales, Presentaciones, Software) Materia TLFA Propuesta Didáctica Conclusiones Cadenas de Markov

15 J. Troyano, Víctor Díaz, F. Enríquez y J. Barroso Departamento de Lenguajes y Sistemas Informáticos E.T.S. Ingeniería Informática Universidad de Sevilla La teoría de autómatas y lenguajes formales, en la práctica ¡¡ GRACIAS !!


Descargar ppt "J. Troyano, Víctor Díaz, F. Enríquez y J. Barroso Departamento de Lenguajes y Sistemas Informáticos E.T.S. Ingeniería Informática Universidad de Sevilla."

Presentaciones similares


Anuncios Google