TÉCNICAS DE DECONSTRUCCIÓN APLICADAS A LAS TECNOLOGÍAS DEL LENGUAJE HUMANO TIN2012-31224 Octubre 2014: Informe Evaluación de resúmenes Grupo de Procesamiento.

Slides:



Advertisements
Presentaciones similares
Escribir aquí el título de la WQ
Advertisements

Moodle.
Tema 6. Evaluación de SRIs
Importancia de la Documentación de proyectos
La redacción del reporte de investigación
Prof. Adelaide Bianchini. Dpto. de Computación y Tecnología de la Información. Universidad Simón Bolívar. Mayo Diseño centrado en el usuario Prof.
PLAN DE INVESTIGACIÓN.
¿Y EL PLAN DE CLASE? ¿Dónde está? Mtra. Alma Rosa Muñoz Zepeda
Calvin N. Mooers Information Retrieval La búsqueda de información en un stock de documentos, efectuada a partir de la especificación.
MI PROGRAMA DE FORMACION
ATTOS Análisis de Tendencias y Temáticas a través de Opiniones y Sentimientos Kick-off 18 de julio de 2013.
Muestra: Recolección de Datos: Análisis de Datos:
Carmen Helena Guerrero, Ph.D Maestría en Comunicación Educación Trabajo de grado I.
Formulación de la metodología
El análisis y recuperación de información
Copyright © 2014 by The University of Kansas Métodos cualitativos para evaluar asuntos comunitarios.
Se viven nuevos escenarios
Prueba Suficiencia Investigadora Doctorando: Rosa Filgueira Vicente Tutor: David Expósito Singh 27 Febrero 2007.
Selección de los estudios
Tecnologías de Información y Comunicación Profa. Damaris González Medina.
CONSECUENCIAS DE LA OPCIÓN METODOLÓGICA EN LA PROGRAMACIÓN Y LA EVALUACIÓN Elena Rodríguez Halffter 27 de octubre de 2006 Palma de Mallorca.
Marcos para la clasificación pedagógica de objetos para el aprendizaje: un caso de estudio Miguel A. Sicilia, Elena García y Salvador Sánchez Universidad.
Recursos generales del traductor Bianca Vitalaru Universidad de Alcalá
Ailyn Lopez pitty Leda Sequeira picado Kevin barquero irola
REVISIÓN DE LA LITERATURA EVALUATIVA O INTEGRATIVA
Evaluación del impacto científico © FECYT. Fundación Española para la Ciencia y la Tecnología 1.
Definición de Etiquetas Semánticas Dentro de la Tesis Digital para Realizar Búsquedas de Información Pertinente Dra. Rocío Abascal-Mena DC-2006, México.
EL REPORTE DE RESULTADOS DEL PROCESO CUALITATIVO
PROGRAMA NACIONAL EN CIENCIAS DE LA INFORMACION PROYECTOS Elaborado por: Lic. Arelis Barrios Jaimes Lic. Juan Carlos Linarez Pérez.
Dime con quién andas: Las Bases de Datos Bibliográficas como Herramientas de Medición Jane M. Russell Barnard Instituto de Investigaciones Bibliotecológicas.
APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (I)
Análisis Organizacional de entidades Públicas en Chile: Lecciones para la gestión y diseño de políticas públicas. Encuentro Sociedad de Políticas Públicas,
SALIR REINTENTAR De acuerdo a lo presentado en clase hay una cantidad de preguntas que debes resolver a continuación.
Un instrumento estándar de assessment Profa. G.Viruet
Plan de Sistemas de Información (PSI)
Un modelo matricial: reactivos y escalas
NORMAS ISO ISO Carlos Mario Zapata J. 4/15/2017
RECOMENDACIONES PARA EL ANÁLISIS DE LOS RESULTADOS
SOLUCIÓN DE PROBLEMAS MEDIANTE TÉCNICAS DE INTELIGENCIA EMPRESARIAL

Contribuciones a Lenguajes de Modelado Educativo
Tecnologías para el Aprendizaje
SENA REGIONAL HUILA REGIONAL HUILA CENTRO DE LA INDUSTRIA LA EMPRESA Y LOS SERVICIOS Huila Elementos de sistemas de información.
INGENIERÍA DEL SOFTWARE GESTIÓN DE PROYECTOS
Capitulo 1: “La ciencia en las ciencias sociales”
Elaboración automática de resúmenes Nahiko Arraiza Eguillor 17-V-2006.
Selección de publicaciones © FECYT. Fundación Española para la Ciencia y la Tecnología 1.
I.- Introducción a los sistemas de información
Los Medios y Recursos Didácticos
U.D. 3. Investigación Comercial
Métodos cuantitativos Construcción y validación de instrumentos en Salud Pública.
U.D.5. EL SIM Y LA IM EL SIM Conjunto de personas, equipos y procedimiento capaces de recoger, clasificar, analizar, evaluar y distribuir la información.
Presentación  Nombre del sitio.  Título de la página.  Qué información puede anticiparse de ellos  Es una web oficial? Autor  Es identificable?
EL INFORME ANA ROSA ORTEGA A..
Metodología de la Investigación
Software libre Integrantes: Leidy Ruiz Jhoana Moncada Jhon Vargas
Métricas de Calidad de Software
Ejemplos y claridad para avanzar la propuesta de investigación en el Trabajo colaborativo Sandra Melo Zipacon.
Evaluar competencias básicas: una propuesta Dr. José Moya Otero Universidad de Las Palmas de Gran Canaria Proyecto AtlántidaDr. José Moya Otero.
Elaboración de artículos científicos
Tema 6: Evaluación de revistas
Profesora Isabel Jazmín Ángeles Huizard
Sistema de Recomendaciones de Contenidos Educativos de VoD Centrado en las Competencias Educativas DIEGO FABIAN DURAN D. Director: PhD. JOSE LUIS ARCINIEGAS.
Benemérita Universidad Autónoma Facultad de Enfermería Contenido de los Informes de Investigación.
Evaluación del impacto de objetos virtuales de aprendizaje sobre el rendimiento académico en un curso de mediación virtual Georffrey Acevedo González UNIVERSIDAD.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Planteamiento del Problema de Investigación (Construcción del objeto de estudio) : De la Idea a su Formulación y Justificación.
Traducción Científico-Periodística Año 2014
Diseño de una herramientas on line de investigación cualitativa para análisis de un generador virtual de exposiciones Autoras: Pilar Rivero Hazel C. Flores.
COMPETENCIAS ESPECÍFICAS EN ADMINISTRACIÓN PÚBLICA.
Transcripción de la presentación:

TÉCNICAS DE DECONSTRUCCIÓN APLICADAS A LAS TECNOLOGÍAS DEL LENGUAJE HUMANO TIN Octubre 2014: Informe Evaluación de resúmenes Grupo de Procesamiento del Lenguaje y Sistemas de Información Dpto. Lenguajes y Sistemas Informáticos ACTIVIDAD: EVALUACIÓN Informe Técnico LEGOLANG-UAge 03/2014 Autora: Elena Lloret

Evaluación aplicada a la Generación de Resúmenes Referencias relevantes: 1. Mani, I Summarization Evaluation: An Overview. In: Proceedings of the North American chapter of the Association for Computational Linguistics. (NAACL), Workshop on Automatic Summarization, Fernandes de Oliveira P.C, “Evaluation Metrics for the Summarization Task”. Chapter 5 in Innovative Document Summarisation Techniques, IGI Global, January Lloret E., Plaza L., Aker A The Challenging task of Summary Evaluation: An overview. Submitted to Artificial Intelligence Review, 2014.

Evaluación aplicada a la Generación de Resúmenes La evaluación de resúmenes depende de la finalidad para la que se quiera utilizar el resumen Tarea no trivial Subjetividad de la evaluación Creación de corpus de resúmenes de referencia: alto coste y no objetivo Investigación en esta área aún por desarrollar: sobre todo métricas que determinen la calidad de un resumen

Evaluación intrínseca Automática Contenido (cuantitativa) Calidad (cualitativa) Manual Contenido Calidad Evaluación extrínseca Valorar los resúmenes en función de un escenario o tarea concreta Recuperación de información Búsqueda de respuestas Proporcionar feedback Clasificación de textos Simplificación de textos … Tipos de evaluación Según: (Mani, 2001; Llloret et al., 2014)

Tipos de evaluación Evaluación intrínseca Eval. Manual y directa sobre el resumen generado Los usuarios comprueban la calidad y el contenido el resumen Ejemplos: protocolos FAN (legibilidad) y MLUCE (contenido) (Minel, Nugier and Piat, 1997) Direct Evaluación intrínseca Evaluación del resumen comparándolo con un resumen de referencia Se mide cómo de similar el resumen generado es al resumen modelo Ejemplo: herramienta SEE (Lin 2001) Target- based Evaluación extrínseca Se mide lo bueno/apropiado que es un resumen para ayudar a otra tarea Ejemplo: evaluar resúmenes en el contexto de la tarea de recuperación de información o búsqueda de respuestas. Task-based Evaluación intrínseca Se diseñan métricas automátcas que permitan evaluar el contenido y la calidad del resumen Ejemplo: ROUGE, (Lin and Hovy, 2003) BE,wT-E (Tratz and Hovy, 2008) ROSE (Conroy and Dang, 2008) Automatic Según: (Fernandes de Oliveira,2014)

Métricas intrínsecas Evaluación automática Contenido Calidad Evaluación manual Contenido Calidad

Métricas intrínsecas Evaluación automática Contenido Necesario un o varios resumen/es de referencia (modelo) Precisión, cobertura, medida F Analizando similitud (ej. Coseno) entre frases del resumen y las del resumen de referencia ROUGE Analizando similitud basada en N-GRAMAS entre frases del resumen y las del resumen de referencia Variantes: ROUGE-C (comparación directa con el documento original y no con los resúmenes modelo) JROUGE: implementación en Java

Métricas intrínsecas Evaluación automática Contenido Necesario un o varios resumen/es de referencia (modelo) Basic Elements (BE) Analizando similitud basada en tripletas “HEAD-MODIFIER- RELATION” entre frases del resumen y las del resumen de referencia a partir de un conjunto de paráfrasis Variantes: BE with transformations for evaluation (BEwT-E), incluye reglas para identificar algunos casos de paráfrasis. Otras herramientas bajo la misma idea: DEPEVAL (summ) AutoSummENG Analizando similitud basada en N-GRAMAS de caracteres entre frases del resumen y las del resumen de referencia

Métricas intrínsecas Evaluación automática Calidad No hay una métrica que predomine sobre las demás. Se ha estudiado en diferentes escenarios proponiendo varios enfoques ROSE Se basa en la métrica ROUGE pero intenta además captar aspectos lingüísticos a partir de obtener los resúmenes que mejor se correlacionan con las métricas lingüísticas (ej. Responsiveness)

Métricas intrínsecas Evaluación manual Contenido SEE Entorno para comparar resúmenes automáticos con resúmenes modelo Pyramid method Método semi-automático Identificación de SCUs (Summary Content Units) extraídas a partir de información común en resúmenes modelo hechos por varias personas Cada SCU tendrá una puntuación indicando su relevancia

Métricas intrínsecas Evaluación manual Calidad Escala Likert en base a criterios lingüísticos DUC/TAC Corrección gramatical Ausencia de redundancia Claridad referencial Foco del resumen Coherencia

Métricas intrínsecas Evaluación manual Contenido y calidad Métodos de Crowdsourcing Moda pasajera? Problemas con la calidad de las evaluaciones y con la selección de evaluadores Plataformas Mechanical Turk Crowdflower

Conclusiones Evaluación de resúmenes Evaluación intrínseca Contenido Evaluación automática ROUGE Calidad Evaluación manual Criterios lingüísticos DUC/TAC Evaluación extrínseca Determinar escenario y metodología de evaluación

TÉCNICAS DE DECONSTRUCCIÓN APLICADAS A LAS TECNOLOGÍAS DEL LENGUAJE HUMANO TIN Octubre 2014: Informe Evaluación de resúmenes Grupo de Procesamiento del Lenguaje y Sistemas de Información Dpto. Lenguajes y Sistemas Informáticos ACTIVIDAD: EVALUACIÓN Informe Técnico LEGOLANG-UAge 01/2014