Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porJosé Luis Salazar Escobar Modificado hace 8 años
1
Elaboración automática de resúmenes Nahiko Arraiza Eguillor 17-V-2006
2
Indice ● Introducción ● Aspectos que afectan a los resúmenes ● Tipos de elaboradores ● Generación automática de resúmenes ● Ejemplo de elaborador
3
Introducción ● Los resúmenes son un elemento muy cotidiano ● Hay un mucha información digitalizada ● La elaboración automática puede convertirse en algo muy útil ● En 1958 ya se empieza a trabajar
4
Introducción ● En los 90 coge fuerza ● En la actualidad podemos encontrar herramientas en el mercado
5
Aspectos que afectan a los resúmenes ● Entrada Forma ● Estructura: la forma exterior del texto ● Escala: el tamaño del texto ● Medio: el idioma como la jerga del texto ● Genero: estilo literario o tipo de texto Especificidad: numero de personas y lo especifica de estas Alcance: Nú mero de fuentes utilizadas para hacer el resumen.
6
Aspectos que afectan a los resúmenes ● Propósito Situación: contexto en el que se sitúa el resumen Audiencia: interés de los lectores para los que se diseña el resumen Función: para lo que se hace, sustituir, ayudar, crear una introducción... ● Salida Formato: texto continuo, con un esquema... Extensión: el tamaño máximo del resumen
7
Tipos de elaboradores ● Monodocumento o Multidocumento ● Indicativos o Informativos Indicativo: anticipar al lector el contenido Informativo: pretenden sustituir poniendo toda la información trascendente. ● Críticos Evalúan el texto base ● Genéricos o adaptados al usuario Para cualquiera o especifico a un ámbito
8
Generación automática de resúmenes ● Extracción de frases Localizar las frases más representativas mediante el análisis y síntesis. Análisis: se procesan las frases y se mide su relevancia. Síntesis: recoger las frases que mayor puntuación han obtenido.
9
Generación automática de resúmenes Problemas: ● Inconsistencia La frase tiene referencias a elementos que no aparecen en el texto ● Desequilibrio Ausencia de temas importantes del texto original o ausencia de referencias de su organización estructural
10
Generación automática de resúmenes ● Estructura del discurso Coherencia: las relaciones entre las frases argumentativas del texto Cohesión: las relaciones semánticas entre las palabras Son importantes para el análisis
11
Generación automática de resúmenes ● Abstracción Contiene frases del texto original y frases que no aparecían 3 fases: ● Análisis: se construye una representación semántica ● Transformación: con la representación semántica se puede eliminar las redundancias, insertar información de otros textos... ● Síntesis: se genera el resumen
12
Generación automática de resúmenes ● Resúmenes Multidocumento Nos encontramos ante muchos textos sobre el mismo tema Los resúmenes multidocumento tienen una problemática diferente ● Los documentos varían de pocos a cientos ● El resumen final tiene que ser parecido, quizá el 10% de los textos no sea aceptable ● Difícil abordar todos los temas ● Los problemas de inconsistencia y la coherencia se agravan
13
Ejemplo de elaborador
14
● Análisis morfosintáctico Determina la categoría léxica de cada palabra ● Ponderación de frases Basada en frecuencia de aparición en el texto Basada en palabras indicativas (esencia...) Basada en palabras del título Presencia de nombres propios En tipografías de texto (negrita, subrayado...)
15
Ejemplo de elaborador Basada en la posición del texto Basada en una consulta al usuario Combinación de puntuaciones ● Detección de anáforas Busca la expresión ya la sustituye ● Selección de frases Se buscan las frases con mayor puntuación y si tienen correspondencia anafórica pues se añaden. ● Post-procesado Su objetivo es buscar palabras como sin embargo y que se unan correctamente en el resumen
16
Ejemplo en la web ● http://home.hccnet.nl/m.b.wieling/nlp.html http://home.hccnet.nl/m.b.wieling/nlp.html
17
¿Preguntas?
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.