APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (I)

Slides:



Advertisements
Presentaciones similares
Como crear y usar una rúbrica
Advertisements

Diccionario de Datos (DD)
PubMed/MeSH - Medical Subject Headings (módulo 4.3)
Informes.
CAPÍTULOS 5 Y 6. ¿QUÉ ES COMENTAR UN TEXTO
DIMENSIÓN SEMÁNTICA.
El discurso expositivo
ESTRATEGIAS DE COMPRENSIÓN LECTORA USAER 43
COMPETENCIAS PROYECTO TIC UNIVERSIDAD PONTIFICIA BOLIVARIANA
Análisis de frecuencias Curso: Lingüística Computacional Heiner Mercado Percia.
Teoría de lenguajes y compiladores
Programas Son una serie o secuencia de instrucciones entendibles por los ordenadores que permiten la realización de las acciones o tareas para las que.
Algunas Técnicas para potenciar la Comprensión de la Lectura
 f Control de documentos ◦ La clarificación de que los documentos referidos son una necesidad para el uso del Sistema de Gestión de Calidad 
Seminario-Taller Como escribir, presentar y publicar resultados científicos 07, 08 y 09 de Febrero, 2011.
EL ESTADO DEL ARTE Hace referencia al nivel más alto de desarrollo conseguido en un momento determinado sobre cualquier aparato, técnica o campo científico.
Condiciones de publicación
04. Título, resumen y palabras clave
EL RESUMEN ¿CÓMO REDACTARLO?.
¿CÓMO ESCRIBIR COMO PERIODISTA Y NO MORIR EN EL INTENTO?
PROF. HIPOLITO BELLO GARCIA
Especificación de Consultas M
Teoría de lenguajes y compiladores
Diagrama de Flujo La presentación gráfica de sistemas es una forma ampliamente utilizada como herramienta de análisis,  ya que permite identificar aspectos.
PAGINA WEB Kelly Hernández Santiago Aranzazu 11:c Carlos Fernández.
HIPERTEXTOS.
(Organización y Manejo de Archivos)
Evaluación del impacto científico © FECYT. Fundación Española para la Ciencia y la Tecnología 1.
COMPARACIÓN ENTRE TIPOS DE TEXTO..
Modelo de Dominio Angela Carrillo R..
Comunicación y Multimedia
Consejo de Educación Primaria Inspección Técnica Jornadas Regionales La enseñanza de la lectura en la escuela.
COMPARACIÓN ENTRE TIPOS DE TEXTO..
4/27/2015Lingüística Computacional1 LEXICONES Y CORPUS Carlos Mario Zapata J.
DIMENSIÓN SEMÁNTICA.
Nombres: Julián López López Natalia Mora Gaitán
Por: Andres Gonzalez Gonzalez Y Santiago Herrera Palma 11°A
Internet y Navegadores Unidad 5. Fecha: 1 de agosto de 2011 Periodo# : 2 Objetivo: identificar el contenido de una dirección web Tema: Elementos de una.
TALLER DE ESTUDIO INDEPENDIENTE (ILCE)

(Proyecto de investigación)
Tecnologías para el Aprendizaje
LE, EI, Profesor Ramón Castro Liceaga UNIVERSIDAD LATINA (UNILA) TRADUCTORES Y ANALIZADOR LEXICOGRÁFICO.
Elaboración automática de resúmenes Nahiko Arraiza Eguillor 17-V-2006.
COMENTARIO DE TEXTO 1º BACHILLERATO.
Internet y Navegadores Unidad 5. Fecha: 1 de agosto de 2011 Periodo# : 2 Objetivo: identificar el contenido de una dirección web Tema: Elementos de una.
Amairani Ortega Karla Colin
Cómo hacer un resumen.
Por: Víctor Manuel Muñoz Arango Y Jesús David Mejía Meneses 11°A.
Elaboración en equipo de resúmenes de textos de otras asignaturas utilizando oraciones simples Importancia del uso de un guión o esquema para la exposición.
Textos personales.
COHESIÓN Y COHERENCIA Son dos propiedades que facilitan la comprensión de los textos. La cohesión es la relación sintáctica que puede establecerse entre.
Programación de Sistemas
¿QUÉ ES EL MODELO ENTIDAD-RELACIÓN?  Como ya he comentado este modelo es solo y exclusivamente un método del que disponemos para diseñar estos esquemas.
Benemérita Universidad Autónoma Facultad de Enfermería Contenido de los Informes de Investigación.
Universidad Pedagógica Experimental Libertador La Investigación a través de ERIC Prof. María Correa Prof. Néstor Ojeda.
Espacio para imagen Póster y comunicación a congreso Antonio Guerrero Espejo.
EL RESUMEN Consiste en recoger de forma abreviada y con el lenguaje propio las ideas principales de un texto. El resultado debe ser una redacción coherente.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.

COMO BUSCAR INFORMACIÓN EN LA RED. La realidad de la red DNo todo lo que está en la red, es de calidad DNo todo es gratuito DHay que respetar derechos.
LA ESCRITURA.
LA COMPRENSIÓN LECTORA
Comentario de textos: El texto periodístico 3ºESO.
TECNICAS DE COMUNICACION. PARA LA CORRECTA ELABORACIÓN DE UN TEMA POR ESCRITO ES PRECISO DAR LOS SIGUIENTES PASOS: Seleccionar bien el tema sobre el que.
Defínamelo de la siguiente manera, es la forma en que cada persona adquiere una idea o una información, la analiza y de esta manera obtiene un conocimiento.
Traducción Científico-Periodística Año 2014
Antonio de Jesús González Arce Matricula DHTIC.
Práctica Basada en Evidencia (PBE) para usuarios de HINARI (Curso avanzado: Módulo 6) TALLER: PROGRAMAS RESEARCH4LIFE: HINARI.
Sanders, T. (2006). “Text and Text Analysis Encyclopedia of Language and Linguistics.
Transcripción de la presentación:

APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (I) Carlos Mario Zapata J. 4/14/2017 Lingüística Computacional

SUMARIZACIÓN DE TEXTOS No hay unidad en cuanto a las definiciones de “Resumen” Un resumen es un texto que se produce a partir de uno o más textos, que contiene una porción significativa de la información de los textos originales, y cuya extensión es menos de la mitad del texto original. Los textos pueden ser documentos multimediales, hipertextos, etc. 4/14/2017 Lingüística Computacional

SUMARIZACIÓN DE TEXTOS Tipos de resumen: Indicativos: que proveen una idea de qué es el texto sin entregar contenidos. Informativos: que proveen una versión corta del contenido. Extractos: son resúmenes creados reutilizando porciones del original. Abstractos: son resúmenes creados regenerando el contenido extraído. 4/14/2017 Lingüística Computacional

SUMARIZACIÓN DE TEXTOS Etapas: Identificación de Tópicos: Tópico es un sujeto particular de lo que se escribe o discute. Son los resúmenes más simples. Se identifican las unidades más importantes (palabras, frases, párrafos, etc.). Se listan o se diagraman esas unidades. 4/14/2017 Lingüística Computacional

SUMARIZACIÓN DE TEXTOS Etapas: Interpretación: Fusión de conceptos, evaluación y otros tipos de procesamiento. Generalmente se hace después de la identificación. Requiere de fuentes adicionales al documento de entrada. Existen pocos modelos del dominio que permitan interpretación. 4/14/2017 Lingüística Computacional

SUMARIZACIÓN DE TEXTOS Etapas: Generación de resúmenes: Se busca producir textos legibles por humanos. Generalmente sólo se logra mejorar un poco la coherencia y densificar el fraseo. Se procura mejorar la coherencia, encadenar las referencias, restablecer los vínculos del discurso, eliminar material repetido y completar el material omitido. 4/14/2017 Lingüística Computacional

SUMARIZACIÓN DE TEXTOS Métodos de sumarización: Identificación de tópicos: Se suelen emplear varios módulos independientes. Cada módulo asigna un marcador a cada unidad de entrada (palabra, oración o pasaje). Un módulo adicional combina los marcadores de cada unidad para darles un marcador final. Se organizan los marcadores de mayor a menor y se muestra hasta un umbral asignado. Criterio de posición: usar el primer párrafo como resumen. Se han desarrollado algoritmos para encontrar otras posiciones importantes. 4/14/2017 Lingüística Computacional

SUMARIZACIÓN DE TEXTOS Métodos de sumarización: Identificación de tópicos: Criterio del indicador de frases clave: Extraer frases que contengan palabras especiales (“significativo”, “en este artículo se muestra”). Criterio de frecuencia de frases y palabras: Si un texto contiene algunas palabras inusualmente frecuentes, esas oraciones contienen palabras que son probablemente importantes. 4/14/2017 Lingüística Computacional

SUMARIZACIÓN DE TEXTOS Métodos de sumarización: Identificación de tópicos: Criterio de traslapo de búsqueda y título. Criterio de conexión léxica o cohesiva: Las palabras más importantes son aquellas que estén más conectadas. Criterio de la estructura del discurso: asignar marcadores con base en la estructura. Combinación de varios marcadores de módulos. 4/14/2017 Lingüística Computacional

SUMARIZACIÓN DE TEXTOS Métodos de sumarización: Interpretación o fusión de tópicos: Se fusionan los tópicos identificados como importantes, se representan en nuevos términos y se expresan en una nueva formulación, usando conceptos o palabras que no están en el texto original. Requiere conocimiento previo del dominio. Se ha usado extracción de información. Se ha intentado abstracción conceptual. 4/14/2017 Lingüística Computacional

SUMARIZACIÓN DE TEXTOS Métodos de sumarización: Generación de resúmenes: La identificación y la interpretación generan resúmenes legibles por máquina que deben ser traducidos a textos legibles por humanos. Se usan técnicas de generación del lenguaje natural. La compresión de textos ha sido una de las técnicas usadas para producir árboles sintácticos únicos a partir de varios árboles sintácticos. 4/14/2017 Lingüística Computacional

SUMARIZACIÓN DE TEXTOS Métricas: Tasa de compresión: TC = Longitud del resumen / Longitud del texto. Tasa de retención: TR = información en el resumen / información en el texto. Buen resumen: TC pequeño con TR grande. 4/14/2017 Lingüística Computacional

SUMARIZACIÓN DE TEXTOS Métricas: Comparación con un resumen hecho por humanos: Correcto = número de sintagmas extraídos por el sistema y el humano. Erróneo = número de sintagmas extraídos por el sistema y no por el humano. Perdido = número de sintagmas extraídos por el humano y no por el sistema. Precisión = correcto / (correcto + erróneo) Similitud = correcto / (correcto + perdido) 4/14/2017 Lingüística Computacional

SUMARIZACIÓN DE TEXTOS Herramientas de sumarización online: http://www.textcompactor.com/ http://www.tools4noobs.com/summarize/ http://clair.si.umich.edu/demos/lexrank/ http://www.splitbrain.org/services/ots 4/14/2017 Lingüística Computacional