LINGÜÍSTICA COMPUTACIONAL

Slides:



Advertisements
Presentaciones similares
Lenguajes de programación Un lenguaje de programación es un lenguaje formal diseñado para expresar procesos que pueden ser llevados a cabo por máquinas.
Advertisements

Trabajo Final de Grado Exploración Web inteligente con aplicación de distancia semántica y lógica difusa. Ezequiel Mariano Gorbatik.
Procesamiento del Lenguaje Natural Inaki Pedroche Aramburu Ismael Baez Cortes Angel Alberto Molina Oscar Daniel Torres Juarez
Melissa Victoria Mendiola Peralta.  Los algoritmos son las series de pasos por los cuales se resuelven los problemas.
1. Diversas herramientas de software libre para diseño. -Ingenio tu sitio -Compromisos de trabajos -El software y su licencia -Aspectos analizados 2.
A NÁLISIS L ÉXICO Y ANÁLISIS SINTÁCTICO. COMPILADORES ANÁLISIS LÉXICO Y ANÁLISIS SINTÁCTICO ANGIE EVILLA LUQUEZ CORPORACIÓN UNIVERSITARIA REMINGTON INGENIERÍA.
DIRECCIÓN NACIONAL DE TECNOLOGÍAS DE LA INFORMACIÓN Y COMUNICACIÓN – DNTIC´S.
Nivel Morfosintáctico Bárbara Zacarías López. Nivel Morfosintáctico Morfosintaxis es la aglutinación de la palabra morfología y la palabra sintaxis, la.
REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA EDUCACION UNIVERSITARIA, CIENCIA Y TECNOLOGIA UNIVERSIDAD BOLIVARIANA DE VENEZUELA.
1 LENGUAJES DE PROGRAMACIÓN. Son aplicaciones específicas diseñadas para crear otras aplicaciones o programas. Son programas para crear programas. 2.
Subtema: Hardware y Software básico
Introducción a la lingüística
Enfoque de los comunicadores:
TERMINOLOGÍA BÁSICA Informática: conjunto de conocimientos científicos y técnicas que hacen posible el tratamiento automático y racional de la información,
INTELIGENCIA ARTIFICIAL
Etimología: Origen de las palabras
Antecedentes de la Psicolingüística
Estrategias psicolinguísticas
Lógica de Proposiciones y Predicados
Profesor: José Luis Gonzalez
TRABAJO BASE DE DATOS CARLOS MARTINEZ 7º3
Teoría Psicolingüística: un modelo sintáctico
Escuela Normal Superior de Envigado
Inteligencia Artificial
Informática Preparatoria
Recursos generales del traductor
LA COMPRENSIÓN LECTORA
Corpus MUST- equipo UCM
Inteligencia Artificial
Pablo carrera m.sc. Docente itshcpp
Características generales
Cómo transformar tu curso a un Modelo Híbrido Flexible
Análisis del discurso Facultad de Estudios Superiores Acatlán Comunicación Investigación en Comunicación IV.
NUEVAS TECNOLOGIAS DE INFORMACION Y COMUNICACIÓN.
ALGORITMOS Y PSEUDOCÓDIGO
Oración Simple.
El proyecto del Diccionario del Español de México (DEM)
Introducción a la gramática generativa
TEORÍA COGNITIVAS.
Introducción a la Lingüística de corpus
CONCEPTOS BÁSICOS DE COMPUTACIÓN E HISTORIA
Me lo cuentas, pero primero DIBÚJAMELO
Resultados comparativos del examen PLANEA 2015.
Temas Selectos de Sistemas Unidad de Competencia
RECURSOS TECNOLÓGICOS PARA LA INTERVENCIÓN DE TRASTORNOS DEL LENGUAJE ORAL Y ESCRITO Consuelo Belloch 2010.
FUDAMENTOS BÀSICOS computación
CURSO PROGRAMACIÓN BÁSICA SEMANA 2
Introducción a la gramática generativa
Emisiones de una palabra
Enfoque de los comunicadores:
Claves del Lenguaje Humano
MSc. Lisett Pérez Quintero Ing. Jorge Carrera Ortega
Jornadas de Puertas Abiertas en: Facultad de Informática
NUEVAS TECNOLOGIAS DE INFORMACION Y COMUNICACIÓN.
Actividad: Fase de Transferencia
María Pereira Rico Tipos de texto Texto instructivo.
“Algoritmos en Inteligencia Artificial” Rogelio Ferreira Escutia
Definición de Base de Datos
Lingüística computacional
INTRODUCCION AL DISEÑO DEL SOFTWARE
Lingüística computacional
¿Qué es la pragmática? Omar Sabaj Meruane
Tema 6: Didáctica del plano léxico-semántico
Eco: Hacia una lógica de la cultura
¿PARA QUIENES ESTA ENFOCADO ESTE DIPLOMADO?
UNIDAD 2 MODELO DE DATOS.
Tecnologías 4º ESO.
7. Didáctica del nivel textual
Didáctica del inglés Valentina Madrid.
Capítulo 5 La sintaxis.
Transcripción de la presentación:

LINGÜÍSTICA COMPUTACIONAL 01 NOCIONES BÁSICAS

NOCIONES BÁSICAS 1. Definición 2. Corpus 3. Treebanks 4. Wordnet 5. Token/Type/Lemma 6. Hapax 7. Ley de Zipf 8. Colocaciones 9. Concordancias

1. Definición La lingüística computacional es un campo multidisciplinar de la lingüística y la informática que utiliza la informática para estudiar y tratar el lenguaje humano. Para lograrlo, intenta modelar de forma lógica el lenguaje natural desde un punto de vista computacional. Dicho modelado no se centra en ninguna de las áreas de la lingüística en particular, sino que es un campo interdisciplinar, en el que participan lingüistas, informáticos especializados en inteligencia artificial, psicólogos cognoscitivos y expertos en lógica, entre otros. Algunas de las áreas de estudio de la lingüística computacional son: Corpus lingüístico asistido por ordenador. Diseño de analizadores sintácticos (en inglés: parser), para lenguajes naturales. Diseño de etiquetadores o lematizadores (en inglés: tagger), tales como el POS-tagger. Definición de lógicas especializadas que sirvan como fuente para el Procesamiento de Lenguajes Naturales. Estudio de la posible relación entre lenguajes formales y naturales. Traducción automática. WIKIPEDIA

2. Corpus Un corpus es una colección de textos. En Lingüística Computacional un corpus es una colección electrónica de texto, que se encuentra indexado de alguna manera y que incluye metadatos. Brown (1MM) British National Corpus (100MM) CORDE, CREA (250MM) CODICACh (900MM)

3. Treebanks Un treebank es un corpus de textos analizados sintácticamente. Penn UAM (5000 oraciones)

4. Wordnet Wordnet es un diccionario establecido sobre una red semántica.

5. Token/Type/Lemma Un token es una entrada o palabra en un corpus. Un type es cada palabra diferente de un corpus. Un lemma es cada raíz diferente en un corpus. La oración: La niña y los niños se la jugaron. Tiene: 8 tokens 7 types (la se cuenta solo una vez) 6 lemmas (la y los se cuenta solo una vez)

6. Hapax Un hapax es una palabra que solo ocurre una vez en un corpus

7. Ley de Zipf

8. Colocaciones Una colocación es una combinación de dos o más palabras seguidas o no en un corpus que tienden a aparecer juntas.

9. Concordancias Una concordancia es un desarrollo de todas las apariciones de una palabra en un corpus contextualizadas.