Descubriendo las reglas para construir nuevas palabras

Slides:



Advertisements
Presentaciones similares
YONEL V. VASQUEZ GUERRA UGEL HUÁNUCO
Advertisements

¿QUE PIENSAS DE LOS DISLEXICOS ?.
METAMOTIVACIÓN.
PROCESOS PSICOLOGICOS Y NEUROLOGICOS DEL APRENDIZAJE
Descubriendo las reglas para construir nuevas palabras Morfología Luis Villaseñor Pineda Laboratorio de Tecnologías del Lenguaje Coordinación de Ciencias.
Parte III La estrategia de estudio: la lectura eficaz. TEST.
El Cerebro.
“IMPORTANCIA DE LOS PROCESOS DE PENSAMIENTO LÓGICO EN LA COMPRENSIÓN LECTORA DE TEXTOS ACADÉMICOS” CETis 107.
Neurociencia y educación
IMPORTANCIA DE LAS HABILIDADES COMUNICATIVAS EN EL MUNDO MODERNO
CEPA Guía de Isora Filosofía (21/11/2013)
Perfil Ocupacional Ingrese el área.
¿Qué diferencia hay entre el lenguaje animal y el humano?
Comprender desarrollar y aplicar aprendizaje basado en
"Sgeun un rceinete etsduio de una uivenrsdiad ignlsea, no ipmotra el odren en el que las ltears de una plabara etsan ersciats, la uicna csoa ipormtnate.
PERCEPCION Según ROBINS, la percepción se puede definir como el proceso mediante el cual los individuos organizan e interpretan sus impresiones sensoriales.
¿ Qué es leer ?. ¿Qué leemos? ¿Letras? Cfgiyr bhomrw degt kabbssr.
Análisis morfológico de oraciones Prof. Estrella Durán L.
El núcleo del grupo verbal. El verbo 1.El grupo verbal. Estructura del verboEl grupo verbal. Estructura del verbo 2.El empleo de los tiempos verbalesEl.
CONCORDANCIA GRAMATICAL OCTAVO BÁSICO.  La concordancia es una herramienta que tiene el lenguaje para expresar las relaciones gramaticales entre las.
LAS CATEGORÍAS GRAMATICALES. DEFINICIÓN: ES LA CLASIFICACIÓN DE LAS PALABRAS DE ACUERDO A LA FUNCIÓN QUE CUMPLEN DENTRO DE UNA ORACIÓN. CLASIFICACIÓN:
De la teoría gramatical a la gramática práctica
selección y creación de contenidos digitales
Interrogativos y exclamativos.
TRABAJO DE LENGUA. LOS SUSTANTIVOS..
“Determinantes Demostrativos”
Modelo de la Gramática Generativa Transformacional (1965)
Curso de Gramática. Unidad II El sustantivo. Teoría
Facultad de Filosofía, Letras y Ciencias de la Educación
Adverbios y locuciones
Diego Pizarro Aldair campos Lorena Pérez Luis quintana
“Determinantes Interrogativos”
“El adjetivo calificativo. Ejercicios”
GRUPO NOMINAL Y VERBAL.
“El sustantivo. Ejercicios”
Categorías gramaticales: el sustantivo
Categorías Gramaticales
LOCUCIONES Grupo de dos o más palabras, que aunque se escriben separadamente, funcionan como una unidad léxica con significado propio, no derivado de cada.
2.LA FORMACIÓN DE PALABRAS: DERIVACIÓN Y COMPOSICIÓN
LA ESTRUCTURA DE LA PALABRA
GRAMÁTICA PARA LENGUAS MODERNAS
CONFABULÉMONOS CON LAS PALABRAS
LAS CATEGORÍAS GRAMATICALES. DEFINICIÓN: Es la clasificación de las palabras de acuerdo a la función que cumplen dentro de una oración. CLASIFICACIÓN:
LENGUAJE, LENGUA Y HABLA. EL SIGNO LINGÜÍSTICO.
APRENDER A LEER SGEUN UN ETSDUIO DE UNA UIVENRSDIAD IGNLSEA, NO IPMOTRA EL ODREN EN EL QUE LAS LTEARS ETSAN ERSCIATS, LA UICNA CSOA IPORMTNATE ES QUE LA.
¿Qué significa ser maestro?
La formación de palabras
LAS ORACIONES SUBORDINADAS SUSTANTIVAS
El porqué de las palabras
Imagen tomada de Pixabay
EL SIGNO LINGÜÍSTICO.  ¿Qué es un signo? EL SIGNO LINGÜÍSTICO Es aquello que percibimos con nuestros sentidos y que nos transmite alguna información.
CATEGORÍAS GRAMATICALES O CLASES DE PALABRAS
CATEGORÍAS GRAMATICALES O CLASES DE PALABRAS
César Areiza Arenas.  La oración gramatical es la mínima unidad de lenguaje con sentido completo.  Podemos definir la oración como una unidad de comunicación.
Unidad 2. La palabra y su significado
LA ESTRUCTURA DE LAS PALABRAS
APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (III)
Valores estilísticos de las categorías gramaticales
PALABRA. LEXEMAS Y MORFEMAS Las palabras, desde el punto de vista de su estructura, se dividen en partes más pequeñas dotadas de significación a las que.
Introducción a la percepción visual
Análisis lingüístico automático
El conjunto de palabras que yo uso se llama VOCABULARIO EL LÉXICO es el conjunto de palabras que forman una lengua El léxico, ordenado alfabéticamente,
La tilde diacrítica.
SGEUN UN ETSDUIO DE UNA UIVENRSDIAD IGNLSEA, NO IPMOTRA EL ODREN EN EL QUE LAS LTEARS ETSAN ERSCIATS, LA UICNA CSOA IPORMTNATE ES QUE LA PMRIREA Y LA UTLIMA.
UNIVERSIDAD VERACRUZANA ESCUELA PRIMARIA “CAYETANO RIVERA”
El acento gráfico (á), puede ayudarnos a determinar la comprensión de los textos, a diferenciar el significado de palabras que se escriben igual. El acento.
El acento diacrítico o la tilde diacrítica Idioma Español.
MORFOLOGÍA: La estructura de la palabra palabr +a raízsufijo significado: (Del lat. parabŏla). 1. f. Segmento del discurso unificado habitualmente por.
ACUERDODOS DE CONVIVENCIA 1. Para participar el estudiante debe levantar la mano. 2.Mientras un estudiante está en uso de la palabra el resto de los estudiantes.
MORFOLOGÍA: La estructura de la palabra palabr +a raízsufijo significado: (Del lat. parabŏla). 1. f. Segmento del discurso unificado habitualmente por.
Transcripción de la presentación:

Descubriendo las reglas para construir nuevas palabras Morfología Luis Villaseñor Pineda Laboratorio de Tecnologías del Lenguaje Coordinación de Ciencias Computacionales, Instituto Nacional de Astrofísica, Óptica y Electrónica

Morfología Entrada: Salida: Estudia: Secuencia de fonemas (letras) Secuencia de pares (lema, tag(s)) Estudia: Composición de fonemas/grafemas en formas léxicas (palabras) a partir de sus raíces (lema) + categorías morfológicas (inflexión, derivación, composición). Laboratorio de Tecnologías del Lenguaje

Contenido ¿Cómo construimos nuevas palabras? ¿Qué es una palabra? Funciones de la Morfología Inflexión Derivación y Composición Algunos enfoques para su resolución Laboratorio de Tecnologías del Lenguaje

¿Para qué la morfología? Usos corrientes Corrigiendo la ortografía *presición => inherente a la palabra Yo caminabas => concordancia número y género termino / término => contexto / categoría gramatical sólo / solo => contexto / categoría gramatical Separando en sílabas ta-re-a trans-crip-ción dí-a Laboratorio de Tecnologías del Lenguaje

¿Para qué la morfología? Recuperando su origen – significado Para clasificación de textos: mientras más se mencione una palabra (un significado) con mayor seguridad el texto versa sobre ese tema huracán, huracanes lluvia, lluvias Como primer paso de un analizador sintáctico Laboratorio de Tecnologías del Lenguaje

¿Para qué la morfología? Recordemos: Recuperación de información: recopilación de documentos pertinentes Extracción de información: extracción de piezas de información de interés a partir de documentos Minería de texto: descubriendo nuevas asociaciones entre las piezas de información extraídas Laboratorio de Tecnologías del Lenguaje

Morfología computacional Trata con el procesamiento de las palabras tanto en su forma escrita (grafemas) como su forma hablada (fonemas). Sistematización para la creación de nuevas palabras así como formas léxicas a partir de unidades más pequeñas. Nuevas palabras deberán considerar la fonología del lenguaje déjà vu bougambillia – bugambilia computadora – ordenador Laboratorio de Tecnologías del Lenguaje

Conceptos básicos Morfemas - los bloques básicos, entidades abstractas expresando características básicas Conceptos semánticos (raíces) Puerta, lápiz Características abstractas Puerta-s plural

Conceptos básicos ¿qué es una palabra? “algo” entre blancos – ¿entonces en el habla? “algo” con significado – Dímelo - una sola palabra pero son tres “algos” Laboratorio de Tecnologías del Lenguaje

Conceptos básicos ¿qué es una palabra? “algo” entre blancos – ¿entonces en el habla? “algo” con significado – Dímelo - una sola palabra pero son tres “algos” Unidades a partir de las cuales se forman oraciones Las palabras se agrupan por su función estructurando una frase (parte de la oración) Laboratorio de Tecnologías del Lenguaje

Funciones de la morfología Varía considerablemente entre idiomas: Inglés/Español I speak – hablo --- I will speak –hablaré Náhuatl Popocatépetl Popocitlali Laboratorio de Tecnologías del Lenguaje

Funciones de la morfología I Inflexión Cambia su categoría gramatical pero no su categoría de parte de la oración. comeré – comiste ladrón – ladronzuelo Tres clases en función de su inflexión Partículas o palabras sin inflexión (conjunciones, artículos, etc.) Verbos – admiten la conjugación Nominales – palabras con declinación (adjetivos, adverbios, etc.) Laboratorio de Tecnologías del Lenguaje

Funciones de la morfología II Derivación Proceso para crear nuevas palabras. Cambia su categoría gramatical y cambia su categoría de parte de la oración. Comer - comestible La derivación es incompleta no se puede aplicar a todas las palabras de una determinada clase Correr – *corrible Depende de su origen (es una raíz latina o griega) Triste – tristeza Feo – *feeza Laboratorio de Tecnologías del Lenguaje

Funciones de la morfología II I Composición Proceso para crear nuevas palabras. A partir de dos palabras (dos raíces) creamos una nueva Cabizbajo Maniatado malhablado No es claro donde termina la derivación y empieza la composición Dinosaurio Televisión Laboratorio de Tecnologías del Lenguaje

¡Los límites no son claros! Pasta – pasto Foco – foca Campana – campanilla Raya – rayo Velo – vela Taza – tazo Punto – punta Marco – marca Fila – filo Pilón – piloncillo Manzana – manzanilla Manzano – manzanillo Laboratorio de Tecnologías del Lenguaje

Construyendo palabras Una palabra es una secuencia / concatenación de morfemas El morfema principal o libre es la raíz Un afijo es un morfema secundario o atado Prefijo – afijo concatenado frente a la raíz Feliz – infeliz Sufijo – afijo concatenado al final de la raíz Marca – marcas Árbol – árboles Laboratorio de Tecnologías del Lenguaje

Ejemplos Pseudohospitalización Destruir Mano Capital Sucio Hospitalizar – hospitalización Hospital – hospitalizar Destruir Mano Capital Sucio Laboratorio de Tecnologías del Lenguaje

Restricciones sobre los afijos Tenemos restricciones semánticas, por ejemplo, no es posible adjetivar negativamente un nombre que ya tiene una carga negativa: Feliz – infeliz Triste – *intriste Correcto – incorrecto Errado – *inerrado Existen muchas más incluyendo restricciones fonológicas Propio – impropio Tonantzintla – Tonanzintla Cempoaxochitl – Cempaxúchil Laboratorio de Tecnologías del Lenguaje

Etiquetando en partes de la oración Usamos las características morfológicas de las palabras junto con su contexto para determinar su parte de la oración (su función gramatical) La ayuda desinteresada de mi parte La – artículo femenino singular Ayuda – sustantivo femenino singular Desinteresada – adjetivo femenino singular De – preposición Mi – adjetivo posesivo primera persona singular Parte – sustantivo femenino singular Laboratorio de Tecnologías del Lenguaje

El contexto es indispensable *parte ayuda mi desinteresada de la ¿Qué pasa con estas frases? dímela Él ayuda a su madre Las notas son: do, re, mi, fa, sol La muy desinteresada se fue con otro Dé el nombre de un árbol Él parte el pastel con cuidado Laboratorio de Tecnologías del Lenguaje

El contexto y nuestra expectativa ¿Qué tanto leemos y que tanto “inventamos”? Laboratorio de Tecnologías del Lenguaje

El contexto y nuestra expectativa ¿Qué tanto leemos y que tanto “inventamos”? "Sgeun un etsduio de una uivenrsdiad ignlsea, no ipmotra el odren en el que las ltears etsan ersciats, la uicna csoa ipormtnate es que la pmrirea y la utlima ltera esten ecsritas en la psiocion cocrrtea. El rsteo peuden estar ttaolmntee mal y aun pordas lerelo sin pobrleams. Etso es pquore no lemeos cada ltera por si msima snio la paalbra cmoo un tdoo. Pesornamelnte me preace icrneilbe..." Laboratorio de Tecnologías del Lenguaje

¿Qué hay detrás de un etiquetador? Un sistema de reglas aplicadas a un lexicón de base Junto con un proceso estocástico para incluir el contexto (Modelos Ocultos de Markov) Sistema con el que trabajaremos FreeLing LingPipe Laboratorio de Tecnologías del Lenguaje

Aplicación: clasificación de preguntas Objetivo: agrupar las preguntas por el tipo de respuesta esperada ¿Dónde nació Benito Juárez? – LUGAR ¿Quién inventó el teléfono? – PERSONA ¿Cuándo cayó la primera bomba atómica? – FECHA ¿Quién invadió a Kuwait? Laboratorio de Tecnologías del Lenguaje

Solución con aprendizaje automático Caracterizamos las preguntas: Los pesos de las palabras objetivo de la pregunta con respecto al tipo de pregunta Usamos la Web ”President is a person” ”President is a place” ”President is a date” ”President is a measure” ”President is an organization” Las palabras de la pregunta (bolsa de palabras) Laboratorio de Tecnologías del Lenguaje

¿Cómo obtener las palabras objetivo? Las obtenemos al consultar sobre la Web: Por ejemplo: Who is the President of the French Republic? Eliminamos las palabras vacías (partículas sin contenido) Eliminamos los adverbios o pronombres interrogativos Reformulamos la consulta con el resto de las palabras: ”President French Republic is a si” donde si є {Person, Organization, Place, Date, Measure}. Si el motor de búsqueda no regresa ningún resultado entonces eliminamos palabras de derecha a izquierda: ”President French is a si” ”President is a si” En particular, para este último caso tenemos respuesta para todas las clases semánticas excepto FECHA Laboratorio de Tecnologías del Lenguaje

Usando la Web para caracterizar una pregunta Laboratorio de Tecnologías del Lenguaje

Usando las palabras de la pregunta Usamos todas las palabras de la pregunta La presencia de una palabra caracteriza una pregunta Problema: los plurales, las conjugaciones !! Quién, Quienes Es, eran, fue Cuánto, Cuántas Solución: un analizador morfológico Laboratorio de Tecnologías del Lenguaje

Usando las palabras de la pregunta Problema: depende del idioma Solución: truncado Quién – quienes A 4 caracteres >quie< A 5 caracteres >quien< Se hicieron cálculos para tres idiomas: Español, italiano e inglés Laboratorio de Tecnologías del Lenguaje

Resultados al clasificación usando palabras, prefijos y la Web Laboratorio de Tecnologías del Lenguaje

Resultados al clasificación usando palabras, prefijos y la Web Laboratorio de Tecnologías del Lenguaje

Resultados al clasificación usando palabras, prefijos y la Web y el lenguaje !!! Laboratorio de Tecnologías del Lenguaje