El proyecto del Diccionario del Español de México (DEM)

Slides:



Advertisements
Presentaciones similares
Desarrollo de las competencias y destrezas lingüísticas del alumno del español como lengua B en el sistema del Bachillerato Internacional Liubov Medvedeva.
Advertisements

UNA APROXIMACIÓN A INTERNET Y A SUS HERRAMIENTAS DE BÚSQUEDA.
Mapa de contenidos precedentes Español y Literatura Comparada Moderna.
Selección de textos presentados durante las clases Rasgos lingüísticos y problemas de traducción.
COMPRENSIÓN Y PRODUCCIÓN DE TEXTOS UNSL ACTIVIDAD CONTINUA DE INTEGRACIÓN DE CONTENIDOS.
Uso del Diccionario de Latín. El Diccionario se encuentra en el entorno de conocimiento. Vamos a ver el uso del diccionario en línea FI-GQ-GCMU
R ASGOS DE LA NOVELA REALISTA. La novela realista se propone representar la realidad social contemporánea de manera objetiva: ver al hombre inserto en.
Nivel Morfosintáctico Bárbara Zacarías López. Nivel Morfosintáctico Morfosintaxis es la aglutinación de la palabra morfología y la palabra sintaxis, la.
LINGÜÍSTICA COMPUTACIONAL
El campo magnético Región del espacio donde se ponen de manifiesto los efectos magnéticos * Actúa sobre los imanes * Actúa sobre cargas eléctricas en movimiento.
Un corpus de documentos del XIX para el estudio histórico del léxico español de la región andina José Carlos Huisa Téllez Johannes Gutenberg-Universität.
Gestores Bibliográficos o Manejadores de referencia
Biblioteca Virtual, Repositorio Institucional y Observatorio Tecnológico Objetivo: Recuperar y gestionar toda la documentación científica, revistas, tesis,
Etimología: Origen de las palabras
JORNADA DE INTRODUCCION A LAS HUMANIDADES DIGITALES
Desempeño en los exámenes de diagnóstico de Español,
Martha, Luis, Martín, Yoly
Lengua Española y su Didáctica 1ºGrado E. Primaria B3
Historia de la Comunicación Social
Profesora Isabel Jazmín Ángeles Huizard
HABILITACIÓN DE MATERIAL BIBLIOGRÁFICO Y TESIS
Metabúsqueda en .Q Metabúsqueda en .Q COMENZAR.
Cronograma Semana 1 Las ciencias políticas y el mundo contemporáneo
Profesor: José Luis Gonzalez
Tema 1 El método científico
1ra Reunión de trabajo. Portafolio Virtual de Evidencias.
Profesora Isabel Jazmín Ángeles Huizard
Instituto Tecnológico de Mérida Departamento química-bioquímica
Tarea de Español de Primaria
Corpus MUST- equipo UCM
La programación de la educación lingüística y literaria en EI
La lingüística panhispánica
Escuela Preparatoria Dr. Juan Palomo Martínez
Características generales
Motores de busqueda.
Plan Estratégico OEA Avances Grupo de Trabajo sobre la Revisión de los Programas de la OEA |CAAP/RVPP Octubre 2017.
Estándares Curriculares.
TAREAS ESPAÑOL COLEGIO ZAZU DE OCTUBRE
ACT. ExtraClase ENSAYO: INDIVIDUAL
TAREA 3 GLOSARIO TIC Libia Quintana HERRAMIENTA TAREAS.
Antecedentes ESTADO DEL ARTE.
INFORMATICA Es una ciencia que estudia métodos, procesos, técnicas, con el fin de procesar datos en formato digital, almacenar y transmitir información.
Introducción a la Lingüística de corpus
Mónica Delgado Caracas, septiembre 2016
LUZ MERY SILVA BUITRAGO
ESTADÍSTICA BÁSICA.
Aprendizajes Esperados
POR: GUADALUPE MIREYA REYES OLVERA
Colegio La Florida Equipo 3 Proyecto: All my sons
Características de la corrección de estilo
BACHILLERATO RUDYARD KIPLING
PRESENTACIÓN ASIGNATURA LENGUA Y LITERATURA CASTELLANA 1º ESO
EL CAMPO MAGNÉTICO LÍNEAS DE CAMPO.
Autor: María Eugenia Sentíes Santos Año: 2017 Editorial: arteFacto
El Sector Terciario o de servicios.
Lingüística computacional
Saludos 4 Una Tarjeta Postal.
COLEGIO NUEVO CONTINENTE clave incorporación 1247 Equipo No. 4
Escuela internacional SC 1267
Lingüística computacional
WOK para investigadores: Researcher ID
Unidimensional y bidimensional
Diseño de los casos de prueba
PASOS PARA LEER UN TEXTO LITERARIO.
Procesamiento de Texto
Lenguaje literario y lenguaje cotidiano
Apartado 1 Nombre: Instituto Técnico y Cultural Número de equipo: 2
1 Clave del Colegio 7349 La Mujer ayer y hoy. Equipo 5.

La estructura de las palabras
Transcripción de la presentación:

El proyecto del Diccionario del Español de México (DEM)

Antecedentes Proyecto de El Colegio de México A. C. (Centro de Estudios Lingüísticos y Literarios). Equipo de trabajo del Dr. Luis Fernando Lara.

Objetivo Elaborar un diccionario que incluyera el léxico hablado en las fronteras políticas mexicanas.

Componentes Bibliografía en papel. Textos del corpus. Índice estadístico de palabras. Concordancias.

Metodología Crear una fuente primaria de información. Buscar información basada en datos reales. Constituir un corpus como muestra representativa del léxico del español usado en México.

Corpus del Español Mexicano Contemporáneo (CEMC) Creado entre 1921 y 1974. Etiquetado morfosintácticamente mediante un analizar gramatical. Cerca de 2 millones de palabras. 1, 932 textos.

Fragmento del CEMC Número de texto (3 dígitos). Página de la obra (3 dígitos). Línea en la cinta magnética (3 dígitos).

Sistema computacional (SCDEM) Archivos de concordancias. Archivos de datos estadísticos. INFORMIX.

Funciones de búsqueda (SCDEM) TIPOS: Estadística por palabra, raíz, palabra truncada, categoría gramatical y lema. Frecuencia corregida, índice de corrección e índice de dispersión.

Categorías gramaticales

Funciones de búsqueda (SCDEM)

Funciones de búsqueda (SCDEM) CONCOR: Recuperar concordancias. Categoría con palabra, raíz o palabra trunca: *hHOMBREh* - *hHOMBRE*h* - *hHOMBR*h* *[a-n]SER[a-n]* Combinación de categorías: *cYc* *fELf* *hFERROCARRILh* Salida a archivo de concordancias.

Ejemplo de concordancia

Funciones de búsqueda (SCDEM) TEXTOS: Consultar líneas de los textos. 219, 122 líneas. Búsqueda a partir de la concordancia.

Clasificación de documentos

Clasificación de documentos