Compilación de corpus textuales Identificación del objetivo Selección de textos Obtención de los textos Equipo de trabajo Digitalización de documentos Gerardo Sierra
Identificación del objetivo Tipo de corpus ¿Corpus para propósitos generales o para corpus específicos? Medio de accesibilidad (CD, ftp, Internet) Codificación y anotación Diseño de herramientas
Identificación del objetivo Propósitos Análisis lingüísticos Referencia Enseñanza de idiomas Lexicografía y terminología Investigación en PLN Tecnologías del lenguaje
Identificación del objetivo Límites del corpus = f($,t) Temporales Geográficos Dialectales Temáticos Tamaño
Compilación de corpus textuales Identificación del objetivo Selección de textos Obtención de los textos Digitalización de documentos Equipo de trabajo
Selección de los documentos a incorporar Población Muestra Balance
Selección de los partes de los textos Portadas Índices Pies de página Tablas Figuras y gráficas
Compilación de corpus textuales Identificación del objetivo Selección de textos Obtención de los textos Digitalización de documentos Equipo de trabajo
Obtención de los textos Solicitud a editoriales, académicos, etc. Solicitud de derechos de autor Seguimiento: Registro de documentos Registro del estado de los documentos en el proceso
Equipo de trabajo Líder de proyecto. Administrador financiero. Diseñador del corpus. Relaciones públicas para búsqueda de documentos y adquisición de derechos. Revisor de seguimiento del proyecto. Digitalizadores. Etiquetadores. Desarrolladores del sistema. Informáticos de apoyo.