Corpus IULA-SCRC Identificación del recurso Nombre: IULA-Spanish Clinical Records Clasificación por número de lenguas: monolingüe Lenguas*: Español peninsular Descripción del recurso: Corpus de 3138 frases obtenidas de notas de informes clínicos anonimizados sobre exploraciones, evolución del paciente, radiología y procesos. 19/09/2017 2º Taller ReTeLe 1
El corpus está anotado para la detección de negación y el tipo semántico de las entidades médicas correspondientes a estructuras corporales, substancias (fármacos y fluidos biológicos), hallazgos clínicos (enfermedades, síntomas, etc.) y procedimientos clínicos. La anotación de 1093 frases con negación es la primera entrega, a la que seguirá la anotación de las entidades de todas las frases. 19/09/2017 2º Taller ReTeLe 2
eines.iula.upf.edu/brat/#/NegationOnCR_IULA Distribución Versión: v0 URL: eines.iula.upf.edu/brat/#/NegationOnCR_IULA Distribución Licencia: Creative Commons v3 CC_BY Persona de contacto u organización responsable: Nombre y correo electrónico: Núria Bel, nuria.bel@upf.edu Nombre organización: IULA-UPF, Instituto de Lingüística Aplicada, Universidad Pompeu Fabra, www.upf.edu/web/iula 19/09/2017 2º Taller ReTeLe 3
Creación del recurso Proveedor y/o creador: IULA-UPF Procedencia de los datos: Hospital Clínico de Barcelona Proyecto(s) financiador(es): IULA
Descripción del recurso Variedad de la lengua: argot médico Niveles de anotación lingüística: negación Conforme a los estándares: Anotación Brat, etiquetas semánticas SNOMED Tamaño: 3138 Unidad: oraciones FormatCodificación*: UTF8 Brat XML Dominio*: Medicina Género*: Informe Clínico Tipo de texto*: informe Tipo de documento*: informe 19/09/2017 2º Taller ReTeLe 5
Annotation with Brat entity annotations relation annotations