TemaTres servidor de vocabularios controlados Workshop sobre software libre para gestión bibliotecaria 6 y 7 de diciembre de 2011
Qué es TemaTres TemaTres es una herramienta web para gestionar representaciones formales y lingüísticas del conocimiento Permite gestionar servidores de vocabularios controlados de código abierto para gestionar vocabularios controlados, taxonomías, tesauros, listas de encabezados.
Origen de TemaTres Surgió como variante de arquitectura de TemaUno y TemaDos. TemaUno se desarrolló en 2001 para la gestión interna del vocabularios controlados de áreas y temas curriculares de educ.ar TemaDos se desarrolló en 2003 en el marco del proyecto Narratives proyect del NESTA (Reino Unido) La versión 0.21 de TemaTres se liberó en el año 2005.
Ejemplos de vías de explotación de TemaTres Etiquetado y recomendación de palabras clave Búsquedas semánticas Integración de datos Sistemas de recomendación Soporte para aplicaciones multilingües Sugerencias de búsqueda Linked data y publicación de fuentes abiertas de datos (Linked Open Data) Creación y vinculación de contenidos Organización de estructuras de navegación de contenidos
Etiquetado y recomendación de palabras clave http://vocabularyserver.com/tools/autocomplete/ http://vocabularyserver.com/tools/forms/
Búsquedas semánticas y representaciones sintéticas Comparación de campos semánticos http://vocabularyserver.com/smarthesaurus/index.php Representaciones gráficas de conceptos http://vocabularyserver.com/visualvocabulary/ http://vocab.lternet.edu/visualvocabulary/lter/
Integración de datos http://r020.com.ar/paperlandia/
Sistemas de recomendación y Extracción de palabras clave http://vocabularyserver.com/distiller/index.php http://im.lternet.edu/vocab_tematres_viewers
Relaciones entre vocabularios Soporte para aplicaciones multilingües http://vocabularyserver.com/tee/es/ http://vocabularyserver.com/eurovoc/ http://vocabularyserver.com/psh/cs/ http://www.ceframe.eu/thesaurus/ http://vocabularyserver.com/gemet/ http://www.vocabularyserver.com/unesco/es/ Soporte para mapeos terminológicos http://www.bnm.me.gov.ar/vocabularios/mercosur/ http://fundacionevolucion.org.ar/repeal/ www.vocabularyserver.com/ficcion/es/index.php?tema=117
Sugerencias de términos de búsqueda http://www.safetylit.org/thes/index.php http://www.vocabularyserver.com/eurovoc/es/index.php?_ex presion_de_busqueda=desechos+humanos
Expansión de expresiones de búsqueda http://vocabularyserver.com/isoc/index.php?_expresion_de_b usqueda=pobreza
Linked data y publicación de fuentes abiertas de datos (Linked Open Data)
Creación y vinculación de contenidos http://vocabularyserver.com/gobiernolocal/recursos/ http://www.palabrero.com.ar/tesauro-de-legislacion-historica- de-espana/?task=fetchTerm&arg=1400#t3 http://www.knoc.com.ar/ddhh/
Creación y vinculación de contenidos http://vocabularyserver.com/webservices/?task=fetchTerm &arg=27
Vocabularios controlados en ambientes digitales TemaTres: mejoras para la gestión Tipos de mejoras: Ayudas y facilidades de uso Mecanismos activos de control de consistencia e integridad Herramientas de auditoría y control de calidad 15
Vocabularios controlados: ayudas Ayudas y facilidades de uso Condiciones para el trabajo colaborativo Herramientas multiusuario Trasabilidad: quién y cuándo hace qué Control activo de consistencia e integridad Comunicación interna: notas privadas Servicio de alerta sobre cambios o novedades en el vocabulario controlado 16
Vocabularios controlados: ayudas Términos duplicados Agregado masivo de términos 17
Vocabularios controlados: ayudas Facilidades de edición: editar en el lugar Editor visual de notas 18
Vocabularios controlados: ayudas Web services para articulación entre vocabularios controlados Modelos federados de gestión de vocabularios Mapeo terminológico Vocabularios multilíngües Mecanismos automáticos para sincronizar vocabularios 19
Vocabularios controlados: control de consistencia Mecanismos activos de control de consistencia e integridad Conjunto de reglas funcionales y lógicas que implementa una herramienta de gestión de vocabularios controlados para cumplir con un modelo conceptual en condiciones de integridad y consistencia Integridad: corrección y completud de datos Consistencia: validez con respecto a otros datos 20
Vocabularios controlados: control de consistencia Ejemplos de control de flujo: Relaciones compuestas entre n términos no preferidos y uno preferido Especializaciones de la asociación BT/NT (genérica, partitiva, etc) La relación BT/NT debe ser irreflexiva La limitación de concurrencia en relaciones de BT/NT y RT Notas en términos preferidos Relaciones TR, TE, TG con términos no preferidos Relaciones asociativas con términos con las que ya existe una relación jerárquica Relaciones jerárquicas circulares Condiciones para relaciones polijerárquicas 21
Vocabularios controlados: control de consistencia Reglas para gestión del Workflow Términos en estado: Candidato Aceptado Rechazado 22
Workflow de gestión 23
Vocabularios controlados: Auditoría y control de calidad Reportes de auditoría Términos libres Términos repetidos Términos según cantidad de térmions genéricos Términos según cantidad de términos específicos Términos según cantidad de palabras Términos según estados Términos con palabras con sufijos, prefijos e infijos específicos 24
Vocabularios controlados: Auditoría y control de calidad Reportes de auditoría y gestión Términos según tipo de nota Términos según fecha de creación Términos según usuario Términos según dispongan o no relaciones con otros vocabularios (mapeos o vocabularios multilíngües) 25
Vocabularios controlados: control de calidad Ejemplos de indicadores de uso de indicadores de calidad para vocabularios controlados Se han utilizado las siguientes fuentes para la elaboración de indicadores y criterios de calidad: MARTÍNEZ, A.M.a et al. Concepto, forma y longitud de los términos preferentes del tesauro: una propuesta de indicadores de calidad. Anales de Documentación, 2010, vol. 13, p. 185-195. http://revistas.um.es/analesdoc/article/view/107151 MARTÍNEZ, A.M.a et al. Indicadores para evaluar el vocabulario y la estructura sistemática de un tesauro. I Jornada de Intercambio y Reflexión acerca de la Investigación en Bibliotecología, La Plata, 6-7 de diciembre de 2010. Facultad de Humanidades y Ciencias de la Educación de la Universidad Nacional de La Plata. Mader, Christian Quality Criteria for SKOS Vocabularies visitado: 2011/04/11 https://github.com/cmader/qSKOS/wiki/Quality-Criteria-for-SKOS-Vocabularies 26
Vocabularios controlados: control de calidad Se estableció un análisis comparativo entre vocabularios generalistas: Tesauro de la UNESCO (Inglés, Español, Francés) UK Archival Thesaurus (UKAT) Subjects of New Zealand Thesaurus (SONZ) Australian Public Affairs Information Service Thesaurus (APAIS) Government of Canada Core Subject Thesaurus (CST) Polythematic Structured Subject Heading System (PSH) 27
Vocabularios controlados: control de calidad Cant.términos URL UNESCO 4419 http://www.vocabularyserver.com/unesco/ PSH 9803 http://www.vocabularyserver.com/psh/ SONZ 1125 http://www.vocabularyserver.com/sonz/ UKAT 13937 http://www.vocabularyserver.com/ukat/ APAIS 1262 http://www.vocabularyserver.com/psh/apais/ CST 4242 http://www.vocabularyserver.com/cst/ 28
Vocabularios controlados: control de calidad Media de palabras por término UNESCO EN 1,78 UNESCO ES 2,12 UNESCO FR 2,04 PSH 1,94 UKAT 2,16 SONZ 1,47 APAIS 1,60 CST 1,64 29
Vocabularios controlados: control de calidad Porcentaje de términos con un solo término específicos ¿Es lo mismo en cualquier posición? UNESCO EN 10.86 % PSH 4.6 % UKAT 9.42 % SONZ 8 % APAIS 10.61 % CST 3.41 % 30
Vocabularios controlados: control de calidad Porcentaje de términos sin relaciones jerárquicas UNESCO EN 0 % PSH 0.01% UKAT 0.45 % SONZ 19.37 % APAIS 31.45 % CST 8.58 % 31
Distribución de términos según profundidad (en porcentaje) 32
TemaTres: agenda actual Se esta haciendo la ronda de pruebas de la versión 1.5 Principales mejoras de la versión: Incorporación de novedades de la norma iso25964-1: 2011 Tipos de relaciones definidas por usuarios Relaciones entre términos y entidades web (linked data) Más formatos de exportación
TemaTres: algunas direcciones Sitio internacional: http://www.vocabularyserver.com Algunos casos conocidos: http://www.vocabularyserver.com/vocabularies.php Wiki: http://r020.com.ar/tematres/wiki/ Manual: http://r020.com.ar/tematres/manual/ Demo: http://r020.com.ar/tematres/demo/ Contacto: tematres@r020.com.ar