María Esther del Moral - Departamento de Ciencias de la Educación SOAF: un sistema de indexado semántico de OA basado en las anotaciones colaborativas SPDECE 2007 - Bilbao Universidad de Oviedo Doina Ana Cernea - Departamento de Matemáticas María Esther del Moral - Departamento de Ciencias de la Educación Emilio Labra - Departamento de Informática
Introducción El nuevo marco de la Web Semántica se convierte en un escenario idóneo para la formación on-line, ya que permite la adaptabilidad a las necesidades específicas del alumno y facilita el aprendizaje colaborativo. Los contenidos educativos diseñados y organizados en Objetos de Aprendizaje (OA) se caracterizan por su alta densidad de elementos multimedia. Se detecta la necesidad de dotar de semántica de manera automática a los recursos multimedia, componentes esenciales de los OA, para su óptima localización y recuperación, en consonancia con las necesidades específicas de unos objetivos educativos concretos, frente al vacío semántico que existe entre la descripción basada en los contenidos y la descripción basada en conceptos. Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El nuevo marco de la Web Semántica e implicaciones en el diseño de los OA La Web Semántica es una visión (Tim Berners-Lee): disponer los datos en la Web definidos y entrelazados de forma que puedan ser leídos y utilizados por las máquinas no solamente para su visualización sino también para: Automatizar tareas Integrar y Reutilizar datos entre aplicaciones RDF (Resource Description Framework): un modelo de datos para describir recursos Ontologías: un vocabulario compartido que describe la organización del conocimiento de un dominio. OWL (Web Ontology Language) es un lenguaje de marcado para publicar y compartir datos usando ontologías en la WWW Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Tecnologías de la Web Semántica La Web Semántica implica la creación de tecnologías para la descripción de los datos contenidos dentro de las páginas Web. RDF - vocabulario propuesto para la descripción de los recursos y de las relaciones que existen entre ellos. Ejemplo: código RDF para la descripción semántica de un OA sobre Geometría Fractal: <rdf:RDF xmlns:rdf=”...” ... > <rdf:Description rdf:about="http://.../geofractal/estruFractal"> <rdf:type rdf:resource="http://...#Introduction"/> <dc:title>Introducción a la Estructura Fractal</dc:title> <dc:creator> <lom:entity> <vCard:FN>J. Garrido</vCard:FN></lom:entity> </dc:creator> </rdf:Description> </rdf:RDF> Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Tecnologías de la Web Semántica Otra tecnología clave en el desarrollo de la Web Semántica es la asociada a la representación del conocimiento de un dominio concreto, es decir, la definición de los conceptos y sus relaciones OWL - lenguaje común para la definición de las ontologías y está basada en la lógica descriptiva Ejemplo: el OA “Introducción a la Geometría Fractal” Introducción es de tipo Lección y puede contener varios ejercicios Exercise: http://...#Introduction http://...#Lecture http://...#Introduction http://...#contains http://...#Exercise Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Aprendizaje colaborativo potenciado por la Web Semántica En el contexto creado por la Web 2.0 surge el nuevo paradigma de la colaboración denominado software social, cuyas aplicaciones como las redes sociales, wikis y folksonomías han encontrado una gran aceptación dentro de las comunidades de e-Learning, potenciando el aprendizaje colaborativo, basado en la construcción conjunta del conocimiento. Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Sistemas de etiquetado colaborativo: folksonomías Las folksonomías se definen como sistemas colaborativos para la categorización no jerárquica de los recursos de Internet a través de etiquetas compartidas por una comunidad o red social. Estructuras sociales emergentes mediante las conexiones: Usuarios – recursos: las etiquetas de los usuarios establecen un vínculo entre éstos y los recursos Recursos – recursos: los recursos pueden estar conectados entre sí a través de enlaces (sus propias etiquetas sirven de enlace con otros recursos etiquetados del mismo modo) Usuarios – usuarios: los usuarios pueden responder a ciertas afiliaciones sociales, al proceder de comunidades virtuales que comparten los mismos intereses Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Modelo conceptual de un sistema de etiquetado colaborativo t1,t8,t9 t7,t2,t5 t1,t2,t3 t10,t2 t5,t7,t3 t7,t8,t9 Recursos Etiquetas Usuarios Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Indexado semántico de los recursos Web educativos Web Semántica ↔ descripción de los recursos con un grado más fino de granularidad (los recursos de Internet dejan de ser unidades de información) Ejemplo: de la descripción semántica del OA “Introducción a la Geometría Fractal” se podría extraer la definición del concepto de estructura fractal o la propiedad de recursividad. Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Contenidos para e-Learning: el concepto de Objeto de Aprendizaje Definición y estructura Objeto de Aprendizaje (OA), Learning Object (LO), Reusable Learning Object (RLO). Polsani: “unidades de contenido educativo, independientes, con sentido por si mismas, con potencial para ser reutilizadas en múltiples contextos de enseñanza” Un OA puede ser: Un único recurso educativo (imagen, animación, simulación, párrafo descriptivo…) Un apartado de una lección Una lección Un curso Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Contenidos para e-Learning: el concepto de Objeto de Aprendizaje Definición y estructura Curso Módulo (Capítulo) - opcional Lección (Objeto de Aprendizaje - RLO) Tópico (Objeto de Información – RIO) Subtema (incluye los recursos educativos) 7+2 módulos teóricos para su máximo rendimiento, teniendo en cuenta las limitaciones de la memoria humana (Miller) Visión General Resumen Evaluación Actividades Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
OA en la Web Semántica Los OA poseen una estructura granular flexible: En un primer nivel los apartados (Objetos de Información) En un segundo nivel los recursos que los componen (texto, multimedia, etc.) Recursos de Aprendizaje Objetos de Información Objeto de Aprendizaje Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Tipos de recursos educativos, componenetes de los OA Resursos de texto: técnicas de procesamiento del lenguaje natural, muy utilizadas por los buscadores, que suponen la división del texto en una lista de términos que a continuación serán normalizados mediante técnicas de radicación, eliminando las ambigüedades lingüísticas y las palabras vacías de contenido Recursos de imagen Recursos audio y vídeo Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El gap semántico de los recursos multimedia Vacío semántico que existe entre la extracción automática de información proporcionada por los ordenadores y percepción humana de las imágenes basada en conceptos de alto nivel (high-level concepts). La ausencia de coincidencias entre la información que se puede extraer de los datos visuales y la interpretación un usuario determinado pueda encontrar para los mismos datos en una situación concreta Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Descripción basada en contenidos “low – level features” bordes color y texturas vectores de características Información Semántica Semantic Gap Descripción basada en contenidos “low – level features” Descripción basada en conceptos de alto nivel: “high – level concept” Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El gap semántico de los recursos multimedia Características de bajo nivel y conceptos de alto nivel: Los rasgos que pueden ser directamente extraídos a partir de las representaciones digitales de los objetos, se denominan características de bajo nivel (low-level-features). Pueden estar muy lejos de la metodología de interpretación que los seres vivos asocian con la percepción del objeto. Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El gap semántico de los recursos multimedia Características de bajo nivel y conceptos de alto nivel: Características de bajo nivel: estadísticas de tonos y colores (medias, histogramas, etc) descriptores de Fourier (DFT) descriptores relacionados con la geometría fractal parámetros de forma (áreas, diámetros, perímetros) parámetros geométricos (líneas, curvas y contornos) parámetros extraídos de la imagen binaria descripción de los modelos de textura … Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El gap semántico de los recursos multimedia Interpretación subjetiva del ser humano implica el uso de conceptos de alto nivel (high-level-concepts) específicos para los diversos dominios de aplicación. El proceso de extracción de la semántica de los recursos es más compleja, ya que requiere el conocimiento del dominio, interacciones del usuario o ambas cosas e interpretaciones subjetivas. Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El gap semántico de los recursos multimedia Extracción de la información de los recursos multimedia Distintas aproximaciones: Segmentación de la imagen en varias regiones. Aplicación de un modelo matemático (redes de inferencia o distribuciones Múltiples Bernoulli) para enlazar las regiones con los conceptos. Análisis orientado a la escena global. Aplicación de anotaciones de escenas básicas obtenidas mediante filtros globales o utilización de descriptores locales correspondientes a las regiones relevantes de la imagen. Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El gap semántico de los recursos multimedia Descripción semántica de recursos multimedia: el estándar MPEG - 7 La necesidad de una representación de alto nivel de los recursos multimedia, que capture también el significado de sus contenidos, ha impulsado el desarrollo del estándar MPEG – 7, desarrollado por la MPEG (Moving Picture Experts Group). Proporciona descriptores de metadatos para los contenidos de bajo nivel y aporta también un conjunto de herramientas para la modelación de una descripción semántica de estos recursos. Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Arquitectura SOAF: Integración de las anotaciones colaborativas de los usuarios con la semántica emergente Desde esta perspectiva, el sistema SOAF contempla y procesa tres tipos de meta-información que pueden acompañar a los OA o a los recursos que los componen: La semántica proporcionada de forma automática mediante indexado semántico a partir de las características de bajo nivel Los descriptores de alto nivel o metadatos de los autores (en la mayoría de los casos se refieren a título, fecha de creación, nombre de los autores, tema, objetivos de aprendizaje,…) La semántica de los usuarios mediante anotaciones colaborativas. Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Arquitectura SOAF: Integración de las anotaciones colaborativas de los usuarios con la semántica emergente Descriptores de bajo nivel Proceso automático OA Descriptores de alto nivel Autores Etiquetas Usuarios Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Descripción semántica Arquitectura SOAF: Integración de las anotaciones colaborativas de los usuarios con la semántica emergente Retroalimentación del sistema Características de bajo nivel LSI SOAF OA Metadata del autor Descripción semántica Anotaciones usuarios Folksonomías O1 O4 O2 O3 Filtrado Social Tags colaborativos Sugerencias del sistema Red de Ontologías Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Extracción de semántica emergente El sistema SOAF propone una arquitectura para la extracción automática de descripción semántica de los recursos educativos multimedia basada en Latent Semantic Indexing [28] a partir de la representación de los recursos (texto o multimedia) en vectores del espacio vectorial Rn, y aplicando análisis de matrices establece las asociaciones y las conexiones entre los diversos recursos de un repositorio. Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Semántica emergente Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Semántica emergente Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Etiquetas generadas colaborativamente SOAF utiliza un sistema basado en folksonomías para capturar las anotaciones de los propios usuarios focalizadas en sus experiencias de aprendizaje. SOAF utiliza estas anotaciones colaborativas para completar y corregir el indexado semántico generado automáticamente por ordenador a partir de las características de bajo nivel. Se observa que con el tiempo, la frecuencia relativa de una misma etiqueta tiende a ser un valor constante, lo que indica que el etiquetado colaborativo posee la capacidad de coordinar las acciones de los usuarios para crear anotaciones coherentes para los recursos que comparten. Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Filtrado social de las anotaciones colaborativas de los usuarios El conjunto de etiquetas asignadas por los usuarios se pueden filtrar aplicándoles un test de confianza basado en la similitud de perfiles para garantizar su fiabilidad, pertinencia y validez. El sistema crea y almacena los perfiles de los usuarios a partir de sus intereses y sus criterios subjetivos, a la vez que compara sus perfiles y determina similitudes vía fórmulas estándar de correlación estadística. Mediante el filtrado social el sistema “recomienda” una etiqueta si varios usuarios con perfiles similares la han asignado, es decir, se le asigna un mayor valor de confianza a la etiqueta más utilizada por usuarios con perfiles similares. Bilbao - 21 de septiembre de 2007 Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas