Interrogando WebSources Investigadores: Louiqa Raschid, Laura Bright University of Maryland María Esther Vidal Universidad Simón Bolívar Jean-Robert Gruser INRIA-Francia CLIP/DARPA/ww97.html
Objetivos: Generar Adaptadores (Wrappers) para fuentes de datos en el Web Adaptadores proveen: –interfaces estandares para interrogar fuentes de datos en el Web – respuestas estructuradas Obtener y representar Capacidades, Cobertura y Contenidos de WebSources. Estimar Costos de Ejecución de Queries
Generador de Adaptadores para WebSources Permite definir y exportar las Capacidades de Ejecución de los WebSources. Ofrece lenguajes declarativos para definir: –familia de URLs que corresponden a una familia de queries – porción del documento HTML que corresponde a la respuesta de una familia de queries. Genera Adaptadores JDBC.
Arquitectura de Mediadores y Adaptadores
Query: Informe del Tiempo Estado de Maryland Interfaz con el WebSource
Respuesta WebSource
Respuesta Adaptador
Árboles HTML: Modelo de Datos para documentos HTML
Qualified Path Expression (QPE): Lenguaje para especificar porciones del documento que son relevantes para una respuesta. EJEMPLO: Documento HTML con un TABLE tag, título MD. Cada fila de la tabla corresponde a una ciudad. La segunda columna de la tabla corresponde al nombre de la ciudad. DATOS RELEVANTES: Ciudades en MD. QPE: Root.child[Name= TABLE & Title= MD]. child.child[Name= Td & Ocurrence= 2].Data
Proceso de Extracción de Datos Relevantes