La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Seminario de Extracción de Información DAPPER: The Data Mapper Rubén Izquierdo Beviá Departamento de Lenguajes y Sistemas Informáticos

Presentaciones similares


Presentación del tema: "Seminario de Extracción de Información DAPPER: The Data Mapper Rubén Izquierdo Beviá Departamento de Lenguajes y Sistemas Informáticos"— Transcripción de la presentación:

1 Seminario de Extracción de Información DAPPER: The Data Mapper Rubén Izquierdo Beviá Departamento de Lenguajes y Sistemas Informáticos ruben@dlsi.ua.es

2 INDICE 1. Problemática 2. ¿ Qué es DAPPER 3. ¿ Cómo crear un Dapp? 4. ¿ Cómo usar un Dapp? 5. Dos ejemplos prácticos 6. Características Interesantes 7. Algunos problemas de DAPPER 2

3 Problemática En 2008, alrededor de 160 millones de webs Estructura heterogénea y dinámica Datos semi-estructurados Desarrollo manual de wrappers Especializado por web Muy costoso de desarrollar Todavía más de mantener 3

4 ¿Qué es DAPPER? Herramienta de Extracción de Información desde Internet 4

5 ¿Qué es DAPPER? Servicio web, gratuito (registro) No es necesario programar (entorno visual) Fases: 1 desarrollo del Dapp para una web usos del Dapp sobre diferentes webs Nos permitirá: Extraer la información requerida de una web Utilizarla de diferentes modos 5

6 ¿Cómo crear un DAPP? 1. Varias muestras de webs con la misma estructura 6

7 ¿Cómo crear un DAPP? 7

8 1. Varias muestras de webs con la misma estructura 2. Definir información que queremos 8

9 ¿Cómo funciona DAPPER? 9

10 ¿Cómo crear un DAPP? 1. Varias muestras de webs con la misma estructura 2. Definir información que queremos 3. DAPPER aprende y propone automáticamente Información estática / dinámica Estructura y etiquetas HTML (XPATH) 4. Refinamos el Dapp 5. Guardamos el Dapp 10

11 ¿Cómo usar un DAPP? Suscribirnos mediante un lector RSS Feed (formato de redifusión de fuentes web) Atom Feed Ponerlo en nuestra página web Gadget Google Módulo Netvibes Widget en flash 11

12 ¿Cómo usar un DAPP? Usarlo desde un lenguaje de programación XML JSON YAML, XSL, CSV … Otros iCal Google Map 12

13 Ejemplo Práctico I Extraer información de noticias del diario MARCA Titular Subtitular Cuerpo Crear un widget para mi página web 13

14 Ejemplo Práctico II Crear un buscador que use yahoo Crear un gadget para iGoogle 14

15 Características Interesantes Uso de variables de entrada Query para un buscador Creación de alertas Email cuando en cuerpo de noticia aparezca Rubén Izquierdo Enlazar varios Dapp Dapp buscador inglés Dapp traductor Explotación de Dapps API JAVA Python… 15

16 Algunos problemas de DAPPER No funciona con flash Algunas web bloquean al robot de DAPPER Limitación hits/segundo Se ejecuta en el servidor de Yahoo Dependencia de Yahoo Dependencia de la carga de la red 16

17 ¿Sugerencias? ¿Preguntas? DAPPER: The Data Mapper Rubén Izquierdo Beviá Departamento de Lenguajes y Sistemas Informáticos ruben@dlsi.ua.es


Descargar ppt "Seminario de Extracción de Información DAPPER: The Data Mapper Rubén Izquierdo Beviá Departamento de Lenguajes y Sistemas Informáticos"

Presentaciones similares


Anuncios Google