Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porÁlvaro Poblete Aguilera Modificado hace 7 años
1
Incremental Methods for Context-Based Web Retrieval
Carlos M. Lorenzetti – Fernando M. Sagui Ana G. Maguitman – Guillermo R. Simari Carlos I. Chesñevar
2
Problemas: ambigüedad
Windows styles? CACIC 2006 – Potrero de los Funes – San Luis
3
Una solución: CONTEXTO
Proponemos: identificar términos específicos encontrar fuentes relevantes generar automáticamente consultas CACIC 2006 – Potrero de los Funes – San Luis
4
Una solución: CONTEXTO
Artículos Diario Otros Lista de palabras CACIC 2006 – Potrero de los Funes – San Luis
5
Una solución: CONTEXTO
Artículos Diario Otros Lista de palabras T1 p1 T2 p2 T3 p3 T4 p4 Tn pn CACIC 2006 – Potrero de los Funes – San Luis
6
Importancia de los términos
Método tradicional: TF-IDF emplea la forma más simple CACIC 2006 – Potrero de los Funes – San Luis
7
Importancia de los términos
Método tradicional: TF-IDF emplea la forma más simple Cuenta las apariciones de un término en el documento Penaliza a aquella palabras que son muy comunes CACIC 2006 – Potrero de los Funes – San Luis
8
Importancia de los términos
Método Propuesto: Incremental Descriptores Términos que aparecen muchas veces en documentos de un mismo tópico: ¿Sobre qué trata este tema? Discriminadores Términos que sólo aparecen en documentos de un mismo tópico: ¿Qué palabras utilizo para encontrar información similar? CACIC 2006 – Potrero de los Funes – San Luis
9
Descriptores y Discriminadores
Máquina Java Lenguaje Virtual Programación Ruby Applets NetBeans Computadoras JVM Código JDK Tópico: Máquina Virtual de Java CACIC 2006 – Potrero de los Funes – San Luis
10
Descriptores y Discriminadores
Buenos descriptores Máquina Java Lenguaje Virtual Programación Ruby Applets NetBeans Computadoras JVM Código JDK Tópico: Máquina Virtual de Java CACIC 2006 – Potrero de los Funes – San Luis
11
Descriptores y Discriminadores
Máquina Java Lenguaje Virtual Programación Ruby Applets NetBeans Computadoras JVM Código JDK Buenos discriminadores Tópico: Máquina Virtual de Java CACIC 2006 – Potrero de los Funes – San Luis
12
Cálculo de Descriptores y Discriminadores
CACIC 2006 – Potrero de los Funes – San Luis
13
Descriptores y Discriminadores en Documentos
H Contexto Inicial (1) (2) (3) (4) Tópico: Máquina Virtual de Java java 4 máquina 2 virtual 1 lenguaje programación 3 café isla provincia jvm jdk 2 5 6 3 1 4 espressotec.com netbeans.org sun.com wikitravel.org Cantidad de ocurrencias del término k en el documento i CACIC 2006 – Potrero de los Funes – San Luis
14
Descriptores de Documentos
Contexto Inicial Tópico: Máquina Virtual de Java java 4 máquina 2 virtual 1 lenguaje programación 3 café isla provincia jvm jdk 0,718 0,359 0,180 0,539 0,000 Poder descriptivo de un término de un documento CACIC 2006 – Potrero de los Funes – San Luis
15
Discriminadores de Documentos
Contexto Inicial Tópico: Máquina Virtual de Java java 4 máquina 2 virtual 1 lenguaje programación 3 café isla provincia jvm jdk 0,447 0,500 0,577 0,000 Poder discriminante de un término de un documento CACIC 2006 – Potrero de los Funes – San Luis
16
Similaridad por coseno
K1 d2 Similaridad por coseno d1 a K2 K3 Similaridad entre documentos CACIC 2006 – Potrero de los Funes – San Luis
17
Descriptores de Tópicos
Contexto Inicial Tópico: Máquina Virtual de Java java 4 máquina 2 jdk café isla programación 3 lenguaje 1 provincia jvm virtual 0,385 0,158 0,124 0,089 0,064 0,055 0,040 0,032 0,014 Poder descriptivo de un término en el tópico de un documento CACIC 2006 – Potrero de los Funes – San Luis
18
Discriminadores de Tópicos
Contexto Inicial Tópico: Máquina Virtual de Java jvm jdk virtual 1 programación 3 máquina 2 lenguaje java 4 café isla provincia 0,848 0,566 0,524 0,517 0,493 0,385 Poder discriminante de un término en el tópico de un documento CACIC 2006 – Potrero de los Funes – San Luis
19
Implementación CACIC 2006 – Potrero de los Funes – San Luis
20
Framework CACIC 2006 – Potrero de los Funes – San Luis
21
Se encarga de la comunicación con la Web
Framework Se encarga de la comunicación con la Web CACIC 2006 – Potrero de los Funes – San Luis
22
Estima la importancia del contenido que recibe
Framework Estima la importancia del contenido que recibe CACIC 2006 – Potrero de los Funes – San Luis
23
Refina la representación que tiene del contexto del usuario
Framework Refina la representación que tiene del contexto del usuario CACIC 2006 – Potrero de los Funes – San Luis
24
Framework CACIC 2006 – Potrero de los Funes – San Luis
25
Evaluación CACIC 2006 – Potrero de los Funes – San Luis
26
Evaluación Método Base
Generar la Q(0) usando los términos con TFs más altos i 0 Enviar la Q(i) al motor de búsqueda Obtener las respuestas y convertirlas a repres. vectorial Generar una lista ordenada términos LTF por frecuencia i i + 1 Q(i) n términos de LTF ir al paso 3 CACIC 2006 – Potrero de los Funes – San Luis
27
Evaluación Query–Based
Generar la Q(0) usando los términos con TFs más altos i 0 Enviar la Q(i) al motor de búsqueda Obtener las respuestas y convertirlas a repres. vectorial Generar una lista ordenada de descriptores, L Generar una lista ordenada de discriminadores, L i i + 1 Q(i) una combinación de L y L ir al paso 3 CACIC 2006 – Potrero de los Funes – San Luis
28
Evaluación Contexto Inicial Consulta Resultados analizados
5 páginas en inglés del DMOZ Tópico: Recreación Consulta 3 términos L + 2 términos L Resultados analizados Similaridades promedio por iteración CACIC 2006 – Potrero de los Funes – San Luis
29
Campamentos en Costa Rica
Evaluación Campamentos en Costa Rica Consultas generadas Método base world costa rica experience programs costa rica abroad program programs study abroad programs costa rica Método incremental costa rica couples families individuals costa rica adventures austin cater adventure costa hike kick lodge costa rica below click damas CACIC 2006 – Potrero de los Funes – San Luis
30
Publicidad acerca de campamentos
Evaluación Publicidad acerca de campamentos Consultas generadas Método base koa rv camping soda america camping soda koa rv campgrounds camping koa soda rv campgrounds Método incremental soda camping containers copy disposing containers disposing america campgrounds chance camping america campground campgrounds directory camping directory cabins usa koa CACIC 2006 – Potrero de los Funes – San Luis
31
Evaluación CACIC 2006 – Potrero de los Funes – San Luis
32
Trabajo a Futuro Adaptación Métodos cualitativos
Evaluaciones intensivas CACIC 2006 – Potrero de los Funes – San Luis
33
Incremental Methods for Context-Based Web Retrieval
Carlos M. Lorenzetti – Fernando M. Sagui Ana G. Maguitman – Guillermo R. Simari Carlos I. Chesñevar
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.