Búsqueda y Obtención de Información
Contenido de esta presentación Búsquedas avanzadas Booleanas L. Codina - UPF Octubre 2013
Entornos Sistemas de información relevantes Motores de búsqueda especializados. Web Invisible Bases de datos especializadas Catálogos de bibliotecas L. Codina - UPF Octubre 2013
Las Consecuencias Es letal Necesitamos Mucha información (ruido) Perder información (silencio) Necesitamos Solamente información relevante (precisión), pero Toda la información relevante (exhaustividad) L. Codina - UPF Octubre 2013
Las Soluciones Necesitamos Conocer las fuentes Saber buscar Fuentes críticas de cada sector de actividad o rama del conocimiento Saber buscar Conocer los principios unificadores de la búsqueda Ecuaciones de búsqueda Uso efectivo de los formularios de búsquedas avanzadas L. Codina - UPF Octubre 2013
Búsqueda simple Palabra(s) clave(s) Frase Recomendación general Un único término Ejemplos: web Problema: ruido Dos o más términos yuxtapuestos (sin sintaxis, términos separados por espacios en blanco) Ejemplos: web móvil Problema: falsas coordinaciones Frase Una frase o una palabra clave compuesta rodeada por comillas Ejemplos: “la web móvil y los medios de comunicación” Problema: silencio Recomendación general Uso de búsquedas avanzadas L. Codina - UPF Octubre 2013
Búsquedas avanzadas Booleanas L. Codina - UPF Octubre 2013
Parametrizadas Palabras clave Restricción por campos o parámetros Los más habituales Título Tema Fecha de publicación Autor Lengua Ejemplo Título: “cine musical” Entre: 1960 y 1980 L. Codina - UPF Octubre 2013
Parametrizadas Catálogos: Catálogo Athenea de la UPO http://athenea.upo.es/ REBIUN http://rebiun.absysnet.com/ Bases de datos: ISOC del CSIC En http://athenea.upo.es/ buscar ISOC Dialnet: http://dialnet.unirioja.es/ Buscadores académicos: SCIRUS http://www.scirus.com/ L. Codina - UPF Octubre 2013
Booleanas - 1 Basada en álgebra de Boole Operadores principales AND OR NOT Forma simple t1 OP t2 Dónde: t1 es una palabra clave OP es uno de los operadores principales (AND, OR, NOT) Concepto de ecuación t1 OP t2 = conjunto de documentos L. Codina - UPF Octubre 2013
Booleanas - 2 Forma compuesta (t1 OP t2) OP (t3 OP t4) Ejemplos (cine OR vídeo) AND (ayudas OR becas) (sitcom OR “comedia de situación”) AND (niños OR adolescentes) L. Codina - UPF Octubre 2013
Booleanas - 3 Uso Balance: AND > reduce resultados y aumenta precisión OR > aumenta resultados y reduce precisión NOT > reduce resultados y aumenta precisión Balance: AND > aumenta precisión pero elimina información OR > aumenta resultados pero incrementa el ruido NOT > reduce el ruido pero elimina información L. Codina - UPF Octubre 2013
Cuadro resumen - + Operador Resultados Precisión Ruido AND OR NOT L. Codina - UPF Octubre 2013
Problemas - 1 AND > Falsamente intuitivo No corresponde necesariamente con el uso del “y” gramatical Ejemplo: “necesito información sobre la obras de teatro y novelas que han sido adaptadas para cine y televisión” Traducción booleana incorrecta: (teatro AND novela) AND (cine AND televisión) Problema: el usuario perderá información muy relevante Traducción booleana correcta: (teatro OR novela) AND (cine OR televisión) Ventaja: el usuario consigue una gran precisión sin pérdida de información L. Codina - UPF Octubre 2013
Búsquedas Combinadas Combinan ecuaciones Ejemplo Parametrizadas Booleanas Ejemplo (Título artículo= “web móvil” AND publicidad) AND (Años= 2010-2012) Interpretación: buscamos artículos sobre la web móvil y la publicidad, pero siempre que esas palabras clave aparezcan en el título, y se hayan publicado en los últimos dos años. L. Codina - UPF Octubre 2013
Ejemplo: CSIC Formulario de búsqueda combinada en CSIC Octubre 2013 L. Codina - UPF Octubre 2013
Problemas - 2 OR Anti intuitivo término 1 o bien término 2, o ambos cuantos más términos, más ruido, no menos En la lengua natural, la partícula “O” puede tener dos significados: Incluyente Excluyente Cómo operador booleano siempre es incluyente L. Codina - UPF Octubre 2013
Problemas 3 NOT Anti intuitivo Puede destruir información: elimina por igual información relevante y no relevante Ejemplo: “necesito información sobre publicidad de refrescos, pero siempre que sean bebidas para adultos” Con la ecuación: (refrescos AND publicidad) NOT jóvenes Perdemos este documento: “Resultados de una investigación sobre publicidad de marcas de refrescos para jóvenes y adultos” L. Codina - UPF Octubre 2013
Ejercicio 1 Dada la siguiente necesidad de información: “becas y ayudas para producciones de cine y vídeo”, ¿cuál de las siguientes ecuaciones es mejor?: (becas AND ayudas) AND (cine AND vídeo) (becas OR ayudas) AND (cine OR vídeo) L. Codina - UPF Octubre 2013
Ejercicio 2 Dada la siguiente pregunta: “necesito información sobre mascotas”, ¿cuál es la mejor ecuación?: perros AND gatos perros OR gatos L. Codina - UPF Octubre 2013
Ejercicio 3 ¿Podría enunciar en lenguaje natural la interpretación de esta ecuación booleana?: (legislación OR directivas) AND (europa OR estados unidos) AND ((niños OR adolescentes) NOT (videojuegos)) L. Codina - UPF Octubre 2013
Ejercicio 4 ¿Podría ofrecer un ejemplo de formalización en una ecuación booleana del siguiente problema de información?: “posicionamiento en la web móvil de marcas de ciudades en Europa y Canadá utilizando técnicas SEO o bien técnicas SEM” L. Codina - UPF Octubre 2013
Ejemplo de sistemas relevantes Motores académicos Scirus Google Scholar Bases de datos académicas (multidisciplinares) Dialnet CSIC Bases de datos profesionales (Humanistas) Historical Abstracts Fondo antiguo de la USE: http://fondosdigitales.us.es/ Fondo antiguo del Laboratorio de arte: http://fototeca.us.es/ Cartoteca Digital http://cartotecadigital.icc.cat/ Portal de Humanidades Liceus http://0-www.liceus.com.athenea.upo.es/cgi-bin/aco/excellence_quees.asp?opcion=2 Acceso a Pares http://pares.mcu.es/ Europeana http://www.europeana.eu/portal/ Hemerotecas digitales http://bitelia.com/2012/09/hemerotecas-digitales-online-espanol L. Codina - UPF Octubre 2013