UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, Herramientas de búsqueda en la red Internet 3.Metodología para utilizar las herramientas de búsquedas 4.Internet invisible y bases de datos vía web Tema 4. La red Internet: la búsqueda de la información en la red
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, ÍNDICES TEMÁTICOS (CATÁLOGOS, DIRECTORIOS, BUSCADORES POR CATEGORÍA) Recogen información que le envían o introducen manualmente. Organizan la información temáticamente: categorías, subcategorías, etc. Mejor para búsquedas generalistas (sobre una materia amplia y conocida) Yahoo, Looksmart, Euroseek, Terra, MSN, Ozu, Elcano, Biwe... MOTORES DE BÚSQUEDA, ROBOTS (BUSCADORES POR CONTENIDO) Sus robots van en busca de nueva información, recorriendo las páginas periódicamente y de manera “inteligente”. Siempre permiten realizar búsquedas por texto completo sobre el contenido de las páginas Web. Mejor para buscar información más actualizada o detallada. AltaVista, Excite, Lycos, Sol, Trovator, El Inspector... Herramientas de búsqueda en WWW
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, ¿Qué son ÍNDICES y ROBOTS? Los índices funcionan de una forma similar a las páginas amarillas por lo que tienen una serie de inconvenientes importantes: Para que una página aparezca en el índice debe ser introducida por su autor. La clasificación de una página en un grupo puede no ser excesivamente apropiada (podría pertenecer a varios grupos). Los índices sólo permiten asignar un número limitado de palabras clave para localizar una página dada.
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, ¿Qué son ÍNDICES y ROBOTS? Para solucionar estos inconvenientes era necesario un sistema que pudiera: Recorrer el web de forma autónoma localizando páginas que no hubieran sido introducidas por sus autores. Utilizase todo el texto de la página para realizar búsquedas y no unas pocas palabras clave. No estableciese clasificaciones artificiales. –Dicho sistema es lo que se conoce como robot, los mejores buscadores actuales son robots y no simples índices. –Ejemplos de buscadores basados en robots son: Google ( y AllTheWeb (
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, ÍNDICES TEMÁTICOS (CATÁLOGOS, DIRECTORIOS, BUSCADORES POR CATEGORÍA) MOTORES DE BÚSQUEDA (BUSCADORES POR CONTENIDO) Herramientas de búsqueda en WWW Urls Títulos páginas Breves comentarios Palabras claves Y puede que en la página Estructura Jerárquica + Páginas WWW Robot Motor de búsqueda ++
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, Herramientas de búsqueda por índice temático o por categorías Internacionales Españoles
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna,
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, Herramientas de búsqueda por contenido o motores de búsqueda Internacionales Españoles
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna,
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, ¿Cómo funciona Google? –Google utiliza robots que navegan por el web de forma autónoma. –Estos robots almacenan por cada página su dirección y todas las palabras relevantes (eliminan, por ejemplo, preposiciones y artículos). –A cada página almacenada se le da una puntuación en relación a páginas con contenido similar. –Para otorgar dicha puntuación el sistema utiliza el número de enlaces que llegan a dicha página y el número de enlaces que salen desde esa página hacia páginas con puntuación elevada. –Así, una página mencionada en páginas con alta puntuación tendrá a su vez una puntuación elevada y una página que sirva como índice de páginas interesantes resultará a su vez interesante. –Este sistema parte del supuesto de que una página muy citada es una página de calidad e interés.
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, DEFINIR EL TEMA CON NUESTRO LENGUAJE NATURAL SEPARAR CADA UNO DE LOS CONCEPTOS QUE CONFORMAN EL TEMA BUSCAR LOS POSIBLES SINÓNIMOS O TÉRMINOS QUE SE RELACIONEN CON CADA UNO DE LOS CONCEPTOS UNA VEZ QUE TENGAMOS LA LISTA CON TODOS LOS TÉRMINOS, ESTABLECER LAS RELACIONES LÓGICAS QUE SE DARÁN ENTRE ELLOS: UTILIZAR * (subcadena de caracteres) PARA RECUPERAR SINGULARES, PLURALES, ADVERBIOS... UTILIZAR PARÉNTESIS PARA INDICAR LA OPERACIÓN A EFECTUAR EN PRIMER LUGAR. Normalmente utilizado para ejecutar en primer lugar una unión (OR), y su resultado combinarlo con otro término mediante AND. ESTRATEGIA DE BÚSQUEDA en WWW OR (para sinónimos o conceptos relacionados) AND (para relacionar términos que corresponden a conceptos distintos, pero que queremos que aparezcan en el mismo documento) NOT (para eliminar los documentos que contengan un término no deseado)
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, Cuidado con las mayúsculas o minúsculas, pues en algunos casos resulta indiferente, pero en otros no. Cuidado con los acentos (utilizar OR, ?, * ó $) Utilizar operadores booleanos: (Or, |), (XOR), (And, +, &) y (Not, And Not, -, ^, !), posicionales (Near, , Near/n) y de exactitud (*, ?, “”) Restringir la búsqueda a determinados campos de información: a los títulos de las páginas Web (t:), a los URLs (u:), a los dominios (h:), a los nombres de imágenes (i:), etc. Leer siempre la ayuda y probar distintos buscadores Algunas recomendaciones para buscar (1/2)
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, Conocer el campo de información que abarca el buscador (páginas web, mensajes de grupos de noticias, sólo en dominios.es, etc.) Cuidar la ortografía (CDROM CD-ROM) Comprobar la fiabilidad de la fuente. Mucha información no tiene carácter académico ni rigor científico, y su propósito es solamente promocional, comercial o personal. Ver el nombre del autor o institución responsable y la fecha de la última revisión. Algunas recomendaciones para buscar (2/2)
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, Autoridad: ¿quién es el autor?, ¿es el autor el creador de la información?, ¿aporta éste alguna credencial? Filiación: ¿soporta la información alguna Institución? En caso de ser un proveedor comercial, ¿el autor tiene conexión con alguna Institución? ¿dicha Institución parece aplicar algún control sobre lo que se publica en su página? Actualidad: ¿está la información puesta al día? ¿aparecen fechas de creación? ¿Cuándo fue creada esta información o cuándo fue actualizada por última vez? Propósito: ¿cuál parece ser el propósito de la página y de la información que contiene?, ¿informar, explicar, vender, persuadir...?, ¿satisface mi necesidad? Audiencia: ¿quién se supone que es la audiencia? Legibilidad: ¿es fácil navegar por ella?, ¿están los contenidos bien estructurados?, ¿visualmente es agradable? Comparación: ¿qué es lo ofrece comparado con otras fuentes, incluyendo trabajos fuera de la Internet? Algunos criterios a seguir para evaluar los recursos de la Red
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, TRADUCTORES DICCIONARIOS Portal de traductores y diccionarios:
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, MULTIBUSCADORES Actúan de intermediarios entre el usuario y varias herramientas de búsqueda. En ellos, se ha copiado el cuadro de diálogo y el botón de buscar de una serie de buscadores (copiando su código fuente). Realizan la búsqueda en el buscador que se le indique cada vez. Generalmente, no permiten obtener toda la potencia de cada herramienta de búsqueda. Proliferan en las páginas personales. Herramientas de búsqueda en WWW
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, METAÍNDICES o METABUSCADORES Actúan de intermediarios entre el usuario y varias herramientas de búsqueda. Realizan la búsqueda simultáneamente en las distintas herramientas de búsqueda con las que mantiene enlace. Eliminan duplicados y reordenación por relevancia. Algunos ofrecen detalles de las respuestas obtenidas por cada una de las herramientas y otros sólo proporcionan un único listado con todos los resultados. Generalmente no permiten obtener toda la potencia de cada herramienta de búsqueda. MetaCrawler: (AltaVista, Yahoo!, Excite, Lycos, InfoSeek,Direct Hit, GoTo.com, LookSmart, Google y WebCrawler ) Los mejores metabuscadores Herramientas de búsqueda en WWW
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, SHAREWARE Copernic: / Grokker: WebFerret BullsEyes 2 Pro Trial
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna,
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, Agentes inteligentes de búsqueda o robots de búsqueda erary/Letizia/Letizia-Intro.html os.htm
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, ÍNDICES TEMÁTICOS CON SELECCIÓN ESPECIALIZADA Su especialización no es temática, sino de selección, ya que se trata de directorios generalistas. Limitan su selección a recursos con valor académico, que son aquéllos que, aunque no necesariamente pertenezcan al mundo académico, ofrecen calidad y garantía suficientes como para ser utilizados en el ámbito de la investigación. Argus Bubl Herramientas de búsqueda en WWW
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, ANILLOS VIRTUALES DE WEB (WebRings) Conjuntos de páginas web, normalmente personales, que se agrupan voluntariamente en función de una temática compartida. Sólo permiten buscar por términos definitorios. No se suele poder hacer búsqueda con operadores booleanos. Para búsquedas temáticas, es la mejor opción para acercamientos rápidos a un determinado tema (búsquedas “poco exigentes”). Herramientas de búsqueda en WWW
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, BUSCADORES REGIONALES Especializados en un ámbito regional concreto. Herramientas de búsqueda en WWW HERRAMIENTAS DE BÚSQUEDA ESPECIALIZADA Contienen grandes recopilaciones de recursos existentes en la red sobre un tema específico, ofreciendo mejores resultados que los buscadores no especializados
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, BUSCADORES DE EMPRESAS Herramientas de búsqueda en WWW
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, BUSCADORES DE EMPRESAS Herramientas de búsqueda en WWW
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, BUSCADORES DE EMPRESAS Herramientas de búsqueda en WWW
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, BUSCADORES DE BECAS y AYUDAS Herramientas de búsqueda en WWW
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, BUSCADORES ESPECIALIZADOS Herramientas de búsqueda en WWW En noticias:Google News En imágenes: Google Images En compras: Dealtime Frooglehttp:// Yahoo comprashttp://shopping.yahoo.comhttp://shopping.yahoo.com Pricegrabber Mysimon Bizrate Personalogichttp:// Roboshopperhttp:// ShopSmart Kelkoo Buscaproductos
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, BUSCADORES DE BUSCADORES Herramientas de búsqueda en WWW
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, BUSCADORES INTELIGENTES Permiten realizar búsquedas en lenguaje natural. Ask Jeeves Herramientas de búsqueda en WWW
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, UTILIZACIÓN DE LOS BUSCADORES 65% Google 13% AllTheWeb 7% Teoma 7% Yahoo 6% AltaVista 1% MSN 1% Lycos
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, El 99% de las búsquedas son hechas por medio de los 7 mejores buscadores: Google, AltaVista, Excite, Webcrawler, Lycos, HotBot y Yahoo! Google, Terra y Yahoo son, por ese orden, los tres buscadores más utilizados por los internautas españoles. Google se ha convertido en el primer buscador con una cuota de mercado del 55,1%. Guías de uso de las herramientas de búsqueda: UTILIZACIÓN DE LOS BUSCADORES
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, Internet invisible o profunda bleWeb.html Bases de datos Catálogos de bibliotecas Revistas electrónicas Enciclopedias, diccionarios, etc.
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, Recursos electrónicos de la BUS
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, ASISTENTES HUMANOS PARA LA BÚSQUEDA Se trata de expertos en la búsqueda de información que interpretan la necesidad de información de los usuarios, la traducen en una ecuación de búsqueda que envían a distintos buscadores, y analizan los resultados conseguidos para ordenarlos de acuerdo con un criterio de relevancia útil, para, posteriormente, enviárselos a los usuarios, vía generalmente Herramientas de búsqueda en WWW
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, Aplicaciones P2P (intercambio de recursos entre iguales) Programas para el intercambio de ficheros mediante la conexión puerto a puerto a través de la Red. Napster Propietaria de los grandes servidores que alojaban a los usuarios y proporcionaban el marco para el intercambio de ficheros mp3. Recording Industry Association of America, RIAA KAZAA BearShare LimeWire The File Sharing Portal
UNIVERSIDAD de SEVILLA Tema 4. La búsqueda de información en la red Internet Técnicas y Métodos de Racionalización administrativa I. © Paula Luna, Aplicaciones P2P (intercambio de recursos entre iguales) como negocio El modelo de transacción P2P puede convertirse en modelo de negocio Creación de comunidades en el seno de una empresa, que posibilitaría el intercambio de archivos de forma descentralizada. Intercambio de información de forma rápida y descentralizada en comunidades de profesionales. Arrendamiento de capacidades ociosas de computación de PCs de particulares. Plataformas de Emarketplaces descentralizados, que una vez implantadas en las diferentes empresas no serían controladas por ningún tercero. Aceptar la esponsorización y campañas de marketing. Extracción y venta de datos de los usuarios.