Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porFelipe Salazar Cárdenas Modificado hace 8 años
1
INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino
2
Datos Preliminares Las predicciones de NUA apuntan a un problema de exceso de información y menos efectividad en los mecanismos de búsqueda Se estima en cerca de 320 millones de páginas en el WWW (NEC Research Institute) Existen sobre 1,800 diferentes tipos de mecanismos de búsqueda Los mecanismos de búsqueda solo abarcan un porciento de la totalidad de los datos en el Web
3
Algunas Observaciones La internet/WWW no posee toda la información del mundo No siempre se encuentra lo que se desea Algunos resultados de búsquedas no son útliles La búsqueda puede ser imprecisa e inconsistente Es imprescindible evaluar la calidad de los resultados, cuando se trate de información
4
Conceptos Fundamentales Un Banco de Datos es: – Una colección de información – Organizado para aumentar su valor – La guía telefónica es un ejemplo
5
Estructura de un Banco de Datos Registros (e.g., entradas en una guía telefónica) Campos (e.g., nombre, dirección, número telefónico) Organización (alfabético, jerárquico, numérico, etc.)
6
Estructura de un Banco de Datos Una página del web es un registro Los campos puede ser: – Título – URL – Encabezado – Texto – Gráficos Ejemplo
7
Opciones de Búsqueda en el Web Curioseando (“Browsing”) Con una dirección (URL) a la mano: – Dada por otra persona – Encontrada en un libro o registro de direcciones de Internet/Web – Utilizando alguna herramienta de búsqueda
8
Herramientas de Búsqueda en el Web Programas que permiten la búsqueda por palabras en diversos servidores WWW dando como resultado final el lugar donde se encuentera la información * Descripción *
9
Páginas que proveen espacios o formas para entrar palabras orientadas a localizar documentos y otras utilidades en las bases de datos en formato HTML a través de la Internet Herramientas de Búsqueda en el Web * Descripción *
10
Programas de computadoras que permiten buscar y colectar información de lugares en el “Web” Proveen un encasillado para escribir términos, llevan a cabo la búsqueda y ofrecen una lista de documentos disponibles Herramientas de Búsqueda en el Web * Descripción *
11
Herramientas de Búsqueda NINGUNA HERRAMIENTA DE BÚSQUEDA ES TOTALMENTE EFECTIVA
12
Tipos de Herramientas Motores de búsqueda o “Robots” Megabuscadores (Meta-Índices) Directorios (Índices)
13
“Robots” de Búsqueda Programa de computadora que atraviesa la base de datos disponibles en los documentos del Web en busca de la estructura hipertexto de estas páginas HTML con el fin de localizar alguna pieza de información, como puede ser un documento, una imagen o un programa de computadora * Descripción *
14
Programas que localizan las diferentes Páginas WWW que tienen el término de búsqueda y proveen un índice de documentos “Robots” de Búsqueda * Descripción *
15
Programas diseñados para rastrear banco de datos en hypertexto localizados en el Web Son un Producto Comercial Generales y abarcadores: – Banco de datos grandes Requiere el uso de palabras claves Características “Robots” de Búsqueda
16
Páginas del Web (URLs, encabezados, texto, enlaces) Archivos de imágenes y sonido Mensajes de texto completo de grupos de noticias (“newsgroup”) Lista de archivos de servidores ftp Banco de Datos “Robots” de Búsqueda
17
¿Cómo Deciden a Dónde Ir? Depende del “robot” que sea, todos usan diversas estrategias Comienzan por buscar en su propia lista de localizadores (URL’s) Siguen por las páginas “Whats New” y los lugares más populares en el Web
18
Relevancia de los Resultados Catalogados Los resultados se enumeran según su relevancia Los métodos de clasificación de los resultados varían entre los diversos “Robots” de búsqueda Puede significar que una palabra clave aparece en la página WWW
19
Factores que Influyen en los Resultados tamañoEl tamaño de la base de datos La frecuencia con que se actualiza Las capacidades de búsqueda disponibles Velocidad de respuesta Diseño de la interfaz La forma en que despliega los resultados La cantidad de ayudas que brinde meta-datosLa composición de los meta-datos
20
Cobertura de los Robots en el Web Recurso: NEC Research Institute, 1998
21
Características Generales de los “Robots” y Otros Mecanismos Se enriquecen y actualizan automáticamenmte Ordenamiento por relevancia Uso de múltiples palabras Truncamiento Sensitividad a la mayúsculas Usos de comandos booleanos Utilización de booleanos sustitutos Uso de frases Empleo de campos de acción
22
Se debe especificar el campo donde el término debe aparecer: – Título: Salud y Medicina – URL: www.saludmed.com Ayuda aumentar la calidad de los resultados Búsqueda de Campo “Robots” de Búsqueda
23
Búsquedas realizadas con la raíz de una palabra Ejemplo:Comput resulta en: – Computadora – Computación Evitar los plurares en cada búsqueda Truncación “Robots” de Búsqueda
24
Crean relaciones entre términos/palabras de búsqueda en la base de dados localizadas en el Web Operadores Lógicos Booleanos “Robots” de Búsqueda
25
Te permiten buscar el resultado de: – La intersección de dos términos/palabras de búsqueda – La combinación de dos palabras – La exclusión de una palabra de la búsqueda Operadores Lógicos Booleanos “Robots” de Búsqueda
26
Conectores Booleanos: – “and”: Todas las plalabras deben de estar contenidas en los documentos – “or”: Cualquiera de las palabras deben estar contenidas en los documentos – “not” Remueve los documentos que contienen una palabra dada Operadores Lógicos Booleanos “Robots” de Búsqueda
27
Especifica que ambas palabras en cualquiera de los lados del operador deben estar contenidas en los documentos de la base de datos del Web en la cual se esta buscando Ejemplo: – Internet AND Education: Busca únicamente aquellas bases de datos en las cuales se encuentran las palabras Internet y la palabra Educación Conectores Booleanos: “AND” “Robots” : Operadores Booleanos
28
Especifica que una o la otra o ambas de las palabras en cualquiera de los lados del operador deben estar contenidas en los documentos de la base de datos del Web que se esta buscando Ejemplo: – Internet OR Education: Busca únicamente aquellas bases de datos en las cuales se encuentran la palabra Internet o la palabra Educación o ambas Conectores Booleanos: “OR” “Robots” : Operadores Booleanos
29
Especifica que la palabra antes del operador debe estar contenida en los documentos de la base de datos del Web, pero la palabra después del operador no debe de estar contenida en los resultados Ejemplo: – Internet NOT Web: Busca todas aquellas bases de datos en las cuales se encuentran la palabra Internet con excepción de aqueloos registros en la cual aparece la palabra Web Conectores Booleanos: “NOT” “Robots” : Operadores Booleanos
30
Empleados entre dos palabras de búsqueda para indicar que la palabra debe estar contenida en los documentos de la base de datos dentro de una distancia específica de cada una para el pareo en dicho banco de datos De Proximidad Operadores Lógicos Booleanos: De Proximidad “Robots” de Búsqueda
31
Características:Características: – Seguridad cerca de la encriptación – Ayuda con la relevancia – Asocia una palabra con la otra – Puede determinar cuan cerca (e.g., distancia entre dos palabras claves): * Dentro de tres palabras, etc De Proximidad Operadores Lógicos Booleanos: De Proximidad “Robots” de Búsqueda
32
Componentes: – Una palabra o letra que indica la dirección – Un número que indica la distancia en palabras De Proximidad Operadores Lógicos Booleanos: De Proximidad “Robots” de Búsqueda
33
Comandos de Aproximación: “NEAR” – Se usan para acercar o aproximar dos palabras dadas – Ejemplos: *university NEAR3 college Parea cualquier banco de dados en la cual la palabra university y college se encuentran contenidas entre tres o menos palabras de cada una en cualquier dirección Operadores Lógicos Booleanos “Robots” de Búsqueda
34
Utilizados para sustituir los conectores booleanos AND, OR y NOT Símbolos empleados: + - Sustitutos Operadores Lógicos Booleanos: Sustitutos “Robots” de Búsqueda
35
Ejemplo: +computadora+disco duro (es equivalente a: computadora AND disco duro) Sustitutos Operadores Lógicos Booleanos: Sustitutos “Robots” de Búsqueda
36
Unen palabras y frases para que sean tratadas como una sola unidad o para determinar el orden en el cual los operadores Booleanos son aplicados De Agrupamiento Operadores Lógicos Booleanos: De Agrupamiento “Robots” de Búsqueda
37
Comillas Dobles (“”): – Los documentos encontrados por la búsqueda deben de contener las palabras dentro de las comillas dobles exactamente como se entraron Ejemplo: “World Wide Web” Busca aquellas páginas que contienen la frase World Wide Web y no las palabras individuales separadas por otras palabras o las mismas palabras en minúsculas “Robots” de Búsqueda De Agrupamiento Operadores Lógicos Booleanos: De Agrupamiento
38
Paréntesis (): Agrupa palabras y operadores en una cadena de búsqueda para definir el orden en el cual los operadores Booleanos deben aparecer Utilidad/Indicación de Uso: Cuando se emplean varios operadores simultáneamente “Robots” de Búsqueda De Agrupamiento Operadores Lógicos Booleanos: De Agrupamiento
39
Ejemplo: – Se desea buscar información con referente a un visualizadior Web (navegador): Cadena de busqueda que se debe entrar:Cadena de busqueda que se debe entrar: browser AND (inTERNET or Web): browser AND (inTERNET or Web): Esta cadena encontrará páginas que contienen las palabras Internet y browser o las palabras Web y browser “Robots” de Búsqueda De Agrupamiento Operadores Lógicos Booleanos: De Agrupamiento
40
Alta Vista:Alta Vista: http://altavista.digital.com Hot Bot:Hot Bot: http://www.hotbot.com InfoSeek:InfoSeek: http://www.infoseek.com Excite:Excite: http://www.excite.com Google:Google: http://www.google.com Lycos:Lycos: http://www.lycos.com LookSmart:LookSmart: http://www.looksmart.com “Robots” de Búsqueda - Parte I:
41
GoTo:GoTo: http://www.goto.com WebCrawler:WebCrawler: http://www.webcrawler.com Open Text:Open Text: http://www.opentext.com DejaNews:DejaNews: http://www.deja.com InfoHiway:InfoHiway: http://www.infohiway.com ThunderStone:ThunderStone: http://www.thunderstone.com ScrubTheWeb:ScrubTheWeb: http://www.scrubtheweb.com Northern Light:Northern Light: http://www.nothernlight.com “Robots” de Búsqueda: Parte II
42
Netscape:Netscape: http://search.netscape.com/ About..com:About..com: http://search.about.com/ Voila:Voila: http://world.voila.com/ HispaVista:HispaVista: http://buscar.hispavista.com “Robots” de Búsqueda: Parte III
43
Biwe:Biwe: http://biwe.cesat.es Encuentrelo:Encuentrelo: http://encuentrelo.com Telepolis:Telepolis: http://www.telepolis.com MexSearch:MexSearch: http://www.yellow.com.mx Señas:Señas: http://www.combios.net/senyas MexWeb:MexWeb: http://www.mty.itesm.mx/Mexweb LatinWorld:LatinWorld: http://www.latinworld.com Mundivia:Mundivia: http://www.mundivia/es/mundi2.html “Robots” de Búsqueda: Español
44
Megabuscadores Realizan búsquedas simultáneas en varios “Robots”: Programas que ejecutan búsquedas simultáneas en múltiples herramientas No tienen una base de datos propia Remueven los duplicados
45
Megabuscadores: Parte I MetaCrawler:MetaCrawler: http://www.metacrawler.com SavvySearch:SavvySearch: http://www.savvysearch.com Beaucoup:Beaucoup: http://www.beaucoup.com Dogpile:Dogpile: http://www.dogpile.com ProFusion:ProFusion: http://www.profusion.com All-in-One Search:All-in-One Search: – http://www.allonesearch.com – http://www.unam.mx/allinone/
46
Megabuscadores: Parte II StartingPoint:StartingPoint: http://www.stpt.com MetaFind:MetaFind: http://www.metafind.com Inference Find:Inference Find: http://www.infind.com Mamma:Mamma: http://www.mamma.com Cyber411:Cyber411: http://www.c4.com/index.html?cyber411=1 AskJeeves:AskJeeves: http://www.ask.com
47
Directorios (Índices) Son creados manualmente sin la ayuda de ningún “Robot” Son más precisos que los “robots” pues son personas quienes compilan y mantiennen la información Proveen una lista de materiales organizada alfabéticamente: – Basados en listas o catálogos – Organizados jerárquicamente por materias Son más pequeños en contenido en comparación con los “Robots”
48
Directorios (Índices) Banco de datos de lugares de internet Estos lugares son sometidos por sus creadores o evaluadores Organizados en categoría Pueden incluir un robot de búsqueda para buscar en su banco de datos Son similares a catálogos o páginas amarillas Los sitios en el web cobren el mismo tópico agrupados en uno Son buenos para curiosear (“browsing”)
49
Directorios (Índices): Parte I Yahoo!:Yahoo!: http://www.yahoo.com Magellan:Magellan: http://magellan.mckinley.com/ Snap:Snap: http://www.snap.com Web Help:Web Help: http://www.webhelp.com/
50
Directorios (Índices): Parte II Argus Clearinhouse:Argus Clearinhouse: http://www.clearinghouse.net/ World Wide Web Virtual Library:World Wide Web Virtual Library: http://www.vlib.org/ Britannica.com:Britannica.com: http://www.britannica.com Librarians’ Index to the Internet::Librarians’ Index to the Internet:: http://lii.org/
51
Recomendaciones para Lograr Búsquedas Efectivas Selecciones dos o tres herramientas de búsqueda y aprenda a usarlas correctamente Identifique sus términos antes de iniciar la búsqueda Considere sinonimos, palabras relacionadas y variaciones tales como plurales Aprenda a utilizar los conectores booleanos. Utilice comandos de aproximación y símbolos de truncada cuando estén disponibles No se limite a usar una sola herramienta de búsqueda.
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.