La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Presentaciones similares


Presentación del tema: "INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino."— Transcripción de la presentación:

1 INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino

2 Datos Preliminares Las predicciones de NUA apuntan a un problema de exceso de información y menos efectividad en los mecanismos de búsqueda Se estima en cerca de 320 millones de páginas en el WWW (NEC Research Institute) Existen sobre 1,800 diferentes tipos de mecanismos de búsqueda Los mecanismos de búsqueda solo abarcan un porciento de la totalidad de los datos en el Web

3 Algunas Observaciones La internet/WWW no posee toda la información del mundo No siempre se encuentra lo que se desea Algunos resultados de búsquedas no son útliles La búsqueda puede ser imprecisa e inconsistente Es imprescindible evaluar la calidad de los resultados, cuando se trate de información

4 Conceptos Fundamentales Un Banco de Datos es: – Una colección de información – Organizado para aumentar su valor – La guía telefónica es un ejemplo

5 Estructura de un Banco de Datos Registros (e.g., entradas en una guía telefónica) Campos (e.g., nombre, dirección, número telefónico) Organización (alfabético, jerárquico, numérico, etc.)

6 Estructura de un Banco de Datos Una página del web es un registro Los campos puede ser: – Título – URL – Encabezado – Texto – Gráficos Ejemplo

7 Opciones de Búsqueda en el Web Curioseando (“Browsing”) Con una dirección (URL) a la mano: – Dada por otra persona – Encontrada en un libro o registro de direcciones de Internet/Web – Utilizando alguna herramienta de búsqueda

8 Herramientas de Búsqueda en el Web Programas que permiten la búsqueda por palabras en diversos servidores WWW dando como resultado final el lugar donde se encuentera la información * Descripción *

9 Páginas que proveen espacios o formas para entrar palabras orientadas a localizar documentos y otras utilidades en las bases de datos en formato HTML a través de la Internet Herramientas de Búsqueda en el Web * Descripción *

10 Programas de computadoras que permiten buscar y colectar información de lugares en el “Web” Proveen un encasillado para escribir términos, llevan a cabo la búsqueda y ofrecen una lista de documentos disponibles Herramientas de Búsqueda en el Web * Descripción *

11 Herramientas de Búsqueda NINGUNA HERRAMIENTA DE BÚSQUEDA ES TOTALMENTE EFECTIVA

12 Tipos de Herramientas Motores de búsqueda o “Robots” Megabuscadores (Meta-Índices) Directorios (Índices)

13 “Robots” de Búsqueda Programa de computadora que atraviesa la base de datos disponibles en los documentos del Web en busca de la estructura hipertexto de estas páginas HTML con el fin de localizar alguna pieza de información, como puede ser un documento, una imagen o un programa de computadora * Descripción *

14 Programas que localizan las diferentes Páginas WWW que tienen el término de búsqueda y proveen un índice de documentos “Robots” de Búsqueda * Descripción *

15 Programas diseñados para rastrear banco de datos en hypertexto localizados en el Web Son un Producto Comercial Generales y abarcadores: – Banco de datos grandes Requiere el uso de palabras claves Características “Robots” de Búsqueda

16 Páginas del Web (URLs, encabezados, texto, enlaces) Archivos de imágenes y sonido Mensajes de texto completo de grupos de noticias (“newsgroup”) Lista de archivos de servidores ftp Banco de Datos “Robots” de Búsqueda

17 ¿Cómo Deciden a Dónde Ir? Depende del “robot” que sea, todos usan diversas estrategias Comienzan por buscar en su propia lista de localizadores (URL’s) Siguen por las páginas “Whats New” y los lugares más populares en el Web

18 Relevancia de los Resultados Catalogados Los resultados se enumeran según su relevancia Los métodos de clasificación de los resultados varían entre los diversos “Robots” de búsqueda Puede significar que una palabra clave aparece en la página WWW

19 Factores que Influyen en los Resultados tamañoEl tamaño de la base de datos La frecuencia con que se actualiza Las capacidades de búsqueda disponibles Velocidad de respuesta Diseño de la interfaz La forma en que despliega los resultados La cantidad de ayudas que brinde meta-datosLa composición de los meta-datos

20 Cobertura de los Robots en el Web Recurso: NEC Research Institute, 1998

21 Características Generales de los “Robots” y Otros Mecanismos Se enriquecen y actualizan automáticamenmte Ordenamiento por relevancia Uso de múltiples palabras Truncamiento Sensitividad a la mayúsculas Usos de comandos booleanos Utilización de booleanos sustitutos Uso de frases Empleo de campos de acción

22 Se debe especificar el campo donde el término debe aparecer: – Título: Salud y Medicina – URL: www.saludmed.com Ayuda aumentar la calidad de los resultados Búsqueda de Campo “Robots” de Búsqueda

23 Búsquedas realizadas con la raíz de una palabra Ejemplo:Comput resulta en: – Computadora – Computación Evitar los plurares en cada búsqueda Truncación “Robots” de Búsqueda

24 Crean relaciones entre términos/palabras de búsqueda en la base de dados localizadas en el Web Operadores Lógicos Booleanos “Robots” de Búsqueda

25 Te permiten buscar el resultado de: – La intersección de dos términos/palabras de búsqueda – La combinación de dos palabras – La exclusión de una palabra de la búsqueda Operadores Lógicos Booleanos “Robots” de Búsqueda

26 Conectores Booleanos: – “and”: Todas las plalabras deben de estar contenidas en los documentos – “or”: Cualquiera de las palabras deben estar contenidas en los documentos – “not” Remueve los documentos que contienen una palabra dada Operadores Lógicos Booleanos “Robots” de Búsqueda

27 Especifica que ambas palabras en cualquiera de los lados del operador deben estar contenidas en los documentos de la base de datos del Web en la cual se esta buscando Ejemplo: – Internet AND Education: Busca únicamente aquellas bases de datos en las cuales se encuentran las palabras Internet y la palabra Educación Conectores Booleanos: “AND” “Robots” : Operadores Booleanos

28 Especifica que una o la otra o ambas de las palabras en cualquiera de los lados del operador deben estar contenidas en los documentos de la base de datos del Web que se esta buscando Ejemplo: – Internet OR Education: Busca únicamente aquellas bases de datos en las cuales se encuentran la palabra Internet o la palabra Educación o ambas Conectores Booleanos: “OR” “Robots” : Operadores Booleanos

29 Especifica que la palabra antes del operador debe estar contenida en los documentos de la base de datos del Web, pero la palabra después del operador no debe de estar contenida en los resultados Ejemplo: – Internet NOT Web: Busca todas aquellas bases de datos en las cuales se encuentran la palabra Internet con excepción de aqueloos registros en la cual aparece la palabra Web Conectores Booleanos: “NOT” “Robots” : Operadores Booleanos

30 Empleados entre dos palabras de búsqueda para indicar que la palabra debe estar contenida en los documentos de la base de datos dentro de una distancia específica de cada una para el pareo en dicho banco de datos De Proximidad Operadores Lógicos Booleanos: De Proximidad “Robots” de Búsqueda

31 Características:Características: – Seguridad cerca de la encriptación – Ayuda con la relevancia – Asocia una palabra con la otra – Puede determinar cuan cerca (e.g., distancia entre dos palabras claves): * Dentro de tres palabras, etc De Proximidad Operadores Lógicos Booleanos: De Proximidad “Robots” de Búsqueda

32 Componentes: – Una palabra o letra que indica la dirección – Un número que indica la distancia en palabras De Proximidad Operadores Lógicos Booleanos: De Proximidad “Robots” de Búsqueda

33 Comandos de Aproximación: “NEAR” – Se usan para acercar o aproximar dos palabras dadas – Ejemplos: *university NEAR3 college Parea cualquier banco de dados en la cual la palabra university y college se encuentran contenidas entre tres o menos palabras de cada una en cualquier dirección Operadores Lógicos Booleanos “Robots” de Búsqueda

34 Utilizados para sustituir los conectores booleanos AND, OR y NOT Símbolos empleados: + - Sustitutos Operadores Lógicos Booleanos: Sustitutos “Robots” de Búsqueda

35 Ejemplo: +computadora+disco duro (es equivalente a: computadora AND disco duro) Sustitutos Operadores Lógicos Booleanos: Sustitutos “Robots” de Búsqueda

36 Unen palabras y frases para que sean tratadas como una sola unidad o para determinar el orden en el cual los operadores Booleanos son aplicados De Agrupamiento Operadores Lógicos Booleanos: De Agrupamiento “Robots” de Búsqueda

37 Comillas Dobles (“”): – Los documentos encontrados por la búsqueda deben de contener las palabras dentro de las comillas dobles exactamente como se entraron Ejemplo: “World Wide Web” Busca aquellas páginas que contienen la frase World Wide Web y no las palabras individuales separadas por otras palabras o las mismas palabras en minúsculas “Robots” de Búsqueda De Agrupamiento Operadores Lógicos Booleanos: De Agrupamiento

38 Paréntesis (): Agrupa palabras y operadores en una cadena de búsqueda para definir el orden en el cual los operadores Booleanos deben aparecer Utilidad/Indicación de Uso: Cuando se emplean varios operadores simultáneamente “Robots” de Búsqueda De Agrupamiento Operadores Lógicos Booleanos: De Agrupamiento

39 Ejemplo: – Se desea buscar información con referente a un visualizadior Web (navegador): Cadena de busqueda que se debe entrar:Cadena de busqueda que se debe entrar: browser AND (inTERNET or Web): browser AND (inTERNET or Web): Esta cadena encontrará páginas que contienen las palabras Internet y browser o las palabras Web y browser “Robots” de Búsqueda De Agrupamiento Operadores Lógicos Booleanos: De Agrupamiento

40 Alta Vista:Alta Vista: http://altavista.digital.com Hot Bot:Hot Bot: http://www.hotbot.com InfoSeek:InfoSeek: http://www.infoseek.com Excite:Excite: http://www.excite.com Google:Google: http://www.google.com Lycos:Lycos: http://www.lycos.com LookSmart:LookSmart: http://www.looksmart.com “Robots” de Búsqueda - Parte I:

41 GoTo:GoTo: http://www.goto.com WebCrawler:WebCrawler: http://www.webcrawler.com Open Text:Open Text: http://www.opentext.com DejaNews:DejaNews: http://www.deja.com InfoHiway:InfoHiway: http://www.infohiway.com ThunderStone:ThunderStone: http://www.thunderstone.com ScrubTheWeb:ScrubTheWeb: http://www.scrubtheweb.com Northern Light:Northern Light: http://www.nothernlight.com “Robots” de Búsqueda: Parte II

42 Netscape:Netscape: http://search.netscape.com/ About..com:About..com: http://search.about.com/ Voila:Voila: http://world.voila.com/ HispaVista:HispaVista: http://buscar.hispavista.com “Robots” de Búsqueda: Parte III

43 Biwe:Biwe: http://biwe.cesat.es Encuentrelo:Encuentrelo: http://encuentrelo.com Telepolis:Telepolis: http://www.telepolis.com MexSearch:MexSearch: http://www.yellow.com.mx Señas:Señas: http://www.combios.net/senyas MexWeb:MexWeb: http://www.mty.itesm.mx/Mexweb LatinWorld:LatinWorld: http://www.latinworld.com Mundivia:Mundivia: http://www.mundivia/es/mundi2.html “Robots” de Búsqueda: Español

44 Megabuscadores Realizan búsquedas simultáneas en varios “Robots”: Programas que ejecutan búsquedas simultáneas en múltiples herramientas No tienen una base de datos propia Remueven los duplicados

45 Megabuscadores: Parte I MetaCrawler:MetaCrawler: http://www.metacrawler.com SavvySearch:SavvySearch: http://www.savvysearch.com Beaucoup:Beaucoup: http://www.beaucoup.com Dogpile:Dogpile: http://www.dogpile.com ProFusion:ProFusion: http://www.profusion.com All-in-One Search:All-in-One Search: – http://www.allonesearch.com – http://www.unam.mx/allinone/

46 Megabuscadores: Parte II StartingPoint:StartingPoint: http://www.stpt.com MetaFind:MetaFind: http://www.metafind.com Inference Find:Inference Find: http://www.infind.com Mamma:Mamma: http://www.mamma.com Cyber411:Cyber411: http://www.c4.com/index.html?cyber411=1 AskJeeves:AskJeeves: http://www.ask.com

47 Directorios (Índices) Son creados manualmente sin la ayuda de ningún “Robot” Son más precisos que los “robots” pues son personas quienes compilan y mantiennen la información Proveen una lista de materiales organizada alfabéticamente: – Basados en listas o catálogos – Organizados jerárquicamente por materias Son más pequeños en contenido en comparación con los “Robots”

48 Directorios (Índices) Banco de datos de lugares de internet Estos lugares son sometidos por sus creadores o evaluadores Organizados en categoría Pueden incluir un robot de búsqueda para buscar en su banco de datos Son similares a catálogos o páginas amarillas Los sitios en el web cobren el mismo tópico agrupados en uno Son buenos para curiosear (“browsing”)

49 Directorios (Índices): Parte I Yahoo!:Yahoo!: http://www.yahoo.com Magellan:Magellan: http://magellan.mckinley.com/ Snap:Snap: http://www.snap.com Web Help:Web Help: http://www.webhelp.com/

50 Directorios (Índices): Parte II Argus Clearinhouse:Argus Clearinhouse: http://www.clearinghouse.net/ World Wide Web Virtual Library:World Wide Web Virtual Library: http://www.vlib.org/ Britannica.com:Britannica.com: http://www.britannica.com Librarians’ Index to the Internet::Librarians’ Index to the Internet:: http://lii.org/

51 Recomendaciones para Lograr Búsquedas Efectivas Selecciones dos o tres herramientas de búsqueda y aprenda a usarlas correctamente Identifique sus términos antes de iniciar la búsqueda Considere sinonimos, palabras relacionadas y variaciones tales como plurales Aprenda a utilizar los conectores booleanos. Utilice comandos de aproximación y símbolos de truncada cuando estén disponibles No se limite a usar una sola herramienta de búsqueda.


Descargar ppt "INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino."

Presentaciones similares


Anuncios Google