INTERNET Y EL ”WORLD WIDE WEB”: Navegación y Búsqueda Preparado por: Prof. Edgar Lopategui Corsino http://www.saludmed.com/Informat/Internet/Busqueda.html
Navegación Representa un método aleatorio para efectuar búsquedas en la internet. No se posee un plan estratégico específico, simplemente se comienza a realizar clics a diversos menús o enlaces que lleva a varias páginas Web. Se entrar y camina por el ciberespacio de la Internet/Web al examinar (curiosar, hojear, "browse") este mundo virtual.
Datos Preliminares Las predicciones de NUA apuntan a un problema de exceso de información y menos efectividad en los mecanismos de búsqueda Se estima en cerca de 320 millones de páginas en el WWW (NEC Research Institute) Existen sobre 1,800 diferentes tipos de mecanismos de búsqueda Los mecanismos de búsqueda solo abarcan un porciento de la totalidad de los datos en el Web
Algunas Observaciones La internet/WWW no posee toda la información del mundo No siempre se encuentra lo que se desea Algunos resultados de búsquedas no son útliles La búsqueda puede ser imprecisa e inconsistente Es imprescindible evaluar la calidad de los resultados, cuando se trate de información
Conceptos Fundamentales Un Banco de Datos es: Una colección de información Organizado para aumentar su valor La guía telefónica es un ejemplo
Estructura de un Banco de Datos Registros (e.g., entradas en una guía telefónica) Campos (e.g., nombre, dirección, número telefónico) Organización (alfabético, jerárquico, numérico, etc.)
Estructura de un Banco de Datos Ejemplo Una página del web es un registro Los campos puede ser: Título URL Encabezado Texto Gráficos
Buscar Un proceso organizado y lógico mediante el cual se implementa un plan estratégico previamente planificado para encontrar en la Internet/Web aquello que desee el usuario, el cual puede ser un documento, una imagen, un archivo de música, la dirección de una persona, entre otros. En la búsqueda se emplean sistemas de rastreo o herramientas de búsquedas (generales o especializadas por materia). Este método es más eficiente y comunmente produce resultado más específicos.
Recomendaciones para Lograr Búsquedas Efectivas Selecciones dos o tres herramientas de búsqueda y aprenda a usarlas correctamente Identifique sus términos antes de iniciar la búsqueda Considere sinónimos, palabras relacionadas y variaciones tales como plurales Aprenda a utilizar los conectores booleanos. Utilice comandos de aproximación y símbolos de truncada cuando estén disponibles No se limite a usar una sola herramienta de búsqueda.
Opciones de Búsqueda en el Web Curioseando (“Browsing”) Con una dirección (URL) a la mano: Dada por otra persona Encontrada en un libro o registro de direcciones de Internet/Web Utilizando alguna herramienta de búsqueda
Herramientas de Búsqueda en el Web * Descripción * Programas que permiten la búsqueda por palabras en diversos servidores WWW dando como resultado final el lugar donde se encuentera la información
Herramientas de Búsqueda en el Web * Descripción * Páginas que proveen espacios o formas para entrar palabras orientadas a localizar documentos y otras utilidades en las bases de datos en formato HTML a través de la Internet
Herramientas de Búsqueda en el Web * Descripción * Programas de computadoras que permiten buscar y colectar información de lugares en el “Web” Proveen un encasillado para escribir términos, llevan a cabo la búsqueda y ofrecen una lista de documentos disponibles
Herramientas de Búsqueda NINGUNA HERRAMIENTA DE BÚSQUEDA ES TOTALMENTE EFECTIVA
Tipos de Herramientas Motores de búsqueda o “Robots” Megabuscadores (Meta-Índices) Directorios (Índices)
* Descripción * “Robots” de Búsqueda Programa de computadora que atraviesa la base de datos disponibles en los documentos del Web en busca de la estructura hipertexto de estas páginas HTML con el fin de localizar alguna pieza de información, como puede ser un documento, una imagen o un programa de computadora
“Robots” de Búsqueda * Descripción * Programas que localizan las diferentes Páginas WWW que tienen el término de búsqueda y proveen un índice de documentos
Características “Robots” de Búsqueda Programas diseñados para rastrear banco de datos en hypertexto localizados en el Web Son un Producto Comercial Generales y abarcadores: Banco de datos grandes Requiere el uso de palabras claves
Banco de Datos “Robots” de Búsqueda Páginas del Web (URLs, encabezados, texto, enlaces) Archivos de imágenes y sonido Mensajes de texto completo de grupos de noticias (“newsgroup”) Lista de archivos de servidores ftp
¿Cómo Deciden a Dónde Ir? Depende del “robot” que sea, todos usan diversas estrategias Comienzan por buscar en su propia lista de localizadores (URL’s) Siguen por las páginas “Whats New” y los lugares más populares en el Web
Relevancia de los Resultados Catalogados Los resultados se enumeran según su relevancia Los métodos de clasificación de los resultados varían entre los diversos “Robots” de búsqueda Puede significar que una palabra clave aparece en la página WWW
Factores que Influyen en los Resultados El tamaño de la base de datos La frecuencia con que se actualiza Las capacidades de búsqueda disponibles Velocidad de respuesta Diseño de la interfaz La forma en que despliega los resultados La cantidad de ayudas que brinde La composición de los meta-datos
Características Generales de los “Robots” y Otros Mecanismos Se enriquecen y actualizan automáticamenmte Ordenamiento por relevancia Uso de múltiples palabras Truncamiento No son sensibles a las mayúsculas Usos de comandos booleanos Utilización de booleanos sustitutos Uso de frases Empleo de campos de acción
Búsqueda de Campo “Robots” de Búsqueda Se debe especificar el campo donde el término debe aparecer: Título: Salud y Medicina URL: www.saludmed.com Ayuda aumentar la calidad de los resultados
Truncación “Robots” de Búsqueda Búsquedas realizadas con la raíz de una palabra Ejemplo:Comput resulta en: Computadora Computación Evitar los plurares en cada búsqueda
“Robots” de Búsqueda Operadores Lógicos Booleanos Crean relaciones entre términos/palabras de búsqueda en la base de dados localizadas en el Web
Operadores Lógicos Booleanos “Robots” de Búsqueda Operadores Lógicos Booleanos Te permiten buscar el resultado de: La intersección de dos términos/palabras de búsqueda La combinación de dos palabras La exclusión de una palabra de la búsqueda
Operadores Lógicos Booleanos “Robots” de Búsqueda Operadores Lógicos Booleanos Conectores Booleanos: “AND”: Todas las plalabras deben de estar contenidas en los documentos “OR”: Cualquiera de las palabras deben estar contenidas en los documentos “NOT” Remueve los documentos que contienen una palabra dada
“Robots” : Operadores Booleanos Conectores Booleanos: “AND” Especifica que ambas palabras en cualquiera de los lados del operador deben estar contenidas en los documentos de la base de datos del Web en la cual se esta buscando Ejemplo: Internet AND Education: Busca únicamente aquellas bases de datos en las cuales se encuentran las palabras Internet y la palabra Educación
“Robots” : Operadores Booleanos Conectores Booleanos: “OR” Especifica que una o la otra o ambas de las palabras en cualquiera de los lados del operador deben estar contenidas en los documentos de la base de datos del Web que se esta buscando Ejemplo: Internet OR Education: Busca únicamente aquellas bases de datos en las cuales se encuentran la palabra Internet o la palabra Educación o ambas
“Robots” : Operadores Booleanos Conectores Booleanos: “NOT” Especifica que la palabra antes del operador debe estar contenida en los documentos de la base de datos del Web, pero la palabra después del operador no debe de estar contenida en los resultados Ejemplo: Internet NOT Web: Busca todas aquellas bases de datos en las cuales se encuentran la palabra Internet con excepción de aqueloos registros en la cual aparece la palabra Web
Ejercicios: Operadores Booleanos http://www.saludmed.com/ Informat/Internet/ BusqEjer.html#Busqueda-Ejer#3
Operadores Lógicos Booleanos: De Proximidad “Robots” de Búsqueda Operadores Lógicos Booleanos: De Proximidad Empleados entre dos palabras de búsqueda para indicar que la palabra debe estar contenida en los documentos de la base de datos dentro de una distancia específica de cada una para el pareo en dicho banco de datos
Operadores Lógicos Booleanos: De Proximidad “Robots” de Búsqueda Operadores Lógicos Booleanos: De Proximidad Características: Seguridad cerca de la encriptación Ayuda con la relevancia Asocia una palabra con la otra Puede determinar cuan cerca (e.g., distancia entre dos palabras claves): Dentro de tres palabras, etc
Operadores Lógicos Booleanos: De Proximidad “Robots” de Búsqueda Operadores Lógicos Booleanos: De Proximidad Componentes: Una palabra o letra que indica la dirección Un número que indica la distancia en palabras
Operadores Lógicos Booleanos “Robots” de Búsqueda Operadores Lógicos Booleanos Comandos de Aproximación: “NEAR” Se usan para acercar o aproximar dos palabras dadas Ejemplos: university NEAR3 college Parea cualquier banco de dados en la cual la palabra university y college se encuentran contenidas entre tres o menos palabras de cada una en cualquier dirección
Operadores Lógicos Booleanos: Sustitutos “Robots” de Búsqueda Operadores Lógicos Booleanos: Sustitutos Utilizados para sustituir los conectores booleanos AND, OR y NOT Símbolos empleados: + -
+ computadora + disco duro (es equivalente a: “Robots” de Búsqueda Operadores Lógicos Booleanos: Sustitutos Ejemplo: + computadora + disco duro (es equivalente a: computadora AND disco duro)
Operadores Lógicos Booleanos: Sustitutos Ejercicios: Operadores Lógicos Booleanos: Sustitutos http://www.saludmed.com/ Informat/Internet/ BusqEjer.html#Busqueda-Ejer#2
“Robots” de Búsqueda Operadores Lógicos Booleanos: De Agrupamiento Unen palabras y frases para que sean tratadas como una sola unidad o para determinar el orden en el cual los operadores Booleanos son aplicados
“Robots” de Búsqueda Operadores Lógicos Booleanos: De Agrupamiento Comillas Dobles (“”): Los documentos encontrados por la búsqueda deben de contener las palabras dentro de las comillas dobles exactamente como se entraron Ejemplo: “World Wide Web” Busca aquellas páginas que contienen la frase World Wide Web y no las palabras individuales separadas por otras palabras o las mismas palabras en minúsculas
“Robots” de Búsqueda Operadores Lógicos Booleanos: De Agrupamiento Paréntesis (): Agrupa palabras y operadores en una cadena de búsqueda para definir el orden en el cual los operadores Booleanos deben aparecer Utilidad/Indicación de Uso: Cuando se emplean varios operadores simultáneamente
“Robots” de Búsqueda Operadores Lógicos Booleanos: De Agrupamiento Ejemplo: Se desea buscar información con referente a un visualizadior Web (navegador): Cadena de busqueda que se debe entrar: browser AND (internet or Web): Esta cadena encontrará páginas que contienen las palabras Internet y browser o las palabras Web y browser
“Robots” de Búsqueda - Parte I: Alta Vista: http://altavista.digital.com Hot Bot: http://www.hotbot.com InfoSeek: http://www.infoseek.com Excite: http://www.excite.com Google: http://www.google.com Lycos: http://www.lycos.com LookSmart: http://www.looksmart.com
“Robots” de Búsqueda: Parte II GoTo: http://www.goto.com WebCrawler: http://www.webcrawler.com Open Text: http://www.opentext.com DejaNews: http://www.deja.com InfoHiway: http://www.infohiway.com ThunderStone: http://www.thunderstone.com ScrubTheWeb: http://www.scrubtheweb.com Northern Light: http://www.nothernlight.com
“Robots” de Búsqueda: Parte III Netscape: http://search.netscape.com/ About..com: http://search.about.com/ Voila: http://world.voila.com/ HispaVista: http://buscar.hispavista.com
“Robots” de Búsqueda: Español Biwe: http://biwe.cesat.es Encuentrelo: http://encuentrelo.com Telepolis: http://www.telepolis.com MexSearch: http://www.yellow.com.mx Señas: http://www.combios.net/senyas MexWeb: http://www.mty.itesm.mx/Mexweb LatinWorld: http://www.latinworld.com Mundivia: http://www.mundivia/es/mundi2.html
Megabuscadores Realizan búsquedas simultáneas en varios “Robots”: Programas que ejecutan búsquedas simultáneas en múltiples herramientas No tienen una base de datos propia Remueven los duplicados
Megabuscadores: Parte I MetaCrawler: http://www.metacrawler.com SavvySearch: http://www.savvysearch.com Beaucoup: http://www.beaucoup.com Dogpile: http://www.dogpile.com ProFusion: http://www.profusion.com All-in-One Search: http://www.allonesearch.com http://www.unam.mx/allinone/
Megabuscadores: Parte II StartingPoint: http://www.stpt.com MetaFind: http://www.metafind.com Inference Find: http://www.infind.com Mamma: http://www.mamma.com Cyber411: http://www.c4.com/index.html?cyber411=1 AskJeeves: http://www.ask.com
Directorios (Índices) Son creados manualmente sin la ayuda de ningún “Robot” Son más precisos que los “robots” pues son personas quienes compilan y mantiennen la información Proveen una lista de materiales organizada alfabéticamente: Basados en listas o catálogos Organizados jerárquicamente por materias Son más pequeños en contenido en comparación con los “Robots”
Directorios (Índices) Banco de datos de lugares de internet Estos lugares son sometidos por sus creadores o evaluadores Organizados en categoría Pueden incluir un robot de búsqueda para buscar en su banco de datos Son similares a catálogos o páginas amarillas Los sitios en el web cobren el mismo tópico agrupados en uno Son buenos para curiosear (“browsing”)
Directorios (Índices): Parte I Yahoo!: http://www.yahoo.com Magellan: http://magellan.mckinley.com/ Snap: http://www.snap.com Web Help: http://www.webhelp.com/
Directorios (Índices): Parte II Argus Clearinhouse: http://www.clearinghouse.net/ World Wide Web Virtual Library: http://www.vlib.org/ Britannica.com: http://www.britannica.com Librarians’ Index to the Internet:: http://lii.org/
Directorios (Índices): Ejercicios: Directorios (Índices): http://www.saludmed.com/ Informat/Internet/ BusqEjer.html#Busqueda-Ejer#1