La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Seminario de Investigación (5) Mtra. Marcela Alvarez Pérez.

Presentaciones similares


Presentación del tema: "Seminario de Investigación (5) Mtra. Marcela Alvarez Pérez."— Transcripción de la presentación:

1 Seminario de Investigación (5) Mtra. Marcela Alvarez Pérez

2 ¿Cómo buscar en la Web? (Melanie Hanes-Ramos, Assistant Library Director, University of South Carolina Beaufort South Campus Library) MOTORES DE BÚSQUEDA –grandes bases de datos conteniendo los archivos de las páginas de la red ensambladas automáticamente. ¿CÓMO TRABAJAN? compilan sus bases de datos empleando “arañas” o “robots” (“bots”) para recorrer el espacio de la red desde un vínculo a otro, identificando y leyendo las páginas. Los sitios sin vínculos hacia otras páginas pueden ser ignorados por las “arañas” totalmente. Una vez que las “arañas” ingresan al sitio, normalmente indizan la mayoría de las palabras de las páginas disponibles públicamente en la red. Siempre que se utilice un motor de búsqueda, se le está solicitando que rastree su índice de sitios y haga coincidir las palabras claves y frases del pedido con aquellas existentes en los textos y documentos dentro de la base de datos del motor. (http://www.sc.edu/beaufort/library/pages/bones/bones.shtml)

3 PROS: –Los motores de búsqueda brindan acceso a una gran porción de las páginas disponibles públicamente en la red, en crecimiento exponencial –Hasta ahora los motores de búsqueda son los mejores medios diseñados para ser utilizados en la red. CONTRAS: –la inmensa cantidad de palabras indizadas por los motores de búsqueda aumentan la posibilidad de encontrarse con cientos de miles de respuestas para una simple pedido de búsqueda. –se entregarán largos documentos en donde la palabra clave aparece sólo una vez. –muchas de las respuestas serán irrelevantes a la búsqueda.

4 los programas llegan a ser similares, pero no existen dos programas de búsqueda exactamente iguales en términos de tamaño, velocidad y contenido; no existen dos motores de búsqueda que utilicen el mismo listado de relevancia y tampoco cada motor de búsqueda ofrece las mismas opciones de búsqueda. La búsqueda resultará diferente en cada motor utilizado. La diferencia podría no ser mucha, pero sí significativa. Los buscadores son ideales para encontrar palabras claves únicas, frases, declaraciones e información escondida en los textos de la página. Debido a que indizan palabra por palabra, los buscadores también son útiles recuperando muchísimos documentos.

5 EJEMPLOS DE BUSCADORES INDIVIDUALES: Altavista Bing Blekko DuckDuckGo Gigablast Google Yahoo! Yebol WireDoo

6 METABUSCADORES No revisan toda la web, sino las bases de datos de los motores de búsqueda Buena forma de saber (rápido) qué motor de búsqueda arroja más/mejores resultados –Puede presentar todos los resultados en una lista única, o una lista por cada motor Son muy veloces y nos dan una idea general de lo que hay y dónde buscarlo …pero no son tan versátiles

7 Ejemplos Metabuscadores Brainboost ChunkIt! Clusty DeeperWeb Dogpile Excite Harvester42 HotBot Info.com Ixquick Kayak LeapFish Mamma Metacrawler MetaLib Mobissimo Myriad Search SideStep Turbo10 WebCrawler http://en.wikipedia.org/wiki/List_of_search_engines#Metasearch_engines

8

9 DIRECTORIOS POR MATERIAS Los directorios por materias, al contrario de los buscadores, son creados y mantenidos por editores humanos Los editores revisan y eligen sitios para ser incluidos en sus directorios sobre la base de un criterio de selección previamente determinado. Los directorios tienden a ser más chicos que las bases de datos de los buscadores, indizando sólo la página principal o las páginas de alto nivel del sitio. ¿CÓMO FUNCIONAN? Al iniciar una búsqueda con una palabra clave en los contenidos del directorio, el directorio intenta hacer coincidir sus palabras claves y frases con aquéllas en sus descripciones escritas. Los directorios por materia vienen en varios tipos: directorios generales, directorios académicos, directorios comerciales, portales y vortales.

10 Los portales son directorios que han sido creados o comprados por intereses comerciales y luego reconfigurados como distribuidores (gateways). Estos portales no sólo se vinculan a categorías sobre temas populares, también ofrecen servicios adicionales como correo electrónico, noticias actualizadas, cotizaciones de acciones, información de viajes y mapas. Los vortales, o portales verticales, son directorios sobre materias específicas.

11 PROS: Los editores de directorio generalmente organizan los directorios en forma jerárquica en categorías y subcategorías por materia. Debido a la supervisión humana realizada en los directorios por materia, ellos son capaces de entregar una mejor calidad de contenido. También brindan menos resultados fuera de contexto que los entregados por motores de búsqueda. CONTRAS: Al contrario de los buscadores, la mayoría de los directorios no compilan sus bases de datos. En lugar de almacenar páginas, las señalan. Problemas: una vez aceptada para ser incluida en un directorio, la página de la Red podría cambiar su contenido sin que los editores lo percibieran.

12 los directorios por materia son la mejor opción para revisar y buscar temas generales. Son buenas fuentes de recursos de información en temas populares, organizaciones, sitios comerciales y productos. Cuando se desea ver qué tipo de información está disponible en la Red en un campo en particular o área de interés Ejemplos Directorios por Categoría –Beaucoup; CompletePlanet; LookSmart; Lycos; Open Directory Project; Yahoo! Portales –Excite; MSN; Netscape; Yahoo!

13 DISTRIBUIDORES Y BASES DE DATOS ESPECÍFICAS POR MATERIAS Distribuidores (Gateways) Existen dos tipos de distribuidores: los bibliotecarios y los portales. Bibliotecarios: colecciones de bases de datos y sitios de información, dispuestas por materia, que han sido organizadas, revisadas y recomendadas por especialistas, usualmente bibliotecarios. apoyan las necesidades de investigación y referencia identificando y señalando a las páginas en la red recomendadas y académicamente orientadas. Bases de datos específicas por materia (a veces llamadas "Vortales") son bases de datos dedicadas a una sola materia, creadas por profesores, investigadores, expertos, agencias gubernamentales, intereses de negocios y otros especialistas en la materia y/o individuos que tienen un profundo interés y conocimiento profesional sobre un campo en particular y han acumulado información y datos sobre el mismo.

14 Utilizar los distribuidores bibliotecarios cuando se busque información de alta calidad en la red. Utilizar las bases de datos específicas en una materia cuando se busque información sobre un tema dado EJEMPLOS DE DISTRIBUIDORES BIBLIOTECARIOS Academic Information; Digital Librarian; Gary Price's "Resource Shelf“; Infomine; Internet Public Library; Librarians' Index to the Internet; PINAKES; WWW Virtual Library EJEMPLOS DE BASES DE DATOS ESPECÍFICAS POR MATERIA Ask ERIC (Información educativa); Expedia (Viajes); Internet Movie Database (Películas); Jumbo Software (Programas de computadora); PsychCrawler (Recursos sobre psicología); SearchEdu (Sitios de instituciones universitarias); Voice of the Shuttle (Investigación en Humanidades); WebMD (Información de Salud); xrefer (Fuentes de referencia)

15 EVALUANDO PÁGINAS DE LA RED VERIFICAR LA FUENTE: ¿Cómo saber elegir? Primero hay que saber leer una dirección en la red, o URL (Universal Resource Locator-Localizador Universal del Recursos) http://www.sc.edu/beaufort/library/bones.html "http" quiere decir el protocolo de transferencia del hipertexto y se refiere al formato utilizado para transferir y tratar la información "www" significa World Wide Web y es el nombre generalizado para el servidor que soporta texto, gráficos, archivos de sonido, etc. (Al no ser una parte esencial de la dirección y algunos sitios optan por no utilizarlo) "sc"es el dominio de segundo nivel y generalmente designa la ubicación del servidor, en este caso la Universidad de Carolina del Sur "edu" es el nombre de primer nivel del dominio "beaufort" es el nombre del directorio "library" es el nombre del subdirectorio "bones" es el nombre de la carpeta "html" es el tipo de carpeta y en este caso significa hypertext mark-up language (lenguaje para señalar el hipertexto, que es el lenguaje que lee la computadora.)

16 lista de dominios que han estado funcionando durante los últimos años y son aceptados en general –.edu -- sitio educativo (usualmente universidad o institución educativa superior) –.com – sitio comercial de negocios –.gov -- sitio del gobierno de los Estados Unidos de Norteamérica, de clase no militar –.mil -- sitios militares norteamericanos y agencias –.net -- redes, proveedores de servicio de internet, organizaciones –.org -- organizaciones sin fines de lucro estadounidenses y otras Internet creada en EEUU: - "US"- no se asignó a los dominios estadounidenses, sin embargo es utilizado para designar servidores de gobiernos estatales y locales, incluyendo muchas escuelas públicas. Otros países tienen sus códigos de dos letras como parte final de sus dominios, Para una lista de Códigos de país, ir a: ISO's list of Country Codes.ISO's list of Country Codes

17 CÓMO DETERMINAR LA AUTORÍA DE UNA PÁGINA Mucho se puede decir sobre la autenticidad de una página averiguando todo lo que se puede acerca del autor/editor. ¿Quién es el responsable de la página? Es una agencia gubernamental u otra fuente oficial?¿Una universidad?¿Una empresa, una sociedad u otro interés comercial? ¿Un individuo? Regla: confiar en GOV y EDU para presentar información exacta. Los dominios NET, ORG, MIL, y COM generalmente albergan páginas con sus agendas personales u organizacionales y podrían requerir verificación adicional. VERIFICANDO LA INFORMACIÓN VITAL Una página Web reconocida generalmente brindará la siguiente información: La última fecha de actualización de la página Vínculo para el correo por preguntas, comentarios Nombre, dirección, número de teléfono y dirección de correo electrónico del propietario de la página Si el propietario de la página no es fácilmente reconocible, ¿brinda credenciales o alguna información sobre sus fuentes o autoridad?

18 VERIFICANDO EL CONTENIDO ¿Quién auspicia la página? ¿Quién se vincula a esta página y qué vínculos a otras páginas mantiene la página? Fijarse si el dueño de la página le informa cuándo fue actualizada. ¿Es la información actual? ¿Puede verificarse en otros sitios similares?

19 EVALUANDO LA ESTABILIDAD DE UNA PÁGINA WEB No hay manera de congelar una página web en el tiempo, son fluidas –mundo impreso: fechas de publicación, ediciones, números ISBN, etc., No existe control bibliográfico en la red. La página puede ser modificada o revisada mañana o podría desaparecer completamente. Tratar de evaluar la estabilidad de las páginas. –una de las mejores formas es observar detenidamente al auspiciante de la página, la última fecha de actualización y la autoridad del autor/es. Al escribir un trabajo y utilizar páginas web como fuente de recursos, mantener un respaldo de lo encontrado en la web, (ya sea impreso o guardado en el disco) de manera que se puedan verificar las fuentes más tarde en caso de ser necesario.

20 CREANDO UNA ESTRATEGIA DE BÚSQUEDA PENSAR sobre la búsqueda antes de comenzar. Crear una estrategia preguntándose: ¿Qué es lo que quiero hacer ? 1. ¿Revisar? 2. ¿Ubicar una pieza específica de información? 3. ¿Recuperar todo lo que pueda sobre el tema? La respuesta determinará cómo conducir la búsqueda y qué herramientas utilizar 1. revisando y tratando de determinar qué hay disponible sobre el tema: elegir un directorio de temas como Yahoo!; Luego, ingresar palabras clave de búsqueda en uno de los megabuscadores como Ixquick, sólo para ver qué es lo que hay. 2. pieza específica de información: ir a un buscador importante como Google, o a una base de datos especializada como Voice of the Shuttle (para búsqueda en Humanidades) o Bureau of the Census (para estadísticas). 3. recuperar todo lo que pueda sobre un tema: intentar la misma búsqueda en varios buscadores.

21 BUSCANDO EN LA RED OPCIÓN POR DEFECTO Al ingresar más de una palabra clave sin utilizar ningún signo acompañante, marca o símbolo, los buscadores agregarán automáticamente la conjunción Y (AND) u O (OR) para reunir sus términos de búsqueda. Algunas veces los sistemas de categorización de relevancias que utilizan los buscadores pueden destruir la búsqueda al ignorar algunas de las palabras. –cuando el buscador reconoce la lista separada de palabras claves como una frase en su lista de frases predeterminadas –cuando está respondiendo a su propio listado interno de “palabras de pare”("stop words")

22 STOP WORDS Éstas son palabras en las que muchos buscadores no se detienen cuando buscan textos y títulos en la red. para recortar el tiempo de respuesta, rutinariamente ignoran las palabras de pare, por ejemplo, pequeñas palabras comunes: (adverbios, conjunciones, preposiciones o formas del verbo ser-estar) como: un/a, aproximadamente, y son, como, en, ser-estar, por, desde, de, cómo, yo, en, soy-estoy, él/ella - cosas, animales - de, sobre, o, que, este/a, a nosotros, que, cuando, donde, cuales, con, etc. No todos los buscadores reconocen las mismas palabras de pare. en un sitio que mantiene un listado de palabras de pare si escribimos cualquiera de dichas palabras en la expresión de búsqueda (aún en frases entrecomilladas), es probable que continúen siendo ignoradas. Una excepción a esto es Google, que dispone de un listado de palabras de pare pero las reconoce dentro de frases entrecomilladas

23 CREANDO UNA EXPRESIÓN DE BÚSQUEDA Ser específico EJEMPLO: Huracán Hugo Donde sea posible, utilizar nombres y sustantivos como palabras claves EJEMPLO: vajilla platos tazas fiesta Poner los términos más importantes primero en la lista de palabras clave; para asegurarse que serán buscadas colocar un signo + en frente de cada una de ellas EJEMPLO: +híbrido +eléctrico +gas +vehículos Utilizar por lo menos tres palabras claves en la demanda EJEMPLO: interacción vitaminas drogas Combinar palabras claves, donde sea posible, en frases EJEMPLO: "tutorial sobre buscadores" Evitar palabras comunes, por ejemplo: agua, a menos que sean parte de una frase EJEMPLO: "agua embotellada" pensar en palabras que esperaríamos encontrar en el cuerpo de la página y utilízarlas como palabras clave EJEMPLO: anorexia bulimia desorden alimentario Escribir la demanda de búsqueda y revisarla antes EJEMPLO: +" carolina del sur" +"ayuda financiera" +solicitudes +subsidios

24 RECOMENDACIONES BÁSICAS DE BÚSQUEDA Utilizar los signos (+) y menos (-) frente a las palabras para forzar su exclusión y/o exclusión en las búsquedas. EJEMPLO: +carne -papas (NO dejar espacio entre el signo y la palabra clave) Utilizar comillas para encerrar frases (" ") para asegurar que sean buscadas exactamente así, con las palabras una al lado de la otra en el mismo orden. EJEMPLO: “alicia expulsada al país de las maravillas" (NO encomillar palabras en forma unitaria.) Ubicar las palabras claves más importantes al principio de la ilación. EJEMPLO: perro cría familia mascota elegir Escribir palabras clave y frases en minúscula para hallar versiones tanto en minúscula como en mayúscula. Escribir en mayúsculas usualmente obtendrá una coincidencia exacta. EJEMPLO: presidente recupera tanto presidente y Presidente Utilizar el truncado y comodines (por ej., *) para buscar variaciones en el deletreado y la forma de la palabra. EJEMPLO: biblio* recupera biblioteca, bibliotecas, bibliotecario, etc. EJEMPLO: : colo*r recupera color (deletreado en inglés versión americana) y colour (deletreado en inglés versión británica)

25 Combinar frases con palabras claves, utilizando comillas y los signos (+) y/o menos (-). EJEMPLO: +vaqueros +"salvaje oeste " – “fútbol americano” –dallas En la búsqueda dentro de un documento para ubicar la ubicación de la/s palabra/s clave/s utilizar la orden "find" (encontrar) en dicha página.

26 Sugerencias rápidas para Búsquedas booleanas En las búsquedas Booleanas, siempre encerrar las expresiones con O entre paréntesis. EJEMPLO: Yosemite (campamentos O reservas) Siempre utilizar MAYÚSCULAS cuando escribimos operadores Booleanos en la expresión de búsqueda. La mayoría de los motores de búsqueda exigen que los operadores (Y, O, Y NO/NO) se encuentren en mayúsculas El “Y” BOOLEANO (AND) El Y Booleano selecciona su búsqueda al recuperar sólo los documentos que contienen cada una de las palabras claves que se ingresan. A mayor cantidad de términos, mayor precisión en la búsqueda. EJEMPLO: híbrido Y Toyota EL"O" BOOLEANO (OR) El O Booleano aumenta su búsqueda recuperando documentos donde una o ambas palabras claves aparecen. Debido a que el operador O generalmente se utiliza para palabras claves que son similares o sinónimas, la mayor cantidad de palabras clave que se ingresen, mayor cantidad de documentos se recuperarán. EJEMPLO: (híbrido O eléctrico) Y (Honda O Toyota)

27 El “NO/Y NO” Booleano ("NOT" / "AND NOT“) –El NO o Y NO Booleano (algunas veces escrito como YNO) limita la búsqueda recuperando sólo la primera palabra clave, pero no la segunda, aún si la primera palabra aparece en tal documento, también. La utilización de paréntesis es una forma efectiva de combinar varias expresiones de búsqueda en una sola. Utilizar paréntesis para separar palabras claves cuando se encuentre utilizando más de un operador y tres o más palabras claves. EJEMPLO: (híbrido O eléctrico) Y (Honda O Toyota) NO 2008 (para mejores resultados siempre encerrar las expresiones con O entre paréntesis) La lógica Booleano no siempre es simple o sencilla. Los diferentes motores de búsqueda manejan los operadores Boléanos en forma distinta. Por ejemplo, algunos aceptan NO, mientras que otro acepta YNO como una sola palabra, otros Y NO como dos palabras. Algunos exigen que los operadores se escriban en letras mayúsculas mientras que otros no.

28 OPERADORES DE PROXIMIDAD Los operadores de proximidad o posicionales (NEAR, ADJ, SAME) no forman parte realmente de la lógica Booleana, pero sirven en forma similar en la formulación de expresiones de búsqueda. No todos los motores de búsqueda aceptan los operadores de proximidad, pero unos pocos aceptan NEAR en la opción de búsqueda avanzada. El operador NEAR permite buscar los términos ubicados dentro de una distancia especificada entre cada uno en cualquier orden. Cuanto más cerca se encuentren, se observará que el documento encabeza la lista de resultados. Utilizando NEAR, cuando es posible, en lugar del Y Booleano generalmente recupera resultados más relevantes

29 BÚSQUEDA DE CAMPO Los registros electrónicos están organizados según campos distintos. Una página web típica está compuesta de los siguientes campos importantes: título, dominio, host (o sitio), URL y vínculo. Cuando la información es ingresada en un campo de registro, algunos motores de búsqueda permiten recuperarla utilizando la etiqueta correcta del campo en combinación con el término/s de búsqueda. Cuando se encuentra disponible es una herramienta muy poderosa que permite especificar exactamente dónde queremos que el motor de búsqueda se fije en el documento web.

30 EJEMPLO: título: “tutorial sobre figuras de origami" recupera página que tienen estas palabras en el título EJEMPLO: dominio:edu Y "El origen de las especies" Y Darwin Y paleontología limita su búsqueda a los sitios educativos que traten sobre Charles Darwin y su teoría de la evolución. BÚSQUEDA DE VÍNCULO Si tenemos una página web y queremos saber quiénes se están vinculando a ella o quién se está vinculando a una página de interés particular, podemos elegir una búsqueda de vínculo (LINK). EJEMPLO: link:www.buap.mx

31 QUÉ HACER SI... MI BÚSQUEDA RECUPERA UN MILLON DE DOCUMENTOS Probablemente se escribió un sólo término y era demasiado común. Pensar en algunos sinónimos. Intentar agregar por lo menos dos términos específicos más. MI BÚSQUEDA RECUPERA MUY POCOS DOCUMENTOS Probablemente se está buscando en el lugar equivocado o la búsqueda es demasiado limitada. Quizás no se configuró la expresión correctamente. Quizás la información que se está buscando no se encuentra en la red. Intentar omitir algunos de los términos de búsqueda. Intentar la búsqueda en otro buscador, directorio, buscador personal, o un recurso de especialidades. MI BÚSQUEDA RECUPERA UN MENSAJE "404 -- FILE NOT FOUND" Este mensaje informa que el archivo se ha mudado, retirado o renombrado. Volver al buscador y realizar una búsqueda por frase o una búsqueda por campo de título. Intentar acortar el URL para ver si el archivo podría estar en el mismo servidor. Intentar en Google, que mantiene copias en cache de las páginas.

32 EL BUSCADOR RECUPERA UN MENSAJE “ EL SERVIDOR NO DISPONE UN INGRESO DNS” ("SERVER DOES NOT HAVE A DNS ENTRY") Este mensaje informa que el programa no puede ubicar el servidor (es decir, la computadora que alberga la página web) Podría significar que la red está ocupada o que el servidor ha sido retirado o se encuentra en mantenimiento. Verificar el deletreado e intentar nuevamente más tarde.. LA BÚSQUEDA RECUPERA UN MENSAJE DE “ERROR DE SERVIDOR” ("SERVER ERROR") O “SERVIDOR OCUPADO”(“SERVER IS BUSY") El servidor que está intentando contactar puede encontrarse fuera de línea, estar colgado o muy ocupado. Intente nuevamente más tarde.


Descargar ppt "Seminario de Investigación (5) Mtra. Marcela Alvarez Pérez."

Presentaciones similares


Anuncios Google