La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Motores de búsqueda para usos académicos 2009 (v1)

Presentaciones similares


Presentación del tema: "Motores de búsqueda para usos académicos 2009 (v1)"— Transcripción de la presentación:

1 Motores de búsqueda para usos académicos 2009 (v1)
Rafael Pedraza y Lluís Codina | Área de Ciencias de la Documentación. Departamento de Comunicación Universidad Pompeu Fabra Valencia, Octubre 2009

2 Contenidos del curso Parte 1: Fundamentos en buscadores
Parte 2: Buscadores para usos académicos Parte 3: La Ciencia 2.0

3 Parte 1: Fundamentos en buscadores
¿Qué es la Web? ¿Qué es un buscador? Historia de los buscadores Buscadores vs. Directorios Funciones de un motor de búsqueda Componentes de un motor de búsqueda: El Spider de un buscador Formularios de búsqueda Software de relevancia Página de resultados Principales buscadores generalistas Los Metabuscadores 8. Publicidad contextualizada junto a los resultados de búsqueda

4 ¿Qué es la Web? (I) La Web es un sistema hipertextual que funciona sobre Internet, permitiendo la consulta de documentos o páginas web y la navegación a través de las mismas. Web invisible: constituyen esta web todas aquellas páginas que escapan a los índice de los motores de búsqueda generalistas. Forman parte de esta web algunas páginas generadas dinámicamente (p.e. como respuesta a una consulta) o aquellas páginas que forman parte de intranets o de sitios web que requieren acceso mediante contraseñas

5 ¿Qué es la Web? (II) Web 2.0: es el término acuñado para referirse a la nueva web que se caracteriza por la dimensión social y comunicativa aparecida en la web, y de la que son buen ejemplo los blogs, redes sociales, foros, wikis, etc. ¿Existe una Web 3.0?: Web Semántica: evolución tecnológica de la web actual hacia una nueva web que persigue la comprensión de sus contenidos por las máquinas.

6 ¿Qué es un buscador? Los buscadores, o motores de búsqueda, son sistemas de información documental que permiten realizar consultas y recuperar información contenida en la Web. Hoy día estas aplicaciones se han convertido en la principal herramienta para acceder a los contenidos de la Web.

7 Historia de los buscadores
< 1990: Sistemas de búsqueda de archivo no Web: Archie 1990: Nace la Web 1994: Web Crawler 1995: Altavista, Excite, Infoseek 2001: Llegada de Google (PageRank) 2004: Yahoo! Buscador, Clusty, MSN Search 2005: Windows Live y 1995, intento de los buscadores por hacerse por los usuarios de los directorios Web, el más importante Yahoo! Directory - 2001: La llegada de Google marca el comienzo de una nueva concepción de la recuperación de información. Google para organizar los resultados de las búsquedas en su ranking no sólo tiene en consideración el emparejamiento de las palabras de la consulta con los documentos, sino también la popularidad de los mismas (enlaces de entrada).

8 Buscadores vs. Directorios
Existen dos formas básicas de obtener información en la web: La Navegación  Directorios La Interrogación  Motores de búsqueda Creación: Directorios: creados y mantenidos mediante esfuerzo intelectual. Buscadores: búsqueda de forma automática mediante programas informáticos Resultados: Sitios web (Directorios) vs. Páginas web y documentos (Buscadores) La Navegación no permite cruzar temas: no podemos saber por ejemplo qué recursos tratan sobre legislación aplicada a los programas infantiles. La respuesta de un directorio es un sitio web, la respuesta a de un buscador es una página (con independencia de su nivel de profundidad), además los buscadores permiten la recuperación de documentos de distintos formatos (pdf, doc, etc.).

9 Funciones de un motor de búsqueda
Acceder a sitios web, localizar y descargar documentos. Extraer el contenido textual (y multimedia) de los documentos descargados. Analizar e indexar el contenido de los documentos para construir los índices del motor. Realizar el análisis de enlaces de cada página y otorgar alguna medida de popularidad. Permitir la formulación de consultas mediante palabras clave. Facilitar el acceso a los resultados de una consulta ordenándolos conforme a unos criterios de relevancia.

10 Componentes de un motor de búsqueda
Un motor de búsqueda consta de un conjunto de programas que trabajan cooperativamente. Son: Rastreador del motor de búsqueda o Spider. Sistema de recuperación de información: Índices directos Índices invertidos Interfaz: Formulario de consulta Página de resultados Software de relevancia.

11 Componente 1: Rastreador o Spider
Un spider (araña) o un crawler (rastreador) es un programa que explora la Web de forma sistemática con dos objetivos principales: Interactuar con los servidores de sitios web para descargar páginas web u otros documentos y Obtener nuevas direcciones (URL) para añadir a su lista de enlaces pendientes de revisar. Las expresiones crawler , spider y robot (en este contexto) son equivalentes.

12 Componente 2: Formularios de búsqueda
Los motores de búsqueda se interrogan utilizando palabras clave. Normalmente presentan dos opciones de búsqueda: Búsqueda simple. Búsqueda avanzada: Búsqueda booleana. Búsqueda por campos. Filtros. Minería de datos. Búsqueda avanzada Google: - Búsqueda booleana - Búsqueda por derechos de uso - Páginas similares

13 Componente 3: Software de relevancia
Su función es la ordenación de los resultados, es decir, la construcción del ranking de resultados en función de unos criterios de relevancia. Algunos de ellos son: Enlaces: enlaces de entrada y URL. Contenido/Propiedades de la página: frecuencia / ubicación / formato de las palabras clave, etc. Resultados pagados y Resultados no pagados.

14 Componente 4: Página de resultados (I)
Presenta la lista de documentos organizados en un ranking. Ofrece las siguientes informaciones: Título de la página (o del documento). El tipo del documento (cuando no es HTML). Unas líneas de descripción del contenido del documento. URL de la página. Tamaño de la página web. y opciones:

15 Componente 4: Página de resultados (II)
Opciones: Obtener una versión traducida de la página con traducción automática (en general muy deficiente). Ver la página en la caché de Google. Buscar páginas con contenidos similares. Navegación secuencial entre los resultados o yendo a una página de resultados concreta (hasta la página 90 más o menos). Restringir la siguiente búsqueda a los resultados obtenidos.

16 Principales buscadores generalistas
Existen cientos de buscadores que compiten entre sí para atraer a los usuarios. No obstante, sólo cuatro concentran la mayoría de las búsquedas. Estos son: Google ( ) Yahoo! ( ) bing ( ) Ask.com ( )

17 Google Fue creado por Larry Page y Sergey Brin en 1998, a raíz de una idea nacida tres años antes cuando eran estudiantes de doctorado en la Universidad de Stanford. Hoy Google está considerado el mayor y más eficiente motor de búsqueda del mercado. Las claves su éxito son: Su facilidad de uso La eficacia y eficiencia de su tecnología para indexar la web Su software de relevancia (PageRank)

18 Actividad 1 Compare los buscadores generalistas mencionados. Para ello defina tres consultas y compare los resultados obtenidos en cada uno de ellos: ¿Qué buscador le devuelve los resultados más apropiados para su necesidad de información? ¿Qué interfaz de búsqueda avanzada le parece más “usable”? ¿y cuál más útil? ¿Qué página de resultados le ofrece mejores opciones? Estudie las opciones de configuración de estos buscadores.

19 Metabuscadores Son herramientas para la búsqueda de recursos web que utilizan los índices de varios buscadores para satisfacer las consultas de sus usuarios Idea principal: recoger los mejores resultados que ofrecen diferentes buscadores para una consulta Justificación: constatación de que la coincidencia en los primeros resultados de los principales buscadores está por debajo del 1%

20 Comparación de resultados: Google vs. Yahoo!

21 Ventajas e inconvenientes de los metabuscadores
Evitar que los usuarios realicen su consulta en varios buscadores Obtener los mejores resultados de diversos buscadores Inconvenientes: ¿Son de calidad los buscadores que utiliza el metabuscador?

22 Principales Metabuscadores
Tradicionales: Metacrawler (http://www.metacrawler.com/) dogpile (http://www.dogpile.com/) De agrupamiento: Clusty (http://clusty.com/) Visuales: KartOO (http://www.kartoo.com/) Grokker (http://www.grokker.com/)

23 Actividad 2 Formule las consultas definidas en la actividad anterior para interrogar los metabuscadores que se han mencionado: ¿Qué aspectos de estos metabuscadores le han parecido más interesantes y por qué? ¿Qué metabuscador le ofrece mejores resultados? En su opinión ¿es más apropiado utilizar un buscador generalista o un metabuscador?

24 Bibliografía Todo acerca de Google: Información sobre Yahoo! España: Descubre Windows Live: Acerca de Ask.com España:

25 Parte 2: Buscadores para usos académicos
Los buscadores especializados Buscadores académicos Buscadores de libros Buscadores de imágenes Buscadores de informes Buscadores de noticias Buscadores de blogs Otros buscadores de interés

26 Buscadores especializados
Los buscadores generalistas constituyen hoy la mejor opción ante búsquedas sencillas y fácilmente formulables. No obstante, estas herramientas ofrecen resultados poco satisfactorios cuando tratamos de encontrar información muy especializada. Un buscador especializado (BE) es aquel que limita su ámbito de búsqueda a un dominio concreto, con el objetivo de proporcionar a sus usuarios acceso a los contenidos de calidad que sobre su área de especialización hay en la web.

27 Ventajas e inconvenientes de los BE (I)
Su capacidad para buscar en páginas que no están indexadas por los buscadores generalistas: los motores de búsqueda especializados son capaces de indexar los contenidos de su especialización incluso cuando estos están ubicados en la denominada web invisible. Mayor funcionalidad y potencial de búsqueda: por ejemplo mediante el uso de interfaces adaptados al dominio específico que cubren.

28 Ventajas e inconvenientes de los BE (II)
Una gran desventaja de estos sistemas es la necesidad de acudir a un buscador u otro en función de la temática que sea de nuestro interés, lo cual disuade normalmente a los usuarios de utilizar este tipo de herramientas.

29 Creación de BE Existen dos modos de crear un motor de búsqueda especializado: Construir o utilizar un índice especializado: es decir, disponer de un registro con la descripción de los contenidos web disponibles en internet sobre una temática concreta. Diseñar una herramienta de búsqueda que, actuando sobre la consulta de los usuarios, permita realizar búsquedas sobre la temática objeto de especialización.

30 Técnica 1: índice especializado
Existen tres modos de crear o utilizar un índice especializado: Generar el índice especializado indexando sólo aquellos contenidos relacionados con la temática de interés. Utilizar un sistema de metabusqueda que consulte simultáneamente diferentes bases de datos web especializadas en la materia de interés. Realizar la recuperación de la información en tiempo real tras formular el usuario su consulta. Ventajas: 1. Homogeniedad del contenido; 2. Indexación completa de las web especializadas; 3. Rápida actualización del índice. Por ejemplo: CiteSeer, Sistema de metabúsqueda sobre bases de datos web especializadas. Por ejemplo: Kelkoo,

31 Técnica 2: especialización de la consulta
Consiste en la modificación de la consulta de sus usuarios para adaptarlas a un dominio específico. Los buscadores especializados que utilizan esta técnica no restringen la búsqueda y recuperación de la información a un subconjunto de páginas disponibles en la web, en su lugar se centran en limitar el tipo de consultas que el usuario puede realizar. Scirus:

32 Áreas de especialización
Documentos académicos / técnicos Libros Imágenes Informes Noticias Blogs Videos Software etc.

33 Bibliografía R. Steele. Techniques for Specialized Search Engines [Consulta: 24/09/2007]

34 Buscadores académicos
Son buscadores que sólo indizan sitios web vinculados con el mundo académico. Los más importantes son: Scirus Google Scholar Science Research

35 Inputs: fuentes de información
La tipología de los sitios web indizados por los buscadores académicos comprende: Universidades (dominio .edu) Centros de investigación (NASA, RAND, etc.) Gobierno (sitios web relacionados con la ciencia, tecnología, etc.) Editores de libros y revistas Colecciones de bibliotecas Repositorios digitales (e-prints, e-books, etc.)

36 Outputs: tipos de documentos recuperados
T1: Páginas web (html) y documentos de toda clase (word, ppt, etc.) publicados en sitios de instituciones académicas o científicas (p.e., sitios del tipo .edu). T2: Artículos de publicaciones científicas, ya se trate de publicaciones abiertas o de publicaciones de pago. T3: Trabajos académicos, tales como tesis doctorales o tesis de licenciatura T4: Documentos depositados en repositorios científicos T5: Patentes T6: Libros, es decir, monografías, por acuerdos con editoriales comerciales o bien a través de acuerdos con bibliotecas Abril 2009

37 Google Scholar (I) scholar.google.com
Contexto Google Amplia tipología de documentos (sin patentes) Mayor número de documentos, pero sin información precisa Completamente localizado Acceso a libros completos (acuerdos con bibliotecas) Características especiales Análisis de citas Opciones de ranking y navegación Abril 2009

38 Google Scholar (II)

39 Scirus (I) www.scirus.com
Contexto Editorial Elsevier, parte de Reed-Elsevier ScienceDirect Scopus Creado en el 2001 Amplia tipología de documentos (sin libros y referencias) 450 millones de documentos a inicios del 2009 Características especiales Opciones de búsqueda Abril 2009

40 Scirus (II)

41 Science Research (I) Contexto Características especiales:
Desarrollo de Deep Web Technologies Utiliza la búsqueda federada (es decir, es un metabuscador) Características especiales: Acude a casi 400 fuentes: Colecciones de asociaciones Repositorios Editoriales y revistas científicas Motores de búsqueda especializados Redundancia en los resultados obtenidos

42 Science Research (II)

43 Actividad 3 (I) Realice un análisis comparativo de los tres buscadores presentados. Preste especial atención en él a los siguientes criterios: Opciones de búsqueda avanzada: qué opciones le ofrece cada buscador (búsqueda a texto completo, por el título, por el autor, por rangos de fecha, por publicación, por tipo de documento, uso de operadores de consulta, etc.). Cantidad de información que son capaces de proporcionar: para ello formule al menos tres consultas (p. ej. Web semántica, Web social, y Cambio climático). Páginas de resultados de cada uno de estos buscadores (comente brevemente su opinión con respecto a la calidad de las mismas). Utilidad o relevancia (subjetiva) de los 10 primeros resultados.

44 Actividad 3 (II) Tipología documental en Scirus
Utilizando un término vinculado con alguna disciplina científica o área del saber… Intentar obtener: Una patente Una tesis doctoral Un artículo de publicación científica Sugerencia de palabras clave: Web semántica Web social Observaciones: puede hacer los ejercicios en parejas o en pequeños grupos Abril 2009

45 Buscadores de libros (I)
Contexto: Fracaso de los e-books a comienzos del milenio. Las editoriales incorporan entonces entre sus productos los libros electrónicos (principalmente académicos). Desarrollo de plataformas para el acceso a los contenidos digitales (Bibliotecas universitarias, etc.): NetLibrary (http://www.netlibrary.com/) Safari Books online (http://my.safaribooksonline.com/) Ebrary Discover (http://shop.ebrary.com/) Amazon.com (http://www.amazon.com/)

46 Buscadores de libros (II)
Soluciones más importantes: A9 (http://www.a9.com/) Google búsqueda de libros (http://books.google.com/books) El presente/futuro: Amazon Kindle Sony Reader Digital Book Google Edition

47 Actividad 4 Acceda a la siguiente URL:
Lea con atención la información que encontrará en ella. En su opinión, ¿le parece acertada la iniciativa llevada a cabo por Google? ¿cree que las instituciones académicas pueden verse favorecidas por ella? Comparta su opinión con sus compañeros en el debate que iniciará el profesor. Para finalizar, formule tres consultas (las mismas) en los buscadores A9 y Google Libros. Haga un breve análisis comparativo de sus opciones de búsqueda, páginas de resultados, y relevancia de los resultados obtenidos

48 La búsqueda de imágenes
Motores de búsqueda: Imágenes de poca calidad y con copyright. Interfaces de consulta inapropiados: Indexación inadecuada de las imágenes. Bancos de imágenes comerciales: Gestionan los derechos de los artistas. Imágenes de calidad: de contenido y de formato. Tratamiento documental de las imágenes. Repositorios abiertos: Licencias Creative Commons. Imágenes de calidad. Interfaces de consulta inapropiados.

49 Segmentación del mercado
Dos grandes sectores: Sector Editorial: Prensa no diaria Prensa diaria Televisión: informativos, reportajes y documentales Sector Creativo: Publicidad y relaciones públicas Packaging Multimedia (dvd, web) Televisión y vídeo: video arte y cine de creación o de ficción Y una larga cola: Uso personal: invitaciones, tarjetas, webs, etc. Corporaciones: folletos y publicaciones de empresa Investigación: arte, sociología, política, historia, etc. Abril 2009

50 Buscadores de imágenes
Búsqueda mediante palabras clave. Emparejamiento contra el nombre de los archivos o el texto próximo a las imágenes. Opciones avanzadas: Tamaño. Formato. Color. Localización. Buenas opciones: Google images: bing:

51 Bancos de imágenes comerciales
Búsqueda por palabras clave. Contenidos indexados profesionalmente. Los más importantes: AGE Fotostock (a nivel nacional): Getty: Corbis:

52 Repositorios abiertos
Búsqueda mediante palabras clave. Emparejamiento contra el etiquetado de las imágenes realizado por los autores. Opciones de búsqueda avanzada muy limitadas Buenas opciones: Flickr Creative Commons: Archive.org: MorgueFile:

53 ¿El futuro de la búsqueda de imágenes?
Consulta de imágenes mediante ejemplo (Content-based Image Retrieval): CIRES:

54 Actividad 4 Para la realización de esta actividad utilice la plantilla “EnunciadoActividad4.doc”. Pueden realizar estos ejercicios en parejas o pequeños grupos. Abril 2009

55 Búsqueda de informes La información de carácter económico o empresarial constituye hoy uno de los factores críticos de cualquier institución. El producto más elaborado que podemos obtener dentro de este tipo de informaciones son los informes y los estudios de mercado. A diferencia de otros recursos, este tipo de información normalmente sólo puede ser accedida previo pago.

56 Fuentes para la obtención de informes y estudios de mercado (I)
Hoover's, Inc.: información empresarial e industrial.

57 Fuentes para la obtención de informes y estudios de mercado (II)
Northern Light: información financiera (Analyst Direct).

58 Fuentes para la obtención de informes y estudios de mercado (III)
ESADE Guíame: en España es probablemente el recurso más importante para la búsqueda de información sectorial y empresarial. ICEX (Instituto Expañol de Comercio Exterior): elabora y difunde información sobre la oferta de productos españoles, y sobre mercados internacionales.

59 La búsqueda de noticias
Contexto: La popularización de la Web, especialmente con la llegada de la Web 2.0, ha propiciado la presencia de la mayoría de los medios de comunicación en la Web. La prensa escrita ha tenido que adaptarse a este nuevo entorno para satisfacer a sus usuarios, cada día más tecnificados. Aparición de los buscadores de noticias, unas herramientas que permiten la recuperación de noticias a partir de un gran número de fuentes (diarios, revistas, agencias de noticias, blogs, canales RSS, etc.

60 Google Noticias (I) http://news.google.es/ Opera en más de 40 países.
Recoge noticias de más de 4000 fuentes (en España más de 700). Agrupación de las noticias en torno a secciones. La selección de las noticias de cada sección se hace de manera automática. ¿Y la selección de las fuentes? Dispone de interfaz de búsqueda avanzada.

61 Google Noticias (II) De cada noticia aparece: el titular, fuente y fecha, un breve resumen, enlaces a otras noticias relacionadas, y enlaces a otras fuentes. Permite la personalización del buscador (opción “Personalizar esta página”). Su interfaz de consulta es casi idéntico al de Google (Web). Recupera noticias tanto en formato texto como en video, yendo muchas de ellas acompañadas de imágenes.

62 Google Noticias (III) Todas las noticias recuperadas han sido publicadas en los últimos 30 días. Otros servicios de Google Noticias son: Servicio de alertas de noticias por correo electrónico. Suscripción a sus secciones o a alguna de sus consultas a través de canales de contenido sindicado (RSS y Atom). Interfaz para su consulta a través de dispositivos móviles.

63 Google Archive Search http://news.google.com/archivesearch
Iniciativa de Google News de Estados Unidos para la consulta de noticias de carácter histórico. Ordena sus resultados atendiendo a la importancia histórica de los documentos recuperados. Con esta herramienta podemos recuperar noticias en función de su relevancia para la consulta o bien una cronología con las noticias publicadas para nuestra consulta. Para medir la importancia de una noticia se tienen en cuenta distintos aspectos, como la publicación en la que apareció el artículo, cuantas veces se ha citado el acontencimiento que describe, y quién lo ha citado.

64 Yahoo! Noticias (I) http://es.noticias.yahoo.com/
Al igual que Google Noticias este servicio se presenta en un portal organizado en distintas secciones. A diferencia de Google Noticias, estas secciones constan de distintas subsecciones que ayudan a organizar mejor su información. Como opción por defecto, Yahoo! España Noticias ofrece noticias de su propiedad, obtenidas de diferentes agencias (EFE, Reuters, AFP, Europa Press, etc.) y que se visualizan en su propio portal.

65 Yahoo! Noticias (II) Ofrece la opción de búsqueda de fotos de noticias. Realizada una consulta recupera como resultados noticias en los formatos: texto, video y audio. Otros servicios de Yahoo! Noticias son: Posibilidad de suscripción a tres canales de contenido sindicado. Interfaz para la consulta y búsqueda de noticias desde el móvil.

66 abastodenoticias.com http://www.abastodenoticias.com/
Es un buscador de titulares de noticias aparecidos en la prensa española. Dispone de opciones de búsqueda normal y avanzada. Dirigida a usuarios normales, pero sobre todo a webmasters y administradores de páginas web interesados en incorporar titulares de noticias en sus sitios o portales. Accede a más de diez mil titulares diarios de diferentes periódicos y fuentes de información de España. Ofrece boletines temáticos (más de 150) de suscripción gratuita mediante correo electrónico. Cuenta con 150 foros que permiten la participación libre de sus usuarios.

67 Wasa Live http://es.wasalive.com/
Buscador de titulares de noticias que recoge más de fuentes, entre las que se incluyen medios de comunicación, blogs y foros. Recupera información en los formatos texto, imágenes y video. Permite el seguimiento de una consulta mediante su suscripción RSS.

68 Hemerotecas Digitales (I)
Son colecciones de noticias ya aparecidas que se conservan en formato digital y que permiten realizar búsquedas retrospectivas de determinados acontecimientos. Destacamos: El País (1976-) (http://www.elpais.com/archivo/hemeroteca.html) La Vanguardia (1881-) (http://www.lavanguardia.es/hemeroteca/) El Mundo (1994-) (http://www.elmundo.es/papel/hemeroteca/) ABC (2002-) (http://www.abc.es/hemeroteca/)

69 Hemerotecas Digitales (II)
La Voz de Galicia (2000-) (http://www.lavozdegalicia.es/hemeroteca/index.htm) 20 minutos (2005-) (http://www.20minutos.es/archivo/) Time (1923-) (http://www.time.com/time/archive/) The New York Times (1853-) (http://www.nytimes.com/ref/membercenter/nytarchive.html)

70 Otras opciones: BdD de prensa
My News Online: Participada por el grupo La Información (desde abril de 2007) Unas 120 fuentes nacionales (principalmente) e internacionales Factiva Grupo Dow Jones (The Wall Street Journal) Más de fuentes de 159 países LexisNexis Grupo Red Elsevier Más de fuentes

71 La búsqueda de blogs Contexto:
El primer blog aparece en 1993 de mano de Tim Berners Lee. Su uso se populariza a partir de 1999 con la llegada de Blogger (que en 2003 es adquirido por Google). Los blogs constituyen hoy un fenómeno imparable y de continuo crecimiento en la web. Concentran en torno a ellos a auténticas comunidades que comparten gustos e inquietudes similares. Su especialización les convierte en buenas fuentes para detectar recursos (es decir, enlaces) valiosos sobre su temática, así como a aquellas personas o comunidades interesadas en la misma.

72 Herramientas para la búsqueda de blogs o feeds
Buscadores y directorios de los servicios para la publicación de blogs. Agregadores o lectores de feeds (Google Reader, Bloglines). Canales de contenidos sindicado (RSS y Atom de los blogs). Directorios de blogs. Buscadores de blogs.

73 Directorios de blogs Yahoo! Directorios:
EatonWeb: Directorio de blogs en España:

74 Buscadores de blogs Google Búsqueda de blogs:
Technorati: Bloglines: BlogPulse Profile:

75 Búsqueda de videos online
Recuperación en función de: Etiquetas asignadas por los usuarios. Categorías predefinidas de los servicios de alojamiento. Inconveniente: hemos de confiar en la honestidad y capacidad de los usuarios para describir los contenidos.

76 Herramientas para la búsqueda de videos online
Buscadores de los servicios de alojamiento de video: conocer estos servicios y utilizar sus herramientas es la mejor manera de encontrar el video que necesitamos. Buscadores de video: realizan su consulta simultáneamente sobre los principales servicios de publicación de videos.

77 Servicios de alojamiento para video
DailyMotion: dispone de videos de hasta 150 Mb y 20 minutos de duración, más que la mayoría de estos servicios. Metacafe: sus videos son en su mayoría profesionales (fragmentos de películas, videoclips, etc.). MySpaceTV.com: servicio de alojamiento gratuito de videos de MySpace. Se caracteriza por la presencia en ella de multitud de grupos musicales y celebridades. Su orientación es principalmente profesional. Youtube: fundada en 2005 esta empresa es la líder indiscutible del sector del video online. Entre sus proveedores de contenidos destacan: BBC, Sony Music Group, NBA, etc.

78 Buscadores de video (I)
Blinkx: es a la par un servicio de alojamiento de videos gratuito y un buscador de videos. Como buscador indexa y recupera videos procedentes, entre otros, de la BBC, Fox, MTV, Sky News, Reuters, Metacafe, y Youtube. BuscaTube: potente buscador de videos en castellano que realiza las consultas sobre: YouTube, Google Video, MySpaceTv, SoapBox, DailyMotion, y Metacafe.

79 Buscadores de video (II)
Exalead Video: realiza sus consultas sobre: YouTube, DailyMotion, Metacafe, Kewego, e ifilm. Su interfaz de búsqueda avanzada es muy potente, haciendo uso de operadores booleanos y de proximidad. Google Video: es tanto un servicio para el alojamiento gratuito de videos como un potente buscador de videos. Como motor de búsqueda presenta los resultados hallados principalmente en YouTube, pero también de otros servicios de alojamiento como el propio Google video, Metacafe, etc. Facilita una buena interfaz de búsqueda avanzada.

80 Problemas: contenidos digitales y buscadores
Aspectos legales de los contenidos online: Copyright vs. Creative Commons La búsqueda y recuperación de contenidos online ¿una barrera para los proveedores de contenidos?: Modelo de negocio de los diarios online. Demanda de los diarios belgas a Google. Demanda de Sony a Youtube.

81 Calidad de los contenidos en la Web 2.0
¿Qué define un contenido de calidad? Profesionales expertos VS. Bloggers y Ciberperiodistas. Casos de: Artículos y noticias no contrastados Nature: Wikipedia vs. Enciclopaedia Britannica Usuarios y calidad (Google y Servicios de bookmarking (Del.icio.us)).

82 Creative Commons: ¿una solución?
Creative commons (some right reserved): Inglés: Castellano:

83 Creative Commons: formatos
Una obra bajo licencia Creative Commons tiene copyright Pensada para proteger obras en formato: Texto. Audio. Video. Imagen Interactivo

84 Creative Commons Estas licencias ofrecen diferentes derechos en función de las siguientes condiciones: Reconocimiento (Attribution): El material creado por un artista puede ser distribuido, copiado y exhibido por terceras personas si se muestra en los créditos. No comercial (Non Commercial): El material original y los trabajos derivados pueden ser distribuidos, copiados y exhibidos mientras su uso no sea comercial. Sin Obra Derivada (No Derivate Works): El material creado por un artista puede ser distribuido, copiado y exhibido pero no se puede utilizar para crear un trabajo derivado del original. Compartir Igual (Share alike): El material creado por un artista puede ser modificado y distribuido pero bajo la misma licencia que el material original.

85 Licencias Creative Commons (I)
La combinación de estas condiciones da lugar a seis licencias: Reconocimiento: El material creado por un artista puede ser distribuido, copiado y exhibido por terceros si se muestra en los créditos. Reconocimiento - Sin obra derivada: El material creado por un artista puede ser distribuido, copiado y exhibido por terceros si se muestra en los créditos. No se pueden realizar obras derivadas. Reconocimiento - Sin obra derivada - No comercial: El material creado por un artista puede ser distribuido, copiado y exhibido por terceros si se muestra en los créditos. No se puede obtener ningún beneficio comercial. No se pueden realizar obras derivadas.

86 Licencias Creative Commons (II)
Reconocimiento - No comercial: El material creado por un artista puede ser distribuido, copiado y exhibido por terceros si se muestra en los créditos. No se puede obtener ningún beneficio comercial. Reconocimiento - No comercial - Compartir igual: El material creado por un artista puede ser distribuido, copiado y exhibido por terceros si se muestra en los créditos. No se puede obtener ningún beneficio comercial y las obras derivadas tienen que estar bajo los mismos términos de licencia que el trabajo original. Reconocimiento - Compartir igual: El material creado por un artista puede ser distribuido, copiado y exhibido por terceros si se muestra en los créditos. Las obras derivadas tienen que estar bajo los mismos términos de licencia que el trabajo original.

87 Bibliografía The Quality Gap: The Race for Context Pushes Content Quality to the Sidelines  John Blossom  30 May 2007 Ley de propiedad intelectual. Derecho de autor / Wikipedia Commission sees need for a stronger more consumer-friendly Single Market for Online Music, Films and Games in Europe "Creative Commons se convertirá en una organización de estándares de los derechos de autor“ / Consumer Eroski Catedra COIT de la Universidad Politécnica de Madrid: Telefónica. “Descarga de contenido y gestión de derechos digitales” [Informe técnico].. Capítulo 19 de: “Las telecomunicaciones y la movilidad en la sociedad de la información” Transparencias de las ponencias del Dr. Fernando Pérez González: Página personal: Transparencias:

88 Parte 3: La Ciencia 2.0 Características de la Web 2.0:
Contenido creado por usuarios (prosumidores) Redes sociales Aplicaciones en línea (cloud computing) Herramientas colaborativas

89 Web 2.0

90 Ciencia 2.0 / E-Science Recursos de la Web 2.0 aplicada, al menos, a tres actividades características del mundo académico: Gestión de información Publicación y difusión de resultados Acreditación y promoción Una visión global: Otra dimensión: Open peer review (no tratado en esta presentación)

91 Casos concretos Gestores de información: p.e. RefWorks
Repositorios académicos: p.e. E-LIS Portales de documentos: p.e. SlideShare Herramientas de creación: p.e. Mindomo Redes sociales: p.e. Exit

92 RefWorks (I) Aplicación en línea:
No es necesario descargar ningún programa La aplicación está disponible desde cualquier lugar del planeta … siempre que haya conexión a la Web Los datos están a mano desde cualquier lugar del planeta Los datos están en un servidor seguro Funciones: Gestor personal de información Generador de bibliografías Herramienta de colaboración

93 RefWorks (II) Gestor personal de información:
Importa referencias individuales o en grupo de manera automática: Desde bases de datos: De modo automático Previa exportación desde la base de datos De sitios web visitados De búsquedas realizadas desde el propio RefWorks a catálogos de bibliotecas o bases de datos Permite editar y entrar referencias “a mano” Permite incorporar imágenes y documentos a las referencias Permite búsquedas selectivas en la base de datos y diversos modos de exportación

94 RefWorks (III) Generador de bibliografías
Decenas o cientos de formatos disponibles Posibilidades: Referencias: Individuales De un conjunto tras una búsqueda selectiva o de toda la base de datos Contexto: Desde RefWorks en línea Desde el procesador de textos (requiere instalar un complemento en el procesador y conexión a la Web)

95 Depósitos digitales (I)
Origen en los e-prints Diversos tipos: Pre-prints Post-prints Actualmente: Parte de la estrategia a nivel: De país De Comunidad Autónoma De Universidad De autor La motivación: Visibilidad: la acreditación “informal” Instrumento: los motores de búsqueda y otros sistemas de información especializados en Ciencia 2.0

96 Depósitos digitales (II)
En general: Depósitos digitales por institución Algunas disciplinas: Abiertos a todos los autores de un sector, p.e.: Economía (RePec), Física, Matemáticas y Computación (Arxiv), Documentación e Información (E-LIS) Directorio de depósitos a nivel nacional e internacional:

97 Herramientas de creación y publicación
Permiten crear documentos que, al mismo tiempo quedan publicados en la web Presentaciones Zoho Diagramas Mindomo Wisemapping

98 Portales de documentos
El caso de SlideShare Depósito de presentaciones y documentos Plugin en PowerPoint Publicación automática Difusión automática Acceso universal Parte del ciclo de vida de la creación de una presentación o un documento (artículo, informe, etc.)

99 Redes Sociales Instrumento de visibilidad y de acreditación “informal”
Sistema de colaboración y de difusión de resultados Medio de contacto Algunos casos concretos: Exit Academia.edu LinkedIn ResearchGate

100 Conclusiones Son herramientas de coste cero (para los usuarios)
Implican una pequeña curva de aprendizaje, pero rinden resultados de manera inmediata Bien seleccionadas aportan: Visibilidad (acreditación formal e informal) Productividad Y en general: ventajas competitivas Propuestas para la acción: Una vez producido un documento (artículo, presentación, informe, etc.) consideren que empieza el ciclo de vida de su difusión. Consideren SlideShare para presentaciones (u otro tipo de documentos) Consideren el paso a las aplicaciones en línea: RefWorks (o equivalentes) puede ser un buen inicio. Consideren el uso de alguna red social. Por último: la Ciencia 2.0 es también un nuevo campo de investigación, por tanto, una nueva zona de oportunidades

101 Actividad 5 Como actividad final de este curso deberá elaborar un diagrama con Mindomo. En él deberá reflejar los contenidos aprendidos en este curso, poner notas definitorias de las herramientas estudiadas, y realizar enlaces a las fuentes presentadas.

102 Referencias Directorio sobre Ciencia 2.0 Artículo Wikipedia sobre Web 2.0 Diagramas sobre otras características de la Web, el SEO y los buscadores:


Descargar ppt "Motores de búsqueda para usos académicos 2009 (v1)"

Presentaciones similares


Anuncios Google