Autores: Autores: Pedro Flores Pérez, José Figueroa, Caleb Lizárraga, Ernesto Brau, Adrian Lucero, Carlos David Briceño, Ivo Jimenez, Juan A. Raygoza y.

Slides:



Advertisements
Presentaciones similares
Búsqueda de una frase exacta
Advertisements

Google.
Herramientas informáticas
FACULTAD DE CIENCIAS MÉDICAS CARRERA DE MEDICO Y CIRUJANO
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:23 PRESENTACION: BASE DE DATOS ALUMNAS: Velazquez Corona Elsa Ponciano Antonio.
HERRAMIENTAS DE INTERNET
Buscar bibliografía en
Danilo Yáñez Alarcón. Avance II
TECNOLOGÍA DE LA COMUNICACIÓN I LICS. EN COMUNICACIÓN SOCIAL Y PERIODISMO CLASE 1- AÑO 2013 ELABORADO POR PROF. VIVIANA M. PONCE
Definicion Son bases de datos creadas a partir de la información obtenida por programas que sistemáticamente recorren la Internet, localizando recursos.
Base de Datos ProQuest.
Buscador Es un sistema informático que busca archivos almacenados en servidores web HERRAMIENTAS DE COMPUTACION I.
Lo bucadores son sistemas que permite al usuario buscar información,estos la consiguen de la web, pero otroa tanto la obtienen del news,gopher,ftp,etc.
Método Científico.
Una base de datos es un “almacén” que nos permite guardar grandes cantidades de información de forma organizada para que luego podamos encontrar y utilizar.
Recursos de Información y Presentaciones Digitales Integrantes: Alison Caiguan Carla Escobar Claudia Opazo Sebastian Santander.
Contesta Cierto o Falso (al final del módulo podrás tomar la prueba de nuevo): – Yahoo ofrece un motor de búsqueda. – Los motores de búsqueda funcionan.
Elaborado por: Aldo López Garrido Aránzazu Andrade Lara David González Quiroz.
Escribiendo y publicando un artículo
Google Objetivos: comprender y conocer los beneficios que nos entrega este buscador. Nombres: -Javiera Arratia -Milena Pereira Curso: 2ºMedio B Fecha:
SEO Los términos posicionamiento en buscadores, posicionamiento web u optimización de motores de búsqueda engloban todos los procesos que se encargan de.
Navegadores Y Buscadores
REPÚBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD NACIONAL EXPERIMENTAL SIMÓN RODRÍGUEZ COORDINACIÓN DE DESARROLLO PROFESORAL NÚCLEO BOLÍVAR FACILITADOR:
Estudio comparativo rediseño portal web. Centro de Cómputo y de Procesamiento de Información [ 1 de junio de 2010 ] UNIVERSIDAD.
Herramientas informáticas
Internet básico Buscadores Daniel Gayo Avello. 2 Internet básico. Buscadores zHoy veremos... yLa expansión del web y¿Qué son índices y robots? y¿Cómo.

INTERNET.
Un buscador es una página de internet que permite realizar búsquedas en la red. Su forma de utilización es muy sencilla, basta con introducir una o más.
Martínez Quechotl Alejandra 1° “F”. Internet es una gran red internacional de ordenadores. Permite, como todas las redes, compartir recursos. Es decir:
¿Qué son los motores de búsqueda?
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:21 PRESENTACION: BASE DE DATOS ALUMNAS: Adán Millán Sánchez.
SEO Search Engine Optimization. SEO Google. Yahoo, Bing. Baidu, Yandex.
1 Clase 3 Registro de resultados Tecnología de la Comunicación I.
MANUAL DE USO BASES DE DATOS Por: EBSCO Information Services
Taller de Herramientas de Presentación
CARRERA DE OBSERVACIÓN JORGE YULIAN FLOREZ. ¿QUÉ ES LA INTERNET? INTERCONEXIÓN DE REDES INFORMÁTICAS QUE PERMITE A LOS ORDENADORES O COMPUTADORAS CONECTADAS.
Buscadores.
WORD WIDE WEB Nace a principios de los años 90 en Suiza. Su función es ordenar y distribuir la información que existe en internet. La World Wide Web se.
DEFINICION Un buscador es una página web en la que se ofrece consultar una base de datos en la cual se relacionan direcciones de páginas web con su contenido.
TALLER #5 GERMAN BECDACH MUÑOZ. PREGUNTAS  Qué es una pagina web? Una página web es el nombre de un documento o información electrónica adaptada para.
 Un motor de búsqueda, también conocido como buscador es un sistema informático que busca archivos almacenados en servidores web gracias a su «spider»
Tema: P roblemas con el navegador. Motor de búsqueda.
Por: Mayela Mascorro Aplicación de las Tecnologías de la Información, Grupo 003. UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE ARQUITECTURA.
¿Qué son los motores de búsqueda? Son los que permiten buscar y recuperar información en Internet a través de la utilización palabras clave y combinaciones.
INTERNET Búsqueda y evaluación de información WWW Universidad Interamericana de Puerto Rico Recinto Metropolitano Centro de Acceso a la Información.
Profesor: Tema: Qué es un Buscador Integrantes del equipo: *Jennifer Rojas Gandarilla * INFORMÁTICA Y COMPUTACIÓN II.
Búsqueda de Información en Internet
Ciencia o no ciencia. Montserrat Pureco Torres A
MOTORES DE BUSQUEDA.
Internet y Navegadores Unidad 5. Fecha: 1 de agosto de 2011 Periodo# : 2 Objetivo: identificar el contenido de una dirección web Tema: Elementos de una.
INSTITUTO TECNOLÓGICO DE CELAYA MANUAL DEL BLOG “MICROREDZONAV” DEPARTAMENTO DE DESARROLLO ACADÉMICO ING. JUAN CARLOS GALLEGOS LÓPEZ.
 Porque de un texto o palabra se puede pasar a otro en el mismo documento a otro, también recibe este nombre porque soporta imágenes.
Las máquinas Buscadoras (Buscadores) Las máquinas buscadoras (Search Engines) son computadoras (llamados servidores) dedicados a almacenar información.
Internet Internet es una red de alcance mundial, compuesta por redes de datos privadas y públicas que se comunican entre si, independientemente del hardware.
Temas: El Ordenador | Redes | ¿Qué es un wiki? | Diseño Web | Programación informática | Hojas de cálculo El OrdenadorRedes¿Qué.
LOS PRINCIPALES BUSCADORES WEB Y LAS PRINCIPALES REDES SOCIALES.
TIC MÓNICA BAUTISTA CORONA ROCÍO JAHUEY BIÑUELO
Es una web en donde se muestran varias direcciones de páginas que contienen el tema que se está buscando. Sus orígenes se remontan al año de 1994, cuando.
UD4 – 2ª Parte SEO y Comunicación Audiovisual Lluís Codina Área de Ciencias de la Documentación. Facultad de Comunicación. UPF 2015.
¿ QUÉ ES UN NAVEGADOR? Es un software que permite recorrer la internet, ver la información, y las distintas páginas que contiene. Posee una interfaz gráfica:
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
En Internet: Los datos se transforman en información cuando una persona los lee, los comprende y los usa con algún fin: para estudiar, para trabajar,
LOS BUSCADORES:. LOS BUSCADORES SON SISTEMAS INFORMÁTICOS QUE BUSCAN ARCHIVOS ALMACENADOS EN SERVIDORES WEB, GRACIAS A SU «SPIDER» (O WEB CRAWLER). UN.
YAHOO En 1995 los universitarios Jerry Yang y David Filo aceptan la propuesta de volver la red en un negocio. “Comprueban que se puede hacer dinero en.
Búsqueda de Información y localización de recursos
1.ª Parte: Dónde y cómo buscar información.  Cuando se busca información sobre un tema, es necesario emplear una «estrategia de búsqueda» para optimizar.
DHTIC Juan Esteban Hernández Pérez Estrategias de Búsqueda.
Nombre: ramirez morales alexis alberto Maestra: margarita romero alvarado Tema: buscadores Grupo: ‘’jm’’ Aula: 11.
Antonio de Jesús González Arce Matricula DHTIC.
Transcripción de la presentación:

Autores: Autores: Pedro Flores Pérez, José Figueroa, Caleb Lizárraga, Ernesto Brau, Adrian Lucero, Carlos David Briceño, Ivo Jimenez, Juan A. Raygoza y Fernando Razo.Pedro Flores Pérez, José Figueroa, Caleb Lizárraga, Ernesto Brau, Adrian Lucero, Carlos David Briceño, Ivo Jimenez, Juan A. Raygoza y Fernando Razo. Autores: Autores: Pedro Flores Pérez, José Figueroa, Caleb Lizárraga, Ernesto Brau, Adrian Lucero, Carlos David Briceño, Ivo Jimenez, Juan A. Raygoza y Fernando Razo.Pedro Flores Pérez, José Figueroa, Caleb Lizárraga, Ernesto Brau, Adrian Lucero, Carlos David Briceño, Ivo Jimenez, Juan A. Raygoza y Fernando Razo.

Qué es un motor de búsqueda? - Es un sistema de recuperación de información - Ejemplos: Google, Yahoo!

¿Para qué se utiliza? Buscar “algo” donde Páginas HTML documentos: *.doc, *.pdf “algo” imágenes otros, proporciona información, realizar cálculos, etc. Universo de Búsqueda Universo de Búsqueda

A futuro “algo” = Música, melodía, letra, video Ejemplo: ¿Silvar una canción?

¿Por qué estudiar Motores de Búsqueda? Porque es una de las areas de mayor desarrollo tecnológico y lo seguirá siendo durante los próximos años. Ejemplos:Buscador de Microsoft Buscador de Google para Documentos en PC. Investigación en Yahoo! y Altavista para desarrollar sus propios métodos de búsqueda. Nuevos esquemas de venta (E-Comerce) a través de la red de Internet.

Porque es una de las areas de mayor desarrollo en Investigación. El crecimiento exponencial de la información en la red plantea nuevos problemas en las areas de lingüística, matemáticas, Matemática Numérica, Bases de Datos, Inteligencia Artificial, etc

Desde el punto de vista académico, es toda una experiencia el investigar sobre este tema, ya que se aplican conocimientos de Bases de Datos, Estructuras de Datos, Redes (Clúster), Ingeniería del Software, Métodos Matemáticas, Teoría de Lenguajes, Compiladores, etc

¿Porqué hacer un motor de búsqueda? Porque es algo que esta al alcance de la mano, pero.... “es dificil..... dificil la primera vez....” Canción: “Difícil” Autor: Alex Lora y el Tri

Los principales motores de búsqueda en su primera versión fueron hecho por pocas personas. Google fue fundado en 1998 por Sergey Brin’s y Larry Page

Yahoo! se funda en 1994 por David Filo y Jerry Yang.

¿Qué estamos haciendo en el curso de Motores de Búsqueda? Desarrollando un motor de búsqueda original con las siguientes características: - Que no sea muy grande. - Que tenga un funcionamiento comparado con el de un motor de búsqueda como Google. - Que se monte sobre clusters y que sea escalable.

Otras actividades: - Revisión de materiales, artículos, libros, etc. - Escribiendo material. -Impartiendo este curso

Expositores del curso: Clusters y Bases de Datos. José Figueroa Martínez. Robots. Ernesto Brau y Caleb Lizárraga. Conversión a texto plano (Word) Adrian Lucero Compresión de Archivos. Carlos David Briceño. Un ejemplo con triadas. Ivo Jiménez Ramos y Juan Antonio Raygoza. Estructuras de Datos Fernando Razo Mendivil

Temario: -Principales aspectos de la recuperación de información. -Estructura de un motor de búsqueda. - Una introducción a las distintas partes de un motor de búsqueda.

Objetivo del curso: En 3 horas, dar una brevísima introducción a motores de búsqueda

Motor de búsqueda: Un sistema almacenamiento de datos (Bases de Datos), diseñado para indexar direcciones web.

¿Qué es Indexación? Análisis de documento para ver como está estructurado (título, autor, cuerpo), como se presenta la información más importante; tablas, gráficas, imágenes, etc. Esto nos lleva a establecer partes del documento que sean importantes.

Análisis por palabras de las secciones importantes, tratando de encontrar qué palabras o frases sean las que identificaran el documento estableciendo la mejor respresentación de los contenidos semánticos (significado del documento). Existen diversas formas de hacer el indexado, las más importantes son: latent semantic indexing (LSI) que trata de representar los documentos por su contenido a diferencia de la coincidencia de palabras.

El indexado puede ser totalmente manual como en yahoo! donde una persona decide la clasificación por categorías del documento. Semi automático: sería cuando alguien ayuda a un programa a establecer la indexación. Totalmente automática, donde un programa se encarga de todos los pasos de indexación, por ejemplo: Google

Representación vectorial de documentos: SMART (System for the Mechanical Análisys and Retrieval of Text) desarrollado por Gerald Selton fue el sistema básico para representar documentos.

Ejemplos: Documento 1 La Bamba Para bailar la bamba se necesita una poca de gracia y otra cosita......

Documento 2 Sin ti Sin ti, no podre vivir jamas y pensar que nunca mas estaras junto a mi Sin ti, que me puede ya importar, si lo que me hace soñar está lejos de mi

Documento 1#1854 R 1 La Bamba R 2 Para bailar la bamba R 3 Para bailar la bamba R 4 se necesita una R 5 poca de gracia y R 6 otra cosita......

Documento 1#1854 R 1 La Bamba R 2 Para bailar la bamba R 3 Para bailar la bamba R 4 se necesita una R 5 poca de gracia y R 6 otra cosita......

Documento 2# 7523 R 1 Sin ti R 2 Sin ti, no podre vivir jamas R 3 y pensar que nunca mas estaras R 4 junto a mi R 5 Sin ti, que me puede ya R 6 importar, si lo que me hace R 7 sonar está lejos de mi

Documento 2# 7523 R 1 Sin ti R 2 Sin ti, no podre vivir jamas R 3 y pensar que nunca mas estaras R 4 junto a mi R 5 Sin ti, que me puede ya R 6 importar, si lo que me hace R 7 soñar está lejos de mi

¿Qué palabras incluir? Hay una base de datos de los términos incluidos en todos los documentos. Google en 1998, tenía 14 millones de términos. Con esta base de datos se crea una estructura en memoria de tipo Arbol-B para procesar todas las palabras de los documentos.

Base de datos I

Lista invertida de términos: Base de datos II

Frecuencia de palabras en documentos Base de datos III

Procedimiento de consulta Suponiendo que queremos buscar en los documentos, los documentos con las palabras: Sin ti Se construye el vector W W = (0,..., 0, 1,1,0,.....,0) Sin ti Que tiene dos componentes iguales a 1 en los lugares de las palabras Sin y ti

Resultado: Si se tiene una consulta representada por W y un documento representado por U, entonces Si U.W = 0 El documento W no tiene ninguna de las palabras de la consulta W. Si U.W > 0 entonces el documento U tiene algunas palabras de la consulta W.

Una mejor aproximación es tener Cos  = U.W / || U || || W || Donde  es el ángulo entre U y V. SiCos  > 0.5 Diremos que U es una respuesta de la consulta W y si Cos  < 0.5 Entonces U no es una respuesta a la consulta W.

Se contruye una estructura de datos en memoria para calcular eficientemente los productos interiores de la consulta por los documentos y se eligen documentos que tengan las palabras de búsqueda.

Ranking de un documento De entre todos los documentos que tienen las palabras que se buscan, se presentan los que tengan ranking de mayor a menor. Google calcula el ranking de acuerdo a:

R(i)Ranking de la página i. N(i)Número de enlace salidas de i B(i)Número de enlaces entradas de i m Total de páginas en el sistema d factor que mide la longitud de la búsqueda

r(i) es la probabilidad de llegar a la página i a partir de otra d es una fecha que mide la longitud de la búsqueda. Se eligen los documentos de ranking más grande y a partir de W y las bases de datos I y II se construyen las respuestas.

Partes de un motor de búsqueda (con indexación automática) Robots: Encargada de traer las páginas, comprimirlas y guardarlas. Diccionario: Base de Datos con la información de todas las palabras a utilizar. Procesador de páginas: Revisa los documentos a partir del documento y los indexa.

Procesador de consultas: Dada una consulta construye los resultados. Sistema de Rankeo: Calcula la importancia de cada página.

Arquitectura de Google

Bibliografia S.Brin, L. Page. The anathomy of a large-scale hipertextual web search engine. 7th international world wide web conference.Brisbane, Australia, April Michael W. Berry, Murray Boune. Understanding search engines: mathematical modeling and text retrieval. SIAM press 1999.