La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A.

Presentaciones similares


Presentación del tema: "Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A."— Transcripción de la presentación:

1 Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A

2 1. Introducción Google es el motor de búsqueda más utilizado en el mundo, y ya su nombre se suele asociar con internet. La razón de que sea tan famoso es su algoritmo de clasificación: el PageRank, que ordena las páginas para hacer la búsqueda más efectiva. ¿Cómo funciona el algoritmo PageRank?

3 En este caso: B-A-C-E-D
Después de 32 links las probabilidades de estar en una determinada página se han estabilizado y resultan: La probabilidad estabilizada de estar en una u otra página tras un elevado nº de enlaces nos mide su importancia. En este caso: B-A-C-E-D

4 Significado de P2

5 Ejemplo práctico: En nuestro ejemplo, hemos usado una web hipotética con 5 páginas (Wikipedia, Desmotivaciones, Youtube, Facebook y la página web del instituto) Agrupamos los datos en esta tabla: Lo transformamos en una matriz A, sumamos sus columnas y dividimos cada término por la suma de la columna donde este, obteniendo A’: W D Y F I Wikipedia 1 Desmotivaciones Youtube Facebook IES. Sta. Mª Alarcos Youtube tiene enlaces (links) a wikipedia: ponemos un 1 Wikipedia no tiene enlaces a Desmotivaciones: ponemos un 0 También ponemos 0 en las celdas donde coincida la misma página Rellenamos el resto de la tabla:

6 Matriz T de probabilidades de transición de una web a otra
1 1 1 1/3 1/4 1/2 1 1/4 1 1 1 1/2 1/4 1/2 1 1 1 1/2 1 1/3 1 1 1/3 1/4 Total links 2 1 3 4 2 Matriz T de probabilidades de transición de una web a otra Tras muchos links (50) las probabilidades ya se estabilizan y resultan: Luego el orden de “importancia” será: Facebook-Youtube-Wikipedia-Alarcos-Desmotivaciones

7 d>c>a>e>b
El procedimiento que seguimos para localizar el vector “v” de probabilidades estables sin tener que calcular potencias, consiste en resolver la ecuación matricial: T·v=v. Es decir: T·v-I·v=(T-I)·v=0 a= Wikipedia b= Desmotivaciones c= Youtube d= Facebook e= IES Sta. Mª Alarcos d>c>a>e>b

8 Notas: Al hacer la potencia 50 ya aparecía este mismo orden. Además si en la solución paramétrica anterior tomamos “e= ” (valor que obtuvimos en P50 para 2e”) obtenemos el resto de valores: Este ejemplo solo tenía 5 páginas que no tienen casi relación, pero Google trabaja con millones, y en una búsqueda ordena esas páginas en función de la cantidad y calidad de enlaces que llegan a ellas.

9


Descargar ppt "Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A."

Presentaciones similares


Anuncios Google