La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Hola Bartolo: Soy Luis García Rodríguez, el que hacía el trabajo del Pagerank de google. Te mando el trabajo creo que más o menos listo, hay muchas cosas.

Presentaciones similares


Presentación del tema: "Hola Bartolo: Soy Luis García Rodríguez, el que hacía el trabajo del Pagerank de google. Te mando el trabajo creo que más o menos listo, hay muchas cosas."— Transcripción de la presentación:

1 Hola Bartolo: Soy Luis García Rodríguez, el que hacía el trabajo del Pagerank de google. Te mando el trabajo creo que más o menos listo, hay muchas cosas que se pueden poner, pero creo que hacen que se extienda demasiado y sea más aburrido.

2 PAGERANK de Sólo Google tiene almacenadas más de 8mil millones de páginas web y es poco comparado con las existentes en internet y no paran de crecer día a día. Buscar algo en la red se hace imposible si no fuera por los buscadores, pero ¿como sabe una máquina que páginas son más importantes, o quién debe aparecer como primer resultado? Larry Page y Sergey Brin (fundadores de Google) desarrollaron una solución, el ranking de Page ó PAGERANK

3 ¿Qué es y para qué sirve el PageRank? PageRank (PR) es un valor numérico que representa la importancia que una página web tiene en Internet. Google usa el pagerank para poner orden en internet. De esta manera cuando buscas algo, los resultados no se colocan al azar, sino de más a menos importante. Esto hace que la gente pierda menos tiempo y encuentre mejores resultados. ¿Alguien necesitó llegar a mirar la última pagina de resultados?

4 ¿Cómo funciona? El PR usa los links como votos. Cada voto tiene diferente peso en el cómputo total. El peso depende de los links que apuntan a la página que da el voto. Cuantos mas links más PR tiene la página y más peso tiene su voto. B alto PR C bajoPR A alto PR Links Voto con mucho peso PR(A) voto con poco peso PR(B)/7 El peso de cada voto se divide por el número de votos que da esa pagina.

5 Algoritmo simple Este podría ser uno de los algoritmos usados por google para calcular el PR. Incluye un factor dumping, que tiene en cuenta que todo navegante en algún momento deja de seguir enlaces. L=linksPR=pagerankq=dumping factor(0,85) 1-q= indica que la suma (normalizada) de todos los PR de la web deben ser 1.

6 Modelo actual

7 Principos de PR No importa con que número se empiece la estimación(vale incluso el 0), una vez comenzado el algoritmo la distribución de probabilidad normalizada sera 1. (ejemplo con 2 pag) Si una página es muy importante, lo mejor es establecer una estructura jeraráquica con la pagina principal en la cúspide.. Intentar abusar del algoritmo de PR es más difiicil de lo que crees. Una página bonita atrae a webmasters y links, con ello aumentas tu PR. El contenido es el rey, cuanto mas y mejor, más PR. todos los principios en:http://www.iprcom.com/papers/pagerank /

8 En la práctica Google usa un algoritmo bastante mas complicado. El PR representa la probabilidad que tiene un navegante de acabar en esa pagina siguiendo un link. Por tanto tiene en cuenta que una persona no hace infinitos clicks. Podriamos interpretar todo esto como una cadena de Markov en la que las páginas son estados y las transiciones son los links. En estas cadenas no hay memoria, cada suceso pasado no se tiene en cuenta para la decisión futura. Podríamos decir que es una persona con amnesia que olvida todo lo que le pasa y por tanto solo tiene en cuenta el presente. Puede pasar 30 veces por la misma calle o comer 8 veces al día.

9 El futuro Lo cierto es que el algoritmo para calcular el PR cambia continuamente para reparar los errores y para hacerlo cada vez mas fiable. Cada vez es más difícil engañarlo. Hoy en día, no solo tiene en cuenta los links, sino el contenido de la página y la calidad de este, clasificándolas en categorías. Hay opiniones para todo y algunos piensan que esta obsoleto, hace poco el fenómeno blog produjo un gran desajuste en los PR debido a los links que cada webmaster ponía en los libros de visitas de cientos de blogs.(Google ya a cambiado el codigo para evitar esto)

10 Luis García Rodríguez Webgrafia: original/ el ruido en google: actualizacion florida:


Descargar ppt "Hola Bartolo: Soy Luis García Rodríguez, el que hacía el trabajo del Pagerank de google. Te mando el trabajo creo que más o menos listo, hay muchas cosas."

Presentaciones similares


Anuncios Google