¿Qué tan relevante es un nodo de la red?

Slides:



Advertisements
Presentaciones similares
Centralidad ¿Qué tan relevante es un nodo de la red?
Advertisements

Conceptos Básicos. Grafo pesado Un grafo es… Un grafo G es un conjunto de nodos y enlaces grafo simple no-dirigido loop multi-enlace Grafo dirigido.
Ver VIDEO Aquí.
Cálculo II Profesor Ing. Gustavo Rocha Área entre dos Curvas Por Alan Reyes Vilchis Grupo 9 Abril 2005 Universidad Nacional Autónoma de México Facultad.
ESCUELA: NOMBRES: ÁLGEBRA FECHA: Ciencias de la Computación Ing. Ricardo Blacio ABRIL /AGOSTO
Conceptos Básicos 2. Caminos Dada una red, distintos tipos de flujo pueden ser de interés Imaginemos flujo de objetos (items indivisibles que están en.
Centralidad vs. Letalidad Centrality/Lethality rule  Jeong 2001 Nature, “Lethality and centrality in protein networks”  He 2006 PLOS Genetics Bio “Why.
 Para poder resolver una ecuación como ésta: x² = -4 No hay ningún número real que elevado al cuadrado nos pueda dar un resultado negativo. Ahora bien,
Tipos de funciones Marcela mayen#14 4b.
TRANSISTORES BIPOLARES
Funciones.
Funciones y gráficas ITZEL ALEJANDRA LOZOYARODRIGUEZ
Funciones y gráficas Daniel Ordoñez Aguirre Licenciatura EN DERECHO
Riesgos y seguridad en iNternet
BUAP-FCE-ISA : FÍSICA I
Potenciación Bibliografía: el mentor de matemática Grupo Océano
LÍMITES Y CONTINUIDAD IVºELECTIVO
DESIGUALDADES CON VALOR ABSOLUTO
Tarea II Matemáticas Francisco Raul Gandara Villaverde
Desigualdades.
Caminatas.
Los sistemas de información
Unidad 1 Capítulo VI Resolución por integración directa
ESTIMACION DEL TAMAÑO DE LA MUESTRA.
Sistema Distribuido para entidad bancaria
CAPÍTULO 9: DETECCIÓN DE LÍNEAS
Modelado de Sistemas Eloy Edmundo Rodríguez Vázquez
Geometría Analítica.
VECTORES Juan Daniel Fregoso Rubio B.
ESTADÍSTICA UNIDIMENSIONAL
Ecuaciones de segundo grado
NOTAS TECNICAS 1 METODO DE NEWTON-RAPHSON
El problema siguiente se presenta en varias áreas de la ciencia
2.1 POTENCIAS Y RADICALES.
REGRESIÓN LINEAL SIMPLE
METODO DE TRANSPORTE APROXIMACION DE VOGEL
PROGRAMACION LINEAL UNIVERSIDAD LIBRE 2016
Simulador modular secuencial basado en ecuaciones
CAPACIDAD DE DETECCION Y CORRECCION DE ERRORES
Tema 2. Ecuaciones y sistemas. Inecuaciones
CONCEPTOS MATEMATICOS BASICOS I
FunciÓn PotenciaL, exponencial y logarÍtmica.
Sucesiones.
Sistemas Numéricos 1. Introducción 2. Sistema de Numeración Decimal
Servicios de Seguridad Informática
5. Optimización de redes. Integrantes: * Christian Cota * Cesar Rojo
Estructuras de Datos MC Beatriz Beltrán Martínez Primavera 2018
DEL MANIPULADOR: PARTE 1 Roger Miranda Colorado
COLEGIO NACIONAL LOPERENA Germán Isaac Sosa Montenegro
Eslared 2006 Seguridad Informática
CINEMÁTICA DEL SÓLIDO RÍGIDO.
Quadratic Assignment Problem
Compendio por Eugenio Skerrett
Momento cuadrupolar eléctrico
2. La probabilidad de encontrar una partícula con función de onda  en
ECUACIONES DIFERENCIALES PROBLEMA DE VALORES EN LA FRONTERA
Aidan Hogan Gestión de Datos (Masivos) Diplomado de Datos 2017 Clase 6: Recuperación de Información (II) Aidan Hogan
DEPARTAMENTO DE MATEMÁTICAS
2/22/2019 SISTEMAS NO LINEALES.
Tiro Parabólico Supongamos que se dispara un proyectil, con velocidad inicial v0, desde una altura h, formando un ángulo  con la horizontal. Se pretende.
2/23/2019 TRAZADOR CUBICO SPLINE.
CAPACIDAD DE DETECCION Y CORRECCION DE ERRORES
Concepto de Campo Un campo es toda magnitud física definida en una cierta región del espacio y para un cierto intervalo temporal. El concepto de campo.
TEMARIO DEFINICIÓN ………………………………………………………..………..
Análisis de error en estado estacionario
CINEMÁTICA Movimiento Rectilíneo Uniforme (MRU)
Interferencia.
ANALISIS DE REGRESION SIMPLE
Grafos. Concepto: Un Grafo no es más que un conjunto de nodos o vértices que se encuentran relacionados con unas aristas. Además, los vértices tienen.
REGRESION LINEAL SIMPLE
Transcripción de la presentación:

¿Qué tan relevante es un nodo de la red? Centralidad ¿Qué tan relevante es un nodo de la red? Ver Vermont + Newmann: degree eigenvalue, katz, pagerank closeness betweenness

Topológia y rol biológico Redes Complejas Biologia Degree Eccentricity Closeness Betweenness Bridging centrality Eigenvalue centrality Random walk centralities …. Essentiality Phenotypic variability Biological function Cancer related Disease Related … Protein-protein interaction in yeast S. cerevisiae, (N=1870 and L=2240). Jeong et al., Nature, 411, 41 (2001).

Propiedades topológicas: entorno local/global Propiedades Locales Propiedades Globales grado coef. Clustering centralidad ‘random walk’ … betweenness centralidad de autovalores adyacencia cercania grado c.clustering betweenness 𝑏𝑒(𝑣)= 𝑠≠𝑡≠𝑣 𝜎 𝑠,𝑡 𝑠ℎ𝑜𝑟𝑡𝑒𝑠𝑡−𝑝𝑎𝑡ℎ (𝑣) 𝜎 𝑠,𝑡 𝑠ℎ𝑜𝑟𝑡𝑒𝑠𝑡−𝑝𝑎𝑡ℎ 1

Que significa ser importante? Noción de flujo sobre la red Noción de coesividad sobre la red Dime qué modelas con tu red y te diré qué es ser importante

Centralidad Dime qué modelas con tu red y te diré qué es ser importante Noción de flujo sobre la red Noción de coesividad sobre la red intermediatez cercanía autovalor grado centralidad armónica centralidad de Katz

Centralidad y flujos Dime qué modelas con tu red y te diré qué significa ser importante Flujo de items indivisibles que están en un único lugar a un dado tiempo. Su difusión es por transferencia. Puede haber casos en que: Billetes, libros: se mueven por el grafo sin restricciones acerca de repetir enlaces o nodos ya visitados (i.e. walks) Ropa usada, re-gifting: se mueven por el grafo sin repetir enlaces (i.e trails) correo, gps: se mueven por el grafo desde un nodo origen hacia uno destino minimizando distancia recorrida (i.e. geodésicas). Flujo de entidades que pueden estar en varios lugares a la vez. Difusión por replicación. Chismes: Transmisión boca-a-boca, en general no repite enlaces, pero si vértices (i.e. trails) Campaña mailing: Transmisión por emisora (broadcasting), suele ser simultánea. Ideas, creencias, modas, actitudes: influencia que se transmite boca-a-boca por replicación. Puede repetir enlaces (i.e. walks) Procesos infecciosos, con inmunidad. Procede por replicación, pero sin revisitar vértices (i.e. paths). conceptos importantes

Centralidad de grado Utiliza directamente el grado de un nodo como medida de su importancia 𝐶𝑒𝑛𝑡(𝑛 𝑖 )= 𝑘 𝑖 En términos de flujo: caracteriza efectos de influencia inmediata. razonable por ejemplo para aplicar en procesos de duplicación paralela (prob de recibir algo que esta distribuido aleatoriamente por la red es proporcional al nro de contactos) o de caminatas al azar. En términos de cohesividad: Hubs proveen atajos entre pares de nodos Asume linealidad: un nodo con el doble de vecinos que otro es dos veces mas importante Sólo utiliza información local

Centralidad de cercanía Asume que los nodos mas importantes son aquellos que pueden alcanzar fácilmente a más vecinos (están cerca de todos) 𝐶𝑙𝑜𝑠𝑒𝑛𝑒𝑠𝑠 𝐶𝑒𝑛𝑡𝑟𝑎𝑙𝑖𝑡𝑦(𝑛 𝑖 )= 𝑗≠𝑖 𝑑𝑔𝑒𝑜𝑑( 𝑛 𝑖 , 𝑛 𝑗 ) 𝑁−1 −1 0 ≤ ClosensessCentrality ≤ 1 (sin vecinos) (vecino de todos) nodos que en promedio reciben flujo transmitido por la red rápidamente: red de flujo de información: ubicaciones ventajosas red de contactos sexuales : ubicaciones riesgosas en gral para flujos a lo largo de geodésicas o por duplicación en paralelo no seria un buen indice para identificar, por ejemplo, quién recibirá info antes si el proceso de transmisión es tipo rumor (no va por caminos mas cortos) Aunque induce un ordenamiento de nodos, para valores intermedios no queda claro que representa el valor obtenido De hecho tiene un rango dinamico muy acotado. Las distancias geodesicas suelen ser distancias chicas, o(ln

Centralidad de cercanía Asume que los nodos mas importantes son aquellos que pueden alcanzar fácilmente a más vecinos (están cerca de todos) 𝐶𝑙𝑜𝑠𝑒𝑛𝑒𝑠𝑠 𝐶𝑒𝑛𝑡𝑟𝑎𝑙𝑖𝑡𝑦(𝑛 𝑖 )= 𝑗≠𝑖 𝑑𝑔𝑒𝑜𝑑( 𝑛 𝑖 , 𝑛 𝑗 ) 𝑁−1 −1 0 ≤ ClosensessCentrality ≤ 1 (sin vecinos) (vecino de todos) En general tiene un rango dinamico chico (distancias geodésicas son chicas 1< dgeod< o(log N) ) No está bien definido para redes con más de una componente. Aún si calcularamos cada componente por separado no es trivial dar un ordenamiento global (centralidad en componentes más chicas tiende a ser mayor) 𝐻𝑎𝑟𝑚𝑜𝑛𝑖𝑐 𝐶𝑙𝑜𝑠𝑒𝑛𝑒𝑠𝑠 𝐶𝑒𝑛𝑡𝑟𝑎𝑙𝑖𝑡𝑦(𝑛 𝑖 )= 1 𝑁−1 𝑗≠𝑖 1 𝑑𝑔𝑒𝑜𝑑( 𝑛 𝑖 , 𝑛 𝑗 ) Bien definido aún para redes con más de una componente. Se le da más peso a entorno local

Centralidad de intermediatez (betweenness) Si hay un intercambio global de mensajes entre todos los pares de nodos de la red y si la información se intecambia por geodésicas: el nodo por el que pasarán más mensajes es aquél por el que pasan la mayor cantidad de geodésicas de la red. 𝑏𝑒𝑡 𝑛 𝑖 = 𝑟,𝑠 𝑥 𝑖 𝑟𝑠 𝑥 𝑟𝑠 nro de geodésicas entre r y s que pasan por i nro de geodésicas entre r y s bet_min: participa en todos los caminos (rs + sr) que lo tienen como extremo (ii lo cuento una vez) bet_max: todos los caminos n**2 menos los loops de la periferia

Centralidad de intermediatez (betweenness) Si hay un intercambio global de mensajes entre todos los pares de nodos de la red y si la información se intecambia por geodésicas: el nodo por el que pasarán más mensajes es aquél por el que pasan la mayor cantidad de geodésicas de la red. 𝑏𝑒𝑡 𝑛 𝑖 = 𝑟,𝑠 𝑥 𝑖 𝑟𝑠 𝑥 𝑟𝑠 nro de geodésicas entre r y s que pasan por i nro de geodésicas entre r y s bet_min: participa en todos los caminos (rs + sr) que lo tienen como extremo (ii lo cuento una vez) bet_max: todos los caminos n**2 menos los loops de la periferia 𝑏𝑒𝑡𝑚𝑖𝑛=2𝑛−1 Participa en las geodesicas (ida y vuelta) del azul con el resto 2(n-1) mas la del azul consigo mismo. 𝑏𝑒𝑡𝑚𝑎𝑥= 𝑛 2 −(𝑛−1) Participa en la geodesica de todos los pares menos en la de los n-1 perifericos consigo mismos

Centralidad de intermediatez (betweenness) Si hay un intercambio global de mensajes entre todos los pares de nodos de la red y si la información se intecambia por geodésicas: el nodo por el que pasarán más mensajes es aquél por el que pasan la mayor cantidad de geodésicas de la red. 𝑏𝑒𝑡 𝑛 𝑖 = 𝑟,𝑠 𝑥 𝑖 𝑟𝑠 𝑥 𝑟𝑠 nro de geodésicas entre r y s que pasan por i nro de geodésicas entre r y s bet_min: participa en todos los caminos (rs + sr) que lo tienen como extremo (ii lo cuento una vez) bet_max: todos los caminos n**2 menos los loops de la periferia 𝑏𝑒𝑡𝑚𝑖𝑛=2𝑛−1 𝑏𝑒𝑡𝑚𝑎𝑥 𝑏𝑒𝑡𝑚𝑖𝑛 ~ 1 2 𝑛 (amplio rango dinámico) 𝑏𝑒𝑡𝑚𝑎𝑥= 𝑛 2 −(𝑛−1) Es una medida global Es una medida de intermediatez más que de conectividad

Centralidad de autovalor Nodos importantes tienen vecinos importantes xi (importancia de nodo-i) depende de xj (importancia de nodo-j vecino). La importancia se transmite por la red. la manera más simple es asumir linealidad 𝑥 𝑖 ´= 𝑗=1 𝑁 𝑎 𝑖𝑗 𝑥 𝑗 𝒙´=𝑨𝒙 el nivel de importancia se establece recursivamente en la red 𝒙´´=𝑨𝒙´=𝑨𝑨𝒙 𝒙(𝑠)= 𝑨𝑨….𝑨 𝒔 𝒙(0) 𝒙(𝑠)= 𝑨 𝒔 𝒙(0) . Despues de s iteraciones:

Centralidad de autovalor Nodos importantes tienen vecinos importantes xi (importancia de nodo-i) depende de xj (importancia de nodo-j vecino). La importancia se transmite por la red. la manera más simple es asumir linealidad 𝑥 𝑖 ´= 𝑗=1 𝑁 𝑎 𝑖𝑗 𝑥 𝑗 𝒙´=𝑨𝒙 el nivel de importancia se establece recursivamente en la red 𝒙´´=𝑨𝒙´=𝑨𝑨𝒙 𝒙(𝑠)= 𝑨𝑨….𝑨 𝒔 𝒙(0) 𝒙(𝑠)= 𝑨 𝒔 𝒙(0) . Despues de s iteraciones: x solución autoconsitente 𝒙= 𝑨 𝒔 𝒙 s>>1 x es un autovector de A

Centralidad de autovalor 𝒙(𝒔)= 𝑨 𝒔 𝒙(𝟎) Busco x solución autoconsitente Si inicialmente arranco de un autovector: x(0)=vk 𝒙 𝑠 = 𝑨𝑨….𝑨 𝒔−𝟏 𝑨 𝒗 𝑘 = 𝜆 𝑘 𝑨𝑨….𝑨 𝒔−𝟏 𝒗 𝒌 𝑨𝒙=𝜆𝒙 𝑨 𝟐 𝒙= 𝜆 𝟐 𝒙 𝒙 𝑨 𝟑 𝒙= 𝜆 𝟑 𝒙 si x inicial fuera justo un autovector, por ejemplo vk , de la matriz de adyacencia A 𝒙(𝑠)= 𝜆 𝑘 𝑠 𝒗 𝑘 Por lo que la importancia relativa de cada nodo se podría inferir de las componentes de vk

Centralidad de autovalor 𝒙(𝑠)= 𝑨 𝒔 𝒙(0) 𝑨𝒙=𝜆𝒙 𝑨 𝟐 𝒙= 𝜆 𝟐 𝒙 𝒙 𝑨 𝟑 𝒙= 𝜆 𝟑 𝒙 si x inicial fuera justo un autovector, por ejemplo vk , de la matriz de adyacencia A En el caso general x(0) no coincide con una dirección privilegiada asociada con A …. 𝑨𝒙 𝑨 𝟐 𝒙 𝒙 𝑨 𝟑 𝒙

Centralidad de autovalor 𝑨𝒙 𝑨 𝟐 𝒙 𝒙 𝑨 𝟑 𝒙 𝒙(𝑠)= 𝑨 𝒔 𝒙(0) Para ver como una matriz transforma vectores es útil pensar en término de sus autovectores vi (se transforman muy fácil: A vi=λi vi). El vector x(0) puede ser escrito como combinación lineal de los {vi} 𝒙 0 = 𝑐 1 𝒗 1 + 𝑐 2 𝒗 2 +…= 𝒊 𝑐 𝑖 𝒗 𝒊 𝑨 𝒔 𝒙(𝟎)= 𝒊 𝑐 𝑖 𝑨 𝒔 𝒗 𝒊 = 𝒊 𝑐 𝑖 𝜆 𝑖 𝑠 𝒗 𝒊 = 𝜆 ∗ 𝑠 𝒊 𝑐 𝑖 𝜆 𝑖 𝜆 ∗ 𝑠 𝒗 𝒊 mayor autovalor 𝒙 𝑠 = 𝜆 ∗ 𝑠 𝒊 𝑐 𝑖 𝜆 𝑖 𝜆 ∗ 𝑠 𝒗 𝒊 <1 𝑨𝒙= 𝜆 ∗ 𝒙 encontrar x autoconsistente se reduce a encontrar el autovector de A asociado al mayor autovalor 𝒙 𝑠 ~ 𝜆 ∗ 𝑠 𝑐 𝑖 𝒗 ∗ 𝑠→∞

Centralidad de autovalor 𝑨 𝒙 ∗ = 𝜆 ∗ 𝒙 ∗ x se conoce como centralidad de Bonacich La centralidad de un nodo depende de la de sus vecinos. 𝑥 𝑖 ∗ = 1 𝜆 ∗ 𝑖 𝐴 𝑖𝑗 𝑥 𝑗 ∗ Es x* una buena centralidad? Quien me asegura que sus componentes sean todas positivas, por ejemplo? Teorema de Perron-Frobenius Sea A una matriz de N x N con elementos no negativos. Entonces: A tiene un autovalor real dominante: 𝜆 1 > 𝜆 𝑖 para 𝑖=2,…,𝑁 λ1 corresponde a un autovalor para el que se puede elegir un autovector cuyas componentes son no-negativas Además vale que λ1 está acotado por la mínima y máxima suma por columna de A 𝑚𝑖𝑛 𝑗 𝑖=1 𝑁 𝑎 𝑖𝑗 ≤ 𝜆 1 ≤ 𝑚𝑎𝑥 𝑗 𝑖=1 𝑁 𝑎 𝑖𝑗

Centralidad de autovalor 𝑨 𝒙 ∗ = 𝜆 ∗ 𝒙 ∗ x se conoce como centralidad de Bonacich La centralidad de un nodo depende de la de sus vecinos. 𝑥 𝑖 ∗ = 1 𝜆 ∗ 𝑖 𝐴 𝑖𝑗 𝑥 𝑗 ∗ Para redes dirigidas (A matriz no simétrica) se usa la misma definición de centralidad. Esto equivale a considerar el autovector-por-derecha de mayor autovalor. Sin embargo puede haber problemas: C D E xA no tiene vecinos, entonces xA=0 pero también xB=0, xC=0, xD=0, xE=0 paginas web de much in degree que no esten en una componente fuertemente conexa pueden de todas formas ser interesantes! Sólo nodos de una componente fuertemente conexa de dos o más vértices (o la out-component de dicha componente) pueden tener centralidad de Bonacich no nula. Potencial problema (!)

Centralidad de Katz 𝒙= (𝑰−𝛼𝑨) −1 𝛽𝟏 centralidad de base. Gran diferencia para nodos con kin=0 𝑥 𝑖 =𝛼 𝑗 𝐴 𝑖𝑗 𝑥 𝑗 +𝛽 𝒙=𝛼𝑨𝒙+𝛽𝟏 Matricialmente 𝒙−𝛼𝑨𝒙=𝛽𝟏 (𝑰−𝛼𝑨)𝒙=𝛽𝟏 𝒙= (𝑰−𝛼𝑨) −1 𝛽𝟏 ahora todos los que reciban edges van a recibir porotos, aunque los que los reciban de nodos importantes recibiran mas Usualmente se toma β=1 y se debe especificar α, que controla la importancia relativa del primer término respecto del segundo

Centralidad de Katz 𝑥 𝑖 =𝛼 𝑗 𝐴 𝑖𝑗 𝑥 𝑗 +1 𝒙= (𝑰−𝛼𝑨) −1 𝟏 𝑥 𝑖 =𝛼 𝑗 𝐴 𝑖𝑗 𝑥 𝑗 +1 𝒙= (𝑰−𝛼𝑨) −1 𝟏 Se debe especificar α , como lo elijo? α =0 resulta en distribución uniforme de centralidad α>0 le doy más peso al primer término PERO OJO: para algún α > 0 la matriz I- α A puede no ser inversible. Esto sucede cuando 𝑑𝑒𝑡 𝑰−𝛼𝑨 =0 , o lo que es lo mismo, cuando: 𝑑𝑒𝑡 𝑨− 𝛼 −1 𝑰 =0 La condición para identificar α problematicos asociada a la ecuación de autovalores para A (!) Para α creciente el primer problema lo encuentro cuando α-1= λ* 0 < α < 1/λ* Por lo tanto, se suele elegir α en el rango

Centralidad de Katz 𝑥 𝑖 (𝑡+1) =𝛼 𝑗 𝐴 𝑖𝑗 𝑥 𝑗 (𝑡) +𝛽 𝒙= (𝑰−𝛼𝑨) −1 𝛽𝟏 Estimación de centralidad Algebraica: Iterando: 𝑥 𝑖 (𝑡+1) =𝛼 𝑗 𝐴 𝑖𝑗 𝑥 𝑗 (𝑡) +𝛽 𝒙= (𝑰−𝛼𝑨) −1 𝛽𝟏 Costo computacional o(n3) o(M.r) M:#enlaces, i.e. items no nulos de A r: #iteraciones

Centralidad de Katz generalizada Asignamos una relevancia-a-priori, que puede ser diferente para cada nodo, utilizando información externa a la red 𝜷=( 𝛽 1 , 𝛽 2 ,…, 𝛽 𝑁 ) 𝑥 𝑖 (𝑡+1) =𝛼 𝑗 𝐴 𝑖𝑗 𝑥 𝑗 (𝑡) + 𝛽 𝑖 𝒙= (𝑰−𝛼𝑨) −1 𝜷

Centralidad PageRank 𝑥 𝑖 (𝑡+1) =𝛼 𝑗 𝐴 𝑖𝑗 𝑥 𝑗 (𝑡) + 𝛽 𝑖 Katz generalizado: 𝑥 𝑖 (𝑡+1) =𝛼 𝑗 𝐴 𝑖𝑗 𝑥 𝑗 (𝑡) + 𝛽 𝑖 Un posible problema: nodos con alta centralidad distribuyen ese valor (alto) a todos sus contactos kout. Quizas no sea eso lo que uno quiere. 𝑥 𝑖 (𝑡+1) =𝛼 𝑗 1 𝑘 𝑗 𝑜𝑢𝑡 𝐴 𝑖𝑗 𝑥 𝑗 (𝑡) + 𝛽 𝑖 ‘diluye’ la contribución del nodo-j ej. si yahoo

Centralidad PageRank 𝒙=𝛼𝑨 𝑫 −𝟏 𝒙+𝜷 𝒙=𝑫 𝑫−𝛼𝑨 −𝟏 𝜷 𝑥 𝑖 (𝑡+1) =𝛼 𝑗 1 𝑘 𝑗 𝑜𝑢𝑡 𝐴 𝑖𝑗 𝑥 𝑗 (𝑡) + 𝛽 𝑖 𝒙=𝛼𝑨 𝑫 −𝟏 𝒙+𝜷 𝑫 −𝟏 𝑖𝑖 =1/ 𝑘 𝑖 𝑜𝑢𝑡 𝑰−𝛼𝑨 𝑫 −𝟏 𝒙=𝜷 𝒙= (𝑰−𝛼𝑨 𝑫 −𝟏 ) −𝟏 𝜷 para redes no dirigidas se puede demostrar (practica) que autovalor dominante de AD-1 es 1, con autovector (k1,k2,…,kn) para redes dirigidas no. pero parece que es o(1) = (𝑫 𝑫 −𝟏 −𝛼𝑨 𝑫 −𝟏 ) −𝟏 𝜷 = 𝑫−𝛼𝑨 𝑫 −𝟏 −𝟏 𝜷 𝒙=𝑫 𝑫−𝛼𝑨 −𝟏 𝜷 razonando como antes α < λdominante de 𝑨 𝑫 −𝟏 . igual….se suele usar α=0.85

Centralidad PageRank sin bias 𝑥 𝑖 (𝑡+1) =𝛼 𝑗 1 𝑘 𝑗 𝑜𝑢𝑡 𝐴 𝑖𝑗 𝑥 𝑗 (𝑡) + 𝛽 𝑖 𝒙=𝑨 𝑫 −𝟏 𝒙 𝑫 −𝟏 𝑖𝑖 =1/ 𝑘 𝑖 𝑜𝑢𝑡 Estoy buscando el autovector de 𝑨 𝑫 −𝟏 asociado a λ=1 Para redes no-dirigidas es fácil ver que xj=kj es la solución autoconsistente buscada. O sea PageRank sin bias equivale a centralidad de grado.

Centralidades de recurrencia (resumen) 𝑥 𝑖 (𝑡+1) =𝛼 𝑗 1 𝑘 𝑗 𝑜𝑢𝑡 𝐴 𝑖𝑗 𝑥 𝑗 (𝑡) + 𝛽 𝑖 𝑥 𝑖 (𝑡+1) = 𝑗 1 𝑘 𝑗 𝑜𝑢𝑡 𝐴 𝑖𝑗 𝑥 𝑗 (𝑡) 𝒙=𝑫 𝑫−𝛼𝑨 −𝟏 𝜷 𝒙=𝑨 𝑫 −𝟏 𝒙 PageRank centrality Degree centrality ej. si yahoo 𝑥 𝑖 (𝑡+1) =𝛼 𝑗 𝐴 𝑖𝑗 𝑥 𝑗 (𝑡) + 𝛽 𝑖 𝑥 𝑖 (𝑡+1) = 𝑗 𝐴 𝑖𝑗 𝑥 𝑗 (𝑡) 𝒙= 𝑰−𝛼𝑨 −𝟏 𝜷 𝒙= λ ∗ −𝟏 𝑨𝒙 Katz centrality Eigenvector (Bonacich) centrality

Conectores (hubs) y Autoridades Hasta ahora, en redes dirigidas, los algoritmos que vimos asignaban más nivel de centralidad a aquellos nodos que recibían muchas conecciones Puede ser de interés, sin embargo, identificar nodos que actúen como buenos reviews. Implica idea de centralidad asociada con kout hacia nodos relevantes (e.g. página con links hacia otras páginas relevantes) Idea [Kleinberg, Authoritative Sources in a Hyperlinked Environment, 1999 10122 citas)]: Generalizar la centralidad de Bonacich y permitir que cada nodo tenga dos atributos Autoridad: que tanto conocimiento, información, etc, tiene un nodo respecto a un tema Conectividad: que tanto un nodo es capaz de encontrar información sobre un tema En este esquema: Los nodos son caracterizados simultaneamente como conectores y autoridades Los mejores conectores apuntan a las mejores autoridades Algoritmo HITS (Hyperlink-induced topic search)

Conectores (hubs) y Autoridades Para un nodo, dos centralidades: xi (autoridad), yi (conector) 𝑥 𝑖 =𝛼 𝑗 𝐴 𝑖𝑗 𝑦 𝑗 𝒙=𝛼𝑨𝒚 𝑦 𝑖 =𝛽 𝑗 𝐴 𝑗𝑖 𝑥 𝑗 𝒚=𝛽 𝑨 𝑻 𝒙 𝒙=(𝛼𝛽)𝑨 𝑨 𝑻 𝒙 𝒚= 𝛼𝛽 𝑨 𝑻 𝑨 𝒚 pero entonces recordar que AA^T es la matriz de co-citas => centralidad de autoridad tiene que ver con centralidad de autovector de la red de co-citas 𝑨 𝑨 𝑻 𝒙=𝜆 𝒙 𝑨 𝑻 𝑨𝒚=𝜆 𝒚 con λ=α𝛽 fijarse ademas que: AAT es la matriz de co-citas, por lo que la centralidad de autoridad puede verse como centralidad de autovector de la red de co-citas ATA es la matriz bibliográfica, por lo que la centralidad de conectividad puede verse como centralidad de autovector de la red bibliográfica

Conectores (hubs) y Autoridades Para un nodo, dos centralidades: xi (autoridad), yi (conector) 𝑥 𝑖 =𝛼 𝑗 𝐴 𝑖𝑗 𝑦 𝑗 𝒙=𝛼𝑨𝒚 𝑦 𝑖 =𝛽 𝑗 𝐴 𝑗𝑖 𝑥 𝑗 𝒚=𝛽 𝑨 𝑻 𝒙 𝒙=(𝛼𝛽)𝑨 𝑨 𝑻 𝒙 𝒚= 𝛼𝛽 𝑨 𝑻 𝑨 𝒚 pero entonces 𝑨 𝑨 𝑻 𝒙=𝜆 𝒙 𝑨 𝑻 𝑨𝒚=𝜆 𝒚 con λ=α𝛽 fijarse ademas que: 𝑨 𝑻 (𝑨 𝑨 𝑻 𝒙)=𝜆 𝑨 𝑻 𝒙 𝑨 𝑻 𝑨 𝑨 𝑻 𝒙 =𝜆( 𝑨 𝑻 𝒙) 𝒚=( 𝑨 𝑻 𝒙) por lo que o sea, basta con resolver la ecuacion de autovalores de ATA

Conectores (hubs) y Autoridades Para un nodo, dos centralidades: xi (autoridad), yi (conector) 𝑥 𝑖 =𝛼 𝑗 𝐴 𝑖𝑗 𝑦 𝑗 𝒙=𝛼𝑨𝒚 𝑦 𝑖 =𝛽 𝑗 𝐴 𝑗𝑖 𝑥 𝑗 𝒚=𝛽 𝑨 𝑻 𝒙 𝒙=(𝛼𝛽)𝑨 𝑨 𝑻 𝒙 𝒚= 𝛼𝛽 𝑨 𝑻 𝑨 𝒚 pero entonces Esta generalizacion admite modificaciones como las que vimos: un termino aditivo, dividir por el grado, etc… 𝑨 𝑨 𝑻 𝒙=𝜆 𝒙 𝑨 𝑻 𝑨𝒚=𝜆 𝒚 con λ=α𝛽 AAT es una matriz simétrica, semi-definida positiva, por lo que sus autovalores son mayores que cero. De hecho, sus autovalores son los valores-singulares de A elevados al cuadrado Perron-Frobenius: el autovector del autovalor dominante tiene componentes no-negativas