Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Caminatas
2
Caminos Dada una red, distintos tipos de flujo pueden ser de interés
Imaginemos flujo de objetos (items indivisibles que están en un único lugar a un dado tiempo). Su difusión es por transferencia. Puede haber casos en que: se mueven por el grafo sin restricciones acerca de repetir enlaces o nodos ya visitados (e.g. billetes, libros, …). se mueven por el grafo sin repetir enlaces (i.e. ropa usada, re-gifting) Correo: se mueven por el grafo desde un nodo origen hacia uno destino minimizando distancia recorrida. entonces tiene sentido reconocer diferente tipo de trayectorias en un grafo
3
Caminos camino (walk): secuencia de vertices tales que vértices consecutivos están conectados (en grafos dirigidos la secuencia debe respetar las orientaciones de los enlaces) sendero (trail): es un camino que no repite enlaces camino simple (path):es un camino que no repite vértices ciclo: camino de más de dos vértices que no repite elementos, salvo el primero y último longitud de un camino C: número de pasos que contiene desde su comienzo hasta su final (Para redes pesadas, longitud asociado a un camino: suma de los pesos de los enlaces involucrados) camino geodésico : camino de menor longitud que une un par dado de vértices. cwalk={A,B,D,B,C} ctrail={A,B,D,C,B} cpath={A,B,C} cciclo={B,C,D,B} Sin importar el escenario de aplicacion un concepto que suele aparecer es el de establecer distancias y caminos entre elementos del grafo…
4
Longitud de caminos Buscando a lo ancho…Breath-First Search
Empezar en nodo i, etiquetarlo como ´0´ Encontrar sus primeros vecinos, etiquetarlos como ´1´ y ponerlos en espera (en cola de procesamiento) Tomar el primer nodo de etiqueta ´e´ de la cola (e=1, la primera vez). Encontrar sus nodos adyacentes sin etiqueta Etiquetarlos como e+1 y ponerlos en la cola de procesamiento Repetir III hasta encontrar el nodo j buscado, o que no queden mas nodos en la cola. La distancia entre i y j es la etiqueta de j. Si no tiene ninguna 𝑑 𝑖𝑗 =∞
5
Caminos Cuántos caminos de una dada longitud λ existen en una red?
𝐴 𝑖𝑗 ≠0 sii existe un enlace que vaya de nodo-j hacia nodo-i 𝐴 𝑖𝑘 𝐴 𝑘𝑗 ≠0 sii existe un camino de nodo-j hacia nodo-i, pasando por nodo-k 𝐴 𝑖𝑘 𝐴 𝑘𝑙 𝐴 𝑙𝑗 ≠0 sii existe un camino de nodo-j hacia nodo-i, pasando por nodo-k y nodo-l 𝑁𝐶 (2) 𝑖𝑗 = 𝑘=1 𝑁 𝐴 𝑖𝑘 𝐴 𝑘𝑗 = 𝑨 2 𝑖𝑗 ojo. que la estimacion de NC(lambda) cuenta sumando lazos de todos los nodos -> repite caminos es decir cuenta como lazos diferntes el 1,2,3,1 el 2,3,1,2 etc 3,1,2,3 se puede pensar que hay que dividir por r, pero eso noarregla subloops que puedan existir (note 22 p137) 𝑁𝐶 (𝜆) 𝑖𝑗 = 𝑘,𝑙,…,𝑠=1 𝑁 𝐴 𝑖𝑘 𝐴 𝑘𝑙 … 𝐴 𝑠𝑗 𝜆 = 𝑨 𝜆 𝑖𝑗 Cuántos ciclos existen de una dada longitud λ existen en la red? 𝑁𝐶 (𝜆) 𝑖𝑖 = 𝑨 𝜆 𝑖𝑖 𝑁𝐶 (𝜆) = 𝑖=1 𝑁 𝑨 𝜆 𝑖𝑖 =𝑇𝑟( 𝑨 𝜆 ) ↼ojo
6
lo mismo…pero diferente.
Cuántos ciclos existen de una dada longitud λ existen en la red? 𝑁𝐶 (𝜆) = 𝑖=1 𝑁 𝑨 𝜆 𝑖𝑖 =𝑇𝑟 𝑨 𝜆 = 𝑖=1 𝑁 ( 𝛼 𝑖 ) 𝜆 autovalor i-esimo de A Quiero demostrar esto último de otra manera Sea A una matriz cuadrada, real, no necesariamente simétrica. Es posible escribirla como (descomposición de Schur) con 𝑄 𝑄 𝑇 = ⋱ , 𝑇:matriz triangular 𝐴=𝑄 𝑇 𝑄 𝑇 Por ser T triangular sus autovalores 𝜏 𝑖 = 𝑇 𝑖𝑖 Los autovaloes de T son idénticos a los de A
7
() Sea A una matriz cuadrada, real, no necesariamente simétrica. Es posible escribirla como (descomposición de Schur) con 𝑄 𝑄 𝑇 = ⋱ , 𝑇:matriz triangular 𝐴=𝑄 𝑇 𝑄 𝑇 Por ser T triangular sus autovalores 𝜏 𝑖 = 𝑇 𝑖𝑖 Los autovaloes de T son idénticos a los de A Sea x un autovector de A 𝑄 𝑇 𝑄 𝑇 𝑥=𝐴 𝑥= 𝛼 𝑥 𝑄 𝑇 𝑄 𝑇 𝑄 𝑇 𝑥= 𝑄 𝑇 𝛼 𝑥 𝑇 𝑄 𝑇 𝑥= 𝛼 𝑄 𝑇 𝑥 𝑇 (𝑄 𝑇 𝑥)= 𝛼 (𝑄 𝑇 𝑥) o sea QTx es autovector de T con autovalor α=τ
8
() Sea A una matriz cuadrada, real, no necesariamente simétrica. Es posible escribirla como (descomposición de Schur) con 𝑄 𝑄 𝑇 = ⋱ , 𝑇:matriz triangular 𝐴=𝑄 𝑇 𝑄 𝑇 Por ser T triangular sus autovalores 𝛼 𝑖 = 𝑇 𝑖𝑖 Los autovaloes de T son idénticos a los de A ⇒𝑇𝑟 𝐴 𝜆 =𝑇𝑟 𝑄 𝑇 𝜆 𝑄 𝑇 =𝑇𝑟( 𝑄 𝑇 𝑄 𝑇 𝜆 )= 𝑇𝑟 𝑇 𝜆 = 𝑖=1 𝑁 (𝛼 𝑖 ) 𝜆 propiedad de la traza de producto de matrices 𝑇 𝑟 𝑖𝑖 = (𝑇 𝑖𝑖 ) 𝑟 = (𝛼 𝑖 ) 𝑟 𝑇𝑟 𝐴 𝜆 = 𝑖=1 𝑁 (𝛼 𝑖 ) 𝜆
9
() Entonces mostramos que para toda matriz A cuadrada, real, no necesariamente simétrica. 𝑇𝑟 𝐴 𝜆 = 𝑖=1 𝑁 (𝛼 𝑖 ) 𝜆 Nota 1 A podría tener autovalores complejos, pero como es real aparecen siempre los conjugados por lo que la traza queda real. Nota 2 Si A fuese simétrica T queda diagonal y la descomposión de Schur se reduce a descomposición en autovalres y autovectores canónica con 𝑄 𝑄 𝑇 = ⋱ , 𝑇:matriz triangular 𝐴=𝑄 𝑇 𝑄 𝑇
10
Caminos Cuántos caminos de una dada longitud λ existen en una red?
𝑁𝐶 (𝜆) 𝑖𝑗 = 𝑘,𝑙,…,𝑠=1 𝑁 𝐴 𝑖𝑘 𝐴 𝑘𝑙 … 𝐴 𝑠𝑗 𝜆 = 𝑨 𝜆 𝑖𝑗 Cuántos ciclos existen de una dada longitud λ existen en la red? 𝑁𝐶 (𝜆) 𝑖𝑖 = 𝑨 𝜆 𝑖𝑖 𝑁𝐶 (𝜆) = 𝑖=1 𝑁 𝑨 𝜆 𝑖𝑖 =𝑇𝑟( 𝑨 𝜆 ) Cómo saber si mi grafo es acíclico? Un grafo de matriz de adyacencia A es acíclico ↔ todos los autovalores de A son nulos → ← si G es acíclico A puede escribirse como una matriz triangular superior una mts tiene diagonal cero entonces todos sus autov. son nulos 𝑁𝐶 (𝜆) = 𝑖=1 𝑁 𝑨 𝜆 𝑖𝑖 =𝑇𝑟 𝑨 𝜆 = 𝑖=1 𝑁 (𝛼 𝑖 ) 𝜆 =0
11
Caminos Cómo saber si mi grafo es acíclico?
Un grafo de matriz de adyacencia A es acíclico ↔ todos los autovalores de A son nulos → ← si G es acíclico A puede escribirse como una matriz triangular superior (mts) una mts tiene diagonal cero… entonces todos sus autov. son nulos 𝑁𝐶 (𝜆) = 𝑖=1 𝑁 𝑨 𝜆 𝑖𝑖 =𝑇𝑟 𝑨 𝜆 = 𝑖=1 𝑁 (𝛼 𝑖 ) 𝜆 =0
12
Componentes de un grafo
Grafo conexo Grafo disconexo de dos componentes subconjnto maximal> no puedo agregar mas nodos y seguir satisfaciendo la definicion de componente. Por ejemplo{1,2} estan conectados, pero {1,2,4} tambien, entonces {1,2} no es maximal Componente de un grafo subconjunto maximal de vértices tal que existe un camino entre cualesquiera dos de sus elementos
13
Componentes de un grafo
12345 12435 La matriz de un grafo disconexo se puede llevar, mediante permutaciones de filas y columnas, a una matriz diagonal en bloques
14
Buscando componentes Realizar un BFS desde un nodo-i. Etiquetar a todos los nodos alcanzados como c=1 Si el número total de nodos etiquetados es igual al número de nodos de la red entonces stop. Sino continuar a III Elegir un nodo no etiquetado j. Hacer 𝑐←𝑐+1. Realizar un BFS desde el nodo-j y etiquetar a todos los nodos alcanzados como c. Repetir II El número de componentes resulta c
15
Componentes de un grafo dirigido
2 componentes débilmente conexas 5 componentes fuertemente conexas en un grafo dirigido tengo el grado de libertad de la direccionalidad que tengo que tener en cuenta parea ver adonde puedo llegar desde un dado nodo. (por ejemplo, desde que pagina WWW puedo llegar a otra) notar: un nodo puede pertenecer a mas de un in-component si un nodo perteneze a la vez al in-comp y out-comp de un nodo-I, pertenece a su misma componete fuertemente conexa componente débilmente conexa: componente conexa del grafo no-dirigido asociado componente fuertemente conexa: subconjunto maximal de nodos tal que existen caminos dirigidos entre cualquier par ordenado del conjunto. out-component inducido por un nodo-i: subconjunto de nodos alcanzables desde nodo-i a través de caminos dirigidos del grafo in-component inducido por un nodo-i: subconjunto de nodos desde los que se alcanza al nodo-i a través de algun caminos dirigido del grafo
16
Caminos Típicamente hay mas de un camino para ir de un nodo a otro dentro de la red, no todos los caminos son independientes o disjuntos Dos caminos entre un dado par de vértice son nodo-independientes (enlace-independiente) si no comparten ni un nodo (enlace), a menos de sus extremos 2 caminos enlace-independientes entre A y B otros dos caminos enlace-independientes… Nocion de camino…conexiones que empieszana surgir al integrar informacion Tipicamente hay mas de un camino para ir de un nodo a otro dentro de la red, no todos los caminos son INDEPENDIENTES, Algunas propiedades mas o menos obvias: +Si dos caminos son nodo-independientes entonces son enlace-independientes, pero no al reves +Existe un numero finito de caminos independientes entre cualquier par de puntos porque: a) hay un numero fiito de enlaces b) caminos independientes no pueden compartir enlaces Se puede utilizar el nro de caminos independientes como medidad de que tan fuertemente conectados estan dos nodos de la red. La idea de conectiviadad es muy importante para analizar propiedades de difusion sobre la red y encontrar estructura en la red . Interesara encontrar conjunto de vertices mas conectados entre si que con el resto para definir comunidades. Se puede utilizar el nro de caminos independientes como medida de que tan fuertemente conectados están dos nodos de la red idea de conectividad A y B tienen: conectividad de enlace 2 conectividad de nodo 1
17
Conjuntos de corte A D C 2 B
C es un cuello de botella para el flujo A-B. Si se remueve C, A y B quedan desconectados C D E Un conjunto de vértices es un conjunto de corte (cut set), para un dado par de vértices, si su remoción los deja desconectados. Ejemplo: {C} es un conjunto de corte de tamaño 1 para el par (A,B) {D,E} es un conjunto de corte de tamaño 2 para el par (A,B) Un conjunto de enlaces un conjunto de corte (cut set), para un dado par de vértices, si su remoción los deja desconectados. Ejemplo: {(C,D),(C,E)} es un conjunto de corte de tamaño 2 para el par (A,B) {(C,D),(D,B),(C,E)} también es un conjunto de corte de tamaño 3 para el par (A,B) Tambien asociado con el tema de conectividad esta la idea de cuellos de botella. En el ejemplo anterior C era un cuello de botella para los caminos que unian A y B. Si removia C A y B quedaban desconectados conjunto de corte minimal, no necesariamente es unico. Conjunto de corte minimal: conjunto de corte de mínima cardinalidad. Ejemplo {(C,D),(C,E)} es minimal Para redes pesadas (grafo derecha) peso =máximo flujo que puede atravesar un enlace: conjunto de corte de mínimo peso acumulado. Para A y B: cjto corte minimal {(C,B},{A,D}}
18
Conectividad y cjtos de corte
Conceptos de conectividad, conjuntos de corte y flujos en redes están relacionados El tamaño del conjunto de corte minimal de nodo entre dos vértices, es igual a la conectividad-de-nodo (nro de caminos nodo-independientes) entre los mismos. El tamaño del conjunto de corte minimal de enlace entre dos vértices es igual a la conectividad-de-enlace (nro de caminos enlace-independientes) entre los mismos. 2 A B C Hay situaciones donde el peso del enlace representa una capacidad para conducir una cantidad (por ejemplo trafico de vehiculos, o de internet) para esos casos hay un teorema util que relaciona el maximo flujo que puede existir entre dos nodos, con el min cut. Teorema max flow/min-cut El flujo máximo entre un par de vértices de una red es igual a la suma de los pesos de los enlaces del conjunto-de-corte-de-enlaces minimal entre los mismos D Max flow: A-B: 3 A-C: 5
19
Caminatas al azar Imaginemos un caminante (Juan) severamente alcoholizado caminando por una red (simple y conexa / fuertemente conexa). Consideremos el tiempo de manera discreta. A t=0 Juan se encuentra en el nodo-k Al pasar un intervalo Δt Juan avanza desde el nodo donde se encuentra actualmente hacia alguno de sus vecinos ¿Cuál es la probabilidad , 𝑝 𝑖 𝑡 , que a tiempo t Juan se encuentre en el nodo i ? Por qué tiene sentido esta pregunta? Inicialmente Juan está en el nodo-s. El vector de probabilidades p(t=0) es 𝑝 𝑖 𝑡=0 = 𝛿 𝑠𝑖 = 1 𝑠𝑖 𝑖=𝑠 0 𝑠𝑖 𝑖≠𝑠 Por cómo es el proceso de desplazamiento p(t+1) va a ser función de p(t) Para cada tiempo tengo un campo de probabilidades definido sobre la red. Ese campo va evolucionando con el tiempo…hasta una distribucion de equilibrio (?) 𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) prob que esté en nodo-j a tiempo t prob de elegir el enlace que lleva de j a i
20
Caminatas al azar…y difusión
𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) pi(t) probabilidad de encontrar a Juan en el nodo-i, en el paso temporal t Esta misma ecuación aplica a procesos de tipo difusivos en una red, donde en cada paso temporal toda la cantidad de material que se encuentra en el nodo-i es repartida y enviada a sus vecinos 𝑥 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑥 𝑗 (𝑡) xi(t) cantidad de material que a tiempo t se encuentra en el nodo-i
21
Donde está Juan? 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡)
𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 matriz de adyacencia con columnas normalizadas por grado del nodo 𝐴 𝐷 −1 = 0 1/3 0 1/2 0 1/4 0 1/ /2 0 1/ /2 1/ /3 1/4 1/2 0 1/ / 𝐴=
22
Donde está Juan? 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 𝒑∞ =𝐴 𝐷 −1 𝒑∞
𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 Notar que si sucede que la distribución de probabilidad converge, es decir 𝒑 𝑡→∞ →𝒑∞, se debe satisfacer que 𝒑∞ =𝐴 𝐷 −1 𝒑∞ Recordar yo, cuando es valido suponer que la p converja Esto significa que 𝒑∞ es autovector de 𝐴 𝐷 −1 , con autovalor 1. Notas Algebra lineal: 1 es autovalor dominante de 𝐴 𝐷 −1 , lo cual es razonable porque no esperamos que la probabilidad total deje de estar normalizada al evolucionar el tiempo.
23
Donde está Juan? 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 𝒑∞ =𝐴 𝐷 −1 𝒑∞ 𝑝∞ 𝑖= 𝑘 𝑖 𝑗=1 𝑁 𝑘 𝑗
𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 Notar que si sucede que la distribución de probabilidad converge, es decir 𝒑 𝑡→∞ →𝒑∞, se debe satisfacer que 𝒑∞ =𝐴 𝐷 −1 𝒑∞ Recordar yo, cuando es valido suponer que la p converja Esto significa que 𝒑∞ es autovector de 𝐴 𝐷 −1 , con autovalor 1. Por inspección se puede ver que el vector de probabilidades de componente i-esima: 𝑝∞ 𝑖= 𝑘 𝑖 𝑗=1 𝑁 𝑘 𝑗 es la solución buscada
24
a tiempos largos Juan está en…
𝑝∞ 𝑖= 𝑘 𝑖 𝑗=1 𝑁 𝑘 𝑗 𝒑∞ =𝐴 𝐷 −1 𝒑∞ 𝑘 𝑖 𝑗=1 𝑁 𝑘 𝑗 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑘 𝑗 𝑟=1 𝑁 𝑘 𝑟 = 1 𝑟=1 𝑁 𝑘 𝑟 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑘 𝑗 = 1 𝑟=1 𝑁 𝑘 𝑟 𝑗=1 𝑁 𝑎 𝑖𝑗 = 𝑘 𝑖 𝑗=1 𝑁 𝑘 𝑗
25
a tiempos largos Juan está en…
𝒑 0 =(0,0,0,0,0,1 ) 𝑇 𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 𝑝∞ 𝑖= 𝑘 𝑖 𝑗=1 𝑁 𝑘 𝑗
26
a tiempos largos Juan está en…
𝑝∞ 𝑖= 1 𝑗=1 𝑁 𝑘 𝑗 𝑘 𝑖 La probabilidad de encontrar a Juan en el nodo-i es proporcional al grado del nodo El 2 aparece porque en la red nodirigida esta es la prob de ir en cualquier direccion ij o ji En este proceso difusivo, o de caminata, las cosas tienden a uniformizarse a nivel de enlaces: En el régimen asintótico, la probabilidad de encontrar a Juan atravesando uno de los M enlaces de la red, penlace(er=(i,j)), es uniforme 𝑝𝑒𝑛𝑙𝑎𝑐𝑒 𝑖𝑗= 𝑘 𝑗 𝑟=1 𝑁 𝑘 𝑟 𝑘 𝑗 = 1 𝑟=1 𝑁 𝑘 𝑟 =𝑐𝑡𝑒 prob de elegir uno de los vecinos de j prob de estar en j
27
Difusión en redes Cada nodo de la red tiene asociado a un tiempo t una cantidad de material xi(t) Pensamos en un proceso difusivo en el que el flujo desde el nodo-j al nodo-i es proporcional a la diferencia de material: flujoj->i~ C * (xj- xi) cte de difusión 𝑑 𝑥 𝑖 𝑑𝑡 =𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 (𝑥 𝑗 − 𝑥 𝑖 ) Si en lugar de asumir random walk, pensamos en que el flujo es proporcional a la diferencia
28
Difusión en redes [𝐿]𝑖𝑗
Pensamos en un proceso difusivo en el que el flujo desde el nodo-j al nodo-i es proporcional a la diferencia de material: flujoj->i~ C * (xj- xi) cte de difusión 𝑑 𝑥 𝑖 𝑑𝑡 =𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 (𝑥 𝑗 − 𝑥 𝑖 ) 𝑑 𝑥 𝑖 𝑑𝑡 =−𝐶 𝑗=1 𝑁 𝛿𝑖𝑗𝑘𝑗−𝐴 𝑖𝑗 𝑥𝑗 [𝐿]𝑖𝑗 =𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 𝑥 𝑗 −𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 𝑥 𝑖 𝑘𝑖 =𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 𝑥 𝑗 −𝐶 𝑘 𝑖 𝑥 𝑖 𝑑𝒙 𝑑𝑡 =−𝐶.𝐿 𝒙 𝑑𝒙 𝑑𝑡 =𝐶 𝛻 2 𝒙 Ec de difusion de calor =𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 𝑥 𝑗 −𝐶𝛿𝑖𝑗𝑘𝑗𝑥𝑗
29
Difusión en redes [𝐿]𝑖𝑗
Pensamos en un proceso difusivo en el que el flujo desde el nodo-j al nodo-i es proporcional a la diferencia de material: flujoj->i~ C * (xj- xi) cte de difusión 𝑑 𝑥 𝑖 𝑑𝑡 =−𝐶 𝑗=1 𝑁 𝛿𝑖𝑗𝑘𝑗−𝐴 𝑖𝑗 𝑥𝑗 [𝐿]𝑖𝑗 𝐿=𝐷−𝐴 Si en lugar de asumir random walk, pensamos en que el flujo es proporcional a la diferencia
30
Propiedades 𝐿=𝐷−𝐴 L es simétrica
L es semidefinida-positiva (i.e. autovalores 𝜆𝑖≥0) Suma por columnas y por filas de L es cero Siempre 𝜆=0 es autovalor de L con autovector v0=(1,1,…,1), ya que L v0 = 0 v0 = 0 L es una matriz singular (i.e. no inversible)
31
Propiedades 𝐿=𝐷−𝐴 L es simétrica
L es semidefinida-positiva (i.e. autovalores 𝜆𝑖≥0) Suma por columnas y por filas de L es cero Siempre 𝜆=0 es autovalor de L con autovector v0=(1,1,…,1), ya que L v0 = 0 v0 = 0 L es una matriz singular (i.e. no inversible) Si el grafo tiene p componentes, de tamaños n1, n2,…, np Notar que ahora habrá p autovectores de L asociados a 𝜆=0 de la forma L1 L2 ( 1,…,1 𝑛 1 ,0,0,...,0) ( 0,…,0 , 𝑛 ,…,1 𝑛 2 ,0,0,...,0) ( 0,…,0 𝑛 1 , 0,…,0 𝑛 2 , 1,…,1 𝑛 3 ,0,0,...,0)
32
Propiedades 𝐿=𝐷−𝐴 Laplaciano combinatorio L es simétrica
L es semidefinida-positiva (i.e. autovalores 𝜆𝑖≥0) Suma por columnas y por filas de L es cero Siempre 𝜆=0 es autovalor de L con autovector v0=(1,1,…,1), ya que L v0 = 0 v0 = 0 L es una matriz singular (i.e. no inversible) Si el grafo tiene p componentes, de tamaños n1, n2,…, np, existen p autovectores de L asociados a 𝜆=0 Corolario: el segundo autovalor de L es 𝜆2 ≠ 0 sii el grafo posee una única componente 𝜆2 se denomina conectividad algebraica de la red
33
Descomposición espectral de L
𝐿 𝜙 𝑖 = 𝜆 𝑖 𝜙 𝑖 autovector i-esimo 𝐿= 𝑖=1 𝑁 𝜆 𝑖 𝜙 𝑖 𝜙 𝑖 𝑇 matriz
34
Autovectores de L 𝑳 𝝓 𝑖 = 𝜆 𝑖 𝝓 𝑖 𝝓 𝑖
𝑳 𝝓 𝑖 = 𝜆 𝑖 𝝓 𝑖 autovector i-esimo 𝝓 𝑖 define un campo escalar sobre el grafo
35
Caminatas al azar…y difusión
𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) pi(t) probabilidad de encontrar a Juan en el nodo-i, en el paso temporal t Esta misma ecuación aplica a procesos de tipo difusivos en una red, donde en cada paso temporal toda la cantidad de material que se encuentra en el nodo-i es repartida y enviada a sus vecinos 𝑥 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑥 𝑗 (𝑡) xj(t) cantidad de material que a tiempo t se encuentra en el nodo-j
36
Difusión random-walk en redes
A cada paso, la cantidad xi de cada nodo se altera 𝑥 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑥 𝑗 (𝑡) ∆ 𝑥 𝑖 = 𝑥 𝑖 𝑡+1 − 𝑥 𝑖 𝑡 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑥 𝑗 𝑡 − 𝑥 𝑖 𝑡 en cada nodo hay una cantidad xi de material = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑥 𝑗 𝑡 − 𝛿𝑖𝑗 𝑥 𝑗 𝑡 𝛿𝑖𝑗=1 𝑠𝑖𝑖 𝑖=𝑗 =− 𝑗=1 𝑁 𝛿𝑖𝑗 − 1 𝑘 𝑗 𝑎 𝑖𝑗 [𝐿 𝑟𝑤 ]𝑖𝑗 𝑥 𝑗 𝑡 Laplaciano random-walk 𝑑𝒙 𝑑𝑡 =− 𝐿 𝑟𝑤 𝒙 𝑑𝒙 𝑑𝑡 = 𝛻 2 𝒙 ∆𝒙=− 𝐿 𝑟𝑤 𝒙
37
Laplacianos [𝐿]𝑖𝑗 𝑑 𝑥 𝑖 𝑑𝑡 =−𝐶 𝑗=1 𝑁 𝛿𝑖𝑗𝑘𝑗−𝑎 𝑖𝑗 𝑥𝑗 𝐿=𝐷−𝐴 [ 𝐿 𝑟𝑤 ]𝑖𝑗
𝑑 𝑥 𝑖 𝑑𝑡 =−𝐶 𝑗=1 𝑁 𝛿𝑖𝑗𝑘𝑗−𝑎 𝑖𝑗 𝑥𝑗 [𝐿]𝑖𝑗 𝐿=𝐷−𝐴 𝑑 𝑥 𝑖 𝑑𝑡 =− 𝑗=1 𝑁 𝛿𝑖𝑗 − 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑥 𝑗 𝑡 [ 𝐿 𝑟𝑤 ]𝑖𝑗 𝐿 𝑟𝑤 = 𝐼−𝐷 −1 𝐴= 𝐷 −1 𝐿 𝐿 𝑠𝑦𝑚 ≡ 𝐷 −1/2 𝐿 𝐷 −1/2 =𝐼− 𝐷 −1/2 𝐿 𝐷 −1/2
38
Priorización basada en redes
nodos semilla La probabilidad asintótica de encontrar a un caminante aleatorio en el nodo-i es proporcional al grado del nodo 𝑝∞ 𝑖= 1 𝑗=1 𝑁 𝑘 𝑗 𝑘 𝑖 Pobabilidad de visita al nodo-x es una medida de asociación entre el nodo-x y el conjunto semilla Con qué probabilidad, en una caminata corta, voy a visitar un nodo-x si a tiempo t=0 parto de un conjunto nodos de interés (nodos semilla)? Con qué probabilidad asintótica voy a visitar un nodo-x si a tiempo t=0 parto de un nodo tomado al azar de un conjunto de nodos de interés (nodos semilla) y eventualmente fuerzo revisitar semillas? Integro dos espacios de conocimiento el embebido en el conexionado de la red el que utilicé para definir el conjunto de nodos-semilla
39
Priorización de genes asociados a enfermedades
Kolher et al The American Journal of Human Genetics 2008
40
Priorización de nuevas asociaciones gen/enfermedad
Algoritmos para propagar sentido de pertenecia al conjunto de interés: Random Walk with Restart (Kholer 2009) Net-Rank (Chen 2009) Net-Propagation (Vanunu 2010) Functional Flow (Navieba 2005) Kolher et al The American Journal of Human Genetics 2008
41
Priorización de nuevas asociaciones gen/enfermedad
Algoritmos para propagar sentido de pertenecia al conjunto de interés: Random Walk with Restart (Kholer 2009) 𝑝 𝑖 𝑡+1 = 1−𝑟 𝑗=1 𝑁 𝑎 𝑖𝑗 𝑝 𝑗 𝑡 +𝑟 𝑝 𝑖 𝑡=0 𝒑 𝑡+1 = 1−r 𝐀 𝒑 𝑡 +𝑟 𝒑 0 r controla el sesgo hacia las condiciones iniciales el score se suele estimar a partir de simular un número reducido de pasos k: 𝒑 ∞ ~ 𝒑 𝑘 Kolher et al The American Journal of Human Genetics 2008
42
Priorización de nuevas asociaciones gen/enfermedad
caminata aleatoria con reset. El score se suele estimar a partir de simular k-pasos
43
Genómica funcional En la era post-genómica conocemos en alto grado la composición exacta del genoma de un gran número de organismos Sin embargo, entender qué función cumple la proteína asociada a un dado gen sigue siendo un reto En general los métodos computacionales utilizaban exhaustivamente el criterio de similaridad de secuencia para asignar funciones putativas a una dada proteina aun no caracterizada funcionalmente La disponibilidad de datos omicos a escala global permite abordar esto desde otra perspectiva:
44
Functional Flow Asignación de funcionalidad a proteinas aun no caracterizadas simulando flujos de información en redes de interaccion de proteinas. Red de interacción de proteinas (pesada) apoptosis Dime con quien andas y te diré que haces Consideramos una función/proceso biológico (por ejemplo: GO-apoptosis) Cada proteina anotada a esa categoría es considerada una fuente de flujo de una cantidad extensiva xi(t) que representa un score-funcional Pensamos en un proceso difusivo en el que el flujo desde el nodo-j al nodo-i es proporcional a la diferencia de material: flujoj->i~ C * (xj- xi) Luego de cada paso, se reinyecta x a las semillas. La cantidad de flujo que recibe una proteina luego de k pasos de difusión representa el grado de asociación de la misma con la categoría funciopnal analizada. 𝑑 𝑥 𝑖 𝑑𝑡 =𝐶 𝑗=1 𝑁 𝑤 𝑖𝑗 (𝑥 𝑗 − 𝑥 𝑖 ) 𝜃( (𝑥 𝑗 − 𝑥 𝑖 ))
46
Priorización a partir de difusión en redes
Imaginemos ahora que cada nodo de la red tiene asociado a un tiempo t una cantidad de material xi(t) Pensamos en un proceso difusivo en el que el flujo desde el nodo-j al nodo-i es proporcional a la diferencia de material: flujoj->i~ C * (xj- xi) cte de difusión 𝑑 𝑥 𝑖 𝑑𝑡 =𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 (𝑥 𝑗 − 𝑥 𝑖 ) Si en lugar de asumir random walk, pensamos en que el flujo es proporcional a la diferencia
47
Referencias Networks, An Introduction. Mark Newman Charlas
Peter Dodds – Random Walk and diffusion Vito Latora Random Walk with Restart (Kholer 2009) Net-Rank (Chen 2009) Net-Propagation (Vanunu 2010) Functional Flow (Navieba 2005) Prioritization (Lu 2012 – Physics Report)
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.