Caminatas.

Slides:



Advertisements
Presentaciones similares
GRAFOS HUGO ARAYA CARRASCO.
Advertisements

Grafos. Un Grafo G es un par de conjuntos (V, E), donde V es un conjunto no vacío de elementos llamados vértices o nodos y E es un conjunto formado por.
U NIDAD 3 G RAFOS : C AMINOS, ISOMORFISMO Y SU COLOREO M.C. Meliza Contreras González.
ALFONSO TORRES DIAZ Tema: Triángulos y sus propiedades Subtema: Desigualdad Triangular y medida de ángulos Grado: Sexto Estándar: Comparo y.
Centralidad ¿Qué tan relevante es un nodo de la red?
Conceptos Básicos. Grafo pesado Un grafo es… Un grafo G es un conjunto de nodos y enlaces grafo simple no-dirigido loop multi-enlace Grafo dirigido.
Un grafo consta de un conjunto de vértices y un conjunto de aristas. Cada arista de un grafo se especifica mediante un par de vértices. Denotemos al conjunto.
Conceptos Básicos 2. Caminos Dada una red, distintos tipos de flujo pueden ser de interés Imaginemos flujo de objetos (items indivisibles que están en.
VECTORES UNIDAD IV: VECTORES N.SN J. Pomales CeL CONCEPTOS BÁSICOS.
BLOQUE 1: LA DESCRIPCIÓN DEL MOVIMIENTO Y LA FUERZA 1 EL MOVIMIENTO DE LOS OBJETOS Interpreta la velocidad como la relación entre desplazamiento y tiempo,
Profesor: Mag. Ing. Pavel Aliaga E. Facultad de Ing. de Sistemas Universidad de Lima Teoría de Grafos Estructuras Discretas en Computación.
ALGORITMO DE DIJKSTRA BANDA DÍAZ ANA KARINA SUAREZ BARON SINDY TATIANA.
Tipos de funciones Marcela mayen#14 4b.
Curso Sygma. Grafos Universidad San Buenaventura Cali.
LOGICA Y MATEMATICA COMPUTACIONAL
CALCULO DE LÍMITES Elaborado por: Ing. Juan Adolfo Álvarez Martínez Noviembre,
PRUEBAS DE BONDAD DE AJUSTE estas pruebas permiten verificar que la población de la cual proviene una muestra tiene una distribución especificada o supuesta.
Algoritmo kruskal Es un algoritmo (ávido/voraz) de la teoría de grafos para encontrar un árbol de recubrimiento mínimo en un grafo conexo y ponderado.
PROBLEMA DEL AGENTE VIAJERO
Guía de Ejercicios 3: D&AA Universidad Viña del Mar 30/9/2002
FUNDAMENTOS DE TERMODINÁMICA
TAD’s ARBOLES GENERALIZADOS
VECTORES EN EL PLANO Nivel 4º E.S.O..
MATRICES.
REDES DE COMPUTADORAS SEGÚN TOPOLOGIA.
ANÁLISIS E INTERPRETACIÓN DE DATOS
Convergencia de variables aleatorias
VECTORES Juan Daniel Fregoso Rubio B.
ESTADÍSTICA UNIDIMENSIONAL
CAPÍTULO 7: DETECCIÓN DE BORDES
NOTAS TECNICAS 1 METODO DE NEWTON-RAPHSON
REGRESIÓN LINEAL SIMPLE
Simulador modular secuencial basado en ecuaciones
DISTRIBUCIÓN MUESTRAL DE UNA MEDIA.
Michelle Vanessa Rojas Torres 1101
CAPACIDAD DE DETECCION Y CORRECCION DE ERRORES
Teoría de Redes Ing. Douglas Vergara. Concepto básico Un arco es dirigido si permite el flujo positivo en una dirección y un flujo cero en la dirección.
TEMA Nº 1 Conjuntos numéricos. Aprendizajes esperados: Utilizar y clasificar los distintos conjuntos numéricos en sus diversas formas de expresión, tanto.
Tema 7 LÍMITES Y CONTINUIDAD Bloque Análisis Matemático.
Vectores en el espacio 2º Bachillerato
Sucesiones.
Sistemas Numéricos 1. Introducción 2. Sistema de Numeración Decimal
5. Optimización de redes. Integrantes: * Christian Cota * Cesar Rojo
Estructuras de Datos MC Beatriz Beltrán Martínez Primavera 2018
Introducción a los algoritmos
GRAFOS ESTRUCTURAS DE DATOS.
COLEGIO NACIONAL LOPERENA Germán Isaac Sosa Montenegro
Distribución Uniforma Continua Distribución Normal
Introducción Los árboles fueron utilizados por primera vez en 1847 por Gustav Kirchhoff ( ) en su trabajo de redes eléctricas, aunque posteriormente.
Grafos (parte 1).
INTRODUCCIÓN 1. Álgebra lineal y vectores aleatorios 2. Distribución normal multivariante ANÁLISIS DE LA MATRIZ DE COVARIANZAS 3. Componentes principales.
 Función cuadrática Definición Es de la forma: f(x) = ax2 + bx + c
Momento cuadrupolar eléctrico
El camí més curt i estratègies per a trobar-lo
2. La probabilidad de encontrar una partícula con función de onda  en
OPTIMIZACIÓN EN REDES EN ALGUNOS PROBLEMAS DE OPTIMIZACIÓN PUEDE SER ÚTIL REPRESENTAR EL PROBLEMA A TRAVÉS DE UNA GRÁFICA: ruteo de vehículos, distribución.
DEPARTAMENTO DE MATEMÁTICAS
DEPARTAMENTO DE MATEMÁTICAS
Vectores fijos en el plano Vector fijo: Es un segmento orientado, con el sentido del recorrido que va desde el origen al extremo. A B Extremo Origen.
3.7. Colusión Tácita: juegos repetidos
2/23/2019 TRAZADOR CUBICO SPLINE.
Distribución chi-cuadrado Distribución F de Fisher-Snedecor
Tema 5: Grafos CIS - UABJB - Estructura de Datos II
Algoritmos de caminos más cortos
CAPACIDAD DE DETECCION Y CORRECCION DE ERRORES
TEMARIO DEFINICIÓN ………………………………………………………..………..
TEMA Nº 1 Conjuntos numéricos. Aprendizajes esperados: Utilizar y clasificar los distintos conjuntos numéricos en sus diversas formas de expresión, tanto.
CINEMÁTICA Movimiento Rectilíneo Uniforme (MRU)
Interferencia.
Grafos. Concepto: Un Grafo no es más que un conjunto de nodos o vértices que se encuentran relacionados con unas aristas. Además, los vértices tienen.
Transcripción de la presentación:

Caminatas

Caminos Dada una red, distintos tipos de flujo pueden ser de interés Imaginemos flujo de objetos (items indivisibles que están en un único lugar a un dado tiempo). Su difusión es por transferencia. Puede haber casos en que: se mueven por el grafo sin restricciones acerca de repetir enlaces o nodos ya visitados (e.g. billetes, libros, …). se mueven por el grafo sin repetir enlaces (i.e. ropa usada, re-gifting) Correo: se mueven por el grafo desde un nodo origen hacia uno destino minimizando distancia recorrida. entonces tiene sentido reconocer diferente tipo de trayectorias en un grafo

Caminos camino (walk): secuencia de vertices tales que vértices consecutivos están conectados (en grafos dirigidos la secuencia debe respetar las orientaciones de los enlaces) sendero (trail): es un camino que no repite enlaces camino simple (path):es un camino que no repite vértices ciclo: camino de más de dos vértices que no repite elementos, salvo el primero y último longitud de un camino C: número de pasos que contiene desde su comienzo hasta su final (Para redes pesadas, longitud asociado a un camino: suma de los pesos de los enlaces involucrados) camino geodésico : camino de menor longitud que une un par dado de vértices. cwalk={A,B,D,B,C} ctrail={A,B,D,C,B} cpath={A,B,C} cciclo={B,C,D,B} Sin importar el escenario de aplicacion un concepto que suele aparecer es el de establecer distancias y caminos entre elementos del grafo…

Longitud de caminos Buscando a lo ancho…Breath-First Search Empezar en nodo i, etiquetarlo como ´0´ Encontrar sus primeros vecinos, etiquetarlos como ´1´ y ponerlos en espera (en cola de procesamiento) Tomar el primer nodo de etiqueta ´e´ de la cola (e=1, la primera vez). Encontrar sus nodos adyacentes sin etiqueta Etiquetarlos como e+1 y ponerlos en la cola de procesamiento Repetir III hasta encontrar el nodo j buscado, o que no queden mas nodos en la cola. La distancia entre i y j es la etiqueta de j. Si no tiene ninguna 𝑑 𝑖𝑗 =∞

Caminos Cuántos caminos de una dada longitud λ existen en una red? 𝐴 𝑖𝑗 ≠0 sii existe un enlace que vaya de nodo-j hacia nodo-i 𝐴 𝑖𝑘 𝐴 𝑘𝑗 ≠0 sii existe un camino de nodo-j hacia nodo-i, pasando por nodo-k 𝐴 𝑖𝑘 𝐴 𝑘𝑙 𝐴 𝑙𝑗 ≠0 sii existe un camino de nodo-j hacia nodo-i, pasando por nodo-k y nodo-l 𝑁𝐶 (2) 𝑖𝑗 = 𝑘=1 𝑁 𝐴 𝑖𝑘 𝐴 𝑘𝑗 = 𝑨 2 𝑖𝑗 ojo. que la estimacion de NC(lambda) cuenta sumando lazos de todos los nodos -> repite caminos es decir cuenta como lazos diferntes el 1,2,3,1 el 2,3,1,2 etc 3,1,2,3 se puede pensar que hay que dividir por r, pero eso noarregla subloops que puedan existir (note 22 p137) 𝑁𝐶 (𝜆) 𝑖𝑗 = 𝑘,𝑙,…,𝑠=1 𝑁 𝐴 𝑖𝑘 𝐴 𝑘𝑙 … 𝐴 𝑠𝑗 𝜆 = 𝑨 𝜆 𝑖𝑗 Cuántos ciclos existen de una dada longitud λ existen en la red? 𝑁𝐶 (𝜆) 𝑖𝑖 = 𝑨 𝜆 𝑖𝑖 𝑁𝐶 (𝜆) = 𝑖=1 𝑁 𝑨 𝜆 𝑖𝑖 =𝑇𝑟( 𝑨 𝜆 ) ↼ojo

lo mismo…pero diferente. Cuántos ciclos existen de una dada longitud λ existen en la red? 𝑁𝐶 (𝜆) = 𝑖=1 𝑁 𝑨 𝜆 𝑖𝑖 =𝑇𝑟 𝑨 𝜆 = 𝑖=1 𝑁 ( 𝛼 𝑖 ) 𝜆 autovalor i-esimo de A Quiero demostrar esto último de otra manera Sea A una matriz cuadrada, real, no necesariamente simétrica. Es posible escribirla como (descomposición de Schur) con 𝑄 𝑄 𝑇 = 1 0 0 0 ⋱ 0 0 0 1 , 𝑇:matriz triangular 𝐴=𝑄 𝑇 𝑄 𝑇 Por ser T triangular sus autovalores 𝜏 𝑖 = 𝑇 𝑖𝑖 Los autovaloes de T son idénticos a los de A

() Sea A una matriz cuadrada, real, no necesariamente simétrica. Es posible escribirla como (descomposición de Schur) con 𝑄 𝑄 𝑇 = 1 0 0 0 ⋱ 0 0 0 1 , 𝑇:matriz triangular 𝐴=𝑄 𝑇 𝑄 𝑇 Por ser T triangular sus autovalores 𝜏 𝑖 = 𝑇 𝑖𝑖 Los autovaloes de T son idénticos a los de A Sea x un autovector de A 𝑄 𝑇 𝑄 𝑇 𝑥=𝐴 𝑥= 𝛼 𝑥 𝑄 𝑇 𝑄 𝑇 𝑄 𝑇 𝑥= 𝑄 𝑇 𝛼 𝑥 𝑇 𝑄 𝑇 𝑥= 𝛼 𝑄 𝑇 𝑥 𝑇 (𝑄 𝑇 𝑥)= 𝛼 (𝑄 𝑇 𝑥) o sea QTx es autovector de T con autovalor α=τ

() Sea A una matriz cuadrada, real, no necesariamente simétrica. Es posible escribirla como (descomposición de Schur) con 𝑄 𝑄 𝑇 = 1 0 0 0 ⋱ 0 0 0 1 , 𝑇:matriz triangular 𝐴=𝑄 𝑇 𝑄 𝑇 Por ser T triangular sus autovalores 𝛼 𝑖 = 𝑇 𝑖𝑖 Los autovaloes de T son idénticos a los de A ⇒𝑇𝑟 𝐴 𝜆 =𝑇𝑟 𝑄 𝑇 𝜆 𝑄 𝑇 =𝑇𝑟( 𝑄 𝑇 𝑄 𝑇 𝜆 )= 𝑇𝑟 𝑇 𝜆 = 𝑖=1 𝑁 (𝛼 𝑖 ) 𝜆 propiedad de la traza de producto de matrices 𝑇 𝑟 𝑖𝑖 = (𝑇 𝑖𝑖 ) 𝑟 = (𝛼 𝑖 ) 𝑟 𝑇𝑟 𝐴 𝜆 = 𝑖=1 𝑁 (𝛼 𝑖 ) 𝜆

() Entonces mostramos que para toda matriz A cuadrada, real, no necesariamente simétrica. 𝑇𝑟 𝐴 𝜆 = 𝑖=1 𝑁 (𝛼 𝑖 ) 𝜆 Nota 1 A podría tener autovalores complejos, pero como es real aparecen siempre los conjugados por lo que la traza queda real. Nota 2 Si A fuese simétrica T queda diagonal y la descomposión de Schur se reduce a descomposición en autovalres y autovectores canónica con 𝑄 𝑄 𝑇 = 1 0 0 0 ⋱ 0 0 0 1 , 𝑇:matriz triangular 𝐴=𝑄 𝑇 𝑄 𝑇

Caminos Cuántos caminos de una dada longitud λ existen en una red? 𝑁𝐶 (𝜆) 𝑖𝑗 = 𝑘,𝑙,…,𝑠=1 𝑁 𝐴 𝑖𝑘 𝐴 𝑘𝑙 … 𝐴 𝑠𝑗 𝜆 = 𝑨 𝜆 𝑖𝑗 Cuántos ciclos existen de una dada longitud λ existen en la red? 𝑁𝐶 (𝜆) 𝑖𝑖 = 𝑨 𝜆 𝑖𝑖 𝑁𝐶 (𝜆) = 𝑖=1 𝑁 𝑨 𝜆 𝑖𝑖 =𝑇𝑟( 𝑨 𝜆 ) Cómo saber si mi grafo es acíclico? Un grafo de matriz de adyacencia A es acíclico ↔ todos los autovalores de A son nulos → ← si G es acíclico A puede escribirse como una matriz triangular superior una mts tiene diagonal cero entonces todos sus autov. son nulos 𝑁𝐶 (𝜆) = 𝑖=1 𝑁 𝑨 𝜆 𝑖𝑖 =𝑇𝑟 𝑨 𝜆 = 𝑖=1 𝑁 (𝛼 𝑖 ) 𝜆 =0

Caminos Cómo saber si mi grafo es acíclico? Un grafo de matriz de adyacencia A es acíclico ↔ todos los autovalores de A son nulos → ← si G es acíclico A puede escribirse como una matriz triangular superior (mts) una mts tiene diagonal cero… entonces todos sus autov. son nulos 𝑁𝐶 (𝜆) = 𝑖=1 𝑁 𝑨 𝜆 𝑖𝑖 =𝑇𝑟 𝑨 𝜆 = 𝑖=1 𝑁 (𝛼 𝑖 ) 𝜆 =0

Componentes de un grafo Grafo conexo Grafo disconexo de dos componentes subconjnto maximal> no puedo agregar mas nodos y seguir satisfaciendo la definicion de componente. Por ejemplo{1,2} estan conectados, pero {1,2,4} tambien, entonces {1,2} no es maximal Componente de un grafo subconjunto maximal de vértices tal que existe un camino entre cualesquiera dos de sus elementos

Componentes de un grafo 1 2 3 4 5 12345 1 2 4 3 5 12435 La matriz de un grafo disconexo se puede llevar, mediante permutaciones de filas y columnas, a una matriz diagonal en bloques

Buscando componentes Realizar un BFS desde un nodo-i. Etiquetar a todos los nodos alcanzados como c=1 Si el número total de nodos etiquetados es igual al número de nodos de la red entonces stop. Sino continuar a III Elegir un nodo no etiquetado j. Hacer 𝑐←𝑐+1. Realizar un BFS desde el nodo-j y etiquetar a todos los nodos alcanzados como c. Repetir II El número de componentes resulta c

Componentes de un grafo dirigido 2 componentes débilmente conexas 5 componentes fuertemente conexas en un grafo dirigido tengo el grado de libertad de la direccionalidad que tengo que tener en cuenta parea ver adonde puedo llegar desde un dado nodo. (por ejemplo, desde que pagina WWW puedo llegar a otra) notar: un nodo puede pertenecer a mas de un in-component si un nodo perteneze a la vez al in-comp y out-comp de un nodo-I, pertenece a su misma componete fuertemente conexa componente débilmente conexa: componente conexa del grafo no-dirigido asociado componente fuertemente conexa: subconjunto maximal de nodos tal que existen caminos dirigidos entre cualquier par ordenado del conjunto. out-component inducido por un nodo-i: subconjunto de nodos alcanzables desde nodo-i a través de caminos dirigidos del grafo in-component inducido por un nodo-i: subconjunto de nodos desde los que se alcanza al nodo-i a través de algun caminos dirigido del grafo

Caminos Típicamente hay mas de un camino para ir de un nodo a otro dentro de la red, no todos los caminos son independientes o disjuntos Dos caminos entre un dado par de vértice son nodo-independientes (enlace-independiente) si no comparten ni un nodo (enlace), a menos de sus extremos 2 caminos enlace-independientes entre A y B otros dos caminos enlace-independientes… Nocion de camino…conexiones que empieszana surgir al integrar informacion Tipicamente hay mas de un camino para ir de un nodo a otro dentro de la red, no todos los caminos son INDEPENDIENTES, Algunas propiedades mas o menos obvias: +Si dos caminos son nodo-independientes entonces son enlace-independientes, pero no al reves +Existe un numero finito de caminos independientes entre cualquier par de puntos porque: a) hay un numero fiito de enlaces b) caminos independientes no pueden compartir enlaces Se puede utilizar el nro de caminos independientes como medidad de que tan fuertemente conectados estan dos nodos de la red. La idea de conectiviadad es muy importante para analizar propiedades de difusion sobre la red y encontrar estructura en la red . Interesara encontrar conjunto de vertices mas conectados entre si que con el resto para definir comunidades. Se puede utilizar el nro de caminos independientes como medida de que tan fuertemente conectados están dos nodos de la red idea de conectividad A y B tienen: conectividad de enlace 2 conectividad de nodo 1

Conjuntos de corte A D C 2 B C es un cuello de botella para el flujo A-B. Si se remueve C, A y B quedan desconectados C D E Un conjunto de vértices es un conjunto de corte (cut set), para un dado par de vértices, si su remoción los deja desconectados. Ejemplo: {C} es un conjunto de corte de tamaño 1 para el par (A,B) {D,E} es un conjunto de corte de tamaño 2 para el par (A,B) Un conjunto de enlaces un conjunto de corte (cut set), para un dado par de vértices, si su remoción los deja desconectados. Ejemplo: {(C,D),(C,E)} es un conjunto de corte de tamaño 2 para el par (A,B) {(C,D),(D,B),(C,E)} también es un conjunto de corte de tamaño 3 para el par (A,B) Tambien asociado con el tema de conectividad esta la idea de cuellos de botella. En el ejemplo anterior C era un cuello de botella para los caminos que unian A y B. Si removia C A y B quedaban desconectados conjunto de corte minimal, no necesariamente es unico. Conjunto de corte minimal: conjunto de corte de mínima cardinalidad. Ejemplo {(C,D),(C,E)} es minimal Para redes pesadas (grafo derecha) peso =máximo flujo que puede atravesar un enlace: conjunto de corte de mínimo peso acumulado. Para A y B: cjto corte minimal {(C,B},{A,D}}

Conectividad y cjtos de corte Conceptos de conectividad, conjuntos de corte y flujos en redes están relacionados El tamaño del conjunto de corte minimal de nodo entre dos vértices, es igual a la conectividad-de-nodo (nro de caminos nodo-independientes) entre los mismos. El tamaño del conjunto de corte minimal de enlace entre dos vértices es igual a la conectividad-de-enlace (nro de caminos enlace-independientes) entre los mismos. 2 A B C Hay situaciones donde el peso del enlace representa una capacidad para conducir una cantidad (por ejemplo trafico de vehiculos, o de internet) para esos casos hay un teorema util que relaciona el maximo flujo que puede existir entre dos nodos, con el min cut. Teorema max flow/min-cut El flujo máximo entre un par de vértices de una red es igual a la suma de los pesos de los enlaces del conjunto-de-corte-de-enlaces minimal entre los mismos D Max flow: A-B: 3 A-C: 5

Caminatas al azar Imaginemos un caminante (Juan) severamente alcoholizado caminando por una red (simple y conexa / fuertemente conexa). Consideremos el tiempo de manera discreta. A t=0 Juan se encuentra en el nodo-k Al pasar un intervalo Δt Juan avanza desde el nodo donde se encuentra actualmente hacia alguno de sus vecinos ¿Cuál es la probabilidad , 𝑝 𝑖 𝑡 , que a tiempo t Juan se encuentre en el nodo i ? Por qué tiene sentido esta pregunta? Inicialmente Juan está en el nodo-s. El vector de probabilidades p(t=0) es 𝑝 𝑖 𝑡=0 = 𝛿 𝑠𝑖 = 1 𝑠𝑖 𝑖=𝑠 0 𝑠𝑖 𝑖≠𝑠 Por cómo es el proceso de desplazamiento p(t+1) va a ser función de p(t) Para cada tiempo tengo un campo de probabilidades definido sobre la red. Ese campo va evolucionando con el tiempo…hasta una distribucion de equilibrio (?) 𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) prob que esté en nodo-j a tiempo t prob de elegir el enlace que lleva de j a i

Caminatas al azar…y difusión 𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) pi(t) probabilidad de encontrar a Juan en el nodo-i, en el paso temporal t Esta misma ecuación aplica a procesos de tipo difusivos en una red, donde en cada paso temporal toda la cantidad de material que se encuentra en el nodo-i es repartida y enviada a sus vecinos 𝑥 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑥 𝑗 (𝑡) xi(t) cantidad de material que a tiempo t se encuentra en el nodo-i

Donde está Juan? 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) 𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 matriz de adyacencia con columnas normalizadas por grado del nodo 𝐴 𝐷 −1 = 0 1/3 0 1/2 0 1/4 0 1/3 0 0 1/2 0 1/2 0 0 1/2 1/2 1 0 1/3 1/4 1/2 0 1/4 0 0 1/4 0 0 0 0 0 0 0 0 0 𝐴= 0 1 0 1 0 1 0 1 0 0 1 0 1 0 0 1 1 1 0 1 1 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0

Donde está Juan? 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 𝒑∞ =𝐴 𝐷 −1 𝒑∞ 𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 Notar que si sucede que la distribución de probabilidad converge, es decir 𝒑 𝑡→∞ →𝒑∞, se debe satisfacer que 𝒑∞ =𝐴 𝐷 −1 𝒑∞ Recordar yo, cuando es valido suponer que la p converja Esto significa que 𝒑∞ es autovector de 𝐴 𝐷 −1 , con autovalor 1. Notas Algebra lineal: 1 es autovalor dominante de 𝐴 𝐷 −1 , lo cual es razonable porque no esperamos que la probabilidad total deje de estar normalizada al evolucionar el tiempo.

Donde está Juan? 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 𝒑∞ =𝐴 𝐷 −1 𝒑∞ 𝑝∞ 𝑖= 𝑘 𝑖 𝑗=1 𝑁 𝑘 𝑗 𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 Notar que si sucede que la distribución de probabilidad converge, es decir 𝒑 𝑡→∞ →𝒑∞, se debe satisfacer que 𝒑∞ =𝐴 𝐷 −1 𝒑∞ Recordar yo, cuando es valido suponer que la p converja Esto significa que 𝒑∞ es autovector de 𝐴 𝐷 −1 , con autovalor 1. Por inspección se puede ver que el vector de probabilidades de componente i-esima: 𝑝∞ 𝑖= 𝑘 𝑖 𝑗=1 𝑁 𝑘 𝑗 es la solución buscada

a tiempos largos Juan está en… 𝑝∞ 𝑖= 𝑘 𝑖 𝑗=1 𝑁 𝑘 𝑗 𝒑∞ =𝐴 𝐷 −1 𝒑∞ 𝑘 𝑖 𝑗=1 𝑁 𝑘 𝑗 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑘 𝑗 𝑟=1 𝑁 𝑘 𝑟 = 1 𝑟=1 𝑁 𝑘 𝑟 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑘 𝑗 = 1 𝑟=1 𝑁 𝑘 𝑟 𝑗=1 𝑁 𝑎 𝑖𝑗 = 𝑘 𝑖 𝑗=1 𝑁 𝑘 𝑗

a tiempos largos Juan está en… 𝒑 0 =(0,0,0,0,0,1 ) 𝑇 𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) 𝒑 𝑡+1 =𝐴 𝐷 −1 𝒑 𝑡 𝑝∞ 𝑖= 𝑘 𝑖 𝑗=1 𝑁 𝑘 𝑗

a tiempos largos Juan está en… 𝑝∞ 𝑖= 1 𝑗=1 𝑁 𝑘 𝑗 𝑘 𝑖 La probabilidad de encontrar a Juan en el nodo-i es proporcional al grado del nodo El 2 aparece porque en la red nodirigida esta es la prob de ir en cualquier direccion ij o ji En este proceso difusivo, o de caminata, las cosas tienden a uniformizarse a nivel de enlaces: En el régimen asintótico, la probabilidad de encontrar a Juan atravesando uno de los M enlaces de la red, penlace(er=(i,j)), es uniforme 𝑝𝑒𝑛𝑙𝑎𝑐𝑒 𝑖𝑗= 𝑘 𝑗 𝑟=1 𝑁 𝑘 𝑟 1 𝑘 𝑗 = 1 𝑟=1 𝑁 𝑘 𝑟 =𝑐𝑡𝑒 prob de elegir uno de los vecinos de j prob de estar en j

Difusión en redes Cada nodo de la red tiene asociado a un tiempo t una cantidad de material xi(t) Pensamos en un proceso difusivo en el que el flujo desde el nodo-j al nodo-i es proporcional a la diferencia de material: flujoj->i~ C * (xj- xi) cte de difusión 𝑑 𝑥 𝑖 𝑑𝑡 =𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 (𝑥 𝑗 − 𝑥 𝑖 ) Si en lugar de asumir random walk, pensamos en que el flujo es proporcional a la diferencia

Difusión en redes [𝐿]𝑖𝑗 Pensamos en un proceso difusivo en el que el flujo desde el nodo-j al nodo-i es proporcional a la diferencia de material: flujoj->i~ C * (xj- xi) cte de difusión 𝑑 𝑥 𝑖 𝑑𝑡 =𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 (𝑥 𝑗 − 𝑥 𝑖 ) 𝑑 𝑥 𝑖 𝑑𝑡 =−𝐶 𝑗=1 𝑁 𝛿𝑖𝑗𝑘𝑗−𝐴 𝑖𝑗 𝑥𝑗 [𝐿]𝑖𝑗 =𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 𝑥 𝑗 −𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 𝑥 𝑖 𝑘𝑖 =𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 𝑥 𝑗 −𝐶 𝑘 𝑖 𝑥 𝑖 𝑑𝒙 𝑑𝑡 =−𝐶.𝐿 𝒙 𝑑𝒙 𝑑𝑡 =𝐶 𝛻 2 𝒙 Ec de difusion de calor =𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 𝑥 𝑗 −𝐶𝛿𝑖𝑗𝑘𝑗𝑥𝑗

Difusión en redes [𝐿]𝑖𝑗 Pensamos en un proceso difusivo en el que el flujo desde el nodo-j al nodo-i es proporcional a la diferencia de material: flujoj->i~ C * (xj- xi) cte de difusión 𝑑 𝑥 𝑖 𝑑𝑡 =−𝐶 𝑗=1 𝑁 𝛿𝑖𝑗𝑘𝑗−𝐴 𝑖𝑗 𝑥𝑗 [𝐿]𝑖𝑗 𝐿=𝐷−𝐴 Si en lugar de asumir random walk, pensamos en que el flujo es proporcional a la diferencia

Propiedades 𝐿=𝐷−𝐴 L es simétrica L es semidefinida-positiva (i.e. autovalores 𝜆𝑖≥0) Suma por columnas y por filas de L es cero Siempre 𝜆=0 es autovalor de L con autovector v0=(1,1,…,1), ya que L v0 = 0 v0 = 0 L es una matriz singular (i.e. no inversible)

Propiedades 𝐿=𝐷−𝐴 L es simétrica L es semidefinida-positiva (i.e. autovalores 𝜆𝑖≥0) Suma por columnas y por filas de L es cero Siempre 𝜆=0 es autovalor de L con autovector v0=(1,1,…,1), ya que L v0 = 0 v0 = 0 L es una matriz singular (i.e. no inversible) Si el grafo tiene p componentes, de tamaños n1, n2,…, np Notar que ahora habrá p autovectores de L asociados a 𝜆=0 de la forma L1 L2 ( 1,…,1 𝑛 1 ,0,0,...,0) ( 0,…,0 , 𝑛 1 1,…,1 𝑛 2 ,0,0,...,0) ( 0,…,0 𝑛 1 , 0,…,0 𝑛 2 , 1,…,1 𝑛 3 ,0,0,...,0)

Propiedades 𝐿=𝐷−𝐴 Laplaciano combinatorio L es simétrica L es semidefinida-positiva (i.e. autovalores 𝜆𝑖≥0) Suma por columnas y por filas de L es cero Siempre 𝜆=0 es autovalor de L con autovector v0=(1,1,…,1), ya que L v0 = 0 v0 = 0 L es una matriz singular (i.e. no inversible) Si el grafo tiene p componentes, de tamaños n1, n2,…, np, existen p autovectores de L asociados a 𝜆=0 Corolario: el segundo autovalor de L es 𝜆2 ≠ 0 sii el grafo posee una única componente 𝜆2 se denomina conectividad algebraica de la red

Descomposición espectral de L 𝐿 𝜙 𝑖 = 𝜆 𝑖 𝜙 𝑖 autovector i-esimo 𝐿= 𝑖=1 𝑁 𝜆 𝑖 𝜙 𝑖 𝜙 𝑖 𝑇 matriz

Autovectores de L 𝑳 𝝓 𝑖 = 𝜆 𝑖 𝝓 𝑖 𝝓 𝑖 𝑳 𝝓 𝑖 = 𝜆 𝑖 𝝓 𝑖 autovector i-esimo 𝝓 𝑖 define un campo escalar sobre el grafo

Caminatas al azar…y difusión 𝑝 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑝 𝑗 (𝑡) pi(t) probabilidad de encontrar a Juan en el nodo-i, en el paso temporal t Esta misma ecuación aplica a procesos de tipo difusivos en una red, donde en cada paso temporal toda la cantidad de material que se encuentra en el nodo-i es repartida y enviada a sus vecinos 𝑥 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑥 𝑗 (𝑡) xj(t) cantidad de material que a tiempo t se encuentra en el nodo-j

Difusión random-walk en redes A cada paso, la cantidad xi de cada nodo se altera 𝑥 𝑖 𝑡+1 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑥 𝑗 (𝑡) ∆ 𝑥 𝑖 = 𝑥 𝑖 𝑡+1 − 𝑥 𝑖 𝑡 = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑥 𝑗 𝑡 − 𝑥 𝑖 𝑡 en cada nodo hay una cantidad xi de material = 𝑗=1 𝑁 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑥 𝑗 𝑡 − 𝛿𝑖𝑗 𝑥 𝑗 𝑡 𝛿𝑖𝑗=1 𝑠𝑖𝑖 𝑖=𝑗 =− 𝑗=1 𝑁 𝛿𝑖𝑗 − 1 𝑘 𝑗 𝑎 𝑖𝑗 [𝐿 𝑟𝑤 ]𝑖𝑗 𝑥 𝑗 𝑡 Laplaciano random-walk 𝑑𝒙 𝑑𝑡 =− 𝐿 𝑟𝑤 𝒙 𝑑𝒙 𝑑𝑡 = 𝛻 2 𝒙 ∆𝒙=− 𝐿 𝑟𝑤 𝒙

Laplacianos [𝐿]𝑖𝑗 𝑑 𝑥 𝑖 𝑑𝑡 =−𝐶 𝑗=1 𝑁 𝛿𝑖𝑗𝑘𝑗−𝑎 𝑖𝑗 𝑥𝑗 𝐿=𝐷−𝐴 [ 𝐿 𝑟𝑤 ]𝑖𝑗 𝑑 𝑥 𝑖 𝑑𝑡 =−𝐶 𝑗=1 𝑁 𝛿𝑖𝑗𝑘𝑗−𝑎 𝑖𝑗 𝑥𝑗 [𝐿]𝑖𝑗 𝐿=𝐷−𝐴 𝑑 𝑥 𝑖 𝑑𝑡 =− 𝑗=1 𝑁 𝛿𝑖𝑗 − 1 𝑘 𝑗 𝑎 𝑖𝑗 𝑥 𝑗 𝑡 [ 𝐿 𝑟𝑤 ]𝑖𝑗 𝐿 𝑟𝑤 = 𝐼−𝐷 −1 𝐴= 𝐷 −1 𝐿 𝐿 𝑠𝑦𝑚 ≡ 𝐷 −1/2 𝐿 𝐷 −1/2 =𝐼− 𝐷 −1/2 𝐿 𝐷 −1/2

Priorización basada en redes nodos semilla La probabilidad asintótica de encontrar a un caminante aleatorio en el nodo-i es proporcional al grado del nodo 𝑝∞ 𝑖= 1 𝑗=1 𝑁 𝑘 𝑗 𝑘 𝑖 Pobabilidad de visita al nodo-x es una medida de asociación entre el nodo-x y el conjunto semilla Con qué probabilidad, en una caminata corta, voy a visitar un nodo-x si a tiempo t=0 parto de un conjunto nodos de interés (nodos semilla)? Con qué probabilidad asintótica voy a visitar un nodo-x si a tiempo t=0 parto de un nodo tomado al azar de un conjunto de nodos de interés (nodos semilla) y eventualmente fuerzo revisitar semillas? Integro dos espacios de conocimiento el embebido en el conexionado de la red el que utilicé para definir el conjunto de nodos-semilla

Priorización de genes asociados a enfermedades Kolher et al The American Journal of Human Genetics 2008

Priorización de nuevas asociaciones gen/enfermedad Algoritmos para propagar sentido de pertenecia al conjunto de interés: Random Walk with Restart (Kholer 2009) Net-Rank (Chen 2009) Net-Propagation (Vanunu 2010) Functional Flow (Navieba 2005) Kolher et al The American Journal of Human Genetics 2008

Priorización de nuevas asociaciones gen/enfermedad Algoritmos para propagar sentido de pertenecia al conjunto de interés: Random Walk with Restart (Kholer 2009) 𝑝 𝑖 𝑡+1 = 1−𝑟 𝑗=1 𝑁 𝑎 𝑖𝑗 𝑝 𝑗 𝑡 +𝑟 𝑝 𝑖 𝑡=0 𝒑 𝑡+1 = 1−r 𝐀 𝒑 𝑡 +𝑟 𝒑 0 r controla el sesgo hacia las condiciones iniciales el score se suele estimar a partir de simular un número reducido de pasos k: 𝒑 ∞ ~ 𝒑 𝑘 Kolher et al The American Journal of Human Genetics 2008

Priorización de nuevas asociaciones gen/enfermedad caminata aleatoria con reset. El score se suele estimar a partir de simular k-pasos

Genómica funcional En la era post-genómica conocemos en alto grado la composición exacta del genoma de un gran número de organismos Sin embargo, entender qué función cumple la proteína asociada a un dado gen sigue siendo un reto En general los métodos computacionales utilizaban exhaustivamente el criterio de similaridad de secuencia para asignar funciones putativas a una dada proteina aun no caracterizada funcionalmente La disponibilidad de datos omicos a escala global permite abordar esto desde otra perspectiva:

Functional Flow Asignación de funcionalidad a proteinas aun no caracterizadas simulando flujos de información en redes de interaccion de proteinas. Red de interacción de proteinas (pesada) apoptosis Dime con quien andas y te diré que haces Consideramos una función/proceso biológico (por ejemplo: GO-apoptosis) Cada proteina anotada a esa categoría es considerada una fuente de flujo de una cantidad extensiva xi(t) que representa un score-funcional Pensamos en un proceso difusivo en el que el flujo desde el nodo-j al nodo-i es proporcional a la diferencia de material: flujoj->i~ C * (xj- xi) Luego de cada paso, se reinyecta x a las semillas. La cantidad de flujo que recibe una proteina luego de k pasos de difusión representa el grado de asociación de la misma con la categoría funciopnal analizada. 𝑑 𝑥 𝑖 𝑑𝑡 =𝐶 𝑗=1 𝑁 𝑤 𝑖𝑗 (𝑥 𝑗 − 𝑥 𝑖 ) 𝜃( (𝑥 𝑗 − 𝑥 𝑖 ))

Priorización a partir de difusión en redes Imaginemos ahora que cada nodo de la red tiene asociado a un tiempo t una cantidad de material xi(t) Pensamos en un proceso difusivo en el que el flujo desde el nodo-j al nodo-i es proporcional a la diferencia de material: flujoj->i~ C * (xj- xi) cte de difusión 𝑑 𝑥 𝑖 𝑑𝑡 =𝐶 𝑗=1 𝑁 𝐴 𝑖𝑗 (𝑥 𝑗 − 𝑥 𝑖 ) Si en lugar de asumir random walk, pensamos en que el flujo es proporcional a la diferencia

Referencias Networks, An Introduction. Mark Newman Charlas Peter Dodds – Random Walk and diffusion Vito Latora Random Walk with Restart (Kholer 2009) Net-Rank (Chen 2009) Net-Propagation (Vanunu 2010) Functional Flow (Navieba 2005) Prioritization (Lu 2012 – Physics Report)