ELI11

La modelación es como sigue: cada celda de la grilla representa un nodo. Los nodos que están en una diagonal par (fila + columna es divisible por 2) se conectan con la fuente, mientras que los nodos que están en una diagonal impar se conectan con el sumidero. Además, dos nodos se conectan entre ellos si y solo si representan celdas adyacentes en la grilla, y la dirección de la arista va desde el nodo asociado a una diagonal par hacia el nodo asociado a una diagonal impar. La capacidad de cada arista es 1 y los nodos asociados a celdas bloqueadas no tienen aristas. Luego, el tablero puede ser cubierto con dominós si y solo si el flujo máximo desde la fuente al sumidero es igual a la mitad de las celdas no bloqueadas.

La siguiente visualización muestra la modelación descrita anteriormente. A la izquierda se encuentra la grilla, mientras que a la derecha se encuentra el grafo que deriva de ella. Para simplificar el grafo, se asume que las aristas van de izquierda a derecha, y la capacidad de cada arista es 1. Al mover el cursor sobre una celda de la grilla se hace resaltar el nodo correspondiente en el grafo. Además, se puede hacer doble click sobre las celdas para bloquearlas/desbloquearlas. Por último, al colocar un dominó se representa el flujo en el grafo resaltando las aristas correspondientes con color morado (por ejemplo, al colocar un dominó vertical sobre las celdas 2 y 7, se resalta el camino fuente-2-7-sumidero).

¿Por qué funciona?

Consideremos las celdas que estan en una diagonal par. Lo primero es notar estos nodos tienen una única arista de entrada, la que se conecta a la fuente con una capacidad igual a 1. Esto hace respetar la restricción de que cada una de estas celdas es ocupada por a lo más un dominó, puesto que no puede pasar más que una unidad de flujo por ese nodo. Luego ese flujo pasa por uno de los nodos asociados a una diagonal impar para luego irse al sumidero.

Ahora consideremos los nodos asociados a una diagonal impar. Análogo a lo anterior, estos nodos tiene solo una arista de salida, la que se conecta al sumidero con una capacidad igual a 1. Esto restringe a que estas celdas también sean ocupadas por a lo más un nodo.

Falta verificar que el flujo representa una configuración válida de dominós y que no se está colocando un dominó "partido en 2" ocupando celdas no adyacentes. Esta restricción se respeta por el hecho de que solo nodos asociados a celdas adyacentes están conectados en el grafo.

Por último, falta justificar cómo se determina que el tablero completo puede ser cubierto. Esto es simple: cada unidad de flujo desde la fuente al sumidero representa un dominó, lo que cubre dos celdas. Por lo tanto, para cubrir todas las celdas se necesita que el flujo máximo sea igual a la mitad del número de celdas.

Volviendo a la instancia inicial del problema...

Push/Relabel

A diferencia de los algoritmos basados en el método de Ford y Fulkerson, los algoritmos basados en push/relabel no mantienen siempre un flujo válido por el grafo. En cambio, estos algoritmos no respetan la "conservación" del fluido, es decir, los nodos pueden recibir más fluido que el que sale de ellos - pueden tener un exceso de flujo. Al igual que los algoritmos basados en Ford y Fulkerson, los algoritmos basados en push/relabel trabajan sobre el grafo de capacidades residuales, es decir, al enviar c unidades de flujo desde u hasta v, se agregan c unidades de capacidad a la arista que va desde v hasta u.

La intuición detrás de los métodos de push/relabel se pueden entender en términos de fluidos. Las aristas representan cañerías entre los vertices. Por el otro lado, los vertices representan un estanque de fluido arbitrariamente grande, el cual guarda el exceso de flujo del vertice. Cada vertice (estanque) se ubica a una determinada altura, la cual va aumentando a lo largo del algoritmo.

La altura de los vértices determina como el flujo se mueve por la red: solo se 'empuja' fluido cuesta abajo, es decir, desde vértices más altos a vértices más bajos. Esta operación se llama push. El flujo puede ir cuesta arriba, pero las operaciones del algoritmo solo empujan el flujo cuesta abajo. El vértice fuente tiene una altura fija en N (el número de nodos de la red), mientras que todos los otros vértices parten con altura 0.

Inicialmente el algoritmo envía todo el fluido posible desde las cañerías que salen de la fuente. Ese fluido se acumula en los vertices a donde llegan esas cañerías y eventualmente se continua empujando cuesta abajo hacia el sumidero. Si un vertice intermedio contiene fluido en su estanque pero solo se conecta con vertices con altura superior, entonces la altura de ese vertice debe ser aumentada. Esta operacion se llama relabel, y consiste en aumentar la altura de un vértice a una unidad más que la altura del más bajo de sus vecinos hacia el que se puede empujar fluido.

Eventualmente todo el fluido que podía llegar al sumidero ha llegado a él. Para hacer que el flujo sea 'legal' y se respete que todo el fluido que entra a un nodo también salga de él, lo que sucede es que los vertices intermedios del grafo siguen aumentando su altura hasta que eventualmente se ubican por sobre la fuente. Una vez llegado a ese punto, el exceso de flujo que quedaba en los estanques empieza a fluir de vuelta hacia la fuente. La respuesta final del algoritmo (osea, el flujo máximo) es igual al exceso de flujo en el sumidero al finalizar.

Operaciones

Ya entregada la intuición detras de los algoritmos de push/relabel se procede a entregar el pseudocódigo. Algunos comentarios sobre la notación:

El grafo se representa como una tupla \(G=V,E\), donde \(V\) es el conjunto de vértices y \(E \subseteq V \times V\) es el conjunto de aristas.
Dado un vértice \(u\), \(u.e\) entrega el exceso de flujo en el vertice y \(u.h\) entrega la altura del vértice..
Dado vértices \(u\) y \(v\), \((u,v)\) representa la arista entre \(u\) y \(v\). \((u,v).c\) representa la capacidad de dicha arista.

Algunos detalles sobre la visualización:

El eje y representa el identificador del nodo. El eje x representa la altura del nodo.
El color del nodo indica el exceso de flujo que posee
Las aristas con capacidad 0 no se muestran en el grafico. Las aristas que sí se muestran tienen capacidad 1.
Los nodos fuente y sumidero son de color azul pues su exceso de flujo puede tomar valores arbitrarios.

• Push

Esta operación toma vértices \(u\) y \(v\), y es válida solo cuando \(u\) tiene exceso de flujo, \((u,v).c\) es mayor a 0 y \(u.h = u.v+1\). Su acción es mover todo el flujo posible desde \(u\) hacia \(v\).

En el ejemplo se hace push desde el nodo 3 al 2.

• InitializePreflow

Esta operación se aplica solamente al comienzo del algoritmo. Lo que hace es empujar todo el flujo posible desde la fuente hacia sus vecinos y setear la altura de cada vértice a la distancia entre el vértice y el sumidero.

Volviendo al problema de los dominos...

Conclusión

Se presentó un problema que inicialmente parecía requerir backtracking para resolverse, y se explicó la modelación del problema como un problema de flujo máximo. Además, se presentó un algoritmo eficiente para resolver el problema de flujo máximo: dependiendo de las estructuras de datos utilizadas (no exploradas acá), el algoritmo puede funcionar en \(O(V^3)\), lo que es considerablemente mejor que el algoritmo de Ford y Fulkerson plano (el cual es exponencial).

Para más detalles sobre el tiempo de ejecución del algoritmo y su correctitud, sugerimos leer 'Introduction to Algorithms' de Cormen et. al.

Cubriendo la Grilla con Push/Relabel

Por Antonio López y Andrés Ríos

El Problema

Modelamiento