Download ppt - 1 AG-Monien Projektgruppe SEROSE Selfish Routing in Sokoban Environments ( Eigennütziges Routen in Netzwerken )

1

AG-Monien

Projektgruppe SEROSE

Selfish Routing in Sokoban Environments

(Eigennütziges Routen in Netzwerken)

http://www.uni-paderborn.de/home/

PG-SEROSE AG Monien 2

Sokoban



Sokoban



Sokoban mit autonomen Arbeitern

• Transportbedarf gegeben durch Jobs

• Kosten für Arbeiter gegeben durch zurückgelegte Wege

• Netzwerk gegeben als Sokoban-Instanz

• Entgelte für Transport gegeben für jeden Job




• Arbeiter sind eigenständige Agenten, die ihre Laufrouten so planen, dass sie ihren Gewinn maximieren.

• Gewinne der Arbeiter sind auch vom Verhalten der anderen Arbeiter abhängig.

• Stabile Zustände eines Systems sind erreicht, wenn alle Arbeiter ihre Routen geplant haben und kein Arbeiter mehr seine Route ändern will.









Thema der Projektgruppe

Berechnung von stabilen bzw. approximativ stabilen Zuständen (approximativen Nash Equilibrien) und global optimalen Zuständen in Sokoban-Systemen mit autonomen Arbeitern

Nash Equilibria vs. Global optimale Transportwege

Anschauliche Vorstellung: Ein Spiel zwischen nicht kooperierenden Spielern (Arbeiter), die ihren

persönlichen Gewinn maximieren wollen.



SOKOBAN

Definitionen:

Push: Verschieben einer Box auf ein Nachbarfeld

Carry: Verschieben einer Box auf ein beliebiges Feld ohne zwischendurch eine andere Box zu bewegen



SOKOBAN: Geschichte

Erfunden in den 1980ern von Thinking Rabbit, Takarazuka, Japan.

Quasi-Standard Benchmark von 50 Instanzen (1984), geordnet nach der Schwierigkeit für Menschen, sie zu lösen.

Bsp: Kürzeste bekannte Lösung (1999):

674 pushes



Literatur/Löser

Joseph Culberson. SOKOBAN is PSPACE-complete. Proceedings in Informatics 4. Fun with Algorithms (E.Lodi,

L.Pagli, N.Santoro eds). Carleton Scientific 1999. Andreas Junghanns. Pushing the limits: New developements in Single-Agent Search. Phd Thesis, Edmonton, CAN, 1999.

Push-basierter IDA*-LöserDatenbanken für DeadlockwiedererkennungSchrankenberechnung über Maximum Bipartite Matching

Ken‘ichiro Takahashi: Löser von Thinking Rabbit

http://www.ic-net.or.jp/home/takaken/e/

xsokoban.lcs.mit.edu/cgi-bin/xsokoban/best-scores (?)

http://www.ic-net.or.jp/home/takaken/e/



Ein eigener Löser

Carry-basiert Iterative Deepening DFS für non-goal carries Hashtabelle für Carryumstellungen Deadlockerkennung (Hashtabelle für

Wiedererkennung) Zielbereichsanalyse (in Kinderschuhen) Heuristische Bewertungsfunktion (Mobility) Erkennung statisch toter Felder



Deadlocks

Lösung:

101-139,

80-42,

60-59,

121-120

143-124

145+166

usw.



Deadlocks

Lösung:

101-139,

80-42,

60-59,

121-120

143-124

145+166

usw.



Deadlocks

Lösung:

101-139,

80-42,

60-59,

121-120

143-124

145+166

usw.

Warum nicht:

101-139,

121-120

143-124

145+166

usw.



Deadlocks

Deadlocked Frei



Zielbereichsanalyse

Welche Zielfelder sollen zuerst besetzt werden ?



Zielbereichsanalyse

Diese Konfiguration ist nicht mehr lösbar !

Gründe für die Unlösbarkeit können außerhalb des Zielbereiches liegen !



Zielgerichtete Suche

Bekannte Lösung erfordert 7 stille Carries am Anfang.

Welche Carries ?




Lösung:

179-181163-18249-12567-6884-65122-103121-123138+248 usw.




Ziele:

138-Goal ?121-(nicht 121)!122-(nicht 122) !84-(nicht 84) !67-(nicht 67) !49-(nicht 49) !163-(nicht 163) !179-(nicht 179) !



Ein eigener Löser

… läuft unter Linux… löst durchaus schon schwierige Instanzen,

(1..10,12) z.B.



Fazit

In der PG: Konzentration auf spieltheoretische

MethodenVermeidung der Deadlocks, z.B. durch

Verwendung von speziellen Eingabeinstanzen oder durch Erlauben von Ziehe-Operationen ?

Vermeidung von Zielbereichsanalysen, z.B. durch Vornummerierung von Boxen und Zielfeldern.

Vermeidung der Notwendigkeit von zielgerichteten Suchen z.B. durch Expansion der Labyrinthe (Straßen breiter machen)



Aufgaben dieser PG

Berechnung einer global optimalen LösungBerechnung eines bestmöglichen Nash

EquilibriumsBerechnung einer Lösung über AuktionenBerechnung einer heuristisch

eigenständigen LösungInstanzengenerator, Optimierer, Auktionator, Simulator, …

Jeder Teilnehmer schreibt einen eigenen Agenten. Anbindung zum Simulator über MPI.