6
und Erfassen des Spielgeschehens und das Entwickeln in- telligenter Verhaltensmuster. Darüber hinaus bieten die jähr- lich stattfindenden Weltmeisterschaften im Roboterfußball (Robocup), zuletzt im Juni 2006 in Bremen, eine ideale Platt- form zum direkten Vergleich verschiedener Techniken und zum wissenschaftlichen Austausch. Ein Roboterfußballspiel verläuft im Prinzip wie ein menschliches Spiel, nur auf einem kleineren Feld und mit weniger Spielern. Zwei bis sechs Roboter in jedem Team tre- ten gegeneinander an, und sobald der Schiedsrichter das Spiel angepfiffen hat, ist jedes menschliche Eingreifen ver- boten. Die Roboter müssen also selbstständig agieren, ihre Umwelt erfassen, ihre eigene Position, die des Balles und der Mitspieler berechnen und daraus eine sinnvolle Verhal- tensweise ableiten und diese umsetzen. Dabei müssen sie die Fußballregeln einhalten, die beim Anstoß, Freistoß, Eck- ball und Torabstoß denen des menschlichen Fußballs ent- sprechen. Lediglich beim Einwurf gibt es Unterschiede, da die Roboter in fast allen Robocup-Ligen noch keine Arme haben. Auch Fouls und gelbe Karten kommen vor,wenn bei- spielsweise ein Roboter den anderen wegschiebt, mutwil- lig beschädigt oder umwirft. Wie im menschlichen Fußball gibt es auch beim Robo- terfußball verschiedene Ligen, die sich an den jeweiligen Fähigkeiten der Roboter orientieren. In der SmallSizeLeague sind die Roboter nur etwa 20 cm groß und besitzen keine eigene Sensorik. Stattdessen wird eine Kamera über dem Spielfeld aufgehängt, die das Spielgeschehen von oben be- obachtet. In der MiddleSizeLeague sind die Roboter etwa 80 cm groß. Eine externe Sensorik ist hier nicht erlaubt; stattdessen besitzen die Roboter Kameras und müssen de- ren Bilder auch an Bord auswerten. Während in der Small- SizeLeague und der MiddleSizeLeague radbasierte Roboter eingesetzt werden, spielen in der FourLeggedLeague vier- beinige Spielzeug-Roboterhunde,die ebenfalls vollkommen autonom arbeiten. Vor wenigen Jahren kam eine Humano- id-Liga hinzu, in der zweibeinige, menschenähnliche Robo- ter mitspielen. Neben den Ligen, in der richtige Roboter gegeneinan- der antreten, gibt es noch eine Simulationsliga. In ihr wird das Spielgeschehen komplett auf einem Computer simu- liert. Die Spieler sind hier autonome Computerprogramme, die an den Simulator angebunden sind. Wegen der gerin- geren Kosten für Hardware können in dieser Liga pro- blemlos 11-gegen-11-Spielstrategien erprobt werden, daher ist das taktische Niveau ist in dieser Liga auch am höchsten. F ällt das Wort Roboter, denken wohl die meisten Men- schen an Figuren aus Hollywoodstreifen wie „I, Robot“ oder an Industrieroboter in Autofabriken, aber wohl kaum jemand verbindet den Begriff mit Fußball. Doch genau die- se Herausforderung, Robotern das Fußballspielen beizu- bringen,beschäftigt Forscher aus aller Welt seit zehn Jahren. Auch wenn diese Idee zunächst skurril anmutet, so hat sie doch einen ernst zu nehmenden Hintergrund. Die bisheri- ge Roboterforschung orientiert sich in erster Linie an der Entwicklung von Industrierobotern, die eingesetzt werden können, um immer wiederkehrende Tätigkeiten innerhalb von industriellen Fertigungsprozessen zu übernehmen. Die dabei erreichte Leistungsfähigkeit und Präzision übertrifft inzwischen diejenige von Menschen bei Weitem. Dem steht jedoch ein eklatanter Mangel gegenüber: Die Roboter kön- nen weder auf eine veränderte Umgebung reagieren noch ihr Verhalten anpassen. Sie verstehen nicht, was sie tun, sondern führen lediglich die einprogrammierte Bewegung aus. In Zukunft wird es jedoch immer mehr Anwendungen geben, in denen Roboter nicht mehr in Fabrikhallen einge- setzt werden, sondern im Alltag ihre Aufgaben erledigen müssen. Dafür müssen sie mit anderen Individuen inter- agieren, sich in einer zunächst unbekannten Umgebung zu- rechtfinden und das eigene Verhalten an die jeweilige Si- tuation anpassen. Und hier kommt der Fußball ins Spiel. Zwar werden wohl auch in Zukunft Ballack,Lehmann & Co nicht durch Roboter ersetzt werden, für die Forschung im Bereich intelligenter autonomer Roboter aber bietet die Auf- gabenstellung Fußballspielen ideale Be- dingungen für die Entwicklung neuer Verfahren und die Verbesserung der Sensorik. Die dynamische Spielumge- bung erfordert Interaktion mit den Mit- spielern und Gegnern, Wahrnehmen Autonome Roboter Roboter lernen Fußball spielen MARTIN L AUER | ROLAND HAFNER Sind Fußball spielende autonome Roboter eine wissenschaft- liche Spielerei? Im Gegenteil, sie sind eine große Herausforde- rung an Robotik und Künstliche Intelligenz. Neben robuster Mechanik brauchen sie vor allem eine zuverlässige Wahr- nehmung der Umgebung und eine intelligente Verhaltens- steuerung. 82 | Phys. Unserer Zeit | 2/2007 (38) © 2007 Wiley-VCH Verlag GmbH & Co. KGaA, Weinheim DOI: 10.1002/piuz.200601127 INTERNET | Brainstormers Tribots www.brainstormers.uos.de RoboCup 2006 www.robocup2006.org

Roboter lernen Fußball spielen: Autonome Roboter

Embed Size (px)

Citation preview

Page 1: Roboter lernen Fußball spielen: Autonome Roboter

und Erfassen des Spielgeschehens und das Entwickeln in-telligenter Verhaltensmuster. Darüber hinaus bieten die jähr-lich stattfindenden Weltmeisterschaften im Roboterfußball(Robocup),zuletzt im Juni 2006 in Bremen,eine ideale Platt-form zum direkten Vergleich verschiedener Techniken undzum wissenschaftlichen Austausch.

Ein Roboterfußballspiel verläuft im Prinzip wie einmenschliches Spiel, nur auf einem kleineren Feld und mitweniger Spielern. Zwei bis sechs Roboter in jedem Team tre-ten gegeneinander an, und sobald der Schiedsrichter dasSpiel angepfiffen hat, ist jedes menschliche Eingreifen ver-boten. Die Roboter müssen also selbstständig agieren, ihreUmwelt erfassen, ihre eigene Position,die des Balles und derMitspieler berechnen und daraus eine sinnvolle Verhal-tensweise ableiten und diese umsetzen. Dabei müssen siedie Fußballregeln einhalten, die beim Anstoß, Freistoß, Eck-ball und Torabstoß denen des menschlichen Fußballs ent-sprechen. Lediglich beim Einwurf gibt es Unterschiede, dadie Roboter in fast allen Robocup-Ligen noch keine Armehaben. Auch Fouls und gelbe Karten kommen vor,wenn bei-spielsweise ein Roboter den anderen wegschiebt, mutwil-lig beschädigt oder umwirft.

Wie im menschlichen Fußball gibt es auch beim Robo-terfußball verschiedene Ligen, die sich an den jeweiligenFähigkeiten der Roboter orientieren. In der SmallSizeLeaguesind die Roboter nur etwa 20 cm groß und besitzen keineeigene Sensorik. Stattdessen wird eine Kamera über demSpielfeld aufgehängt, die das Spielgeschehen von oben be-obachtet. In der MiddleSizeLeague sind die Roboter etwa80 cm groß. Eine externe Sensorik ist hier nicht erlaubt;stattdessen besitzen die Roboter Kameras und müssen de-ren Bilder auch an Bord auswerten. Während in der Small-SizeLeague und der MiddleSizeLeague radbasierte Robotereingesetzt werden, spielen in der FourLeggedLeague vier-beinige Spielzeug-Roboterhunde,die ebenfalls vollkommenautonom arbeiten. Vor wenigen Jahren kam eine Humano-id-Liga hinzu, in der zweibeinige, menschenähnliche Robo-ter mitspielen.

Neben den Ligen, in der richtige Roboter gegeneinan-der antreten, gibt es noch eine Simulationsliga. In ihr wirddas Spielgeschehen komplett auf einem Computer simu-liert. Die Spieler sind hier autonome Computerprogramme,die an den Simulator angebunden sind. Wegen der gerin-geren Kosten für Hardware können in dieser Liga pro-blemlos 11-gegen-11-Spielstrategien erprobt werden, daherist das taktische Niveau ist in dieser Liga auch am höchsten.

Fällt das Wort Roboter, denken wohl die meisten Men-schen an Figuren aus Hollywoodstreifen wie „I, Robot“

oder an Industrieroboter in Autofabriken, aber wohl kaumjemand verbindet den Begriff mit Fußball. Doch genau die-se Herausforderung, Robotern das Fußballspielen beizu-bringen,beschäftigt Forscher aus aller Welt seit zehn Jahren.Auch wenn diese Idee zunächst skurril anmutet, so hat siedoch einen ernst zu nehmenden Hintergrund. Die bisheri-ge Roboterforschung orientiert sich in erster Linie an derEntwicklung von Industrierobotern, die eingesetzt werdenkönnen, um immer wiederkehrende Tätigkeiten innerhalbvon industriellen Fertigungsprozessen zu übernehmen. Diedabei erreichte Leistungsfähigkeit und Präzision übertrifftinzwischen diejenige von Menschen bei Weitem. Dem stehtjedoch ein eklatanter Mangel gegenüber: Die Roboter kön-nen weder auf eine veränderte Umgebung reagieren nochihr Verhalten anpassen. Sie verstehen nicht, was sie tun,sondern führen lediglich die einprogrammierte Bewegungaus.

In Zukunft wird es jedoch immer mehr Anwendungengeben, in denen Roboter nicht mehr in Fabrikhallen einge-setzt werden, sondern im Alltag ihre Aufgaben erledigenmüssen. Dafür müssen sie mit anderen Individuen inter-agieren, sich in einer zunächst unbekannten Umgebung zu-rechtfinden und das eigene Verhalten an die jeweilige Si-tuation anpassen. Und hier kommt der Fußball ins Spiel.Zwar werden wohl auch in Zukunft Ballack,Lehmann & Co

nicht durch Roboter ersetzt werden, fürdie Forschung im Bereich intelligenterautonomer Roboter aber bietet die Auf-gabenstellung Fußballspielen ideale Be-dingungen für die Entwicklung neuerVerfahren und die Verbesserung derSensorik. Die dynamische Spielumge-bung erfordert Interaktion mit den Mit-spielern und Gegnern, Wahrnehmen

Autonome Roboter

Roboter lernen Fußball spielenMARTIN LAUER | ROLAND HAFNER

Sind Fußball spielende autonome Roboter eine wissenschaft-liche Spielerei? Im Gegenteil, sie sind eine große Herausforde-rung an Robotik und Künstliche Intelligenz. Neben robusterMechanik brauchen sie vor allem eine zuverlässige Wahr-nehmung der Umgebung und eine intelligente Verhaltens-steuerung.

82 | Phys. Unserer Zeit | 2/2007 (38) © 2007 Wiley-VCH Verlag GmbH & Co. KGaA, Weinheim

DOI: 10.1002/piuz.200601127

I N T E R N E T |Brainstormers Tribotswww.brainstormers.uos.de

RoboCup 2006www.robocup2006.org

Page 2: Roboter lernen Fußball spielen: Autonome Roboter

F U S S B A L L R O B O T E R | RO B OT I K

Je nach Liga unterscheiden sich die Forschungs-schwerpunkte. Während in der Humanoidliga die Realisie-rung dynamischer Bewegungen wie schnelles Laufen oderBall schießen gegenwärtig im Mittelpunkt stehen, sind inden anderen Ligen Fragen der Wahrnehmung der Umge-bung, des Umgangs mit dem Ball, der Interaktion mit Mit-spielern sowie der Teamstrategie dominierend.

RoboterkonstruktionStellvertretend für die heute üblichen Fußballroboter stel-len wir hier die Roboter unseres Teams Brainstormers Tri-bots von der Universität Osnabrück vor, dem amtierendenWeltmeister in der MiddleSizeLeague [1]. Die Roboter be-stehen aus einer Grundkonstruktion aus Aluminium-Kant-profilen, in die Motoren,Räder und die Elektronik eingebautsind. Das Fahrwerk ist als Omnidirektionalantrieb ausge-legt,das heißt der Roboter kann ohne Wendemanöver in al-le Richtungen fahren (s. „Omnidirektionaler Antrieb,S. 85).Als Antrieb dienen drei 90-Watt-Gleichstrommotoren, dieden Roboter auf maximal 3 m/s beschleunigen können. Al-lerdings ist auf dem nur 12 m langen und 8 m breiten Spiel-feld weniger die Endgeschwindigkeit entscheidend, son-dern eher die Beschleunigung des Roboters und die Präzi-sion, mit der er seine Bewegungen ausführen kann.Batterien stellen die benötigte Energie zur Verfügung, müs-

sen aber wegen der beschränkten Speicherkapazität vor je-dem Spiel gewechselt werden.

Als Sensor dient dem Roboter neben den Inkremental-encodern, die die Drehgeschwindigkeiten der Räder mes-sen, in erster Linie die omnidirektionale Kamera. Diese be-steht aus einer handelsüblichen Industriekamera, die senk-recht nach oben auf einen gekrümmten Spiegel „schaut“(Abbildung 3). Dadurch erhält sie einen Rundumblick aufdas Spielfeld. Sie nimmt also gleichzeitig die Bereiche vor,hinter und neben dem Roboter wahr. Das Bild erscheintzwar etwas verzerrt, dafür bietet die Rundumsicht un-schätzbare Vorteile für die weitere Auswertung der Bildin-formation. Durch sie können wir auch auf den Aufwand ei-ner drehbar gelagerten Kamera verzichten. Allerdings er-fordert die Entzerrung des Bildes einen aufwändigenKalibrierungsprozess des Kamera-Spiegel-Systems.

Neben Kameras und Radencodern werden im Roboter-fußball vereinzelt weitere Sensoren verwendet, zum Bei-spiel Laserscanner zur Erkennung von Toren und Hinder-nissen, taktile Sensoren, Magnetkompasse, Gyroskope undBeschleunigungssensoren. Bei den humanoiden Roboternkommen noch Neigungssensoren hinzu. Zusätzliche Sen-soren ermöglichen eine weitergehende Wahrnehmung derUmgebung. Doch der Preis dafür ist meist ein aufwändige-rer Auswertungsprozess, um Störungen und Rauschen zu-verlässig aus dem Signal zu eliminieren. So wird die Infor-

© 2007 Wiley-VCH Verlag GmbH & Co. KGaA, Weinheim www.phiuz.de 2/2007 (38) | Phys. Unserer Zeit | 83

Abb. 1 Szene aus einem Roboterfußballspiel in der MiddleSizeLeague zwischen den Brainstormers Tribots aus Osnabrück(violette Nummern) und den COPS-Robotern der Universität Stuttgart (blaue Nummern).

Page 3: Roboter lernen Fußball spielen: Autonome Roboter

mation eines Magnetkompasses beispielsweise von den Magnetfeldern der Motoren gestört. Infrarotsensoren kön-nen durch einfallendes Umgebungslicht beeinträchtigt wer-den, Beschleunigungssensoren sind stark verrauscht, schonweil die ungefederten omnidirektionalen Räder relativ un-ruhig laufen. Eine zuverlässige Erfassung der Umgebungbasiert also immer auf mehreren Sensoren und der an-schließenden Kombination der Messdaten.

Die Verarbeitung der Sensorinformation sowie die Be-rechnung einer zweckmäßigen Verhaltensweise erfolgt imRoboter auf einem handelsüblichen Laptop. Aufgrund dereingeschränkten Energieversorgung und des beschränktenPlatzes müssen hier Kompromisse bei der Rechenleistungeingegangen werden. Eine alternative Lösung bieten konfi-gurierbare Mini-PCs, die allerdings auch eine zusätzlicheStromversorgung benötigen.

Um Fußball spielen zu können, besitzen die Roboter ei-nen Schussmechanismus,der bei den meisten Teams aus ei-ner Hebelmechanik besteht. Ausgelöst wird diese von einerFeder, einem Elektromagneten oder pneumatisch. Vor al-lem pneumatische Systeme haben sich in den letzten Jah-ren durchgesetzt, weil sie einfach gebaut sind und einegroße Schussstärke erreichen. Bei ihnen ist ein Druckluft-tank, der vor dem Spiel befüllt wird, über ein Magnetventil

mit einem Druckzylinder verbunden. Öffnet das Ventil,dannströmt Luft in den Zylinder und lenkt über den Kolben denSchusshebel aus. Damit kann der Mechanismus den Ball aufmehr als 5 m/s beschleunigen, schafft also hohe und weiteSchüsse.

WahrnehmungFür den fußballerischen Erfolg braucht der Roboter nichtnur eine robuste mechanische Konstruktion,sondern vor al-lem eine zuverlässige und genaue Auswertung seiner sen-sorischen Messwerte. Für uns Menschen sind die nötigenFähigkeiten wie eine richtige Bildinterpretation, das Erken-nen des Balls oder der Mitspieler geradezu trivial. Doch fürdie Robotik und Künstliche Intelligenz sind sie ausgespro-chen anspruchsvoll,gerade wenn der Roboter sie unter denRahmenbedingungen eines Fußballspiels beherrschen soll.

Die Roboter orientieren sich in erster Linie an den Ka-merabildern (Abbildung 3). Bei der Gestaltung des Fuß-ballfeldes werden derzeit noch einige Kompromisse ge-macht, um den Robotern die Orientierung zu erleichtern:Die Tore sind nicht wie bei normalen Spielen mit Netzenausgestattet sondern besitzen farbige Rück- und Seiten-wände in kräftigen Gelb- und Blautönen, und massive Eck-pfosten ersetzen die filigranen Eckfahnen. Auch der Ball istauffallend orange gefärbt.

Allerdings täuscht uns die menschliche Wahrnehmungeiner Spielszene leicht über die technischen Schwierigkei-ten hinweg. Unser komplexes visuelles System ist nämlichperfekt darin, das Tor als ganzes Objekt zu erkennen. Des-halb kann es zum Beispiel eine Torfläche als zusammen-hängend interpretieren und lässt sie uns in einem schöngleichmäßigen Gelb erscheinen. Doch tatsächlich enthältdiese Fläche viele Schattierungen, die die Kamera – wie un-ser Auge – als unterschiedliche Brauntöne abbildet. Damit

84 | Phys. Unserer Zeit | 2/2007 (38) www.phiuz.de © 2007 Wiley-VCH Verlag GmbH & Co. KGaA, Weinheim

Abb. 2 Ein Roboter des Teams Brainstormers Tribots mitabgenommener Verkleidung. Der Roboter ist etwa 80 cmhoch und circa 40 cm breit. Gut zu erkennen ist die Kameramit Spiegel (oben), der aufgeklappte Laptop, der Schusshebelsowie der Drucklufttank für den Schussmechanismus imInnern.

Abb. 3 Kamerabild einer omnidirektionalen Kamera. DasBild zeigt das Fußballfeld mit Toren (blau und gelb), Ball(orange) und Hindernissen (schwarz). In der Mitte des Bildesist die Linse der Kamera erkennbar. Die drei durch das Bildlaufenden schwarzen Streifen gehören zu den Befestigungs-streben des Spiegels.

Page 4: Roboter lernen Fußball spielen: Autonome Roboter

F U S S B A L L R O B O T E R | RO B OT I K

muss die Software des Roboters zurecht kommen. Sie hates sogar schwer, den leuchtfarbenen Ball als zusammen-hängendes Objekt zu erkennen,denn auf dessen Oberflächeerzeugt das Lichtspiel helle Glanzpunkte und nahezuschwarze Abschattungen.

Die Farbinformation alleine ist also wenig verlässlich,zu-mal die Zuschauer oftmals direkt am Spielfeldrand stehen.Durch ihre bunte Bekleidung würden sie jeden Roboter indie Irre führen, der sich nur auf die Farbe der Objekte ver-lässt. Um die Entwicklung möglichst robuster Algorithmenzu forcieren, wurde zudem die künstliche Beleuchtung derSpielfelder in der MiddleSizeLeague reduziert. Die Folge isteine ungleichmäßige Ausleuchtung der Felder.

Um ein zuverlässiges Erkennen aller relevanten Objek-te auf dem Spielfeld zu erreichen, müssen wir möglichstviele visuelle Merkmale wie Farbe, Form und Helligkeits-verläufe kombinieren. Dem Einsatz solcher Algorithmen set-zen allerdings die beschränkte Rechenleistung und die Echt-zeitanforderungen Grenzen. Je nach Kameratyp müssen dieVerfahren in der Lage sein, zwischen 15 und 30 Bildern proSekunde zu verarbeiten. Pro Bild stehen also nur wenige Millisekunden Rechenzeit zur Verfügung. Das bedeutet,dassnicht einmal alle Pixel eines Bildes ausgewertet werdenkönnen.

Zur Bestimmung der eigenen Position eines Robotersauf dem Spielfeld haben sich daher in den letzten JahrenVerfahren durchgesetzt, die die weißen Markierungslinienauf dem Feld nutzen. Durch den starken Kontrast sind sieauch bei ungleichmäßiger Beleuchtung gut zu erkennen.Durch systematisches Absuchen des Bildes nach hellenschmalen Flächen entsteht auf diese Weise eine Liste mitPunkten im Bild, bei denen es sich um Teile der Feldmar-kierungen handeln könnte. Natürlich kann es passieren,dass das System auch andere helle Streifen, etwa Lichtre-flexionen an metallischen Teilen, irrtümlicherweise als Li-nien interpretiert. Auf diese Gefahr muss die weitere Ver-arbeitung Rücksicht nehmen.

Der Roboter ermittelt nun seine Position, indem er dieerkannten Linienpunkte mit einem Modell des Spielfeldesabgleicht. Dieses beinhaltet die zuvor ausgemessene Längeund Breite des Feldes sowie die Lage der weißen Linien. Da-bei verwenden die Konstrukteure zwei grundsätzlich un-terschiedliche Ansätze. Beim ersten Ansatz wird das Loka-lisierungsproblem als Optimierungsaufgabe formuliert, diedie Diskrepanz zwischen gesehenen Linien und Markie-rungsmodell minimieren soll. Mit Hilfe effizienter numeri-scher Algorithmen ist dann eine Schätzung der Roboter-position möglich [2].

Das zweite Verfahren verwendet so genannte ParticleFilter [3]. Dabei handelt es sich um eine stochastische Mo-dellierung, die eine Verteilung der Aufenthaltswahrschein-lichkeit des Roboters auf dem Feld liefert. Diese Wahr-scheinlichkeitsverteilung ist nicht mehr analytisch darstell-bar. Zu ihrer Repräsentation werden Punktwolken, sogenannte Partikel, verwendet. Je wahrscheinlicher sich derRoboter in einem bestimmten Bereich des Feldes aufhält,

desto dichter ist dort die Partikelwolke. Bei jedem neuenKamerabild werden die Partikel zunächst anhand der aktu-ellen Roboterbewegung verschoben, die der Bordrechneraus den Fahrkommandos und Sensordaten ermittelt. An-schließend werden sie mit dem Kamerabild abgeglichen.Der Bereich mit der dichtesten Partikelkonzentration ist somit die wahrscheinlichste Roboterposition.

Während der Vorteil der Particle Filter vor allem darinbesteht, dass verschiedene Positionshypothesen gleichzei-tig verfolgt werden können, erreichen die Optimierungs-verfahren eine größere Genauigkeit und Zuverlässigkeit inder Positionsbestimmung. Der Schätzfehler liegt bei etwa 10cm. Darüber hinaus benötigen sie weniger Rechenzeit undeignen sich daher für den Einsatz auf den Robotern beson-ders gut.

Ähnlich wie seine eigene Position erfasst der Roboterauch die Positionen des Balls und der anderen Spieler. Der-zeit ist allerdings in der MiddleSizeLeague noch kein Teamin der Lage, aus den Kamerabildern zwischen Mitspielernund Gegnern zu unterscheiden. Deshalb teilen sich bei ei-nigen Teams die Roboter sich gegenseitig per Funk ihre Po-

© 2007 Wiley-VCH Verlag GmbH & Co. KGaA, Weinheim www.phiuz.de 2/2007 (38) | Phys. Unserer Zeit | 85

O M N I D I R E K T I O N A L E R A N T R I E B |Gewöhnliche Antriebe ermöglichen eseinem Fahrzeug lediglich, sich vor- undrückwärts zu bewegen. Seine Fahrtrich-tung muss es durch Lenken ändern. Einomnidirektionaler Antrieb hingegenerlaubt auch Seitwärtsbewegungenund Drehungen auf der Stelle, besitztalso drei Bewegungsfreiheitsgrade.Erreicht wird dies durch omnidirektio-nale Räder, auf deren Radumfangantriebslose Rollen quer zur Radhaupt-achse angebracht sind. Eine geeigneteAnordnung mehrerer omnidirektionalerRäder kann also ein Fahrzeug befähi-gen, Bewegungen in beliebiger Rich-tung auszuführen, ohne sich vorherdrehen zu müssen.

Die so genannte Delta-Anordnung istbesonders einfach: Bei ihr befinden sichdrei individuell angetriebene omni-direktionale Räder an den Eckpunkteneines Dreiecks. Über die Geschwindig-keiten der drei Räder wird das Fahrzeugin alle Richtungen gesteuert, es kommtohne Lenkmechanik aus. Um vorwärtszu fahren, drehen sich beispielsweisedie beiden vorderen Räder gleichschnell, aber gegenläufig. Währenddessen steht das hintere Rad still undgleitet nur auf einer seiner Rollen nachvorne.

Omnidirektionales Rad (links) mit drei Bewegungsfreiheitsgraden und omnidi-rektionales Fahrwerk eines Roboters (rechts) mit drei individuell angetriebenenomnidirektionalen Rädern in Delta-Anordnung.

Page 5: Roboter lernen Fußball spielen: Autonome Roboter

sition mit und können so die gesehenen Hindernisse Mit-spielern und Gegnern zuordnen.

Ein erfolgreicher Spieler muss nicht nur die Position derObjekte auf dem Spielfeld erfassen, sondern auch ihre Ge-schwindigkeit bestimmen können. Erst das ermöglicht dy-namische Interaktionen wie Passspiel oder Dribbeln. Alsoist es sehr wichtig,dass der Roboter die Geschwindigkeitender bewegten Objekte richtig interpretiert und sie in ein Be-wegungsmodell der Szene einbaut. Der Roboter kann sichnur präzise bewegen, wenn dieses Modell ein grundsätzli-ches Problem ausgleichen kann: Die Sensorik und die Um-setzung der Fahrkommandos durch die Motoren verur-sachen Verzögerungen, die sich auf mehr als 150 Milli-sekunden addieren – bei einer Geschwindigkeit von 2 m/s ist das immerhin ein „Blindflug“ über mehr als 30 cm.Zur direkten Bestimmung von Geschwindigkeiten stehenleider kaum geeignete Sensoren zur Verfügung. Deshalb er-rechnet der Roboter die Geschwindigkeiten der Objekteindirekt durch Beobachten ihrer Positionen über eine ge-wisse Zeit hinweg, dabei muss er natürlich seine Eigenbe-wegung berücksichtigen.

Bislang genügten zwei Dimensionen zur Erfassung derObjekte auf dem Spielfeld. Doch der Ball kann auch hochin die Luft geschossen werden. Also brauchen die Robotereine aufwändigere, dreidimensionale Erfassung seiner Posi-tion. Mit den bisher verwendeten Kameratechniken wardas noch nicht möglich. Seit diesem Jahr arbeiten jedoch dieersten Teams mit Stereo-Kamerasystemen. Damit kann der

Roboter auch die Ballhöhe erfassen, indem er die beiden Ka-merabilder abgleicht. Allerdings müssen dazu die beidenKameras zeitlich synchronisiert sein, und der Bordcompu-ter muss doppelt so viele Kamerabilder in der gleichen Zeit-spanne auswerten können. Im Roboterfußball werden al-lerdings keine klassischen Stereo-Kamerasysteme verwen-det, die mit zwei perspektivischen Kameras wie mit zweiAugen arbeiten. Stattdessen behalten die aufgerüsteten Fuß-ballroboter die omnidirektionale Kamera und damit ihreRundumsicht – und bekommen eine zusätzliche perspekti-vische Kamera, die dem Ball folgt.

VerhaltenNeben der Wahrnehmung nimmt die Berechnung des Ro-boterverhaltens den größten Umfang innerhalb der Steue-rungssoftware ein. Je erfolgreicher ein Roboterteam seinsoll, desto detaillierter muss die Modellierung werden undumso mehr Spezialsituationen muss diese berücksichtigen.Zudem muss das Team mit verschiedenen taktischen Vari-anten spielen können. Dann ist es weniger berechenbarund kann sich auch auf unterschiedliche Gegner einstellen.

Unsere Brainstormers Tribots können zum Beispiel fünf-zig verschiedene Verhaltensmuster unterscheiden und er-lauben die Variation der Taktik in 24 verschiedenen Aspek-ten. Bei den Verhaltensmustern unterscheiden wir zwischenAngriffs- und Verteidigungssituationen. Hinzu kommen spe-zielle Verhalten für Standardsituationen wie Anstoß, Ein-wurf und Eckball – und für den Torwart. Die Angriffssitua-tionen untergliedern sich wiederum in zwölf verschiedeneVerhaltensmuster. Sie reichen vom Fernschuss über denPass, das Dribbeln zum Tor bis hin zu Flügelangriffen undBefreiungsschlägen. Je nach Situation und taktischen Vor-gaben folgen die Roboter einem dieser Verhaltensmuster.

Taktische Vorgaben erlauben es,die Roboter aggressiveroder defensiver agieren zu lassen, bestimmte Manöver wiePassspiel oder Dribbeln öfter auszuführen und sich somitauf die Stärken der gegnerischen Mannschaft einzustellen.Während die menschlichen Entwickler die meisten takti-schen Vorgaben schon vor dem Spiel festlegen, werden ei-nige Einstellungen inzwischen auch schon automatisch vor-genommen. Dazu analysiert ein Trainerprogramm den Spiel-verlauf und variiert dementsprechend die Taktik.

Um die verschiedenen Verhaltensmuster zu entwickeln,werden im Roboterfußball ganz unterschiedliche Techni-ken verwendet. Die Bandbreite reicht von ausprogram-mierten Verhaltensweisen über Planungsansätze und logi-sche Schlussfolgerungssysteme bis hin zu lernenden Ansät-zen. Hinzu kommen auf Ebene der Taktik und Teamstrategieverschiedene Ansätze zur Koordination der autonom ar-beitenden Roboter.

Eine Besonderheit der Brainstormers Tribots stellt derEinsatz gelernter Verhalten dar, zum Beispiel zum Abfangeneines rollenden Balls. Hierzu wird der Roboter zunächst miteiner Zufallsstrategie gestartet. Gelingt es ihm, den Ball ab-zufangen,wird er belohnt,bei Verfehlung bestraft. Nach vie-len Versuchen gelingt es dem Roboter durch Variieren sei-

86 | Phys. Unserer Zeit | 2/2007 (38) www.phiuz.de © 2007 Wiley-VCH Verlag GmbH & Co. KGaA, Weinheim

Abb. 4 Humanoide Fußballroboter des Teams NimbRo der Universität Freiburg,Zweitplazierte bei der Weltmeisterschaft in Bremen 2006.

Page 6: Roboter lernen Fußball spielen: Autonome Roboter

F U S S B A L L R O B O T E R | RO B OT I K

nes Verhaltens immer besser,diese Aufgabe zu lösen. Die Be-lohnung und Bestrafung des Roboters erfolgt hierbei natür-lich nur im übertragenen Sinne: Die Lernaufgabe wird in ei-ne mathematische Modellierung übertragen und die Be-lohnung als Zahlenwerte dargestellt, die es zu maximierengilt. Dieses Reinforcement Learning [4] erlaubt also dasselbstständige Erlernen optimaler Strategien, erfordert aberandererseits eine große Anzahl Experimente. Da die Me-chanik der Roboter viele hunderte Versuche nicht unbe-schadet übersteht, wird seine Software in einer Simula-tionsumgebung trainiert.

AusblickVergleicht man den heutigen Stand der Entwicklung mitdem vor zehn Jahren, als zum ersten Mal eine Roboter-Fuß-ballweltmeisterschaft stattfand, so fallen große Fortschritteauf. Das proklamierte Ziel, im Jahr 2050 gegen menschlicheFußballweltmeister antreten zu können,scheint nicht mehrso unrealistisch zu sein wie ehedem. Allerdings sind bis da-hin noch große Forschungsanstrengungen notwendig. Des-halb werden die Rahmenbedingungen in den nächsten Jah-ren immer mehr dem menschlichen Fußball angeglichen.

Bereits für nächstes Jahr stehen natürliche Lichtbedin-gungen, große Felder und weniger speziell auf die Roboterabgestimmte Regeln auf der Tagesordnung. In der Middle-SizeLeague wird sogar bereits darüber diskutiert, in nor-malen Sporthallen zu spielen. Ein erstes Demonstrations-spiel hat es bereits auf der Konferenz KI-2005 in Koblenzgegeben.

Neben der besseren Anpassungsfähigkeit an die Umge-bung kann man auch in den technischen und taktischenFähigkeiten der Roboter eine kräftige Steigerung beobach-ten. Kontrolliertes Fahren mit hohen Geschwindigkeitenist bereits Standard und wird weiter verfeinert. Das gilt auchfür Schuss- und Dribblemechanismen, die eine gute Kon-trolle des Balles erlauben, und für eine große Schussstärke.Auf Taktik und Teamspiel ausgelegte Verhaltenssteuerun-gen spielen eine immer größere Rolle. In der SmallSizeLea-gue und insbesondere in der Simulationsliga haben sie be-reits ein sehr hohes Niveau erreicht.

Zukunftsweisend ist auch die jüngste Entwicklung inForm humanoider Fußballroboter, die in einigen Jahren dieradbasierten Roboter ersetzen werden (Abbildung 4). Seit2005 gibt es Spiele, in denen Zweierteams humanoider Ro-boter gegeneinander antreten. War vor wenigen Jahren be-reits das stabile Stehen und Gehen eine Sensation, so zeich-nen sich alle guten Teams inzwischen durch schnelles Ge-hen, einbeiniges Stehen, Schießen und Aufstehen aus.

ZusammenfassungSeit zehn Jahren gibt es jährlich die Weltmeisterschaft Robo-cup für autonome, fußballspielende Roboter. Inzwischen sindder mechanische Aufbau der Roboter, die Sensorauswertungund Verhaltenssteuerung per Bordrechner so weit entwickelt,dass ein echtes Fußballspiel entstehen kann. Allerdings erfor-dert die Übertragung der Techniken von radbasierten Robo-tern auf zweibeinige, humanoide Roboter noch intensive For-schung. Das gilt auch für eine technische Ausstattung, die dieEntwicklung eines umfassenden taktischen Spiels ermöglicht.Trotz des ermutigenden Fortschritts ist der Weg noch weit,bis ein Fußballroboter mit menschlichen Spielern mithaltenkann.

StichworteRobocup, Fußballroboter, autonomer Roboter, Brainstor-mers Tribots, Sensorik, Bildverarbeitung, Objekterkennung,omnidirektionaler Antrieb, humanoider Fußballroboter.

Literatur[1] M. Riedmiller et al., Informatik Spektrum 22000066, 29, 175.[2] M. Lauer, S. Lange, M. Riedmiller, Calculating the Perfect Match: an

Efficient and Accurate Approach for Robot Self-Localization, in:Robocup 2005: Robot Soccer World Cup IX (Hrsg.: A. Bredenfeld etal.), Springer Verlag, Heidelberg 2006.

[3] S. Thrun, W. Burgard, D. Fox, Probabilistic robotics, MIT Press,Cambridge Mass. 2005.

[4] R. S. Sutton, A. G. Barto, Reinforcement learning: an introduction,MIT Press, Cambridge Mass. 2005.

Die AutorenMartin Lauer, Studium der Informatik an derUniversität Karlsruhe, Promotion an der UniversitätOsnabrück. Seit 2000 wissenschaftlicher Mitarbeiterin den Bereichen Neuroinformatik, maschinellesLernen und kognitive Robotik.

Roland Hafner, Studium der Informatik an derUniversität Karlsruhe, seit 2002 wissenschaftlicherMitarbeiter in den Bereichen maschinelles Lernenund kognitive Robotik.

AnschriftDr. Martin Lauer, Institut für Kognitionswissen-schaft, Universität Osnabrück, 49069 Osnabrück,[email protected]

© 2007 Wiley-VCH Verlag GmbH & Co. KGaA, Weinheim www.phiuz.de 2/2007 (38) | Phys. Unserer Zeit | 87