23
Andreas Diekmann (2009): Spieltheorie – Einführung, Beispiele Ex- perimente. Reinbek bei Hamburg: Rowohlt. Beispiele aus dem Buch („Kästen“) Kasten 1.1 Koordinationsspiele und der fatale Irrtum von Spieltheoretikern «Ian Johnstone, britischer Maurer, und Amy Dolby waren einander nah und doch so fern. Um sie mit einem Heiratsantrag zu überraschen, unterbrach Johnstone seinen einjährigen Australien- aufenthalt und jettete nach England. Als er mit Verlobungsring, Champagner und Blumen an Dolbys Wohnung in Nordengland klingelte, musste er feststellen, dass sie mit derselben Idee nach Australien geflogen war» (Süddeutsche Zeitung vom 27. 7. 2001). Die beiden Partner haben offen- bar kein Nash-Gleichgewicht gefunden. Prosaischer wird das Koordinationsdilemma in einem Roman von D. H. Lawrence erzählt (vgl. Dixit und Nalebuff 1997). Ein junges Paar ist in heftiger Liebe miteinander verbunden, leider aber auch sehr arm. Sie hat wundervolles langes Haar und wünscht sich nichts sehnlicher als einen silbernen Kamm. Sein einziger Besitz ist eine ererbte sil- berne Uhr, für die er gern eine Uhrkette hätte. Weihnachten steht vor der Tür. Er bringt die Uhr zu einem Pfandleiher und ersteht von dem Erlös einen silbernen Kamm. Sie hat ihr Haar abgeschnit- ten, an einen Perückenmacher gegeben und mit dem Geld ein Geschenk für ihren Liebsten ge- kauft: eine silberne Uhrkette. Weihnachten bringt manche Überraschung mit sich! Soziale Nor- men bis hin zu technischen Normierungen sind Lösungen für Koordinationsprobleme. Ob im Straßenverkehr alle Teilnehmer links oder alle rechts fahren, ist im Prinzip gleichgültig. Man muss sich nur auf eines der Gleichgewichte einigen. Oftmals entstehen soziale Normen in Koordinati- onssituationen auch evolutionär ohne zentrale Setzung. Das Wachstumstempo weltweiten Han- delns wäre weit weniger rasant, wenn Malcolm McLean nicht 1956 eine ebenso einfache wie ge- niale Idee gehabt hätte: Er verpackte Waren in eine Kiste mit den Ausmaßen 12,2 2,4 2,6 Meter. Diese Kiste wird «Container» genannt. Die sich rapide ausbreitende «Containerisierung» hat die Transportzeiten und Kosten enorm verringert. Die normative Lösung muss aber keineswegs die optimale Lösung sein. Das Stichwort lautet «Pfadabhängigkeit». Die meisten Eisenbahnen Euro- pas haben eine Spurweite von 1435 mm. Dies war das Maß englischer Kutschen, das der Eisen- bahnpionier George Stephenson für den Bau der ersten Strecke in England von Stockton nach Darlington übernommen hatte. Ob ICE oder TGV, fast alle Züge fahren auf dieser Spurweite auf- grund einer Entscheidung von Stephenson vor bald zwei Jahrhunderten. Optimal ist vermutlich eine andere Norm, nur wären die Änderungskosten prohibitiv hoch. Die Wahl von Gleichge- wichtsstrategien bei Koordinationsproblemen kann zulasten Dritter gehen. Spieltheoretiker ha- ben bei der Versteigerung von Telefonfrequenzen in den USA Mitte der 1990er Jahre einen fatalen Fehler begangen, der die Steuerzahler Milliarden gekostet hat. Aufbauend auf den spieltheoreti- schen Theoremen der Auktionstheorie, wurden die Regeln der Versteigerung lehrbuchgerecht 1

Alle 17 Beispiele - ethz.ch · Kasten 1.4 Chicken, Kubakrise und internationale Politik Im Oktober 1962 entdeckten amerikanische Aufklärungsflugzeuge die Installation sowjetischer

  • Upload
    trandat

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

Andreas Diekmann (2009): Spieltheorie – Einführung, Beispiele Ex-perimente. Reinbek bei Hamburg: Rowohlt.

Beispiele aus dem Buch („Kästen“) Kasten 1.1 Koordinationsspiele und der fatale Irrtum von Spieltheoretikern

«Ian Johnstone, britischer Maurer, und Amy Dolby waren einander nah und doch so fern. Um sie mit einem Heiratsantrag zu überraschen, unterbrach Johnstone seinen einjährigen Australien-aufenthalt und jettete nach England. Als er mit Verlobungsring, Champagner und Blumen an Dolbys Wohnung in Nordengland klingelte, musste er feststellen, dass sie mit derselben Idee nach Australien geflogen war» (Süddeutsche Zeitung vom 27. 7. 2001). Die beiden Partner haben offen-bar kein Nash-Gleichgewicht gefunden. Prosaischer wird das Koordinationsdilemma in einem Roman von D. H. Lawrence erzählt (vgl. Dixit und Nalebuff 1997). Ein junges Paar ist in heftiger Liebe miteinander verbunden, leider aber auch sehr arm. Sie hat wundervolles langes Haar und wünscht sich nichts sehnlicher als einen silbernen Kamm. Sein einziger Besitz ist eine ererbte sil-berne Uhr, für die er gern eine Uhrkette hätte. Weihnachten steht vor der Tür. Er bringt die Uhr zu einem Pfandleiher und ersteht von dem Erlös einen silbernen Kamm. Sie hat ihr Haar abgeschnit-ten, an einen Perückenmacher gegeben und mit dem Geld ein Geschenk für ihren Liebsten ge-kauft: eine silberne Uhrkette. Weihnachten bringt manche Überraschung mit sich! Soziale Nor-men bis hin zu technischen Normierungen sind Lösungen für Koordinationsprobleme. Ob im Straßenverkehr alle Teilnehmer links oder alle rechts fahren, ist im Prinzip gleichgültig. Man muss sich nur auf eines der Gleichgewichte einigen. Oftmals entstehen soziale Normen in Koordinati-onssituationen auch evolutionär ohne zentrale Setzung. Das Wachstumstempo weltweiten Han-delns wäre weit weniger rasant, wenn Malcolm McLean nicht 1956 eine ebenso einfache wie ge-niale Idee gehabt hätte: Er verpackte Waren in eine Kiste mit den Ausmaßen 12,2 2,4 2,6 Meter. Diese Kiste wird «Container» genannt. Die sich rapide ausbreitende «Containerisierung» hat die Transportzeiten und Kosten enorm verringert. Die normative Lösung muss aber keineswegs die optimale Lösung sein. Das Stichwort lautet «Pfadabhängigkeit». Die meisten Eisenbahnen Euro-pas haben eine Spurweite von 1435 mm. Dies war das Maß englischer Kutschen, das der Eisen-bahnpionier George Stephenson für den Bau der ersten Strecke in England von Stockton nach Darlington übernommen hatte. Ob ICE oder TGV, fast alle Züge fahren auf dieser Spurweite auf-grund einer Entscheidung von Stephenson vor bald zwei Jahrhunderten. Optimal ist vermutlich eine andere Norm, nur wären die Änderungskosten prohibitiv hoch. Die Wahl von Gleichge-wichtsstrategien bei Koordinationsproblemen kann zulasten Dritter gehen. Spieltheoretiker ha-ben bei der Versteigerung von Telefonfrequenzen in den USA Mitte der 1990er Jahre einen fatalen Fehler begangen, der die Steuerzahler Milliarden gekostet hat. Aufbauend auf den spieltheoreti-schen Theoremen der Auktionstheorie, wurden die Regeln der Versteigerung lehrbuchgerecht

1

festgelegt. Versteigert wurden die Lizenzen für bestimmte Gebiete wie San Diego oder Los Ange-les. An alles wurde gedacht, nur nicht an die in der Praxis wichtige Aufrundung der Gebote. So konnten sich die teilnehmenden Telefongesellschaften quasi absprechen, indem sie nämlich in ihr Gebot die Vorwahlziffern des bevorzugten Gebiets aufnahmen. Auf diese Weise konnten sie auf völlig legale Weise ihre Strategien koordinieren und Lizenzen weit unter dem Preis einer Auk-tion ohne implizite Absprachen erwerben. In England und später in Deutschland waren die Aukti-onstheoretiker schlauer. Bei der britischen Auktion im März 2000 wurde jedes Detail bedacht. Computersimulationen und Testläufe mit Londoner Studenten gingen den Auktionen voraus. Der Wettbewerb zwischen Vodafone und British Telecom trieb die Einnahmen in die astronomische Höhe von 22,5 Milliarden Pfund. Niemand hatte ein derartiges Ergebnis vorhergesehen (Harford 2007). Kasten 1.2 Gefangenendilemma in der Oper

In Puccinis Oper «Tosca» sind der Polizeichef Scarpia und Tosca Akteure in einem Gefangenendi-lemma. Rapoport (1962) hat in einem Artikel über den «Gebrauch und Missbrauch der Spieltheo-rie» dieses Beispiel zur Illustration angeführt. Toscas Liebhaber Cavaradossi wurde von Scarpia gefangen genommen und soll von einem Exekutionskommando erschossen werden. Nun erklärt sich Scarpia zu folgendem Handel bereit. Wenn Tosca einwilligt, mit ihm die Nacht zu verbringen, will er dafür sorgen, dass die Gewehre des Erschießungskommandos mit Platzpatronen geladen werden. Tosca ist bereit, auf das Angebot einzugehen, und sucht Scarpia auf. Allerdings hat sie einen Dolch dabei, mit dem sie den üblen Gesellen Scarpia tötet. Scarpia hat seinerseits die Ab-machung ignoriert. Cavaradossi stirbt im Kugelhagel des Exekutionskommandos. Tosca und Scar-pia wollten jeweils das beste Ergebnis erzielen und landeten in der «Falle» des zweitschlechtesten Ergebnisses. Spieltheoretisch gesehen haben beide die Nash-Gleichgewichtsstrategie gewählt. Das Gefangenendilemma ist ein Paradigma für einen sozialen oder ökonomischen Tausch, der simultan erfolgt und bei dem keine Rechtsinstitution eine Vertragsverletzung sanktioniert. Die Akteure haben die Wahl, zu kooperieren oder zu betrügen («defektieren»): ein Tausch also unter Bedingungen der Anarchie ohne staatliche Sanktionsgewalt. Auch die von Thomas Hobbes im «Leviathan» beschriebene Situation des «Krieges aller gegen alle» entspricht einem Gefangenen-dilemma, wenn man Zwei-Personen-Interaktionen betrachtet. Der Rüstungswettlauf im Kalten Krieg zwischen den USA und der Sowjetunion lässt sich vereinfacht als Gefangenendilemma be-schreiben. «Abrüsten» entspricht «Kooperation (C)», und «Aufrüsten» ist die defektierende Alter-native (D). Die Handelsbeziehungen zwischen zwei Staaten (C = Freihandel, D = Protektionismus), zwei konkurrierende Firmen, die in Werbung investieren, um sich gegenseitig Marktanteile abzu-nehmen (C = geringer Werbeetat, D = hoher Werbeetat), oder ein Kartell von zwei Firmen (C = die Absprache eines hohen Kartellpreises einhalten, D = den Preis unterbieten) sind weitere von vie-len Beispielen. Zwei Motive verstärken die Wahl von D: das defensive Motiv, nicht Opfer von Aus-beutung zu werden, und das aggressive Motiv, den anderen auszubeuten. Der berühmte «Zehen-

2

spitzeneffekt» bei Positionsgütern ist ein Gefangenendilemma oder zumindest dem Gefange-nendilemma ähnlich. Wenn alle bei einer Vorführung aufstehen, bin ich auch genötigt aufzuste-hen. Alle stehen unbequemer auf den Zehenspitzen, doch keiner sieht besser als vorher. Ein As-pekt der Bildungsexpansion könnte diesem Muster entsprechen. Wenn die anderen sich für eine längere Ausbildung entscheiden, muss ich auch mitmachen, um den sozialen Status zu erhalten, den wir sonst alle mit geringerer Anstrengung erzielt hätten. (Dies ist aber nur ein Aspekt, denn die generelle Anhebung des Bildungsniveaus bringt auch erhebliche Vorteile mit sich – vom Ei-genwert der Bildung bis zum Zuwachs volkswirtschaftlicher Produktivität.) Bei einigen Fällen von Wirtschaftskriminalität greift eine ähnliche Logik wie der «Zehenspitzeneffekt», wenn nämlich Wettbewerber Kosten- oder Umsatzvorteile durch illegale Methoden erzielen und ursprünglich ehrliche Geschäftsleute nachziehen müssen, wenn sie nicht Einbußen erleiden möchten (Opp 1983a). Wer ‹sauber› bleibt, wird benachteiligt. Nicht anders verhält es sich mit Doping im sportli-chen Wettbewerb. Dort können nämlich die beiden Motive eine «Doping-Spirale» auslösen (Ist Doping ein Gefangenendilemma?). Bereits das Verteidigungsmotiv genügt. Als der österreichi-sche Stürmer von Fortuna Köln vom Physiotherapeuten das «Pulver» nicht bekam, weil er schon «bullig genug» sei, soll der Wiener laut Spiegel (48/1999) gesagt haben: «I brauch’ des aa – sunst san die aundern stärker ois i.» In Experimenten sind Versuchspersonen allerdings kooperativer, als die spieltheoretische Rationalitätslösung erwarten lässt. Bis zu 50 % der Versuchspersonen wäh-len in Experimenten mit dem Gefangenendilemma die kooperative Alternative. Kasten 1.3 Cournots Duopol

Mehr als hundert Jahre vor der Erfindung des Gefangenendilemmas und der Formulierung des Nash-Gleichgewichts hat Cournot eine GD-Situation und das Prinzip des Gleichgewichts anhand des Beispiels von zwei Unternehmen analysiert, die sich einen Mineralwassermarkt teilen. Wir betrachten der Einfachheit halber ein Zahlenbeispiel mit der Nachfragefunktion P = 100 – (Q1 + Q2), wobei P der Preis des Mineralwassers und Q1 und Q2 die von Firma 1 und Firma 2 angebotenen Mengen sind (siehe z. B. Frank 1991). Firma 1 nimmt die vom Konkurrenten angebotene Menge Q2 als gegeben hin, d. h., aus der Sicht von Firma 1 gilt: P1 = (100 – Q2) – Q1. (Da die Situation symmet-risch ist, gilt entsprechend P2 = (100 – Q1) – Q2.) Der Erlös einer Firma ist der Preis multipliziert mit der Menge. Firma 1 erlöst also E1 = P1 Q1 = Q1 (100 – Q2) – Q1

2. Die Entscheidung der Firma richtet sich auf die zu produzierende Menge. Firma 1 wird also, gegeben Q2, die Menge Q1 so wählen, dass der Gewinn maximal ist. Der Gewinn ist maximal, wenn der Grenzerlös, also der Erlös für eine zusätz-lich produzierte Einheit, den Grenzkosten entspricht. Den Grenzerlös erhalten wir durch Ableitung der Erlösfunktion: dE1/dQ1 = 100 – Q2 – 2Q1. Es sei angenommen, die Kosten des aus dem Boden sprudelnden Mineralwassers seien null (mit Grenzkosten größer als null ändert sich das Ergebnis nicht). Die gewinnmaximierende Firma produziert dann 100 – Q2 – 2Q1 = 0 oder Q1 = 50 – 0,5Q2. Für Firma 2 gilt analog: Q2 = 50 – 0,5Q1 oder Q1 = 100 – 2Q1. Diese beiden Kurven heißen Reaktionskur-ven. Man kann die beiden Kurven in einem Koordinatensystem mit Q1 an der y-Achse und Q2 an

3

der x-Achse darstellen. Ihr Schnittpunkt ist ein Cournot-Nash-Gleichgewicht. Man erhält als Schnittpunkt der Reaktionsgeraden Q1* = Q2* = 33,33. Beide zusammen produzieren die Menge von 66,67 zu einem Preis von 100 – (Q1 + Q2) = 33,33. Der Erlös einer Firma beträgt also E1 = 33,33 • 33,33 = 1111. Man kann leicht prüfen, ob es sich um ein Nash-Gleichgewicht handelt. Produziert eine Firma mehr (oder weniger) als die Gleichgewichtsmenge, sollte der Gewinn nicht ansteigen. Wenn sich also Firma 1 entschließt, z. B. 34 oder 35 Einheiten zu produzieren, während Firma 2 bei der Menge 33,33 bleibt, erzielt Firma 1 keinen Gewinnzuwachs. Wenn nun aber beide Firmen sich wie die Gefangenen absprechen, ein Kartell bilden und die Menge Q = Q1 + Q2 so festlegen, dass der gemeinsame Gewinn maximiert wird, können sie mehr verdienen. Sie verhalten sich dann zu-sammen wie ein Monopolist. Die Nachfragefunktion ist P = 100 – Q, die Erlösfunktion E = 100 Q – Q2, die Ableitung dE/dQ = 100 – 2Q. Bei Grenzkosten von null beträgt die gewinnmaximierende Menge Qm = 50 oder Q1m = Q2m = 25 bei gleicher Aufteilung unter den beiden Firmen. Der Preis ist dann 50 und der Gewinn 50 • 25 = 1250. Die Entscheidung für Qm ist Pareto-optimal. Jede Abwei-chung liefert Resultate, die für mindestens eine Firma schlechter sind. Die wechselseitige Wahl der kooperativen Strategie Qm ist aber keine Nash-Gleichgewichtsstrategie. Dies lässt sich leicht zeigen. Erhöht eine Firma die Menge, während sich die andere Firma an die Vereinbarung hält, dann erzielt der Abweichler einen Gewinnzuwachs, während die kooperative Firma verliert. Pro-duziert z. B. Firma 1 eine Menge von 33,33 Einheiten, dann sinkt der Preis auf 100 – 58,33 = 41,67. Der Gewinn von Firma 1 steigt auf 41,67 • 33,33 = 1389, der Gewinn von Firma 2 sinkt auf 41,67 • 25 = 1042. Vereinfachen wir die Situation so, dass nur die beiden Strategien «Einhaltung der Kartell-absprache» (= Kooperation) und «Wettbewerb» (Defektion) in Betracht gezogen werden, erhalten wir ein Gefangenendilemma: Kartell (C) Wettbewerb (D)

Kartell (C) 1250, 1250 1042, 1389

Wettbewerb (D) 1389, 1042 1111, 1111

Cournots Duopol kann in verschiedener Hinsicht verallgemeinert werden. So wird ein Unterneh-men nicht die angebotene Menge der anderen Unternehmung als gegeben annehmen, sondern den Preis. Weiterhin können mehrere Firmen auf dem oligopolistischen Markt agieren. Der Grundkonflikt, die Spannung zwischen dem instabilen Pareto-Optimum und dem ineffizienten Nash-Gleichgewicht, bleibt aber bestehen (dazu z. B. Frank 1991). Meistens sind Kartellabsprachen illegal. Die Kooperation der Firmen schadet dem Verbraucher. Sie sind aber auch instabil, weil jede Firma einen Anreiz hat, heimlich mehr zu einem geringeren Preis zu verkaufen. Verlangt der Ge-setzgeber von den Unternehmen Transparenz bezüglich Preisen und Rabatten, weil man sich da-von mehr Wettbewerb verspricht, so kann die Forderung in diesem Fall unerwünschte Folgen ha-ben (Gintis 2000). Mehr Transparenz macht es schwieriger, eine Kartellvereinbarung heimlich zu unterlaufen. Ein Kartell wird dadurch stabiler. Paradoxerweise könnte die sonst wettbewerbsför-dernde Maßnahme bei Gefahr der Kartellbildung den Wettbewerb bremsen.

4

Kasten 1.4 Chicken, Kubakrise und internationale Politik

Im Oktober 1962 entdeckten amerikanische Aufklärungsflugzeuge die Installation sowjetischer Raketenstellungen auf Kuba, keine hundert Meilen von der Küste Floridas entfernt. US-Militärs im Krisenstab der Regierung empfahlen dem Präsidenten, Kuba zu bombardieren. Heute weiß man, dass ein Luftangriff auf Kuba und die Invasion der Insel zum nuklearen Krieg geführt hätte mit unvorstellbaren Folgen für das Schicksal der Menschheit. Mitten im Kalten Krieg stand die Menschheit am Abgrund eines Atomschlags. Robert Kennedy, Bruder und Berater des Präsiden-ten, hat das Drama in seinem Buch «13 Tage» festgehalten (Kennedy 1970). Die Akteure sind Nikita Chruschtschow, Vorsitzender des sowjetischen Politbüros, und der amerikanische Präsident John F. Kennedy sowie ihre Krisenstäbe oder – grob vereinfacht – die USA und die UdSSR. Auch die Ver-kürzung auf zwei Optionen und ein simultanes Spiel sind Vereinfachungen (Brams 2001). Neben dem Luftangriff auf Kuba gab es die Option einer Seeblockade, um russischen Nachschub zu un-terbinden. Die Sowjetunion hatte die Optionen «Rückzug» oder «Festhalten» an der Aufstellung von Nuklearraketen. In seiner plastischen Sprache hat Chruschtschow den Konfrontationskurs so beschrieben: «Wie wäre es, wenn wir Uncle Sam einen Igel in die Unterhose pflanzten?» (Mayr 2007). Wir erhalten die Matrix eines Chickenspiels (Darstellung nach Brams 2001, die Ziffern ge-ben natürlich nur die Rangfolge der möglichen Ereignisse wieder): UdSSR

Rückzug

Fortsetzung der Raketenaufstel-lung

Ausweichen Kompromiss 3, 3 Sieg der UdSSR, Niederlage der USA 2, 4

USA

Nicht ausweichen Sieg der USA, Niederlage der UdSSR 4, 2

Atomkrieg 1, 1

Chruschtschow selbst hat internationale Konflikte durchaus im Sinne eines Chickenspiels inter-pretiert. In einem Brief an Kennedy schreibt er mit Blick auf Berlin am 10. März 1962: «Zwei Zie-genböcke treffen sich Kopf an Kopf auf einer engen Brücke über einem Abgrund. Keiner gibt dem anderen den Weg frei, und so fallen sie beide hinab. Sie waren dumme und dickköpfige Tiere» (Chruschtschow 1962). Kennedy und Chruschtschow entscheiden sich schließlich für Strategien, die zu einem Kompromiss führen. Chruschtschow verlangt einen Verzicht der Amerikaner auf ei-ne Invasion Kubas und den Abzug amerikanischer Atomraketen in der Türkei. Kennedy ist zu die-sem Zugeständnis bereit, wenn Chruschtschow die Raketen auf Kuba abbaut. Vor Erreichen die-ses Kompromisses liegen dramatische Augenblicke: der Abschuss eines US-Aufklärungsflugzeugs über Kuba auf Befehl eines russischen Generals und Konfrontationen zwischen nuklear bewaffne-ten U-Booten und Kriegsschiffen. Auch die Rekonstruktion der Krise Anfang der 1990er Jahre durch Beteiligte beider Seiten – eine Initiative des ehemaligen Verteidigungsministers Robert

5

McNamara – macht im Rückblick klar, dass es fast an ein Wunder grenzt, dass der «kalte» nicht zu einem «heißen» Krieg wurde. Ist das Bild des Konfrontationskurses von zwei aufeinander zura-senden Autos für die Kubakrise zutreffend? Vielleicht mit Einschränkungen zu Beginn. Der Aus-tausch von Forderungen und die Geheimdiplomatie der Akteure während der Krisentage trans-formieren die Situation dagegen in ein komplexes sequenzielles Spiel mit aufeinanderfolgenden Zügen und Gegenzügen. In solchen Entscheidungssituationen gibt es bei jedem Zug die Gefahr von Missverständnissen und Fehlinterpretationen. Unterschiedliche «Situationsdefinitionen» (Es-ser 1996) können dazu führen, dass die Präferenzen des «Mitspielers» verzerrt wahrgenommen werden. Ein Beispiel gibt McNamara in seinem Rückblick auf den Vietnamkrieg. Die amerikani-sche Administration einschließlich McNamara als Verteidigungsminister war in den 1960er Jah-ren besessen von der «Dominotheorie», der Vorstellung, dass in Südostasien ein kommunistisches Vietnam zwangsläufig zum «Umkippen» der Nachbarstaaten führen würde. Die vietnamesische Regierung in Hanoi hatte dagegen ganz andere, primär nationale Ziele. Folgt man McNamara, dann war diese Fehleinschätzung ein wesentlicher Grund für einen Krieg, der mehrere Millionen Vietnamesen und Amerikaner das Leben kostete (McNamara und VanDeMark 1997). Kasten 2.1 Diktator und Ultimatumspiel

Experimentelle Studien über Fairnessmotive basieren häufig auf dem Diktator- und Ultimatum-spiel. Diese Spiele sind äußerst einfach und demonstrieren zugleich, dass reale Versuchspersonen keineswegs immer so handeln, wie man es von einem Homo oeconomicus erwarten würde. Im Sinne der klassischen Spieltheorie ist «Diktator» eigentlich kein strategisches Spiel. Hier teilt ein Spieler den Kuchen auf, der andere muss akzeptieren, was er bekommt. Zum Beispiel soll ein Spie-ler, der Diktator, einen Betrag von 10 € aufteilen. Ein Homo oeconomicus nimmt den gesamten Betrag, Spieler 2 geht leer aus. In Experimenten zeigt sich aber immer wieder, dass ein Großteil der Personen einen Teil abgibt. Das Ultimatumspiel, eingeführt in die experimentelle Forschung von Güth, Schmittberger und Schwarze (1982), ist eine interessante Erweiterung des Diktator-spiels. Die Macht des Diktators wird im Ultimatumspiel durch ein Vetorecht des Mitspielers ein-geschränkt. Der erste Spieler schlägt eine Aufteilung vor. Der zweite Spieler kann zustimmen oder die Aufteilung ablehnen. Lehnt er ab, erhalten beide Spieler nichts. Es gibt sehr viele, sogar Pareto-optimale Nash-Gleichgewichte im Ultimatumspiel. Bleiben wir beim Beispiel mit den 10 €. Die Strategie von Spieler 1 ist z. B. «6 € für mich, 4 € für Spieler 2». Spieler 2 wählt die Strategie «Ich werde alle Angebote unter 4 € ablehnen, sonst aber akzeptieren». Diese Strategienkombination ist – ebenso wie alle anderen Aufteilungen der Summe – ein Pareto-optimales Nash-Gleichgewicht. Aber ist es auch teilspielperfekt? Leider nicht, denn wenn es zum Schwur kommt, müsste Spieler 2 ablehnen und auf die angebotene Summe verzichten. Bei der Wahl zwischen «etwas» und «nichts» wird der rationale Spieler aber immer ein noch so kleines Angebot akzeptieren. Die Dro-hung mit dem Vetorecht ist unglaubwürdig. Ein rationaler Spieler bietet dem Mitspieler den kleinstmöglichen Betrag an, und dieser wird akzeptieren. Die Lösung ist ein teilspielperfektes, Pa-

6

reto-optimales Nash-Gleichgewicht. Das Vetorecht beschert dem Mitspieler keinen Machtge-winn! In Experimenten verhalten sich Menschen aus Fleisch und Blut aber ganz anders. Sie üben Vergeltung, selbst wenn sie dafür Kosten aufbringen müssen. Im Ultimatumspiel werden in der Regel höhere Beträge an den Mitspieler abgegeben als im Diktatorspiel (Forsythe et al. 1994). Die Erklärung ist, dass die Versuchspersonen zwei Gründe haben können, die in die gleiche Richtung gehen: zum einen das Fairnessmotiv wie im Diktatorspiel, zum anderen gilt es zu bedenken, dass ein Mitspieler bei zu geringen Angeboten «rachsüchtig» handeln könnte. Selbst ein Homo oeco-nomicus wird in einer Interaktion mit einem rachsüchtigen Spieler bereit sein, diesem genau den Schwellenwert zu geben, ab dem er der Aufteilung zustimmen wird. Anders als in der wirklichen Welt existieren im Reich des Homo oeconomicus aber weder Rachsucht noch Fairnessmotive. Kasten 2.2 Das Erpresserproblem

Das Buch «Rahmen-Analyse» von Erving Goffman enthält ein Kapitel über «Pläne und Täu-schungsmanöver», in dem sich Goffman auch mit Erpressungen befasst. Dort heißt es (1977: 126 f.): «(…) für das Opfer gibt es gute Gründe, dass es nicht bekannt werden lassen möchte, was der Erpresser angeblich weiß, während dieser vom jeweiligen Opfer im Weigerungsfalle nichts zu gewinnen hat, wenn er seine Drohung wahrmacht. Ein nicht willfähriges und dann bloßgestelltes Opfer trägt lediglich dazu bei, dass die Erpressungen nicht an Wirksamkeit einbüßen, und der ein-zelne Erpresser trägt diesem Gesichtspunkt wohl nicht immer genügend Rechnung. Die Ältesten machen ihre Drohung aus reiner Bosheit wahr, doch solche Gefühle haben in einem gut organi-sierten Gewerbe keinen Platz – wohl aber der Eindruck, man sei boshaft. Kurz, damit Erpressun-gen Erfolg haben, muss der Erpresser den Eindruck erwecken, er werde reden, wenn man ihm nicht willfährig ist, doch nachdem sich ein Opfer geweigert hat, gibt es nur noch wenig Grund da-zu. Damit also Erpressungen gut funktionieren, müssen die Erpresser den glaubhaften Eindruck erwecken, als seien sie ihres Dilemmas gar nicht gewahr.» Das Erpresserproblem lässt sich mit dem folgenden Spielbaum darstellen:

a, b, c > 0 ; c > a

7

E bedeutet «Erpressung», Z «zahlen» und V «das belastende Material veröffentlichen». Ein Balken über dem Buchstaben bedeutet, dass die entsprechende Handlung unterlassen wird. Nehmen wir an, der Erpresser ist an die ausländischen Kontendaten eines reichen Steuersünders gelangt. Zahlt das Opfer nach der Erpressung, gewinnt der Erpresser die Summe a, und das Opfer verliert a. Schickt der Erpresser das Material an die Steuerbehörde, betragen die Kosten des Opfers – c, wo-bei c natürlich größer als a sein muss. Aber auch der Erpresser hat Kosten von – b. Vollzieht der Erpresser die Drohung nicht, haben beide weder Gewinn noch Verlust (0, 0). Im Falle einer Erpres-sung ist die Kombination aus der Strategie des Opfers «zahlen» und der Strategie des Erpressers «nach Zahlen nicht veröffentlichen, nach Weigerung veröffentlichen» ein Nash-Gleichgewicht. Das Nash-Gleichgewicht ist aber nicht teilspielperfekt, denn vor die Wahl gestellt, zu veröffentli-chen oder nicht zu veröffentlichen, wird der Erpresser die Drohung nicht ausführen. Ein rationales Opfer wird nicht zahlen, und ein rationaler Erpresser wird das Material nicht veröffentlichen bzw. von vornherein auf eine Erpressung verzichten. Warum gibt es dann Erpressungen? Wie Goffman erwähnt, wird der Erpresser den Eindruck erwecken, er könnte sich irrational verhalten. Vielleicht wird er vortäuschen, dass er es für eine Pflicht halte, einen reichen Steuerhinterzieher zu bestra-fen, und vermutlich wird die Drohung umso glaubwürdiger sein, je geringere Kosten dem Erpres-ser im Falle einer Veröffentlichung entstehen. Umgekehrt könnte das Opfer seine Kosten bei Ver-öffentlichung herunterspielen («Mein Mann kennt alle meine Seitensprünge», «Ich habe bereits beim Finanzamt Selbstanzeige erstattet»). Kann glaubwürdig kommuniziert werden, dass aus der Sicht des Opfers c < a gilt, wird die Erpressung hinfällig. Kasten 3.1 Von wem kaufen Sie einen Gebrauchtwagen?

Der Kauf eines Gebrauchtwagens ist zweifellos ein Vertrauensproblem. Mit der Technik der Vignettenanalyse haben Buskens und Weesie (2000) (vgl. Raub und Buskens 2006) empirisch untersucht, welche Merkmale dazu beitragen, dass einem Gebrauchtwagenhändler (dem Treuhänder) Vertrauen entgegengebracht wird. Mit einer Vignette wird eine Situation anhand verschiedener Merkmale beschrieben. Zu den Merkmalen gehören der Preis des Autos (4000 € versus 1000 €), gute Erfahrungen in der Vergangenheit, ein geplanter Wohnortwechsel des Kunden, die Bekanntheit des Händlers in der Nachbarschaft und die Netzwerkeinbindung des Händlers. Letztere wurde anhand von zwei Indikatoren erhoben: Freunde hatten schon einmal gute Erfahrungen mit dem Händler gemacht, und der Kunde (die Versuchsperson) sollte sich vorstellen, dass er mit dem Gebrauchtwarenhändler in der gleichen Fußballmannschaft spielt. Eine Vignette könnte etwa folgenden Text haben (rekonstruiert nach Tabelle 2, Raub und Buskens 2006): «Ein Gebrauchtwagenhändler bietet ein Auto für 4000 € an. Sie haben bisher noch kein Auto bei diesem Gebrauchtwarenhändler erworben, und in einigen Wochen wollen Sie in einen anderen Landesteil umziehen. Der Verkäufer ist in Ihrer Nachbarschaft gut be-kannt und hat dort viele Kunden. Soweit Sie wissen, hat keiner Ihrer Freunde schon einmal ein Auto bei diesem Gebrauchtwagenhändler erworben. Der Händler und Sie spielen in der glei-

8

chen Fußballmannschaft.» Die Merkmale sind die unabhängigen Variablen; abhängige Variab-le ist die Präferenz für einen Verkäufer. Bei zwei Ausprägungen je Merkmal gibt es 64 Vignet-ten. Jede der 125 Versuchspersonen aus Chicago, Utrecht und Tilburg sollte als Käufer oder Treugeber zehn Paare von Vignetten beurteilen und bei jedem Paar angeben, welche der bei-den Merkmalskombinationen vorgezogen wird. Mit einem multivariaten statistischen Verfah-ren (dem Random-Utility-Modell von McFadden) wurden sodann die Effekte der Merkmale auf den Grad des Vertrauens gegenüber dem Gebrauchtwarenhändler geschätzt. Die Merkmale wurden mit Bedacht gewählt. So wird erwartet, dass positive Erfahrungen in der Vergangen-heit und mögliche zukünftige Interaktionen (kein Wohnortwechsel) das Vertrauen erhöhen. Die Netzwerkeinbindung (Nachbarschaft, Geschäfte mit Freunden, gemeinsame Fußballspie-le) sollte ebenfalls vertrauensstiftend wirken. Die soziologische These lautet, dass «soziale Einbettung» Vertrauensprobleme löst. Der Grund ist, dass ein Treuhänder im Eigeninteresse Vertrauen nicht missbrauchen wird, wenn er durch Kundenbeziehungen und andere soziale Kontakte im Netzwerk des Treugebers eingebunden ist. Würde er Vertrauen missbrauchen, wäre das für künftige Geschäfte schädlich, denn ein Vertrauensmissbrauch wird sich im Netzwerk herumsprechen. Empirisch zeigen sich signifikante Effekte der Dimensionen «ver-gangene Erfahrungen», «Zukunft» und der Netzwerkvariablen. Bezüglich der Netzwerkeinbin-dung könnte man sagen, dass es sich um ein Vertrauensspiel mit Sanktionsmöglichkeiten durch Dritte handelt. Die Sanktion besteht darin, dass künftige potenzielle Kunden nach der Kenntnis von einem Vertrauensmissbrauch abgeschreckt werden, eine Geschäftsbeziehung mit dem Händler einzugehen. Kasten 4.1 Zahlenwahlspiel, Schönheitswettbewerb und der Kollaps von Aktienmärkten

Rationalitätsdefinitionen gehen von einem Symmetrieprinzip aus. Allen Mitspielern wird gleich-falls rationales Verhalten unterstellt. Das ist zwar theoretisch einleuchtend, aber praktisch oft nicht gegeben. In sozialen Situationen mit vielen Akteuren ist die Annahme besonders kritisch, wenn bereits ein geringer Anteil irrationaler Strategien den Spielausgang stark beeinflusst. Nagel (1995) untersucht das sogenannte Zahlenwahlspiel. Die Regeln sind einfach: 1 Jeder Spieler i (i = 1, 2, … N) wählt eine ganze Zahl xi im Bereich [0, 100]. 2 Den Preis V erhält, wer eine Zahl gewählt hat, die z = u mx am nächsten kommt. Dabei ist 0 ≤ u < 1 und mx der Mittelwert aller gewählten Zahlen. Gibt es mehrere Gewinner, wird der Preis unter den Gewinnern aufgeteilt. Beispielsweise sei u = 2/3. Dann könnte man folgende Überlegung anstellen. Wenn ich vermute, dass meine Mitspieler ihre Zahlen zufällig mit gleicher Wahrscheinlichkeit auswählen, ist ein Mit-telwert von 50 zu erwarten. 2/3 davon sind rund 33. Also wähle ich die Zahl 33. Was mir aber recht ist, ist den anderen billig. Wenn die Mitspieler gleichermaßen räsonieren, werden sie auch 33 wählen. Dann aber ist es besser, die Zahl 22 anzugeben. Wenn dies alle tun, wäre es natürlich von Vorteil, 15 zu wählen usw. Wie viele Iterationen werden die Mitspieler vorausdenken? Wenn dar-

9

über eine Vermutung existiert, müsste man nur einen Schritt weitergehen. Das einfache Spiel si-muliert das Herdenverhalten bei einer Aktienblase kurz vor dem Kollaps des Marktes. «Rationale» Akteure, die genau wissen, dass sich die Preise längst von den fundamentalen Werten entfernt haben, investieren weiter in den Markt, weil sie annehmen, dass die Mitspieler steigende Preise erwarten. Es geht eben nicht darum, ein Urteil über den Wert der Aktie zu bilden, sondern dar-über, wie die anderen Akteure den Wert einschätzen. Oder noch eine Stufe weiter: Wie andere Akteure die Bewertungen ihrer Mitspieler einschätzen. John Maynard Keynes hat die Bewertun-gen mit einem Schönheitswettbewerb verglichen (nach Nagel und Selten 1998): «Professionelle Geldanlage lässt sich mit Zeitungswettbewerben vergleichen, bei denen unter 100 abgebildeten Gesichtern die sechs schönsten auszuwählen sind, wobei der Preis an denjenigen geht, dessen Auswahl der durchschnittlichen Präferenz aller Teilnehmer am nächsten kommt; deshalb darf man nicht solche Gesichter benennen, die man selbst am schönsten findet, sondern diejenigen, von denen man glaubt, dass sie bei den anderen Teilnehmern, die alle das Problem aus demsel-ben Blickwinkel betrachten, am ehesten Gefallen finden. Unter diesen Voraussetzungen werden also nicht etwa diejenigen gewählt, die nach Einschätzung des jeweiligen Teilnehmers wirklich die schönsten sind, und nicht einmal diejenigen, die die Durchschnittsmeinung tatsächlich für die schönsten hält. Wir haben den dritten Grad erreicht, in dem wir unsere Intelligenz anstrengen, zu antizipieren, was nach der Durchschnittsmeinung zu erwarten ist. Und es gibt manche, glaube ich, die den vierten, fünften oder noch einen höheren Grad anwenden.» Wie würde sich ein strikt rationaler Spieltheoretiker im Zahlenwahlspiel verhalten? Er hat es im Prinzip einfach, denn es gibt nur ein einziges Nash-Gleichgewicht. Die Wahl der Null ist die Gleichgewichtsstrategie. Wür-den Sie die Null wählen, wenn Sie genau wissen, dass der Großteil der Akteure nicht zu dieser Er-kenntnis vordringt und ein strikt rationaler Akteur deshalb leer ausgehen wird? Man hat das Zah-lenwahlspiel in verschiedenen Zeitschriften gespielt. Es zeigen sich Häufungen bei den Zahlen 33, 22, 15 usw. Bei diesen Experimenten kommt sogar die Nash-Strategie, also die Null, am häufigsten vor. Wird das Zahlenwahlspiel aber über mehrere Runden gespielt, dann bewegt sich der Mittel-wert immer weiter auf das Nash-Gleichgewicht zu (Nagel 1995). Lernen und Evolution führt zum Gleichgewicht, aber bei einer Runde würde ein strikt rationaler Spieler verlieren. Ist es dann ratio-nal, die Nash-Strategie zu wählen? Kasten 4.2 Erwartungsnutzen: Von Spielern zur Spieltheorie

Der Chevalier de Méré war Mitte des 17. Jahrhunderts als leidenschaftlicher Glücksspieler bekannt. Bei einem einfachen Spiel wird mehrfach nacheinander eine Münze geworfen. A erhält einen Punkt bei «Kopf», B bei «Wappen». Wer zuerst 10 Punkte erreicht, gewinnt den Einsatz x von – sa-gen wir – 100 Silbermünzen. Nun wird das Spiel beim Stand «9 Punkte für A, 8 Punkte für B» ab-gebrochen. Die Streitfrage lautet: Wie soll der Gewinn fairerweise aufgeteilt werden? Im Verhält-nis 9 : 8 wäre ein Vorschlag. Oder besser 2 : 1, denn B benötigt noch zwei, A aber nur noch einen Punkt? Der Chevalier korrespondiert mit dem Mathematiker und Philosophen Blaise Pascal und

10

dieser wiederum mit seinem Kollegen Pierre de Fermat. Fermat berechnet zunächst die Gewinn-wahrscheinlichkeiten der beiden Spieler. Es gibt genau drei einander ausschließende Ereignisse: 1. Beim nächsten Münzwurf kommt «Kopf» und A gewinnt. Die Wahrscheinlichkeit dafür ist 1/2. 2. Im nächsten Wurf kommt «Wappen» und im übernächsten Wurf «Kopf», und A gewinnt eben-falls. Die Wahrscheinlichkeit ist 1/2 1/2 = 1/4. 3. Nur wenn «Wappen», «Wappen» in Folge beobachtet wird, gewinnt B. Die Wahrscheinlichkeit dafür ist 1/4. Somit folgt für die Gewinnwahrscheinlichkeiten von A und B: p (A) = 3/4 und p (B) = 1/4 Dies ist die Geburtsstunde der monetären Gewinnerwartung oder «Gelderwartung» (EM). Für A ist EM (A) = p (A) · x = 75, für B ist EM(B) = 25. Die faire Aufteilung ist nach Fermats Vorschlag das Verhältnis der Gewinnerwartungen von 3 : 1. Ein Problem gelöst, und schon sieht man sich mit einem Para-dox konfrontiert, dem «St. Petersburger Paradox» nach Daniel Bernoulli, der im russischen Peters-burg Mathematik lehrte. Eine Münze wird so häufig geworfen, bis zum ersten Mal «Wappen» auf-tritt. Der Spieler erhält 2n Rubel, wobei n = 0, 1, 2, 3, … die Anzahl «Kopf» (K) bezeichnet. Tritt sofort «Wappen» (W) auf, ist n = 0 und er erhält 20 = 1 Rubel. Kommt die Folge «KW», erhält er 2, bei KKW 4, bei KKKW 8 Rubel usw. Nehmen wir an, wir spielen mit Euro statt Rubel. Welchen Einsatz ist ein Spieler bereit zu zahlen, um in diesem Spiel mitmachen zu dürfen? Die meisten Leute sagen viel-leicht 10, 20 oder auch 30 Euro. Wenn die Gelderwartung der faire Preis ist, dann reicht dieser Ein-satz bei weitem nicht aus. Die Gelderwartung ist nämlich unendlich hoch! Die Wahrscheinlichkei-ten für die Ereignisse W, KW, KKW, KKKW … sind entsprechend 1/2, 1/4, 1/8, 1/16 usw., und die zu-gehörigen Gewinne sind 1, 2, 4, 8 usw. Die Gelderwartung des Spiels ist die Summe der konstan-ten Gelderwartungen von je 1/2 = 2n/2(n+1) für die unendlich vielen einander ausschließenden Ereig-nisse: EM = 1 (1/2) + 2 (1/4) + 4 (1/8) + 8 (1/16) + … = 1/2 + 1/2 + 1/2 + 1/2 + … Aber wer würde, auch wenn er es hätte, alles Vermögen opfern, um nur einmal bei diesem Spiel mitzumachen? Es gibt zwei Lösungen für das Paradox. EM ist nur unendlich groß, wenn die Bank unendlich viel Kapital hat, um die Gewinne auszuzahlen. Keine Bank hat aber unendlich viel Kapital. Hat sie z. B. «nur» 249 €, dann wird ab dem 50. Glied der Reihe nur noch dieser Gewinn fällig, und die Gelderwartung beträgt EM = 25,5 €. Die zweite Lösung wurde von Bernoulli vorgeschlagen. Seine Idee lautet, dass sich erstens der Einsatz nicht nach der Gelderwartung, sondern nach der Nutzenerwartung rich-tet. Es kommt also ein psychologisches Moment ins Spiel. Zweitens trifft er die Annahme, dass der «Grenznutzen» des Geldes abnimmt. Mit wachsendem Reichtum schwindet der Wert weiterer Gewinne. Mathematisch formuliert er den Zusammenhang zwischen psychologischem Nutzen u und physischen Geldeinheiten x mit einer logarithmischen Funktion: u (x) = a log (x + b). Bei ent-sprechender Wahl der Parameter a und b erhält man mit u (x) anstelle von x einen endlichen Wert für das Petersburger Paradox. Der Zusammenhang zwischen physischen Einheiten x und Nutzen u ist eine Nutzenfunktion. Ist sie – wie Bernouillis logarithmische Nutzenfunktion – konkav, dann bringt sie risikoaverses Verhalten zum Ausdruck. Der Grund ist, dass bei einer konkaven Funktion ein sicherer Betrag x immer einer Lotterie mit dem Erwartungswert x vorgezogen wird. 10 € sicher hat einen höheren Wert als beispielsweise die Lotterie «20 € mit Wahrscheinlichkeit 1/2, andern-falls nichts». Bei einer linearen Nutzenfunktion ist man indifferent zwischen dem sicheren Geld-

11

betrag und der Lotterie (Risikoneutralität), und bei einer konvexen Nutzenfunktion besteht Risiko-freude. Risikofreudige Personen präferieren die Lotterie einem gleich hohen, sicheren Geldbetrag. Eine stetige, zweimal differenzierbare Nutzenfunktion vorausgesetzt, gilt zunächst einmal, dass der Nutzen mit den physischen Einheiten x anwächst, d. h. du/dx > 0. Dann können wir die drei Fälle wie folgt charakterisieren: 1. d2u/dx2 < 0 (risikoavers). 2. d2u/dx2 = 0 (risikoneutral) und 3. d2u/dx2 > 0 (risikofreudig). Die Nutzenfunktion ist im ersten Fall nach unten gekrümmt oder kon-kav, im zweiten linear und im dritten Fall nach oben gekrümmt oder konvex. Mit einer konkaven Nutzenfunktion kann man erklären, dass Personen Versicherungen abschließen. Versicherungen leben von den konkaven Nutzenfunktionen ihrer Kunden. Man kann allerdings nicht erklären, dass die gleichen Kunden Lotto spielen oder ein Spielkasino aufsuchen. Dafür müsste die Funktion nämlich konvex sein. Immer wieder neue Paradoxien treten im schönen Gebäude der Nutzenthe-orie auf. Auswege weisen psychologische Theorien wie die «Prospect-Theorie» von Tversky und Kahneman (1981). Kasten 5.1 «The Final Problem». Sherlock Holmes und Professor Moriarty

In Sir Arthur Conan Doyles Kriminalstory «The Final Problem» versucht Sherlock Holmes, seinem Widersacher, dem Mathematiker und Genie des Verbrechens, Professor Moriarty, zu entfliehen. Holmes will zum Kontinent, doch bemerkt er bei der Abfahrt in London, Victoria Station, seinen Verfolger auf dem Bahnsteig. Holmes kann davon ausgehen, dass Moriarty ihn mit einem Sonder-zug verfolgen wird. Zwischen London und Dover gibt es nur einen Halt, nämlich Canterbury. Hol-mes überlegt nun, den Zug in Canterbury zu verlassen. Natürlich denkt auch Moriarty an diese Möglichkeit. Steigen aber beide an der gleichen Station aus, dann hätte Moriarty Gelegenheit, Holmes zu ermorden. Da nun Moriarty weiß, so überlegt Holmes, dass er in Canterbury ausstei-gen könnte, wäre es da nicht besser, im Zug bis Dover zu bleiben? Der superschlaue Moriarty wird aber auch diese Überlegung anstellen, sodass es doch vorzuziehen wäre, die Zwischenstation in Canterbury einzulegen? Und so weiter – ad infinitum. Holmes verlässt in «The Final Problem» den Zug in Canterbury, und Moriarty dampft vorbei in Richtung Dover. Doch die Rettung währt kurz-fristig. Denn Holmes flieht in die Schweiz und wird nahe Bern von Moriarty in eine Falle gelockt. Kämpfend stürzen beide bei Meiringen in eine Schlucht. Weder Holmes noch Moriarty überleben den Sturz – «the final problem»! Dem letzten Problem hat die britische Post eine Briefmarke ge-widmet, die den Kampf der beiden Widersacher am Rande der Schlucht illustriert. Das folgende Nullsummenspiel bezieht sich auf die erste Phase der Verfolgung, wobei wir die Zahlen aus dem Original verwenden (Morgenstern 1928, 1934; von Neumann und Morgenstern 1947: 176–178). Mo-riartys erste Präferenz ist, Holmes in Dover oder Canterbury ins Jenseits zu befördern. Die Auszah-lung für den Bösewicht beträgt jeweils + 100. Wenn Holmes unbeschadet nach Canterbury kommt, aber sein eigentliches Ziel Dover verfehlt, gibt es nach von Neumann eine Art Patt (0 Punkte). Für Moriarty am ungünstigsten ist «Canterbury», falls Holmes Dover erreicht, um von dort auf den Kontinent überzusetzen (– 50). Für Holmes gelten die Werte mit umgekehrtem Vor-

12

zeichen. Wie man sich leicht überzeugen kann, erhält man ein Nullsummenspiel ohne Sattel-punkt, das nach der Theorie von Neumann und Morgenstern mit gemischten Strategien lösbar ist. Kasten 5.2 «Matching Pennies» und Elfmeter

Zwei Spieler legen je eine Münze auf den Tisch, sodass entweder Zahl oder Wappen erscheint. Wohlgemerkt wird die Münze diesmal nicht zufällig geworfen; vielmehr entscheiden sich die Spieler unabhängig voneinander für eine Seite. Spieler 1, der Zeilenspieler, gewinnt einen Punkt, wenn beide Zahl oder wenn beide Wappen legen, also ein «match» vorkommt. Andernfalls ge-winnt Spieler 2 einen Punkt. Das Spiel, das bereits in von Neumann und Morgenstern (1947) zu finden ist, hat folgende Matrixform: Zahl Wappen

Zahl 1 – 1

Wappen – 1 1

Wie man sich leicht denken (und auch berechnen) kann, ist p* = q* =1/2 die Nash-Gleichgewichtsstrategie. Eine Anwendung von «Matching Pennies» ist das Elfmeterschießen im Fußball (Berger und Hammer 2007). Der Spieler kann in die linke oder in die rechte Hälfte des Tors zielen, der Torwart kann sich nach links oder rechts werfen. Ein «Match» ist gut für den Torwart und schlecht für den verhinderten Torschützen. Und bei einem «Mismatch» verhält es sich umge-kehrt. Moment einmal, könnte man einwenden, der Profi-Torhüter reagiert aber doch auf den Elfmeterschützen! Wir hätten dann ein sequenzielles Spiel, wobei der zweite Spieler, der Torhüter, in der stärkeren Position wäre. Man kann nun zeigen, dass eine Reaktion auf die Flugbahn des Balls bei der hohen Ballgeschwindigkeit und der menschlichen Reaktionszeit unmöglich ist. Des-halb wohl die «Angst des Torwarts vor dem Elfmeter». Torschütze und Torhüter müssen sich si-multan entscheiden. Berger und Hammer (2007), die dieses Argument vorbringen, haben zum Test der «Simultanitätshypothese» Daten von Bundesligaspielen ausgewertet. Wenn sich Torhü-ter und Spieler rational verhalten und simultan entscheiden, müssten die vier Kombinationen von Schussrichtung und Abwehrposition des Torwarts gleich häufig vorkommen. Die folgende Tabelle zeigt die Ergebnisse: Elfmeterschütze

Links Rechts

Torwart Links 202 (23 %) 220 (25 %)

Rechts 225 (26 %) 231(26 %)

878 Elfmeter aus Bundesligaspielen (nur Meisterschaftsspiele) der Spielsaisons 1992/93 bis

13

2003/04 haben Eingang in die Tabelle gefunden. Die Daten wurden von der Firma IMP AG erho-ben. «Schüsse auf die Mitte» und «Torhüter in der Mittelposition» wurden hier weggelassen. Ins-gesamt umfasst der von Berger und Hammer (2007) analysierte Datensatz 1043 Elfmeter. – Ein-drucksvoll zeigt sich, dass Profispieler im Durchschnitt der Nash-Strategie ziemlich nahe kommen. Jede Kombination hat ungefähr die gleiche erwartete Wahrscheinlichkeit von einem Viertel. Kasten 6.1 Länger fahren trotz Straßenbau. Das Paradox von Braess

Sechs Autofahrer wollen von A nach D fahren (Abbildung 6.2a). Sie haben zwei Strategien: die Route ABD oder ACD. Die Fahrzeit hängt davon ab, wie viele andere Fahrzeuge den gleichen Weg nehmen. Die Anzahl der Autos auf einer Straße wird mit φ bezeichnet. Fahren z. B. drei Autos von A nach B, benötigen sie 10 φ = 30 Minuten. Von B nach D sind es für drei Fahrzeuge 53 Minuten, insgesamt also für die Route ABD 83 Minuten. Wählt man die Route ACD, ist die Fahrzeit genau gleich lang. Wir gehen davon aus, dass je kürzer die Fahrzeit, desto größer der Nutzen eines Auto-fahrers ist. Man kann dann leicht sehen, dass die Routenwahl ABD und ACD durch je drei Ver-kehrsteilnehmer ein Pareto-optimales Nash-Gleichgewicht darstellt. Wird das Koordinationsprob-lem der Aufteilung auf die beiden Routen gelöst, wenn alle Autofahrer simultan wählen, dann existiert keine Dilemmasituation.

Abbildung 6.2a Abbildung 6.2b (Abbildung nach Pöppe 1992)

Die Verkehrsabteilung im Rathaus überlegt sich nun, zur Verbesserung der Verkehrssituation eine Entlastungsstraße von B nach C zu bauen (Abbildung 6.2b). Jeder der sechs Autofahrer hat jetzt einen Anreiz, die neue Straße und damit die neue Strategie ABCD zu wählen. Wählt er nämlich allein ABCD, während die anderen bei ihrer Strategie bleiben, dann verringert sich seine Fahrzeit von 83 auf 81 Minuten. Gleichzeitig erhöht sich aber die Fahrzeit anderer Autofahrer. Nehmen wir an, er sei vorher die Strecke ABD gefahren. Durch seine Wahl von ABCD erhöht sich die Fahrzeit der drei Autos auf der ACD-Route von vormals 83 auf 93 Minuten. Jetzt wird ein weiterer Fahrer von ACD auf die Route ABCD wechseln, da sich die Fahrzeit dann von 93 auf 92 Minuten vermin-

14

dert. Das Resultat ist, dass alle Autos auf allen drei Routen 92 Minuten benötigen. Das System ist wieder im (Nash-)Gleichgewicht. Kein Autofahrer hat einen Anreiz, seine Routenwahl zu verän-dern. Das Nash-Gleichgewicht ist aber nicht Pareto-optimal. Würden die Verkehrsteilnehmer ei-nen sanktionierbaren Vertrag abschließen, dann würden sie verabreden, dass keiner die «Entlas-tungsstraße» befahren darf, und schon würde ihre Fahrzeit wieder auf 83 Minuten sinken. Braess (1968) analysiert die Situation nicht als Gefangenendilemma. Wie wir gesehen haben, ist es aber eine Variante eines Mehr-Personen-GD (mit drei Entscheidungsalternativen und einem zusätzli-chen Koordinationsproblem). Braess kommentiert: «Für die Verkehrspraxis bedeutet das: In un-günstigen Fällen kann durch eine Erweiterung des Straßennetzes der Zeitaufwand anwachsen.» Wohlbemerkt, ohne zusätzliche Autos, das heißt, es geht noch nicht einmal um den Sogeffekt ei-nes Ausbaus von Verkehrsnetzen. Die Verkehrsplaner im Rathaus sind gut beraten, die neue Stra-ße zu sperren, mit Blumenkübeln und Bänken auszustatten und als Fußgängerzone zu deklarie-ren. Kasten 7.1 «Der kleine Friede im großen Krieg». Kooperation unter feindlichen Soldaten im Ers-ten Weltkrieg

«Der kleine Friede im großen Krieg» lautet der Titel eines Buchs von Jürgs (2005) über die Fraterni-sierung von Soldaten, die im Ersten Weltkrieg an vorderster Frontlinie in ihren Schützengräben lagen. Man weiß von dem System des «Leben und leben lassen» (Ashworth 1980) aus Berichten und Tagebuchaufzeichnungen von Frontsoldaten. Wenige Monate nach Kriegsbeginn im August 1914 kam der deutsche Angriff im Westen zum Stillstand. Auf beiden Seiten wurden die Verteidigungslinien durch Schützengräben ausgebaut. Die Frontlinie verlief vom Atlantik quer durch Belgien und Nordfrankreich bis nahe an die Schweizer Grenze. Ein zäher Stellungskrieg, bei dem die Soldaten oft nur auf Rufweite vonein-ander entfernt waren, begann. Die Frontsoldaten auf beiden Seiten hatten die gleichen Proble-me: alltägliche Dinge zu verrichten, wie Proviant heranzuschaffen, Essen zuzubereiten und vor allem in der miserablen Situation eines Frontsoldaten nicht von Kugeln zerschossen und von Granaten zerfetzt zu werden. Es entwickelte sich ohne Absprache eine heimliche Kooperation. Eine Form der Kooperation ist, nicht aufeinander zu schießen oder bewusst das Ziel zu verfeh-len. Falls aber eine Seite defektierte, wurde auch Vergeltung geübt. Für die Frontsoldaten im Stellungskrieg war es eine wiederholte, einem Gefangenendilemma ähnliche Situation. Axelrod (1986) analysiert die Kooperation aus dem Blickwinkel der Theorie des wiederholten Gefange-nendilemmas. Es entwickelten sich kooperative Strategien wie «Tit for tat» oder Varianten von TFT. Aus Sicht der höheren Of• ziere, des Generalstabs und der Artillerie im weiten Abstand von der Front glich die Situation einem Nullsummenspiel, und natürlich war die heimliche und schwer nachweisbare Kooperation der vorderen Linien den höheren Chargen ein Dorn im Auge.

15

Lassen wir einige Augenzeugen sprechen.1

«Der eigentliche Grund für die Ruhe in einigen Frontabschnitten war der, dass keine Seite ein Interesse daran hatte, in dem jeweiligen Gebiet vorzurücken. (…) Wenn die Briten die Deutschen beschossen, antworteten die Deutschen und die Verluste waren auf beiden Seiten gleich: wenn die Deutschen eine vorgeschobene Stellung bombardierten und fünf Engländer töteten, dann tötete eine Salve zur Antwort fünf Deutsche» (Belton Cobb, S. 69).

«Es wäre ein Kinderspiel, die mit Verpflegungswagen und Wasserkarren vollgestopfte Straße hin-ter den feindlichen Linien zu beschießen und in eine blutige Wüste zu verwandeln. (…) aber im großen und ganzen ist es ruhig. Wenn Du Deinen Feind daran hinderst, seine Verpflegung zu fas-sen, verfügt er schließlich über ein einfaches Mittel: er wird Dich daran hindern, Deine zu be-kommen» (Hay, S. 71). Die Befehlshaber wollten durch den Austausch von Einheiten die Kooperation zerstören, aber die Rotation erwies sich nicht als wirkungsvoll. Die Neuankömmlinge wurden von den alten Mann-schaften eingewiesen: «Der Deutsche ist kein schlechter Kerl. Lass ihn in Ruhe, dann lässt er Dich in Ruhe» (Gillon, S. 73). In manchen Frontabschnitten stabilisierte sich das System: «In einem Abschnitt war die Zeit von acht bis neun Uhr morgens ‹Privatangelegenheiten› gewid-met und bestimmte durch einen Wimpel gekennzeichnete Stellen galten für die Scharfschützen beider Seiten als verboten» (Morgan, S. 71). Allerdings wurde nicht nur «Tit for tat» angewandt: «Nachts verlassen wir die Schützengräben. (…) Die deutschen Arbeitskommandos sind ebenfalls draußen, es gilt daher nicht als die feine Art zu schießen. Wirklich gefährlich sind Gewehrgrana-ten. (…) Sie können bis zu acht oder neun Männer töten, wenn sie in einen Graben fallen. (…) Aber wir benutzen unsere nie, es sei denn, die Deutschen werden besonders laut, denn bei ihrer Art Vergeltung zu üben, kommen drei für jede von uns zurück» (Greenwell 1972, S. 72). Bemerkens-wert ist nachfolgendes Zitat. Die Kooperation hat sich hier so gut entwickelt, dass die Konfliktlinie nicht mehr zwischen den feindlichen Armeen besteht, sondern zwischen den Frontsoldaten und den eigenen Truppen im Hinterland. Ein mutiger Soldat entschuldigt sich für den Vertragsbruch: «Ich trank gerade Tee bei der Kompanie A, als wir lautes Geschrei hörten. Wir gingen nach drau-ßen, um zu sehen was vorgefallen war. Unsere Männer und die Deutschen standen auf der Brustwehr. Plötzlich schlug eine Salve ein, die jedoch keinen Schaden anrichtete. Beide Seiten gin-gen natürlich in Deckung und unsere Leute fluchten über die Deutschen. Auf einmal kletterte ein mutiger Deutscher auf seine Brustwehr und rief ‹Wir bedauern das sehr. Hoffentlich wurde nie-

1 Die Zitate stammen aus diversen Quellen und wurden von Ashworth (1980) in seiner Arbeit «Trench War-fare, 1914–1918. The Live and Let Live System» wiedergegeben. Wir greifen auf die von Axelrod (1986) aus-gewählten Zitate zurück, die in dem Kapitel über «Leben und leben lassen im Stellungskrieg» enthalten sind (übersetzt von Thomas Voss und Werner Raub). Wir geben hier die Namen der Berichterstatter bzw. Auto-ren mit den Seitenzahlen aus Axelrod 1986 an.

16

mand verletzt. Es war nicht unsere Schuld. Es war die verfluchte preußische Artillerie›» (Rutter, S. 77). Jürgs (2005) berichtet sogar von persönlichen Begegnungen und in einzelnen Fällen von Fußball-spielen zwischen Soldaten der feindlichen Armeen. Von der militärischen Führung befohlene Stoßtruppunternehmen bereiten dem «Leben-und-leben-lassen-System» schließlich ein Ende. Blutige Schlachten um wenige Quadratmeter Land wie die Hölle von Verdun und der Horror des Giftgaskriegs – eine Erfindung des Chemie-Nobelpreisträgers Fritz Haber – verdrängen den «klei-nen Frieden im großen Krieg». Die historische Fallstudie ist ein spektakuläres Beispiel dafür, dass selbst in tödlichen Konfliktsituationen zwischen Akteuren feindlicher Gruppierungen Kooperation entstehen kann. Und in der Folge impliziter Kooperation können sich Regeln (wie die Wimpel zur Kennzeichnung neutraler Zonen) und soziale Normen herausbilden. Nicht die Einstellungen der Akteure sind dafür zunächst entscheidend; zentral ist vielmehr die Struktur der Situation: die Be-sonderheit des Stellungskriegs, der zu wiederholten Dilemma-Situationen zwischen den gleichen Akteuren führte. Kasten 7.2 Vampir-Fledermäuse spenden Blut

In Südamerika leben Fledermäuse (Desmodus rotundus), die sich vom Blut großer Säugetiere er-nähren. Sie lassen sich auf dem Rücken von Pferden oder Rindern nieder und beißen sich an ihnen mit scharfen Zähnen fest. Im Speichel haben sie ein Sekret, das die Blutgerinnung hemmt. Bis zu einer halben Stunde benötigen die kleinen Blutsauger für den Aderlass, meist unbemerkt von ih-ren Opfern. Haben die Vampir-Fledermäuse ‹vollgetankt› (sie bringen dann bis zum Zweifachen ihres Körpergewichts auf die Waage), können sie davon maximal 60 Stunden leben. Oft sind die nächtlichen Jagden nicht von Erfolg gekrönt, sodass die Vampire in eine lebensbedrohliche Notla-ge geraten können. Nach den Beobachtungen von Wilkinson (1984) helfen sich die Tiere einer Ko-lonie im Notfall gegenseitig. Ein hilfesuchendes Tier putzt einen satten Artgenossen, den er gut kennt, mit dem er aber nicht verwandt sein muss. Auf dieses Signal hin würgt das satte Tier etwas Blut hervor und lässt seinem hungrigen Mitbewohner die Spende zukommen. Das bei der Jagd glücklose Tier hat dadurch wieder einige Stunden Lebenszeit gewonnen. Für die satte Vampir-Fledermaus ist der Verlust geringer als der Gewinn für das hungrige Tier (siehe Abbildung).

17

Abbildung Gewinn und Verlust scheinbar altruistischer Vampir-Fledermäuse (nach Wilkinson 1984, 1990)

Umgekehrt kann das nächste Mal der Spender in Bedrängnis kommen und dann seinen ‹Kredit› zurückfordern. Die Erklärung von Altruismus unter nichtverwandten Tieren ist eine Herausforde-rung für Biologen. Hier lautet sie, dass es sich um ein wiederholtes Spiel handelt und beide Akteu-re von einer Kooperation profitieren. Die Tiere handeln nur scheinbar altruistisch, auf längere Sicht hingegen im Eigeninteresse. Voraussetzung ist, dass sich die Tiere immer wieder begegnen und die Fähigkeit haben, sich gegenseitig erkennen zu können. Beides ist bei den Fledermäusen, die in Kolonien leben, gegeben. In der Sprache wiederholter Spiele muss der Diskontfaktor genü-gend groß sein, das heißt, künftige Interaktionen müssen sehr wahrscheinlich sein. Der Bedin-gung wird dadurch Genüge getan, dass sich nur gut bekannte Tiere aus der gleichen Kolonie ge-genseitig Hilfe zukommen lassen. Diese Entdeckung haben die ‹Vampir-Forscher› gemacht, in-dem sie tagelang in einem ausgehöhlten Baum die Fledermaus-Kolonie aus unbequemer Lage beobachtet und fein säuberlich die Interaktionen zwischen den Bewohnern protokolliert haben (Wilkinson 1984, 1990). Kasten 7.3 Reputation bei maghrebinischen Händlern und protestantischen Sekten

Die Schaffung von Reputationssystemen ist allerdings keine Erfindung des Internetzeitalters. Mit den technischen Möglichkeiten des Internets wird dieses Prinzip nur auf höchst einfache und ele-gante Weise genutzt, um stabile, effiziente und weitgehend betrugssichere Märkte zu etablieren. Greif (1989, 1993) berichtet in einer aufschlussreichen historisch-ökonomischen Untersuchung von maghrebinischen Kaufleuten im 11. Jahrhundert, die sich bei ihren umfangreichen Handelsak-tivitäten im Mittelmeerraum durch Agenten vertreten ließen. Dadurch entstand für die Händler (Prinzipale) ein Prinzipal-Agenten-Problem, da die Beauftragten praktisch unkontrollierbare Mög-

18

lichkeiten zum Betrug hatten. Tatsächlich verhielten sich aber die Agenten in der Regel koopera-tiv. Die Händler bildeten nämlich eine Koalition, innerhalb deren sie Informationen über die Tätig-keit der Agenten austauschten. Unehrliches Geschäftsgebaren hatte zur Folge, dass kein Händler der Koalition einen solchen Agenten künftig mit einem Unternehmen beauftragte. Hinzu kam, dass Agenten und Händler oftmals die Rollen tauschten, ein betrügerischer Agent aber nicht mehr in der Koalition der Händler Aufnahme gefunden hätte. Das Reputationssystem der ma-ghrebinischen Kaufleute war eine wesentliche Voraussetzung zur Lösung des Kooperationsprob-lems (vgl. auch Homann und Suchanek 2000). Es ist aber nicht nur Reputation für geschäftlichen Erfolg bedeutsam, sondern entscheidend sind zuverlässige Methoden zum Nachweis der Reputa-tion. Dieser Gesichtspunkt wird besonders von Max Weber (1920) in seiner Studie über «Die pro-testantischen Sekten und der Geist des Kapitalismus» hervorgehoben. Weber schildert zunächst diverse Alltagsbeobachtungen über die Zugehörigkeit zu protestantischen Sekten und die damit offenbar verbundene Kreditwürdigkeit. So fuhr Weber auf seiner Amerikareise in einem Abteil zusammen mit einem Handlungsreisenden, dessen Geschäfte sich auf den Verkauf eiserner Grabsteinaufschriften erstreckten. Von dem Geschäftsmann hörte er: «Herr, meinethalben mag jedermann glauben oder nicht glauben, was immer ihm passt; aber: wenn ich einen Farmer oder Kaufmann sehe, der überhaupt keiner Kirche angehört, so ist er mir nicht für 50 Cts gut …» (Weber 1920: 209). Ein Nasen- und Rachenspezialist deutscher Abstammung in Ohio wunderte sich über seinen ersten Patienten, der dem Arzt eröffnete, er sei Mitglied der Baptisten. Ein Kollege klärte den Arzt, der Weber diese Begebenheit erzählte, auf. «… das bedeute nur: ‹Seien Sie wegen des Honorars ohne Sorgen›». Nach einer baptistischen Taufe, deren Zeuge Weber wurde, erfährt er: «‹(…) aber er bekommt ja, nun er getauft ist, die Kundschaft der ganzen Umgegend und wird alles niederkonkurrieren.› Die Rückfragen, warum? und wodurch?, ergaben: daß die Rezeption in die dortige, noch streng an der religiösen Tradition haftenden, Baptistengemeinde, welche erst nach sorgsamster ‹Erprobung› und nach peinlichsten, sich bis in die frühe Kindheit zurückerstrecken-den Recherchen über den ‹Wandel› (‹disorderly conduct›? Wirtshausbesuch? Tanz? Theater? Kar-tenspiel? unpünktliche Zahlung von Verbindlichkeiten? sonstige Leichtfertigkeiten?) erfolgte, als eine derart absolute Garantie der ethischen Qualitäten eines Gentleman, vor allem: der geschäft-lichen, gelte, daß dem Betreffenden die Depots der gesamten Umgegend und schrankenloser Kredit konkurrenzlos sicher seien. Er sei ein ‹gemachter Mann›» (Weber 1920: 210, vgl. dazu auch Voss 1998). Mehrere Merkmale sind zur Begründung der Reputation entscheidend. Erstens wählt die Sekte ihre Mitglieder nach sorgfältiger Prüfung aus und erteilt – in Webers Worten – «ein ethi-sches, insbesondere auch ein geschäftsethisches, Qualifikationsattest» (S. 211). Zweitens erfolgt die Aufnahme per «ballot», also per Abstimmung der Sektenmitglieder. Drittens sollte der Erwerb der Reputation fälschungssicher sein, also Hochstapler keine Chance haben. Und viertens schließ-lich ist es von Vorteil, wenn die Reputation leicht kommunizierbar ist. In säkularisierter Form be-gegnen uns diese Elemente wieder bei Internetauktionen. Dem Qualifikationsattest entspricht das Ratingergebnis, das durch die Bewertung der Kunden, also per «ballot», zustande kommt. Das Verfahren ist relativ fälschungssicher – eine gute Reputation kann man nur durch kooperative Handlungen erzielen. Das Ergebnis und vor allem die Häufigkeit der Bewertungen wird allen inte-

19

ressierten Akteuren zugänglich gemacht. Eine einfache institutionelle Regelung schafft demnach a) Reputation, die b) auf dem Urteil sämtlicher oder vieler Interaktionspartner basiert, c) relativ fälschungssicher und d) äußerst transparent ist und damit die Voraussetzung für einen funktio-nierenden Markt schafft. Aus Diekmann und Wyder 2002: 676–678 Kasten 9.1 Ein Fallbeispiel: «Streetwise – wie Taxifahrer Signale für Vertrauen deuten»

Ein Paradefall für ein Vertrauensproblem ist die Situation von Taxifahrern in Stadtbezirken mit hoher Kriminalität. Diego Gambetta und Heather Hamill (2005) haben in einer bemerkenswerten Studie untersucht, wie Taxifahrer in Belfast und in New York die Vertrauenswürdigkeit von Kun-den ermitteln. In beiden Städten gehen Taxifahrer ein relativ hohes Risiko ein, dass sie betrogen, attackiert oder beraubt werden. In New York steht Taxifahren an der Spitze riskanter Berufe. In der US-Metropole stellen räuberische Überfälle eine womöglich tödlich endende Bedrohung dar, während im religiös hochsegregierten Belfast zum Zeitpunkt der Untersuchung die Gefahr be-stand, protestantischen oder katholischen Extremisten zum Opfer zu fallen. Um in ihrem Beruf im wahren Sinn des Wortes überleben zu können, müssen sie sehr genau lernen, auf Signale der Ver-trauenswürdigkeit zu achten. Um welche Signale es sich dabei handelt, haben Gambetta und Hamill mit qualitativen, teilstrukturierten Interviews, teilnehmender Beobachtung und Inhalts-analysen von Zeitungsartikeln ermittelt. Die Interviews mit Taxifahrern (45 in Belfast und 63 in New York, davon in New York wegen der Sprachprobleme mit den spanischsprechenden ‹livery cab drivers› 50 auswertbare Interviews) wurden aufgezeichnet und transkribiert. Weitere Inter-views wurden mit Kunden durchgeführt. Sodann wurden die Interviews daraufhin analysiert, welche Signale für Entscheidungen herangezogen und welche Signale kommuniziert werden. So sind Taxifahrer in Belfast beispielsweise auf der Hut, Hinweise auf die konfessionelle Zugehörig-keit zu geben. Vermieden werden für den Außenstehenden subtile Anzeichen wie die Vorliebe für schottische Fußballclubs (Katholiken bevorzugen die ‹Glasgow Celtic›, Protestanten die ‹Glasgow Rangers›) oder die Aussprache (katholische Belfaster sprechen den Buchstaben ‹h› anders als Pro-testanten, S. 63). Besonders wichtig ist es indessen, Signale für die Vertrauenswürdigkeit von Fahrgästen zu erkennen und zu deuten. Entscheidend für die Lösung des ‹Vertrauensspiels› ist die Fähigkeit, ‹gute› von ‹schlechten› Kunden zu unterscheiden. Dass Taxifahrer in Belfast oder New York lieber eine wohlgekleidete Dame oder einen Geschäftsmann mitnehmen, deren Adresse über die Zentrale mitgeteilt wurde, als drei junge Männer nachts in einer riskanten Gegend auf der Straße aufzusammeln, liegt auf der Hand. Nur ist die Situation nicht immer so eindeutig. Und Fahrer, die ein geringeres Risiko eingehen, werden auch geringere Einnahmen erzielen. Vor allem ist es ein Problem, Camouflage zu entdecken. Geschäftsleute mit Krawatte werden wohl kaum einen Taxifahrer wegen hundert Dollar berauben; aber wer hindert Leute mit bösen Absichten, sich eine Krawatte umzubinden und den Geschäftsmann vorzutäuschen? So ist man im Vertrau-ensspiel gut beraten, nach möglichst verlässlichen Signalen Ausschau zu halten. Verlässlich sind solche, die zwischen ‹guten› und ‹schlechten› Kunden unterscheiden und von ‹schlechten› Kun-

20

den nicht oder nur unter hohen Kosten vorgetäuscht werden können. So steuern manche Taxifah-rer Flughäfen an, und zwar nicht nur wegen der Distanz, sondern weil Fluggäste, die am Flugha-fen ein Taxi suchen, ein geringes Risiko darstellen. Potenzielle Räuber wiederum verfolgen selten die Mimikry-Strategie, sich zum Flughafen zu begeben und einen gerade angereisten Flugpassa-gier mit Gepäck und entsprechender Kleidung zu simulieren. Angesichts der relativ geringen Summen, die bei einem Raub erbeutet werden, lohnt sich die Mühe dafür nicht. Entsprechend lautet eine zentrale Hypothese der Studie, besonders solche Signale heranzuziehen, die mit hoher Wahrscheinlichkeit von ‹schlechten› Kunden nur unter Kosten produziert werden können, die den Gewinn ihres Vorhabens übersteigen. Gambetta und Hamills Hypothesen, die sie explizit der Spieltheorie entnehmen, werden zwar nicht einer strikten Prüfung unterzogen. Dafür weist die Studie andere Vorzüge auf. Ihre Untersuchungsstrategie ähnelt im Grunde derjenigen eines Bio-logen, welcher die Gültigkeit der Evolutionstheorie unterstellt und bei einem Organismus empi-risch untersucht, welche Merkmale die Fitness für das Überleben erhöhen. Vergleichsweise wer-den auch hier die Hypothesen aus der Theorie der Signalspiele als gültig unterstellt, empirisch wird dann aber nach den im Vorhinein nicht bekannten Signalen gesucht, die für die Akteure in der gegebenen Situation bedeutsam sind. Die Studie ist theoretisch orientiert, zugleich aber explorativ. Die Theorie ist wichtig, weil sie den Blick dafür schärft, worauf zu achten ist, nämlich auf Signale und ihre Kosten für die beteiligten Akteure. Die qualitative Methode eignet sich dafür besonders gut, da die Art der Signale und ihre Kosten, die mit dem sozialen und kulturellen Kon-text variieren, nicht bekannt sind und daher mit einem standardisierten Fragebogen auch nicht erhoben werden können. Hinzu kommt, dass meist nicht einfach ein einzelnes Anzeichen, son-dern komplexe Cluster von Merkmalen der Personen und der Umgebung als Signal gedeutet wer-den. Gambetta und Hamill diskutieren selbst die Probleme verschiedener Methoden, bevor sie sich für qualitative Interviews entscheiden (aus Diekmann 2008a, S. 19 f.). Kasten 10.1 Reziprozität von Löhnen und Arbeitseinsatz

Das Experiment von Fehr, Fischbacher und Tougarova (2002) simuliert einen Arbeitsmarkt mit sechs Unternehmen und neun Arbeitnehmern. Jedes Unternehmen kann genau einen Arbeiter einstellen. Ein Experiment besteht aus zehn Runden. Jede Runde beginnt mit einer Auktion, bei der die Arbeitgeber einen Lohn anbieten. Die Versuchspersonen in der Rolle der Arbeiter haben sodann die Wahl, ein Lohngebot anzunehmen. Erfolgt keine Einstellung, erhält die Person in die-ser Runde nichts. Die Beziehung zwischen Arbeitgeber und Arbeitnehmer wechselt von Runde zu Runde, sodass es sich nicht um wiederholte Spiele handelt. Im sogenannten Gift-Exchange-Markt (GEM) mit Reziprozität von Lohnniveau und Arbeitseinsatz kann ein Arbeitnehmer nach Akzep-tanz eines Lohnangebots den Arbeitseinsatz festlegen. Es gelten folgende Zusammenhänge, die den Versuchspersonen bekanntgemacht werden:

P = (120 – w) e

21

U = w – c (e) – 20

P ist der Pro• t der Firma, w der Lohn und e (0,1 ≤ e ≤ 1) der Arbeitseinsatz. Die Auszahlung U an den Arbeitnehmer ist der Lohn abzüglich der Kosten für einen höheren Arbeitseinsatz c (e) abzüg-lich fixer Kosten von 20 (z. B. für den Arbeitsweg). Die Kosten des Arbeitseinsatzes werden in einer Tabelle angegeben:

Arbeitseinsatz (e) 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

Kosten c (e) 0 1 2 4 6 8 10 12 15 18

Ein individuell-rationaler Unternehmer macht ein Lohnangebot von 20, ein rationaler Arbeiter leistet den minimalen Arbeitseinsatz. Diese Strategienkombination ist das einzige Nash-Gleichgewicht. Das Nash-Gleichgewicht ist aber nicht Pareto-optimal. Das Spiel entspricht einem N-Personen-Gefangenendilemma. Beide Akteure können sich im GEM besserstellen, wenn der Arbeitgeber einen höheren Lohn zahlt und der Arbeitnehmer einen höheren Arbeitseinsatz leistet. Bei z. B. einem Lohn von 60 und einem Arbeitseinsatz von 0,8 macht das Unternehmen einen Pro-fit von 48, der Arbeitnehmer erhält 28. Das ist besser als U = 0 und P = 10 im Nash-Gleichgewicht. Zur Kontrolle wird in einer zweiten Versuchsbedingung ein Arbeitsmarkt simuliert, bei dem eine Effizienzsteigerung der Arbeit nicht möglich ist. Die Funktionen für die Auszahlungen an Arbeit-geber und Arbeitnehmer sind hier einfach: P = 120 – w und U = w – 20. Im Gleichgewicht zahlt der Arbeitgeber einen Lohn von 20. Dieses Gleichgewicht ist ebenso wie jede andere Auszahlung Pa-reto-optimal (Complete Contracts Market, CCM).

An dem Experiment nahmen 120 Studenten einer Hochschule in Moskau teil, die hauptsächlich Ingenieure ausbildet. In der GEM-Situation wurde noch nach hohen und niedrigen Auszahlungen differenziert. Die monetäre Umrechnung der im Spiel erzielten Punkte war in der Gruppe mit ho-her Auszahlung um den Faktor 10 günstiger als in der Gruppe mit «normaler» Auszahlung. Tat-

22

sächlich spielte der Umrechnungsfaktor aber keine Rolle. Reziprozität war sowohl in der Gruppe mit hohen als auch in der Gruppe mit geringeren Auszahlungen beobachtbar. Die Lohnangebote lagen weit über den Angeboten der Nash-Strategie; Gleiches gilt für den Arbeitseinsatz. In der Kontrollgruppe waren dagegen die Lohnangebote nicht nur geringer. Sie bewegten sich auch mit wachsender Rundenzahl in Richtung des Nash-Gleichgewichts. Die Ergebnisse sind ein Beleg für die Reziprozitäts-Hypothese und stützen eine zentrale Annahme des von Akerlof vorgeschlagenen Austauschmodells der «Ef• zienzlohntheorie».

23