43
Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Embed Size (px)

Citation preview

Page 1: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Das Google Zeitalter

Von der Suchmaschine zur künstlichen IntelligenzProfessor Dr. Eduard Heindl

Page 2: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Themen

Woher kommt Google Wie arbeitet Google Was ist an Google einmalig Warum ist Google so mächtig Wohin geht Google

Page 3: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Googlesteinzeit 1995 treffen sich

Sergey Brin (23) und Larry Page (24)

1996 BackRub System an der Stanford University

100.000$ von Andy Bechtolsheim

7. September 1998 Start Google Inc.

*September 21, 1999, the beta label came off the website.

Page 4: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Firmenphilosophie

perfect search enginedefined by co-founder Larry Page

as something that:

"understands exactly what you mean and gives you back exactly what you want."

Page 5: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Live of a Query

Quelle: http://www.google.com/corporate/query.html

Page 6: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Der PageRank Google sortiert nach

PageRank Je mehr Links auf ein

Dokument deuten, um so besser

Algorithmus berücksichtigt aber auch den PageRank der Verweisseiten

Rekursives Problem „solving an equation of

more than 500 million variables and 2 billion terms“ (laut Google)

Link

AA

LL MMNN

GG

OO

FFEE

CCBB

HHDD

II KK

Page 7: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Die LinkmatrixA B C D E F G H I K L M N O

A 0 0 0 0 0 0 0 1 0 0 0 0 0 0

B 0 0 0 0 0 0 0 0 0 0 0 0 0 0

C 0 0 0 0 1 0 0 0 0 0 0 0 0 0

D 0 0 0 0 0 0 0 0 0 0 0 0 0 0

E 0 0 0 0 0 1 0 0 0 0 0 0 0 0

F 0 0 0 0 1 0 0 0 0 0 0 0 0 1

G 0 0 0 0 0 0 0 0 0 0 0 0 0 0

H 0 2 0 0 0 0 0 0 0 1 0 0 0 0

I 0 0 0 1 0 0 0 1 0 1 0 0 0 0

K 0 0 0 0 0 0 0 0 0 0 0 1 0 0

L 0 0 0 0 0 0 0 0 1 0 0 0 0 0

M 0 0 0 0 0 0 0 1 0 0 1 0 0 0

N 0 0 0 0 0 0 1 0 0 0 0 1 0 0

O 0 0 0 0 0 0 0 0 0 0 0 0 1 0

Link

AA

LL MMNN

GG

OO

FFEE

CCBB

HHDD

II KK

Page 8: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Was ist Intelligenz Wissen wo was wichtiges steht Google's technology uses the collective

intelligence of the web to determine a page's importance1

There is no human involvement or manipulation of results1

'The ultimate search engine would be smart; it would understand everything in the world,' says Page.2

[1] http://www.google.com/corporate/tech.html[2] http://www.aaai.org/AITopics/assets/AIalerts/alert.12.18.02.html

Page 9: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Besonderheiten an Google

Page 10: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Domainnamen unter den Top 5oo Yahoo Go Goo Gooooal Cool Room Moon Wanadoo Football Book Cartoon OO Objekt Orientiert

Goodday tool School Choose Look Kategorie Gold Gov Pogo Bingo God Google Googelb?

http://www.alexa.com/site/ds/top_500

Page 11: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Die größte Maschine Das Rechenzentrum von Google hat 100.000

Rechenknoten mit 6 PetaByte Festplattenspeicher (Größte Rechnerkapazität der Welt)*

Google hat „alle“ Dokumente des Webs gespiegelt >30 Terabyte

4.285.199.774 Dokumente, warum? 232=4.294.967.296 Aktuelles Limit für Longinteger! >1.000 Anfragen pro Sekunde Erstmals ist ein Firmennamen zu einem Verb

geworden „googeln“

Anmerkung: ein PetaByte = 250 Byte = 1024 TeraByte* John Markoff in der NYT vom 13. April 2003

Page 12: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Forschung Ungewöhnlich

schnelles Wachstum bei den R&D Ausgaben!

Über 100 Ph.D.´s bei Google, „industry's most unorthodox portfolio of human capital “*

*NYT, June 6, 2004

Page 13: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Zeitgeist Google kennt die

Trends Aufgelöst nach

Länder Aufgelöst nach

Themen Statistisch

aussagekräftig?

www.google.com/press/zeitgeist.html

Page 14: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Google News Ein Roboter der Zeitung liest und schreibt

Google News sortiert aus über 2400 Quellen wichtige Meldungen in die einzelnen Rubriken

Zusätzlich können zu Suchbegriffen News Meldungen abgefragt werden

Zweiter Platz hinter Washington Post im Online Journalismus EPpy Award

Page 15: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Noch ist der Roboter nicht perfekt

Autofahren, Autorennen und schwere Verletzungen liegen nahe zusammen

Page 16: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Der kleine Unterschied

Technik und Techno

Page 17: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Google Ads

Werbung leicht gemacht Jeder kann zu beliebigen Worten

Textanzeigen schalten Bezahlt wird nur wenn jemand klickt Selten geklickte Worte werden

entfernt Gute Anzeigen werden öfter

eingeblendet

Page 18: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Gute Texte schlechte Texte Auf diese Anzeige

haben 1,2% der Nutzer geklickt!

Auf diese 50% mehr! (1,9%)

Werbung optimieren zum Preis einer Pizza

Page 19: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Noch ein Beispiel

Welche Anzeige hat mehr Besucher?

0,7% 2,8% Die Daten sind

hochsignifikant, da 3000 mal geklickt wurde

Page 20: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Google Adsense Geldverdienen leicht

gemacht Bezahlung nach

Klicks Einnahmen bis zu

XX€1 pro tausend Besucher

Einblendung ist kontextsensitiv

Wesentlich höhere Klickrate als bei klassischer Bannerwerbung

[1]Google untersagt seinen Content-Partnern die Einnahmen offen zu legen

Page 21: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Und so lautet der Beschluß

Daß die Maschine

etwas lernen muß

Page 22: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Der Lernvorgang

Lernen bedeutet Ergebnisse liefern und diese verbessern

WWW SuchmaschineNutzer

Page 23: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Suchmachinen Version 0.1

Keywords vor 1995 Fiz Karlsruhe Patentsuche

ContentSuch-maschine

Nutzer

Bibliothekar

Page 24: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Suchmaschinen I. Art

Volltextsuche ~ 1995 Lycos Altavista

WWWSuch-

maschineNutzer

Page 25: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Suchmaschine II. Art

Neue Algorithmen Linkstruktur Textcluster

WWW SuchmaschineNutzer

Vorver-arbeitung

Page 26: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Suchmaschinen III. Art

Textverständnis Rückkopplung Neuronale Algorithmen

WWW SuchmaschineNutzer

IQlesenverstehen

Page 27: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Nutzer

NutzerNutzer

Triebkräfte

Suchmaschine Nutzer Webseiteliefert Link Nutzt Link

Geht fremdSuch-

maschinen-optimiert

zufrieden

liefert Link

Nutzt Link

unzufrieden

Kommt wieder

Such-maschinen-optimierer

NeueSuchmaschine

Verbessert Algorithmus

Bekommt Werbe-

einnahmen

Page 28: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Suchsystem

Zyklus

Verbessert Algorithmus

Kluge Nutzer

Bekommt Werbe-

einnahmen

ContentAnbieter

Page 29: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Fragen Wie vollständig ist die Welt im

WWW repräsentiert? Fast alle Dokumente sind

Produkte menschlicher Ansichten Viel Dokumente sind, zumindest

in Fragmenten, Kopien Wahrheitsgehalt nur über Kontext

zu erschließen Es gibt keine vollständigere

digitale Wissensbasis

WWW

Page 30: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Wissen im Internet

Datenbestand ist mehrsprachig wenige Sprachen relevant, 50% englisch

Daten sind hochgradig redundant Vorteil wenn Interpretation nötig

Multimediadaten (Bilder, Filme) Erfordert komplexe Analyse

Bild-Text Kopplung vorhanden Erlaubt lernen aus Bildern

Page 31: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Fragen zum Lesen

Einfaches Einlesen Problem: viele Seiten

haben unklare Strukturen (Tabellen!)

Problem: häufig wechselnde Inhalte

Datenbank sollte die Link-Struktur des WWW nutzen

lesen

Page 32: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Frage nach Weltbild

Wird ein Vorwissen benötigt

Kann das System aus Nutzerverhalten lernen

Spielt die Datenstruktur eine Rolle

Welche Algorithmen lernen effizient

verstehen

Page 33: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Was ist Intelligenz

Wissen für erfolgreiches Handeln bereithalten

Wissen verarbeiten Wissen richtig einsetzen Wissen durch

Information erweitern Neues Wissen

generieren

IQ

Page 34: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Schleifen I

Einstellen von Dokumenten

durch Menschen

„Lesen“ der Dokumente durch Google

Menschen fragen Google

Menschen lesen Dokumente

und erstellen neue Dokumente

Page 35: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Schleifen II

Einstellen von Dokumenten durch Google

„Lesen“ der Dokumente

durch Menschen

Google frägt

Menschen

Google liest Dokumente und erstellt

neue Dokumente

Page 36: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Zukunft

1000 Touché ©Tom / Thomas Körner. Berlin 1998

Page 37: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Die Googlemauer

Anbieter Interessent

Medien

Anzeigentunnel

GoogleAdsense

Adwords

Page 38: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Effiziente Märkte

Zwischen Informationen vermitteln

Anbieter Kunde

Optimal vermitteln

Page 39: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Strategisches Risiko Was passiert wenn: Google ausfällt?

Hackerangriff Physischer Angriff

Für manche Länder manipuliert wird Zensiert Ergebnisse vertauscht Verkauft wird (z.B. an Microsoft)

Dunkelheit im Internet!

Page 40: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Von der Steinzeit Zeitalter

Wenn zwischen der Hand des Menschen und der zu behandelnden Materie ein bestimmendes Material wirkt

Wenn zwischen dem Gehirn des Menschen und dem zu findenden Wissen eine bestimmende Instanz steht?

Page 41: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Google geht an die Börse

DON’T BE EVIL  Don’t be evil. We believe strongly that in the long term, we will be better served—as shareholders and in all other ways—by a company that does good things for the world even if we forgo some short term gains. This is an important aspect of our culture and is broadly shared within the company.

Risks Related to Our Business and Industry  We face significant competition from Microsoft and Yahoo.

2.718.281.828 Aktien zu einem Preis von 0,01 $

Page 42: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Börsenwert von Google

Abschätzungen (kurzfristig) 200.000.000 Suchergebnisse täglich Wert pro Ergebnis 5ct Jährliche Einnahme $ 3,6 Mrd.

Maximalwert (langfristig) 500 Mio. Google Nutzer Täglich 5 min gespart = $ 1,0 Jährliche Einnahmen = $ 182,5 Mrd.

Page 43: Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl

Eduard Heindl, FH-Furtwangen

Zum Weiterlesen Dieser Vortrag: heindl.de/google

google.com/about.html google.com/ads google.com/adsense labs.google.com labs.google.com/papers.html google.indicateur.com searchenginewatch.com

TThhee EEnndd