View
113
Download
4
Category
Preview:
Citation preview
Das Google Zeitalter
Von der Suchmaschine zur künstlichen IntelligenzProfessor Dr. Eduard Heindl
Eduard Heindl, FH-Furtwangen
Themen
Woher kommt Google Wie arbeitet Google Was ist an Google einmalig Warum ist Google so mächtig Wohin geht Google
Eduard Heindl, FH-Furtwangen
Googlesteinzeit 1995 treffen sich
Sergey Brin (23) und Larry Page (24)
1996 BackRub System an der Stanford University
100.000$ von Andy Bechtolsheim
7. September 1998 Start Google Inc.
*September 21, 1999, the beta label came off the website.
Eduard Heindl, FH-Furtwangen
Firmenphilosophie
perfect search enginedefined by co-founder Larry Page
as something that:
"understands exactly what you mean and gives you back exactly what you want."
Eduard Heindl, FH-Furtwangen
Live of a Query
Quelle: http://www.google.com/corporate/query.html
Eduard Heindl, FH-Furtwangen
Der PageRank Google sortiert nach
PageRank Je mehr Links auf ein
Dokument deuten, um so besser
Algorithmus berücksichtigt aber auch den PageRank der Verweisseiten
Rekursives Problem „solving an equation of
more than 500 million variables and 2 billion terms“ (laut Google)
Link
AA
LL MMNN
GG
OO
FFEE
CCBB
HHDD
II KK
Eduard Heindl, FH-Furtwangen
Die LinkmatrixA B C D E F G H I K L M N O
A 0 0 0 0 0 0 0 1 0 0 0 0 0 0
B 0 0 0 0 0 0 0 0 0 0 0 0 0 0
C 0 0 0 0 1 0 0 0 0 0 0 0 0 0
D 0 0 0 0 0 0 0 0 0 0 0 0 0 0
E 0 0 0 0 0 1 0 0 0 0 0 0 0 0
F 0 0 0 0 1 0 0 0 0 0 0 0 0 1
G 0 0 0 0 0 0 0 0 0 0 0 0 0 0
H 0 2 0 0 0 0 0 0 0 1 0 0 0 0
I 0 0 0 1 0 0 0 1 0 1 0 0 0 0
K 0 0 0 0 0 0 0 0 0 0 0 1 0 0
L 0 0 0 0 0 0 0 0 1 0 0 0 0 0
M 0 0 0 0 0 0 0 1 0 0 1 0 0 0
N 0 0 0 0 0 0 1 0 0 0 0 1 0 0
O 0 0 0 0 0 0 0 0 0 0 0 0 1 0
Link
AA
LL MMNN
GG
OO
FFEE
CCBB
HHDD
II KK
Eduard Heindl, FH-Furtwangen
Was ist Intelligenz Wissen wo was wichtiges steht Google's technology uses the collective
intelligence of the web to determine a page's importance1
There is no human involvement or manipulation of results1
'The ultimate search engine would be smart; it would understand everything in the world,' says Page.2
[1] http://www.google.com/corporate/tech.html[2] http://www.aaai.org/AITopics/assets/AIalerts/alert.12.18.02.html
Eduard Heindl, FH-Furtwangen
Besonderheiten an Google
Eduard Heindl, FH-Furtwangen
Domainnamen unter den Top 5oo Yahoo Go Goo Gooooal Cool Room Moon Wanadoo Football Book Cartoon OO Objekt Orientiert
Goodday tool School Choose Look Kategorie Gold Gov Pogo Bingo God Google Googelb?
http://www.alexa.com/site/ds/top_500
Eduard Heindl, FH-Furtwangen
Die größte Maschine Das Rechenzentrum von Google hat 100.000
Rechenknoten mit 6 PetaByte Festplattenspeicher (Größte Rechnerkapazität der Welt)*
Google hat „alle“ Dokumente des Webs gespiegelt >30 Terabyte
4.285.199.774 Dokumente, warum? 232=4.294.967.296 Aktuelles Limit für Longinteger! >1.000 Anfragen pro Sekunde Erstmals ist ein Firmennamen zu einem Verb
geworden „googeln“
Anmerkung: ein PetaByte = 250 Byte = 1024 TeraByte* John Markoff in der NYT vom 13. April 2003
Eduard Heindl, FH-Furtwangen
Forschung Ungewöhnlich
schnelles Wachstum bei den R&D Ausgaben!
Über 100 Ph.D.´s bei Google, „industry's most unorthodox portfolio of human capital “*
*NYT, June 6, 2004
Eduard Heindl, FH-Furtwangen
Zeitgeist Google kennt die
Trends Aufgelöst nach
Länder Aufgelöst nach
Themen Statistisch
aussagekräftig?
www.google.com/press/zeitgeist.html
Eduard Heindl, FH-Furtwangen
Google News Ein Roboter der Zeitung liest und schreibt
Google News sortiert aus über 2400 Quellen wichtige Meldungen in die einzelnen Rubriken
Zusätzlich können zu Suchbegriffen News Meldungen abgefragt werden
Zweiter Platz hinter Washington Post im Online Journalismus EPpy Award
Eduard Heindl, FH-Furtwangen
Noch ist der Roboter nicht perfekt
Autofahren, Autorennen und schwere Verletzungen liegen nahe zusammen
Eduard Heindl, FH-Furtwangen
Der kleine Unterschied
Technik und Techno
Eduard Heindl, FH-Furtwangen
Google Ads
Werbung leicht gemacht Jeder kann zu beliebigen Worten
Textanzeigen schalten Bezahlt wird nur wenn jemand klickt Selten geklickte Worte werden
entfernt Gute Anzeigen werden öfter
eingeblendet
Eduard Heindl, FH-Furtwangen
Gute Texte schlechte Texte Auf diese Anzeige
haben 1,2% der Nutzer geklickt!
Auf diese 50% mehr! (1,9%)
Werbung optimieren zum Preis einer Pizza
Eduard Heindl, FH-Furtwangen
Noch ein Beispiel
Welche Anzeige hat mehr Besucher?
0,7% 2,8% Die Daten sind
hochsignifikant, da 3000 mal geklickt wurde
Eduard Heindl, FH-Furtwangen
Google Adsense Geldverdienen leicht
gemacht Bezahlung nach
Klicks Einnahmen bis zu
XX€1 pro tausend Besucher
Einblendung ist kontextsensitiv
Wesentlich höhere Klickrate als bei klassischer Bannerwerbung
[1]Google untersagt seinen Content-Partnern die Einnahmen offen zu legen
Eduard Heindl, FH-Furtwangen
Und so lautet der Beschluß
Daß die Maschine
etwas lernen muß
Eduard Heindl, FH-Furtwangen
Der Lernvorgang
Lernen bedeutet Ergebnisse liefern und diese verbessern
WWW SuchmaschineNutzer
Eduard Heindl, FH-Furtwangen
Suchmachinen Version 0.1
Keywords vor 1995 Fiz Karlsruhe Patentsuche
ContentSuch-maschine
Nutzer
Bibliothekar
Eduard Heindl, FH-Furtwangen
Suchmaschinen I. Art
Volltextsuche ~ 1995 Lycos Altavista
WWWSuch-
maschineNutzer
Eduard Heindl, FH-Furtwangen
Suchmaschine II. Art
Neue Algorithmen Linkstruktur Textcluster
WWW SuchmaschineNutzer
Vorver-arbeitung
Eduard Heindl, FH-Furtwangen
Suchmaschinen III. Art
Textverständnis Rückkopplung Neuronale Algorithmen
WWW SuchmaschineNutzer
IQlesenverstehen
Eduard Heindl, FH-Furtwangen
Nutzer
NutzerNutzer
Triebkräfte
Suchmaschine Nutzer Webseiteliefert Link Nutzt Link
Geht fremdSuch-
maschinen-optimiert
zufrieden
liefert Link
Nutzt Link
unzufrieden
Kommt wieder
Such-maschinen-optimierer
NeueSuchmaschine
Verbessert Algorithmus
Bekommt Werbe-
einnahmen
Eduard Heindl, FH-Furtwangen
Suchsystem
Zyklus
Verbessert Algorithmus
Kluge Nutzer
Bekommt Werbe-
einnahmen
ContentAnbieter
Eduard Heindl, FH-Furtwangen
Fragen Wie vollständig ist die Welt im
WWW repräsentiert? Fast alle Dokumente sind
Produkte menschlicher Ansichten Viel Dokumente sind, zumindest
in Fragmenten, Kopien Wahrheitsgehalt nur über Kontext
zu erschließen Es gibt keine vollständigere
digitale Wissensbasis
WWW
Eduard Heindl, FH-Furtwangen
Wissen im Internet
Datenbestand ist mehrsprachig wenige Sprachen relevant, 50% englisch
Daten sind hochgradig redundant Vorteil wenn Interpretation nötig
Multimediadaten (Bilder, Filme) Erfordert komplexe Analyse
Bild-Text Kopplung vorhanden Erlaubt lernen aus Bildern
Eduard Heindl, FH-Furtwangen
Fragen zum Lesen
Einfaches Einlesen Problem: viele Seiten
haben unklare Strukturen (Tabellen!)
Problem: häufig wechselnde Inhalte
Datenbank sollte die Link-Struktur des WWW nutzen
lesen
Eduard Heindl, FH-Furtwangen
Frage nach Weltbild
Wird ein Vorwissen benötigt
Kann das System aus Nutzerverhalten lernen
Spielt die Datenstruktur eine Rolle
Welche Algorithmen lernen effizient
verstehen
Eduard Heindl, FH-Furtwangen
Was ist Intelligenz
Wissen für erfolgreiches Handeln bereithalten
Wissen verarbeiten Wissen richtig einsetzen Wissen durch
Information erweitern Neues Wissen
generieren
IQ
Eduard Heindl, FH-Furtwangen
Schleifen I
Einstellen von Dokumenten
durch Menschen
„Lesen“ der Dokumente durch Google
Menschen fragen Google
Menschen lesen Dokumente
und erstellen neue Dokumente
Eduard Heindl, FH-Furtwangen
Schleifen II
Einstellen von Dokumenten durch Google
„Lesen“ der Dokumente
durch Menschen
Google frägt
Menschen
Google liest Dokumente und erstellt
neue Dokumente
Eduard Heindl, FH-Furtwangen
Zukunft
1000 Touché ©Tom / Thomas Körner. Berlin 1998
Eduard Heindl, FH-Furtwangen
Die Googlemauer
Anbieter Interessent
Medien
Anzeigentunnel
GoogleAdsense
Adwords
Eduard Heindl, FH-Furtwangen
Effiziente Märkte
Zwischen Informationen vermitteln
Anbieter Kunde
Optimal vermitteln
Eduard Heindl, FH-Furtwangen
Strategisches Risiko Was passiert wenn: Google ausfällt?
Hackerangriff Physischer Angriff
Für manche Länder manipuliert wird Zensiert Ergebnisse vertauscht Verkauft wird (z.B. an Microsoft)
Dunkelheit im Internet!
Eduard Heindl, FH-Furtwangen
Von der Steinzeit Zeitalter
Wenn zwischen der Hand des Menschen und der zu behandelnden Materie ein bestimmendes Material wirkt
Wenn zwischen dem Gehirn des Menschen und dem zu findenden Wissen eine bestimmende Instanz steht?
Eduard Heindl, FH-Furtwangen
Google geht an die Börse
DON’T BE EVIL Don’t be evil. We believe strongly that in the long term, we will be better served—as shareholders and in all other ways—by a company that does good things for the world even if we forgo some short term gains. This is an important aspect of our culture and is broadly shared within the company.
Risks Related to Our Business and Industry We face significant competition from Microsoft and Yahoo.
2.718.281.828 Aktien zu einem Preis von 0,01 $
Eduard Heindl, FH-Furtwangen
Börsenwert von Google
Abschätzungen (kurzfristig) 200.000.000 Suchergebnisse täglich Wert pro Ergebnis 5ct Jährliche Einnahme $ 3,6 Mrd.
Maximalwert (langfristig) 500 Mio. Google Nutzer Täglich 5 min gespart = $ 1,0 Jährliche Einnahmen = $ 182,5 Mrd.
Eduard Heindl, FH-Furtwangen
Zum Weiterlesen Dieser Vortrag: heindl.de/google
google.com/about.html google.com/ads google.com/adsense labs.google.com labs.google.com/papers.html google.indicateur.com searchenginewatch.com
TThhee EEnndd
Recommended