30
HEINZ NIXDORF INSTITUT Universität Paderborn Fachbereich Mathematik/Informatik 1 gorithm. Grundlagen des Internets . Mai 2002 Christian Schindelhauer Vorlesung Sommersemester 2002 Algorithmische Grundlagen des Internets (VI) Christian Schindelhauer [email protected] HEINZ NIXDORF INSTITUT Universität Paderborn Fachbereich Mathematik/Informatik AG Meyer auf der Heide

Vorlesung Sommersemester 2002

  • Upload
    yves

  • View
    40

  • Download
    0

Embed Size (px)

DESCRIPTION

Vorlesung Sommersemester 2002. Algorithmische Grundlagen des Internets (VI) Christian Schindelhauer [email protected] HEINZ NIXDORF INSTITUT Universität Paderborn Fachbereich Mathematik/Informatik AG Meyer auf der Heide. Fairness und Effizienz von AIMD Das Modell. - PowerPoint PPT Presentation

Citation preview

Page 1: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

1Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Vorlesung Sommersemester 2002

Algorithmische Grundlagen des Internets (VI)

Christian [email protected]

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/InformatikAG Meyer auf der Heide

Page 2: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

2Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Fairness und Effizienz von AIMDDas Modell

o n Teilnehmer, Rundenmodell

o Teilnehmer i hat Datenrate xi(t)

o Anfangsdatenrate x1(0), …, xn(0) gegeben

o Feedback nach Runde t: y(t) = 0, falls

y(t) = 1, falls

o Jeder Teilnehmer aktualisiert in Runde t+1:

xi(t+1) = f(xi(t),y(t))

Increase-Strategie f0(x) = f(x,0)

Decrease-Strategie f1(x) = f(x,1)

o Wir betrachten lineare Funktionen:

Page 3: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

3Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Fairness und Effizienz von AIMDDas Modell

o Wir betrachten lineare Funktionen:

o Interessante Spezialfälle: MIMD: Multiplicative Increase/Multiplicative Decrease

AIAD: Additive Increase/Additive Decrease

AIMD: Additive Increase/Multiplicative Decrease

Page 4: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

4Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Fairness und Effizienz

o Effizienz Last:

Maß

o Fairness: Für x=(x1, …, xn):

1/n ≤ F(x) ≤ 1 F(x) = 1 ↔ absolute Fairness Skalierungsunabhängig Kontinuierlich, stetig, differenzierbar Falls k von n fair, Rest 0, dann F(x) = k/n

Page 5: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

5Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Konvergenz

o Konvergenz unmöglich

o Bestenfalls Oszillation um Optimalwert

Oszillations-amplitude A

Einschwingzeit T

Page 6: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

6Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

AIADAdditive Increase/Additive Decrease

Page 7: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

7Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

MIMDMultiplicative Increase/Multiplicative

Decrease

Page 8: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

8Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

AIMDAdditive Increase/Multiplicative

Decrease

Page 9: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

9Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Effiziente lineare Funktionen

o X(t) > K

aD ≤ 0 → bD ≤ 1

aD > 0 → bD < 0

o X(t) < K

aI ≥ 0 → bI ≥ 1

aI < 0 → nicht möglich

Page 10: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

10Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

o Fairness von x(t) = (x1(0), …, xn(0)) konvergiert gegen 1, d.h.

für

o Es gilt für c=a/b:

o Beweis?

Fairness (I)

Page 11: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

11Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Beweis! (1)

o Es gilt:

o Substitution

o Dann ist: und

Page 12: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

12Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Beweis! (2)

o Zu zeigen:

o Warum gilt diese Gleichung?

Page 13: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

13Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Beweis! (3)

o Warum gilt diese Gleichung?

wobei

Page 14: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

14Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

o Es gilt:

o D.h. Fairness nimmt mit c=a/b zu. Für c=0 ist F(x(t+1))= F(x(t)) Für c>0 ist F(x(t+1))> F(x(t)), falls F(x(t)) ≠ 1 Für c<0 ist F(x(t+1))< F(x(t))

o Daher aI/bI ≥ 0 und aD/bD ≥ 0

Also, aI,bI,aD,bD ≥ 0

o Aus Effizienz:

aD ≤ 0 → bD ≤ 1, heißt also aD = 0 → bD ≤ 1,

aD > 0 → bD < 0 entfällt.

aI ≥ 0 → bI ≥ 1,

• es muß aI > 0, da sonst Fairness nicht zunimmt (siehe MIMD)

o Führt zu AIMD

Fairness (II)

Page 15: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

15Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Fairness (III)

Page 16: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

16Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

TCP-Datenrate

o AIMD-Probingstrategie verursacht Verlustrate

o = verlorene Segmente / verschickte Segmente

o Mittlere Datenrate B = Bytes/Sek und Fehlerrate interagieren:

Erhöhung der Datenrate erhöht die Verlustrate Höhere Verlustrate verringert die Datenrate

o Experimente zeigen für Segmentlänge MSS und Umlaufzeit RTT:

Page 17: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

17Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

TCP-DatenrateDer statische Fall

o Verfügbare Bandweite = n

o Durchschnittliche Datenrate:

B = 3/4 n

o Nach n/2 Runden Verlust: 1

o Ergibt:

o also

Page 18: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

18Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

TCP-DatenrateEin stochastische Modell

o Paket geht mit W‘keit p verloren

o Anzahl fehlerfreier übertragener Pakete X ist exponentiell verteilt:

o Erwartete fehlerfreie Paketmenge : O(1/p) Rundenanzahl bis Datenratenhalbierung: O(1/p½) Erwartete Datenrate: O(1/p½) Aber: Welcher konstanter Faktor?

o Experimentell: (für verwandtes Modell bewiesen):

Page 19: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

19Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

2. Kapitel

Der Web-Graph

Page 20: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

20Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Eigenschaften des WWW

o WWW: Speicher für Informationen Neues Medium Nicht geplant, unkoordiniert

• Im Gegensatz zu Stromnetz, Telefon, Straßen, Eisenbahn Trotzdem Gesetzmäßigkeiten Selbstorganisation Ändert sich dauernd

o Analyse der Webstruktur ermöglicht Bessere Suchmaschinen Automatisch erzeugte Webverzeichnisse Gezielte Suchdienste Filter

Page 21: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

21Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Der Webgraph

o GWWW:

Statische HTML-Seiten sind Knoten Links sind gerichtete Kanten

o Ausgrad eines Knoten: Anzahl Links auf einer Webseite

o Eingrad eines Knoten: Anzahl der Links zu einer Webseite

o Gerichteter Pfad von Knoten u zu Knoten v: Folge der Webseiten, um von u zu v durch Links zu kommen

o Ungerichteter Pfad (u=w0,w2,…,wm-1,v=wm) von Knoten u zu Knoten v: Für alle i:

Von wi zu wi+1 existiert Link oder umgekehrt

o Starke (schwache) Zusammenhangskomponente: Knotenmenge, in der (un-)gerichteter Pfad von jedem Knoten zu

jedem anderen existiert

Page 22: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

22Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Ein-/Ausgradverteilung

o Ein-/ und Ausgrade sind Paretoverteilt, d.h. Ein/Ausgrad i erscheint mit Häufigkeit ~ 1/iα

o Experimentell überprüft von Kumar et al 97: 40 Mio Webseiten Barabasi et al 99: Domain *.nd.edu + Webseiten im Abstand 3 Broder et al 00: 204 Mio Webseiten (Scan Mai+Okt. 1999)

Page 23: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

23Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Ein-/Ausgradverteilung von Gn,p (I)

o Zufallsgraph Gn,p:

n Knoten Jede gerichtete Kante erscheint mit unabhängiger W’keit p

o Kann der Webgraph durch Gn,p beschrieben werden?

o Erwarteter Ein/Ausgrad in Gn,p = (n-1)p

Da durchschnittl. Grad in GWWW konstant, wähle

Betrachte feste Webseite r• Sei X die Anzahl der Links auf r

• Sei Xi =1 wenn Link nach i existiert, sonst 0

• Dann ist P[Xi=1]=p und P[Xi=0]=1-p

Page 24: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

24Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Ein-/Ausgradverteilung von Gn,p (II)

o Untersuche W’keit, dass mindestens k Links erscheinen

1. Versuch: Markovs Ungleichung

Es gilt

Dann ist:

Kein Widerspruch zu Paretoverteilung

Page 25: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

25Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Ein-/Ausgradverteilung von Gn,p (III)

o Untersuche W’keit, dass mindestens k Links erscheinen

2. Versuch: Chebyshevs Ungleichung

Es gilt, da alle Xi unabhängig:

Dann ist:

Kein Widerspruch zu Paretoverteilung

Page 26: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

26Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Ein-/Ausgradverteilung von Gn,p (IV)

3. Versuch: Chernoff Schranke

Für unabhängig Zufallsvariablen Xi und mit

Dann ist für

Damit ist für die W‘keit ≤

Für alle n Knoten ist diese W‘keit damit ≤

Widerspricht Paretoverteilung

Page 27: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

27Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Pareto-Verteilung (I)

o Diskrete Paretoverteilung für x {1,2,3,…}

mit konstanten Faktor

Es gilt

o Heavy-Tail-Eigenschaft: Nicht alle Momente E[Xk] sind definiert Erwartungswert existiert, gdw, α>2 Varianz und E[X2] definiert, gdw. α>3 E[Xk] definiert, gdw. α>k+1

o Dichtefunktion der kontinuierlichen Paretoverteilung für x>x0

Page 28: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

28Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Pareto-Verteilung (I)

o Beispiele für Paretoverteilungen

Pareto 1897: Privatvermögen in Bevölkerung Yule 1944: Wortlängen in Sprachen Zipf 1949: Größe von Städten Länge gewisser Molekülketten Dateilängen in Unix-Filesystem ….

Zugriffshäufigkeit von Webseiten Besuchshäufigkeit einzelner Websurfer auf einer

bestimmten Seite …

Page 29: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

29Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Zusammenhangskomponenten

o Starke und schwache Zus.-komponenten sind Paretoverteilt

o Riesige schwache Zus.-Kompontente mit 91% aller Seiten

o Größte starke Zus.Komponente nur 28% Durchmesser ≥ 28 Wo ist der Rest?

Page 30: Vorlesung Sommersemester 2002

HEINZ NIXDORF INSTITUTUniversität Paderborn

Fachbereich Mathematik/Informatik

30Algorithm. Grundlagen des Internets27. Mai 2002

Christian Schindelhauer

Ein Bild des Webgraphen

Weberfassung durch Altavista Mai+Oktober 1999: