20
Peer-to-Peer-Netzwerke Peer Peer - - to to - - Peer Peer - - Netzwerke Netzwerke Rolf Wanka Rolf Wanka Sommersemester 2007 Sommersemester 2007 9. Vorlesung 9. Vorlesung 26.06.2007 26.06.2007 [email protected] [email protected] basiert auf einer Vorlesung von basiert auf einer Vorlesung von Christian Schindelhauer Christian Schindelhauer an der Uni Freiburg an der Uni Freiburg

Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

PeerPeer--toto--PeerPeer--NetzwerkeNetzwerkeRolf WankaRolf Wanka

Sommersemester 2007Sommersemester 20079. Vorlesung9. Vorlesung26.06.200726.06.2007

[email protected]@cs.fau.de

basiert auf einer Vorlesung vonbasiert auf einer Vorlesung vonChristian SchindelhauerChristian Schindelhauer

an der Uni Freiburgan der Uni Freiburg

Page 2: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

2

InhalteInhalte• Kurze Geschichte der Peer-to-Peer-

Netzwerke• Das Internet: Unter dem Overlay• Die ersten Peer-to-Peer-Netzwerke

– Napster– Gnutella

• CAN• Chord• Pastry und Tapestry• Gradoptimierte Netzwerke

– Viceroy– Distance-Halving– Koorde

• Netzwerke mit geordneterSpeicherung

– P-Grid– Skip-Net und Skip-Graphs

• Selbstorganisation– Pareto-Netzwerke– Zufallsnetzwerke– Topologie-Management

• Sicherheit in Peer-to-Peer-Netzwerken

• Anonymität• Datenzugriff: Der schnellere

Download • Peer-to-Peer-Netzwerke in der

Praxis– eDonkey– FastTrack– Bittorrent

• Peer-to-Peer-Verkehr• Juristische Situation

Page 3: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

3

SelbstorganisationSelbstorganisation in in PeerPeer--toto--PeerPeer--NetzwerkenNetzwerken

I. Die Graphstruktur von GnutellaA. GradB. Durchmesser

II. Selbstorganisation von ZufallsgraphenA. Typen und Eigenschaften von ZufallsgraphenB. Reguläre ungerichtete zusammenhängende ZufallsgraphenC. Reguläre gerichtete zusammenhängende Zufallsgraphen

III. Gesteuerte SelbstorganisationA. Topologie-Management (T-MAN)B. Selbstorganisierendes Chord

Page 4: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

4

II. GnutellaII. GnutellaA. GradA. Grad

• Scalability Issues in Large Peer-to-Peer Networks - A Case Study of Gnutella,�M.A. Jovanovic, F.S. Annexstein, K.A. Berman - University of Cincinnati, 2001

Page 5: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

5

GnutellaGnutella -- Originalversion Originalversion -- AnbindungAnbindung

• Nachbarschaftslisten– Gnutella verbindet direkt mit anderen

Clients– Beim Download wird eine Liste von

Clients mitgeliefert– Diese werden ausprobiert, bis ein

Aktiver sich meldet– Ein aktiver Client gibt dann seine

Nachbarschaftsliste weiter– Nachbarschaftslisten werden immer

weiter verlängert und gespeichert– Die Anzahl aktiver Nachbarn ist

beschränkt (typisch auf fünf)• Die Nachbarschaftslisten sind

abhängig von der jeweils verwendeten Client-Software

Page 6: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

6

VerteilungVerteilung des Grads in Gnutellades Grads in Gnutella

• Modeling Large-scale Peer-to-Peer Networks and a CaseStudy of Gnutella, Mihajlo A. Jovanovic, Master Thesis, 2001

• Die Anzahl der Nachbarn unterliegt einer Pareto-Verteilung(Power Law)

Page 7: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

7

ParetoPareto VerteilungVerteilung

• Diskrete Pareto-Verteilung für x ∈ {1,2,3,…}

mit konstantem Faktor

(auch bekannt als Riemannsche Zeta-Funktion)

• Heavy tail– nicht alle Momente E[Xk] sind definiert– der Erwartungswert existiert nur, wenn α>2– Varianz und E[X2] existieren genau dann, wenn α>3– E[Xk] definiert genau dann, wenn α>k+1

• Dichtefunktion der kontinuierlichen Funktion für x>x0

.

Page 8: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

8

Eingangsgrad und Ausgangsgrad von WebseitenEingangsgrad und Ausgangsgrad von Webseiten

• unterliegen auch einer Pareto-Verteilung

• Experimente von– Kumar et al. 97: 40 Mio. Webpages– Barabasi et al. 99: Domain *.nd.edu (Univ. of Notre Dame) + Web-

Seiten im Abstand 3– Broder et al. 00: 204 Mio. Webseiten (Scan Mai und Okt. 1999)

Page 9: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

9

Zusammenhang von ParetoZusammenhang von Pareto--GraphenGraphen

• William Aiello, Fan Chung, Linyuan Lu, A Random Graph Model for Massive Graphs, STOC 2000

• Ungerichteter Graph mit n Knoten– Die Wahrscheinlichkeit, daß ein Knoten k Nachbarn hat, sei pk

– wobei pk = c k-τ für einen normalisierenden Faktor c.• Theorem

– Für genügend großes n gilt für solche Pareto-Graphen mit Exponenten τ•Für τ < 1 ist der Graph mit Wahrscheinlichkeit 1-o(1) zusammenhängend•Für τ > 1 sind die Graphen mit W’keit 1-o(1) nicht zusammenhängend•Für 1< τ <2 gibt es eine Zusammenhangskomponente der Größe Θ(n)•Für 2< τ <3.4785 gibt es eine Zusammenhangskomponente der Größe Θ(n) und sonst nur kleinere der Größe O(log n)

•Für τ >3.4785: Es gibt mit Wahrscheinlichkeit 1-o(1) keine große Zusammenhangskomponente der Größe Θ(n)

•Für τ >4: Alle Zusammenhangskomponenten gehorchen einer Pareto-Verteilung

Page 10: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

10

ParetoPareto--VerteilungVerteilung (I)(I)

• Beispiele für Pareto-Verteilungen (Power Laws)– Pareto 1897: Verteilung des Wohlstands in der Bevölkerung– Yule 1944: Worthäufigkeit in Sprachen– Zipf 1949: Größe von Städten– Länge von Molekülketten– Dateilänge von UNIX-Systemdateien– ….

Page 11: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

11

Die ZipfDie Zipf--Verteilung als VarianteVerteilung als Variante• George Kinsley Zipf behauptete,

– daß die Häufigkeit des n-häufigsten Wortes mit relativer Häufigkeit f(n)– der Gleichung n f(n) = c genügt.

• Zipf-Wahrscheinlichkeitsverteilung for x ∈ {1,2,3,…}

mit konstanten Faktor c. Nur definiert für konstante Mengen, da

unbeschränkt ist.

• Zipf-Verteilungen beziehen sich auf den Rang– Der Zipf-Exponent α kann auch größer sein als 1, d.h. f(n) = c/nα

• Pareto-Verteilungen beziehen sich auf die absolute Größe– z.B. Einwohnerzahl

Page 12: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

12

II. GnutellaII. GnutellaB. B. DurchmesserDurchmesser

• Beobachtung: Gnutella• Small-World-Networks• Milgrams Experiment• Preferential Attachment

Page 13: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

13

SmallSmall--WorldWorld--PhänomenPhänomen

• Milgrams Experiment 1967– 60 zufällig ausgewählte Teilnehmer in Wichita, Kansas sollten ein

Paket an eine ihnen unbekannte Adresse versenden– Sie durften aber nur an Bekannte das Paket weiterversenden– Ebenso die Bekannten

• Der Großteil der Pakete kam an und das innerhalb von 6 Schritten

• Small-World-Netzwerke– sind Netzwerke deren Knotengrade Pareto-verteilt ist– mit kleinen Durchmesser– und relativ vielen Cliquen

• Small-World-Netzwerke– Internet, World-Wide-Web, Nervensysteme, soziale Netzwerke, etc.

Page 14: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

14

WieWie entstehenentstehen SmallSmall--WorldWorld--NetzwerkeNetzwerke??

• Emergence of scaling in random networks, Albert-Laszlo Barabasi, Reka Albert, 1999

• Preferential Attachment-Modell (Barabasi-Albert):– Ausgehend von einem (kleinen Startgraphen) werden sukzessive Knoten

eingefügt mit jeweils m Kanten– Die Wahrscheinlichkeit, mit einem Knoten verbunden zu werden, ist

proportional zum aktuellen Grad des Knotens• Ergibt ein Pareto-Netzwerk mit Exponenten 2,9 ± 0,1

– Cliquen treten häufiger auf• Watts-Strogatz (1998)

– Starte mit Ring-Netzwerk mit Verbindungen mit den m nächsten Nachbarn– Mit Wahrscheinlichkeit p wird jede Kante durch eine zufällige Kante ersetzt– Ermöglich einen stufenlosen Übergang von Ordnung zu Chaos

• Aufgegriffen von Kleinberg (1999) zur Verifizierung von MilgramsExperiment

Page 15: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

15

Gnutella Gnutella imim VergleichVergleich

• Modeling Large-scale Peer-to-Peer Networks and a Case Study of Gnutella, Mihajlo A. Jovanovic, Master Thesis, 2001

Page 16: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

16

Gnutella Gnutella im Vergleichim Vergleich

• Modeling Large-scale Peer-to-Peer Networks and a Case Study of Gnutella, Mihajlo A. Jovanovic, Master Thesis, 2001

• Vergleich der charakteristischen Pfadlänge– Durchschnitt der Abstände zwischen zwei Knoten

Page 17: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

17

III. III. ZufallsgraphenZufallsgraphenA. A. TypTyp und und EigenschaftenEigenschaften

• Standardmodell G(n,p)• Zufälliger regulärer ungerichteter Graph• Zufälliger regulärer gerichteter Graph

Page 18: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

18

Ist ein Ist ein ParetoPareto--GraphGraph ein Zufallsgraph?ein Zufallsgraph?

• Zufallsgraph G(n,p)– n Knoten– Jede gerichtete Kante erscheint mit Wahrscheinlichkeit p

• Sei X die Anzahl der Kanten, die von Knoten v ausgehen– Xu =1, falls Kante (v,u) vorkommt, und sonst 0

• Dann ist P[Xu=1]=p und P[Xu=0]=1-p

• Für den durchschnittlichen Grad c gilt dann:

Page 19: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

19

• Chernov-Schranke– Für unabhängige Bernoulli-Variablen Xi und mit

– Daraus folgt für

– Die Häufigkeit nimmt exponentiell ab– Daher entspricht der Grad eines Zufallsgraphens keiner Paretoverteilung

Gradverteilung des ZufallsgraphenGradverteilung des Zufallsgraphen

Page 20: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten

Peer-to-Peer-Netzwerke

Ende der Ende der 9.9. VorlesungVorlesung

PeerPeer--toto--PeerPeer--NetzwerkeNetzwerke