27
Messtudie zu Peer2Peer- Dateiverteilungssystem en Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Embed Size (px)

Citation preview

Page 1: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Messtudie zu Peer2Peer-Dateiverteilungssystemen

Unter Bertachtung von zwei bekannten Vertretern:Napster und Gnutella

Page 2: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Was ist ein Peer2Peer-Dateiverteilungssystem? Direktverbindung zwischen Peers

(sowohl Server- alsauch Client-Verhalten)

Dynamisch durch Hinzufügen und Entfernen von Peers aus einem Netzwerk

Zugehörige Indexlisten

Page 3: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Napster und Gnutellaim Vergleich

Napster: 160 zentrale

Server hohe Kontroll-

möglichkeit Zusammenhängen

des Netzwerk

Gnutella: Aufgaben auf

Peers verteilt beliebige

Netzbilding Netzwerk kann

geteilt sein

Page 4: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Was macht ein gutes Peer2Peer-DVSystem aus? Was heißt gut in Peer2Peer-

Systemen? Bewertung nicht leicht Zu wenige Informationen zum

Verhalten der Nutzer Folge: Sammlung von

übersichtverschaffenden Infos

Page 5: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Methode Sammlung von Schnappschüssen

repräsentative Menge in kurzer Zeit nur relevante Informationen über einen Zeitraum hinweg

Vergleich von Schnappschüssen Vergleich der Systeme anhand der

Ergebnisse

Page 6: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Inhalt der Schnappschüsse Zeit für Schnappschuß Anzahl der Peers (repräsentativ?) Bandbreiten Latenzzeiten Lebensdauer (Online-Zeit) Anzahl der angebotenen Dateien Größe der Dateien

Page 7: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Konsistenz:Die Napster-Peers Kein Zugriff auf den Index

Daher: Bildung von Suchanfragen Datensammlung alle 3-4 Min. Vergleich mit Napster-Angaben

40-60% aller Peers erfasst erfasste Peers hatten 80-95% der

lokalen Dateien

Page 8: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Konsistenz:Die Gnutella-Peers Keine Suchanfragen erforderlich Start bei bekannten Peers

z.B.: gnutellahosts.com oder router.limewire.com

Datensammlung alle 2 Min. 8.000-10.000 erfasste Peers

Entspricht 25-50% aller Peers

Page 9: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Durchführung der Datensammlung Einige Pentium III 700 MHz (dual)

2GB RAM, 40GB SCSI Festplatten 8 Tage Gnutella (1.239.487 Peers) 4 Tage für Napster (509.538 Peers)

Grund der kürzeren Laufzeit: Beschwerde-Mails

Beide beginnend am 06.05.2001

Page 10: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Methode zur Ermittlung der (wirklichen) Bandbreite (1) Im Gegensatz zur angegebenen

Gründe für zu hoch angegebene: Interesse wecken, System „verderben“

Gründe für zu niedrig angegebene: Kein Interesse am Beitrag zum System

Flaschenhals-Bandbreite eigene Anbindung (1 Gigabit) erlaubt

Messung der Min. Bandbreite der Peers

Page 11: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Methode zur Ermittlung der (wirklichen) Bandbreite (2) Zur Ermittlung wurde SProbe

Entwickelt Nach Inspitation von Sting TCP SYN - Paket Paare (Größe: 1,46Kb) Abschicken an einen inaktiven Port

eines aktiven Hosts Bandbreite folgt aus dem Abstand der

zurückkommenden TCP RST´s

Page 12: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Latenzzeitmessung Messung der Zeit ab Absenden bis

Empfang eines 40-Byte TCP-Pakets Wichtiger Faktor bei Peer2Peer

Datei-Tausch-Systemen Dateigröße bei Napster und Gnutella

im Schnitt bei 2-4MB

Page 13: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Ermittlung derLebensdauer der Peers Ebenfalls sehr wichtig bei Verteilung

von wichtigen Aufgaben (z.B.:Index) Verfügbarkeit von Dateien Feststellung des Peer-Zustandes

mithilfe von TCP-Paketen Offline: keine Antwort auf TCP SYN Inaktiv: antwortet mit TCP RST´s Aktiv: akzeptiert ankommende TCP´s

Page 14: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Die gesammelten Daten (1) Erfasste Bandbreite von:

Gnutella 223.552 Up, 16.252 Down Napster 2.049 Down

Erfasste Latenzzeiten von: Gnutella 595.974 Peers Napster 339.502 Peers

Page 15: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Die gesammelten Daten (2) Erfasste Lebensdauer von:

Gnutella 17.125 Peers über 60 Stunden alle 7 Minuten

Napster 7.000 Peers über 25 Stunden alle 2 Minuten

Page 16: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Auswertung der gemessenen Bandbreiten

Gnutella: UpL-Bandbreite < DownL-Bb Bandbreite der Gnutella-Nutzer größer Gnutella für „schnellere“ Nutzer?

Page 17: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Von den Nutzern angegebene Bandbreiten

Napster Bandbreiten inkl. „unbekannt“ ...und exkl. „unbekannt“ Breitbandverbindungen überwiegen

Page 18: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Auswertung der gemessenen Latenzzeiten

Gnutella: 20% haben L-Zeiten>280ms Entfernungen relativ zur University of

Washington erkennbar

Page 19: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Auswertung der gemessenen Lebensdauer

Lebensdauer (Ports<Hosts,Gnutella<Napster) Dauer einzelner Anmeldungen

(Durchschnittlich 60 Min.)

Page 20: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Auswertung der Anzahlder angebotenen Dateien

Gnutella: Hohe Anzahl an „Free-Riders“ Variation der Dateianz. (Gnutella>Napster) Viele „Free-Rider“ auch bei Napster

Page 21: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Wer beteiligt sich Konstruktiv?

Breitbandnutzer tragen zu über 60% der Uploads und 50% des Inhalts bei

Sehr hohen Beitrag an den Downloads haben allerdingsModemnutzer und Nutzer die ihre Verbindungnicht angeben.(zus. Über 55%)

Page 22: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Wieviele, wiegroße Dateien werden angeboten?

Napster: wenig Streuung (Dateigröße) Gnutella: stärkere Streuung Durchschnittliche Dateigröße: 3,7MB

Page 23: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Wie verläßlich sind freiwillige Angaben?

Messungen und freiwillige Angaben im Vergleich (viele Falschangaben)

Wer sind die „Unbekannten“?

Page 24: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Napster und Gnutella haben viele gleiche Probleme Verschiedene Peer-Eignung (Server-

Client) Verteilung verschiedener Aufgaben

auf die Peers (z.B.: Index) Bewußte Falschangaben von

Nutzern Unkooperatives Verhalten

kein Beitrag zum System

Page 25: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Vorschläge für Peer2Peer-Dateiverteilungssysteme Aufgabenverteilung stark

einschränken langlebige Verbindungen mit hoher

Bandbreite und kurzen Latenzzeiten Genauere Daten zu den Peers

Messung durch interne Programmteile Motivieren zur korrekten Angaben

Ausschluß von „Free-Riders“

Page 26: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Blick auf was aktuelles:eDonkey2000 Verteilte Index-Server

mit Serverliste aller ihnen bekannten Motivation durch Möglichkeit der

Werbung Nutzer kann die Bandbreite die er zu

Verfügung stellt selber angeben kleiner upload -> kleiner Download

Teilfertiges wird sofort angeboten

Page 27: Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella

Quellen und weitere Informationen A Measurement Study of Peer-to-Peer File Sharing Systems

http://citeseer.nj.nec.com/450740.html Sting: a TCP-based Network Measurement Tool

http://www.cs.washington.edu/homes/savage/papers/Usits99.pdf SProbe: Another Tool for Measuring Bottleneck Bandwidth

http://citeseer.nj.nec.com/462473.html Informationen zu eDonkey2000

http://www.eDonkey2000.com