Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern:...

Preview:

Citation preview

Messtudie zu Peer2Peer-Dateiverteilungssystemen

Unter Bertachtung von zwei bekannten Vertretern:Napster und Gnutella

Was ist ein Peer2Peer-Dateiverteilungssystem? Direktverbindung zwischen Peers

(sowohl Server- alsauch Client-Verhalten)

Dynamisch durch Hinzufügen und Entfernen von Peers aus einem Netzwerk

Zugehörige Indexlisten

Napster und Gnutellaim Vergleich

Napster: 160 zentrale

Server hohe Kontroll-

möglichkeit Zusammenhängen

des Netzwerk

Gnutella: Aufgaben auf

Peers verteilt beliebige

Netzbilding Netzwerk kann

geteilt sein

Was macht ein gutes Peer2Peer-DVSystem aus? Was heißt gut in Peer2Peer-

Systemen? Bewertung nicht leicht Zu wenige Informationen zum

Verhalten der Nutzer Folge: Sammlung von

übersichtverschaffenden Infos

Methode Sammlung von Schnappschüssen

repräsentative Menge in kurzer Zeit nur relevante Informationen über einen Zeitraum hinweg

Vergleich von Schnappschüssen Vergleich der Systeme anhand der

Ergebnisse

Inhalt der Schnappschüsse Zeit für Schnappschuß Anzahl der Peers (repräsentativ?) Bandbreiten Latenzzeiten Lebensdauer (Online-Zeit) Anzahl der angebotenen Dateien Größe der Dateien

Konsistenz:Die Napster-Peers Kein Zugriff auf den Index

Daher: Bildung von Suchanfragen Datensammlung alle 3-4 Min. Vergleich mit Napster-Angaben

40-60% aller Peers erfasst erfasste Peers hatten 80-95% der

lokalen Dateien

Konsistenz:Die Gnutella-Peers Keine Suchanfragen erforderlich Start bei bekannten Peers

z.B.: gnutellahosts.com oder router.limewire.com

Datensammlung alle 2 Min. 8.000-10.000 erfasste Peers

Entspricht 25-50% aller Peers

Durchführung der Datensammlung Einige Pentium III 700 MHz (dual)

2GB RAM, 40GB SCSI Festplatten 8 Tage Gnutella (1.239.487 Peers) 4 Tage für Napster (509.538 Peers)

Grund der kürzeren Laufzeit: Beschwerde-Mails

Beide beginnend am 06.05.2001

Methode zur Ermittlung der (wirklichen) Bandbreite (1) Im Gegensatz zur angegebenen

Gründe für zu hoch angegebene: Interesse wecken, System „verderben“

Gründe für zu niedrig angegebene: Kein Interesse am Beitrag zum System

Flaschenhals-Bandbreite eigene Anbindung (1 Gigabit) erlaubt

Messung der Min. Bandbreite der Peers

Methode zur Ermittlung der (wirklichen) Bandbreite (2) Zur Ermittlung wurde SProbe

Entwickelt Nach Inspitation von Sting TCP SYN - Paket Paare (Größe: 1,46Kb) Abschicken an einen inaktiven Port

eines aktiven Hosts Bandbreite folgt aus dem Abstand der

zurückkommenden TCP RST´s

Latenzzeitmessung Messung der Zeit ab Absenden bis

Empfang eines 40-Byte TCP-Pakets Wichtiger Faktor bei Peer2Peer

Datei-Tausch-Systemen Dateigröße bei Napster und Gnutella

im Schnitt bei 2-4MB

Ermittlung derLebensdauer der Peers Ebenfalls sehr wichtig bei Verteilung

von wichtigen Aufgaben (z.B.:Index) Verfügbarkeit von Dateien Feststellung des Peer-Zustandes

mithilfe von TCP-Paketen Offline: keine Antwort auf TCP SYN Inaktiv: antwortet mit TCP RST´s Aktiv: akzeptiert ankommende TCP´s

Die gesammelten Daten (1) Erfasste Bandbreite von:

Gnutella 223.552 Up, 16.252 Down Napster 2.049 Down

Erfasste Latenzzeiten von: Gnutella 595.974 Peers Napster 339.502 Peers

Die gesammelten Daten (2) Erfasste Lebensdauer von:

Gnutella 17.125 Peers über 60 Stunden alle 7 Minuten

Napster 7.000 Peers über 25 Stunden alle 2 Minuten

Auswertung der gemessenen Bandbreiten

Gnutella: UpL-Bandbreite < DownL-Bb Bandbreite der Gnutella-Nutzer größer Gnutella für „schnellere“ Nutzer?

Von den Nutzern angegebene Bandbreiten

Napster Bandbreiten inkl. „unbekannt“ ...und exkl. „unbekannt“ Breitbandverbindungen überwiegen

Auswertung der gemessenen Latenzzeiten

Gnutella: 20% haben L-Zeiten>280ms Entfernungen relativ zur University of

Washington erkennbar

Auswertung der gemessenen Lebensdauer

Lebensdauer (Ports<Hosts,Gnutella<Napster) Dauer einzelner Anmeldungen

(Durchschnittlich 60 Min.)

Auswertung der Anzahlder angebotenen Dateien

Gnutella: Hohe Anzahl an „Free-Riders“ Variation der Dateianz. (Gnutella>Napster) Viele „Free-Rider“ auch bei Napster

Wer beteiligt sich Konstruktiv?

Breitbandnutzer tragen zu über 60% der Uploads und 50% des Inhalts bei

Sehr hohen Beitrag an den Downloads haben allerdingsModemnutzer und Nutzer die ihre Verbindungnicht angeben.(zus. Über 55%)

Wieviele, wiegroße Dateien werden angeboten?

Napster: wenig Streuung (Dateigröße) Gnutella: stärkere Streuung Durchschnittliche Dateigröße: 3,7MB

Wie verläßlich sind freiwillige Angaben?

Messungen und freiwillige Angaben im Vergleich (viele Falschangaben)

Wer sind die „Unbekannten“?

Napster und Gnutella haben viele gleiche Probleme Verschiedene Peer-Eignung (Server-

Client) Verteilung verschiedener Aufgaben

auf die Peers (z.B.: Index) Bewußte Falschangaben von

Nutzern Unkooperatives Verhalten

kein Beitrag zum System

Vorschläge für Peer2Peer-Dateiverteilungssysteme Aufgabenverteilung stark

einschränken langlebige Verbindungen mit hoher

Bandbreite und kurzen Latenzzeiten Genauere Daten zu den Peers

Messung durch interne Programmteile Motivieren zur korrekten Angaben

Ausschluß von „Free-Riders“

Blick auf was aktuelles:eDonkey2000 Verteilte Index-Server

mit Serverliste aller ihnen bekannten Motivation durch Möglichkeit der

Werbung Nutzer kann die Bandbreite die er zu

Verfügung stellt selber angeben kleiner upload -> kleiner Download

Teilfertiges wird sofort angeboten

Quellen und weitere Informationen A Measurement Study of Peer-to-Peer File Sharing Systems

http://citeseer.nj.nec.com/450740.html Sting: a TCP-based Network Measurement Tool

http://www.cs.washington.edu/homes/savage/papers/Usits99.pdf SProbe: Another Tool for Measuring Bottleneck Bandwidth

http://citeseer.nj.nec.com/462473.html Informationen zu eDonkey2000

http://www.eDonkey2000.com

Recommended