Upload
fritzi-winkler
View
108
Download
1
Embed Size (px)
Citation preview
Messtudie zu Peer2Peer-Dateiverteilungssystemen
Unter Bertachtung von zwei bekannten Vertretern:Napster und Gnutella
Was ist ein Peer2Peer-Dateiverteilungssystem? Direktverbindung zwischen Peers
(sowohl Server- alsauch Client-Verhalten)
Dynamisch durch Hinzufügen und Entfernen von Peers aus einem Netzwerk
Zugehörige Indexlisten
Napster und Gnutellaim Vergleich
Napster: 160 zentrale
Server hohe Kontroll-
möglichkeit Zusammenhängen
des Netzwerk
Gnutella: Aufgaben auf
Peers verteilt beliebige
Netzbilding Netzwerk kann
geteilt sein
Was macht ein gutes Peer2Peer-DVSystem aus? Was heißt gut in Peer2Peer-
Systemen? Bewertung nicht leicht Zu wenige Informationen zum
Verhalten der Nutzer Folge: Sammlung von
übersichtverschaffenden Infos
Methode Sammlung von Schnappschüssen
repräsentative Menge in kurzer Zeit nur relevante Informationen über einen Zeitraum hinweg
Vergleich von Schnappschüssen Vergleich der Systeme anhand der
Ergebnisse
Inhalt der Schnappschüsse Zeit für Schnappschuß Anzahl der Peers (repräsentativ?) Bandbreiten Latenzzeiten Lebensdauer (Online-Zeit) Anzahl der angebotenen Dateien Größe der Dateien
Konsistenz:Die Napster-Peers Kein Zugriff auf den Index
Daher: Bildung von Suchanfragen Datensammlung alle 3-4 Min. Vergleich mit Napster-Angaben
40-60% aller Peers erfasst erfasste Peers hatten 80-95% der
lokalen Dateien
Konsistenz:Die Gnutella-Peers Keine Suchanfragen erforderlich Start bei bekannten Peers
z.B.: gnutellahosts.com oder router.limewire.com
Datensammlung alle 2 Min. 8.000-10.000 erfasste Peers
Entspricht 25-50% aller Peers
Durchführung der Datensammlung Einige Pentium III 700 MHz (dual)
2GB RAM, 40GB SCSI Festplatten 8 Tage Gnutella (1.239.487 Peers) 4 Tage für Napster (509.538 Peers)
Grund der kürzeren Laufzeit: Beschwerde-Mails
Beide beginnend am 06.05.2001
Methode zur Ermittlung der (wirklichen) Bandbreite (1) Im Gegensatz zur angegebenen
Gründe für zu hoch angegebene: Interesse wecken, System „verderben“
Gründe für zu niedrig angegebene: Kein Interesse am Beitrag zum System
Flaschenhals-Bandbreite eigene Anbindung (1 Gigabit) erlaubt
Messung der Min. Bandbreite der Peers
Methode zur Ermittlung der (wirklichen) Bandbreite (2) Zur Ermittlung wurde SProbe
Entwickelt Nach Inspitation von Sting TCP SYN - Paket Paare (Größe: 1,46Kb) Abschicken an einen inaktiven Port
eines aktiven Hosts Bandbreite folgt aus dem Abstand der
zurückkommenden TCP RST´s
Latenzzeitmessung Messung der Zeit ab Absenden bis
Empfang eines 40-Byte TCP-Pakets Wichtiger Faktor bei Peer2Peer
Datei-Tausch-Systemen Dateigröße bei Napster und Gnutella
im Schnitt bei 2-4MB
Ermittlung derLebensdauer der Peers Ebenfalls sehr wichtig bei Verteilung
von wichtigen Aufgaben (z.B.:Index) Verfügbarkeit von Dateien Feststellung des Peer-Zustandes
mithilfe von TCP-Paketen Offline: keine Antwort auf TCP SYN Inaktiv: antwortet mit TCP RST´s Aktiv: akzeptiert ankommende TCP´s
Die gesammelten Daten (1) Erfasste Bandbreite von:
Gnutella 223.552 Up, 16.252 Down Napster 2.049 Down
Erfasste Latenzzeiten von: Gnutella 595.974 Peers Napster 339.502 Peers
Die gesammelten Daten (2) Erfasste Lebensdauer von:
Gnutella 17.125 Peers über 60 Stunden alle 7 Minuten
Napster 7.000 Peers über 25 Stunden alle 2 Minuten
Auswertung der gemessenen Bandbreiten
Gnutella: UpL-Bandbreite < DownL-Bb Bandbreite der Gnutella-Nutzer größer Gnutella für „schnellere“ Nutzer?
Von den Nutzern angegebene Bandbreiten
Napster Bandbreiten inkl. „unbekannt“ ...und exkl. „unbekannt“ Breitbandverbindungen überwiegen
Auswertung der gemessenen Latenzzeiten
Gnutella: 20% haben L-Zeiten>280ms Entfernungen relativ zur University of
Washington erkennbar
Auswertung der gemessenen Lebensdauer
Lebensdauer (Ports<Hosts,Gnutella<Napster) Dauer einzelner Anmeldungen
(Durchschnittlich 60 Min.)
Auswertung der Anzahlder angebotenen Dateien
Gnutella: Hohe Anzahl an „Free-Riders“ Variation der Dateianz. (Gnutella>Napster) Viele „Free-Rider“ auch bei Napster
Wer beteiligt sich Konstruktiv?
Breitbandnutzer tragen zu über 60% der Uploads und 50% des Inhalts bei
Sehr hohen Beitrag an den Downloads haben allerdingsModemnutzer und Nutzer die ihre Verbindungnicht angeben.(zus. Über 55%)
Wieviele, wiegroße Dateien werden angeboten?
Napster: wenig Streuung (Dateigröße) Gnutella: stärkere Streuung Durchschnittliche Dateigröße: 3,7MB
Wie verläßlich sind freiwillige Angaben?
Messungen und freiwillige Angaben im Vergleich (viele Falschangaben)
Wer sind die „Unbekannten“?
Napster und Gnutella haben viele gleiche Probleme Verschiedene Peer-Eignung (Server-
Client) Verteilung verschiedener Aufgaben
auf die Peers (z.B.: Index) Bewußte Falschangaben von
Nutzern Unkooperatives Verhalten
kein Beitrag zum System
Vorschläge für Peer2Peer-Dateiverteilungssysteme Aufgabenverteilung stark
einschränken langlebige Verbindungen mit hoher
Bandbreite und kurzen Latenzzeiten Genauere Daten zu den Peers
Messung durch interne Programmteile Motivieren zur korrekten Angaben
Ausschluß von „Free-Riders“
Blick auf was aktuelles:eDonkey2000 Verteilte Index-Server
mit Serverliste aller ihnen bekannten Motivation durch Möglichkeit der
Werbung Nutzer kann die Bandbreite die er zu
Verfügung stellt selber angeben kleiner upload -> kleiner Download
Teilfertiges wird sofort angeboten
Quellen und weitere Informationen A Measurement Study of Peer-to-Peer File Sharing Systems
http://citeseer.nj.nec.com/450740.html Sting: a TCP-based Network Measurement Tool
http://www.cs.washington.edu/homes/savage/papers/Usits99.pdf SProbe: Another Tool for Measuring Bottleneck Bandwidth
http://citeseer.nj.nec.com/462473.html Informationen zu eDonkey2000
http://www.eDonkey2000.com