34
Hybride P2P-Netze Hybride P2P-Netze - Jan Ritzenhoff

Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Hybride P2P-Netze

Hybride P2P-Netze - Jan Ritzenhoff

Page 2: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Inhalt:1. Einleitung und Motivation

2. Konzept des Hybriden P2P

3. Kosten und Parameter

4. Performance

5. Zusammenfassung

Hybride P2P-Netze - Jan Ritzenhoff

Page 3: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Einleitung und Motivation

Einleitung und Motivation Hybride P2P-Netze - Jan Ritzenhoff

Page 4: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

P2P als Grundgedanke des Internets

• Die Ursprüngliche Konzipierung des Internets der späten 60er Jahre war ein Peer-To-Peer-System

• Sinn des ARPANETS war die gemeinsame Nutzung von Computern in einem USA weiten Netzwerk

• Jeder Host war gleichberechtigt

Einleitung und Motivation Hybride P2P-Netze - Jan Ritzenhoff

Page 5: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

P2P als Grundgedanke des Internets

• Die Ursprüngliche Konzipierung des Internets der späten 60er Jahre war ein Peer-To-Peer-System

• Sinn des ARPANETS war die gemeinsame Nutzung von Computern in einem USA weiten Netzwerk

• Jeder Host war gleichberechtigt

Einleitung und Motivation Hybride P2P-Netze - Jan Ritzenhoff

Page 6: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

P2P wandelt sich zu einem Client/Server System

• Mit zunehmender Verbreitung wuchs das Internet stark an und es gab immer mehr Nutzer, die jedoch nur Informationen konsumierten.

• Die Zahl der Netzteilnehmer, die Ressourcen bereitstellten wurde immer geringer

• Das Internet kippte um zu einem CS-System

Einleitung und Motivation Hybride P2P-Netze - Jan Ritzenhoff

Page 7: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

P2P wandelt sich zu einem Client/Server System

• Für die meisten neuen Netzteilnehmern war es unmöglich mit ihrer geringen Bandbreite (meist Modemanschluss) Daten dem Netz bereitzustellen.

• Somit beherrschte die C/S-Struktur immer mehr das Internet und P2P wurde zunächst in den Hintergrund gedrängt.

Einleitung und Motivation Hybride P2P-Netze - Jan Ritzenhoff

Page 8: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

P2P wird wieder interessant

• Mitte der 90er Jahre rückte der Wunsch der Clients, Daten untereinander auszutauschen wieder mehr in den Vordergrund, auch wenn der Inhalt nun nicht mehr zu wissenschaftlichen Zwecken diente.

Einleitung und Motivation Hybride P2P-Netze - Jan Ritzenhoff

Page 9: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

P2P wird wieder interessant

• Nachdem zunächst nur Instant Messaging (ICQ) betrieben wurde stieg mit zunehmender Leistungsfähigkeit der Clients der Wunsch Musik und Bilder untereinander, eben P2P zu tauschen.

Einleitung und Motivation Hybride P2P-Netze - Jan Ritzenhoff

Page 10: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

P2P wird wieder interessant

• Die meisten Knoten heutiger P2P-Systeme befinden sich meist am „Rande„ des Netzwerks und sind zudem von dem DNS-System ausgeschlossen, da sie keine fixen IP-Adressen haben.

• Diese Knoten besitzen wertvolle meist brachliegende Speicherressourcen.

Einleitung und Motivation Hybride P2P-Netze - Jan Ritzenhoff

Page 11: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

P2P Systeme kommen zurück

• P2P-Systeme machen sich diese Ressourcen zu Nutze, um das Bedürfnis der Nutzer nach Kommunikation und Datentausch zu befriedigen.

Einleitung und Motivation Hybride P2P-Netze - Jan Ritzenhoff

Page 12: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Formen eines P2P-Systems

• P2P-Applikationen müssen dezentralisierte Ressourcen finden und verwalten können

• Es gibt grundsätzlich zwei verschiedene Formen eines P2P-Netzwerks:

„reines“ P2Phybrides P2P

Einleitung und Motivation Hybride P2P-Netze - Jan Ritzenhoff

Page 13: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Konzept des Hybriden P2P

Konzept des Hybriden P2P Hybride P2P-Netze - Jan Ritzenhoff

Page 14: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Generelles Konzept eines hybriden P2P-Systems

• Hybride P2P-Netze haben einen oder meist mehrere zentrale Server, die das Netzwerk koordinieren. Das eigentliche Konzept besteht aus drei Schritten:

Login

1

2

3

4

1234

Anfrage Download

Konzept des Hybriden P2P Hybride P2P-Netze - Jan Ritzenhoff

Page 15: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Login Policys

• Es gibt zwei verschiedenene Login-Methoden auch Login Policys genannt

Batch Policy Incremental Policy

Bei jedem Login wird dem Server eine Liste des gesamten Datenbestandes übergeben.

Der Server nimmt diese Liste in seinen Index auf.

Loggt sich der User aus, wird seine gesamte Liste aus dem Index des Servers gelöscht.

Nur beim alleeersten Login wird dem Server eine Liste des gesamten Datenbestandes übergeben.

Der Server nimmt diese Liste in seinen Index auf.

Loggt der User sich aus, behält der Server die Liste seiner Daten

Bei jedem erneuten Login wird nur eine Liste der offline neu hinzugekommenen bzw. gelöschten Daten übergeben.

Der Server aktualisiert seinen Index.

Konzept des Hybriden P2P Hybride P2P-Netze - Jan Ritzenhoff

Page 16: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Server-Architekturen

• Chained Architecture

• Full Replication Architecture

• Hash Architecture

• Unchained Architecture

Konzept des Hybriden P2P Hybride P2P-Netze - Jan Ritzenhoff

Page 17: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Chained Architecture

• Prinzip: Kann der lokale Server die Anfrage nicht “befriedigen“, wird sie zum nächsten sog. Remoteserver weitergereicht bis genügend Einträge gefunden sind.

Konzept des Hybriden P2P Hybride P2P-Netze - Jan Ritzenhoff

Page 18: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Full Replication Architecture

• Prinzip: Jeder Server ist zu jedem Zeitpunkt im Besitz einer globalen Liste, mit den Daten aller User.

Konzept des Hybriden P2P Hybride P2P-Netze - Jan Ritzenhoff

Page 19: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Hash Architecture

• Prinzip: Hier werden jedem Server bestimmte Wörter zugewiesen. Jedes Suchwort wird also von einem anderen Server bearbeitet und die Ergebnisse am Ende zu einer Liste zusammengefasst dem User übergeben.

Konzept des Hybriden P2P Hybride P2P-Netze - Jan Ritzenhoff

Page 20: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Unchained Architecture

• Prinzip: Server sind nicht miteinander verbunden und unabhängig voneinander. Der User kann also nur auf die Daten jeweils eines Servers zugreifen.

Konzept des Hybriden P2P Hybride P2P-Netze - Jan Ritzenhoff

Page 21: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Kosten und Parameter

Kosten und Parameter Hybride P2P-Netze - Jan Ritzenhoff

Page 22: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Kosten

• Bei jedem Login/Anfrage, die von einem Client gestellt wird, entstehen Kosten.

• Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher Login-Policy gewählt wird, um die anfallenden Kosten so gering wie eben möglich zu halten.

• Es gibt 3 grundlegende Bereiche in denen Kosten anfallen:

CPU SpeicherNetzwerk

Kosten und Parameter Hybride P2P-Netze - Jan Ritzenhoff

Page 23: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Parameter

User:

Jede 100. Anfrage ist eine Anfrage mit bester „SelectionPower“100x

BeschreibungStandard-WertParameter Name

Durchschnittliche Anzahl der Dateien pro User168FilesPerUser

Durchschnittliche Anzahl der Dateien pro User, die offline geändert werden0.1FracChange

Jede 400. Anfrage ist eine Anfrage mit bester Popularität4r

Prozent der totalen Userpopulation di e zu jeder Zeit aktiv sind.0.05ActiveFrac

Verhältnis von Anfragen zu Downloads pro Sekunde pro User0.5QueryDownloadRatio

Verhältnis von Anfragen zu Logins pro Sekunde pro User0.45QueryLoginRatio

Durchschnittliche Anzahl Anfagen pro Sekunde pro User0.000833QueryPerUserSec

Durchschnittliche Anzahl der Buchstaben pro Wort5CharPerWord

Durchschnittliche Anzahl Keywords pro Anfrage2.4WordsPerQuery

Durchschnittliche Wörter pro Dateiname10WordsPerFile

Kosten und Parameter Hybride P2P-Netze - Jan Ritzenhoff

Page 24: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Parameter

System:

BeschreibungStandard-WertParameter Name

Bandbreite der LAN-Verbindung in Mb/s80 Mb/sLAN Bandbreite

Bandbreite der WAN-Verbindung in Mb/s8 Mb/sWAN Bandbreite

Netzwerktyp zwischen Server und ServerLANServer-server-Net.

Netzwerktyp zwischen User und ServerWANUser-Server-Network

Maximalanzahl der Ergebnisse einer Anfrage100MaxResults

Anzahl der Server im System5NumServers

Geschwindigkeit des Prozessors in MHz800 MHzCPU Speed

Kosten und Parameter Hybride P2P-Netze - Jan Ritzenhoff

Page 25: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Parameter

Abgeleitete Parameter:

BeschreibungParameter Name

Erwartete Anzahl der Server, die benötigt werden, um eine Anfrage zu befriedigenExServ

Erwartete Anzahl der Ergebnisse die von allen Servern zurückgegeben werdenExTotalResults

Anzahl der eingeloggten User pro ServerUsersPerServer

Erwartete Anzahl der Ergebnisse die von allen RemoteSevern zurückgegeben werdenExRemoteResults

Erwartete Anzahl der Ergebnisse die vom Lokalen Server zurückgegeben werdenExLocalResults

Kosten und Parameter Hybride P2P-Netze - Jan Ritzenhoff

Page 26: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Performance

Performance Hybride P2P-Netze - Jan Ritzenhoff

Page 27: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Verhältnis: Erfüllung Anfrage zu Anzahl Dateien

MaxResults = 100

x = 1000

Performance Hybride P2P-Netze - Jan Ritzenhoff

Page 28: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Verhältnis: beteiligte Server zu Anzahl Dateien/Server

MaxResults = 100

x = 1000

Performance Hybride P2P-Netze - Jan Ritzenhoff

Page 29: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Verhältnis: Unterstützte User zu QueryLoginRatio

Performance Hybride P2P-Netze - Jan Ritzenhoff

Page 30: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Limitierende Faktoren

Limitierender FaktorLoginPolicyServer Architektur

User-Server Verbindung über WANincrementalUnchained

User-Server Verbindung über WANbatchUnchained

CPU / später WANbatchFR

CPU / später WANincrementalFR

Server-Server Verbindung über LANbatchHash

Server-Server Verbindung über LANincrementalHash

User-Server Verbindung über WANbatchChained

User-Server Verbindung über WANincrementalChained

Performance Hybride P2P-Netze - Jan Ritzenhoff

Page 31: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Zusammenfassung

Zusammenfassung Hybride P2P-Netze - Jan Ritzenhoff

Page 32: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Zusammenfassung

• Es gibt zwei verschiedenene Login-Methoden: Batch und Incremental

• Es gibt vier verschiedene Server-Architekturen: Chained, FullReplication, Hash und Unchained Architecture

= 8 verschiedene Kombinationsmöglichkeiten

Doch welche ist nun die beste?

Zusammenfassung Hybride P2P-Netze - Jan Ritzenhoff

Page 33: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Batch vs. Incremental

• IncrementalLogin Strategien übertreffen ihr BatchLogin Gegenststück

• In einem Netzwerk, welches eine obere Schranke durch eine Netzauslastung erfährt ist die IncrementalLoginPolicy stets überlegen, da bei gleichen Anfragekosten die Netzwerkkosten fürs Login bedeutend geringer ist.

• Beide LoginPolicies sind äußerst sensitiv, was eine Veränderung des Parameters QueryLoginRatio anbelangt.

Zusammenfassung Hybride P2P-Netze - Jan Ritzenhoff

Page 34: Hybride P2P-Netze - uni-due.de · • Für jede Implementation eines Hybriden P2P-Systems muss individuell festgestellt werden, welche Serverarchitektur in Verbindung mit welcher

Server-Architekturen

• Heutzutage ist der klare Sieger die Chained-Architecture, solange nicht die Bandbreite der WAN Netze stark ansteigt oder aber die Interessen der User sich stark differenzieren werden. Die Performance sinkt jedoch, wenn viele Server an der Bearbeitung einer Anfrage beteiligt sind.

• Die Hash-Architecture benötigt sehr hohe Server-Server Bandbreiten. Diese Architektur ist nur eine gute Wahl, wenn:

• Die Bandbreite der LAN-Netze stark anstiege.

• Der Einsatz in Systemen erfolgt, in denen mit Ids bzw 1-Wort-Anfragen gearbeitet wird.

• Die Full-Replication-Architecture hat vor allem in Sytemen einen klaren Vorteil, in denen sich das Interesse der User stark differenziert, oder aber MaxResults relativ hoch gesetzt ist.

• Die Unchained-Architecture ist eher nicht zu empfehlen, da sie relativ wenige Ergebnisse pro Anfrage liefert. Sie ist nur zu empfehlen, wenn entweder die Menge der Ergebnisse nicht von Interesse ist, oder aber keine Serverkommunikation vorhanden ist.

Zusammenfassung Hybride P2P-Netze - Jan Ritzenhoff