19
Protokoll-Erkennung Technische Universität Berlin Fakultät IV – Elektrotechnik und Informatik Intelligente Netze und Management verteilter Systeme (INET) Research Group Prof. Anja Feldmann, Ph.D. An-Institut Deutsche Telekom Laboratories Andreas Floß Seminar: Internet Measurement Berlin, den 30. Juli 2007

Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

Protokoll-Erkennung

Technische Universität BerlinFakultät IV – Elektrotechnik und Informatik

Intelligente Netze und Management verteilter Systeme (INET)Research Group Prof. Anja Feldmann, Ph.D.An-Institut Deutsche Telekom Laboratories

Andreas Floß

Seminar: Internet Measurement

Berlin, den 30. Juli 2007

Page 2: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 2

Einleitung

• Thema: Analyse von Netzwerkverkehr in einem IP-Netzwerk

• Suche nach Art der Applikation (Browser, Email, Chat, Filesharing) mittels Header-Informationen der Netzwerk-Pakete

• Rückschlüsse auf Protokolle durch Verbindungsdaten (Ziel- und Quell-Ports)

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 3: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 3

Einleitung/Motivation

• Aber: Skype, Bittorrent und andere P2P-Anwendungen:

– zufällig ausgewählte Ports

– Nutzen bekannter Ports anderer Protokolle (Port Tunneling)

• Analyse der Nutzdaten (Payload) der Applikation nach Mustern

• Nutzen statistischer und struktureller Methoden

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 4: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 4

Überblick

o IP, TCP & UDP, Session & Flowo Modell & Konstruktion des Protokoll & Classifier

o Methode 1: Product Distributiono Methode 2: Markov Process Modello Methode 3: Common Substring Graph

o Ergebnisseo Zusammenfassung

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 5: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 5

IP, TCP & UDP

• Transmission Control Protocol:– verlässlicher und

sparsamer Trans-port der Segmente

• User Data Protocol:– min. Protokoll, nur

IP-Addressen und Ports

• Internet Protocol:– organisiert den Weg

der Netzwerkpakete

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 6: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 6

• Session Data: Byte-Strom zwischen Initiator und Responder

Session & Flow

Initiato

r

Resp

onder

TCP-Session

TCP TCP TCPTCP TCP

TCP TCP TCPTCP

Flow

• Flow Data: Byte-Strom in nur eine Richtung

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 7: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 7

Protokoll

• Flow Content:reine Datenohne Header

• Protokoll Modell: 2 Verteilungen über die ersten 64 Bytes beider Flows einer Session

• 64 Byte reichen aus

• Menge gleicher Sessions werden a priori zusammengefasst und ergeben den Classifier

IP-Header

TCP-Header

TCP-Data

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 8: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 8

M1: Product Distribution Modell

• Idee: Sessions gleicher Protokolle haben ähnliche Byte-Vorkommen an fixen stellen in den Flows

• Annahme: n Bytes der Flows sind unabhängig voneinander (independent assumption)

• Verteilungen aller bekannten n Bytes ergeben einen Classifier

• bei unbekannten Sessions wird die Wahrscheinlichkeit der ersten n Bytes eines Flows überprüft

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 9: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 9

M1: Product Distribution Beispiel

• SSH (RFC 4253) diktiert: “… both sides MUST send an identification string. This identification string MUST be SSH-protoversion-softwareversion SP comments CR LF.”

Beispiel SSH: Initiator - Flow

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 10: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 10

M2: Markov Process Modell

• Idee: Sessions gleicher Protokolle bilden zu hoher Wahrscheinlichkeit ähnliche Folgen von Bytes

• Annahme: n Bytes der Flows sind unabhängig voneinander

• Bilden des Classifiers für ein Protokoll mittels Markov-Ketten

• Bei unbekannten Sessions wird die Wahrsch.-keit der ersten 64 Bytes bezüglich des Classifiers überprüft

Markov-Ketten: Betrachten der Änderungswahr-scheinlichkeiten zwischen Byte-Paaren

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 11: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 11

M3: Common Substring Graphs

• Idee: Sessions gleicher Protokolle besitzen genügend viele gemeinsame Teil-Strings

• Bilden des Classifier-Graphen mit strukt. Informationen Häufigkeit und Wiederkehr gemeinsamer „längster gemeinsamer“ Teil-Strings

• Bei unbek. Sessions werden die ersten n-Bytes eines Flows analysiert und mit dem Graphen verglichen

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 12: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 12

Ergebnisse: Fehlklassifizierung

• Fehlklassifizierung– Netzwerk-Datensätze (Uni, Drahtlos, Büro)– Niedrigste Fehlerrate: Product Distribution

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 13: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 13

Ergebnisse: Erkennung

(1) = Cambridge (226,046 flows), (2) = Wireless (403,752 flows), (3) = Departmental (1,064,844 flows)

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 14: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 14

Zusammenfassung

• Identifikation von Protokollen ohne Header-Daten ist möglich: – Gesamt-Sieger: Product Distribution Model – statistischer

Vergleich der Bytes in den Nutzdaten, – Markov Process Model - Auswertung der Byte-Übergänge – Common Substring Graphs: Teil-Strings in den Nutzdaten

• alle 3 Verfahren haben bez. einzelner Protokolle Fehler und schlechte Erkennungsraten

• Ursachen: – Charakteristiken der Protokolle (Binär-Daten oder Text) – Modellierung von Protokollen nicht optimal

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 15: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 15

Ausblick

• Weitere Verbesserung des Protokoll-Modells

– kompaktere Repräsentation der Protokolle

– bessere Unterscheidbarkeit

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 16: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 16

Fragen

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 17: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 17

Das war´s -Vielen Dank!

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 18: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 18

Backup

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar

Page 19: Protokoll-Erkennung - net.t-labs.tu-berlin.de · Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar. 30.07.2007 11 M3: Common Substring Graphs • Idee: Sessions gleicher

30.07.2007 19

Backup

Protokoll-Erkennung, Andreas Floß, Internet Measurement Seminar