Message Passing Interface (MPI)

Julian Pascal Werra

Gliederungsübersicht

B. Parallele und Verteilte Programmierung

C. MPI

A. Motivation

D. Fazit

C. MPI

A. Motivation

D. Fazit

Motivation

Technische Fortschritte Hardware ist günstiger geworden Entwicklung von Hochgeschwindigkeits-Netzwerken (z.B. LAN)

Entwicklung von Parallelrechnern

Warum MPI? Je nach Parallelrechner kann Nachrichtenaustausch notwendig sein MPI ist eine Spezifikation für Datenaustausch auf nachrichtengekoppelten

Systemen

3. MPI4. Fazit

2. Parallele und …1. Motivation

A. Motivation

C. MPI

1. Klassifizierung von Parallelrechnern2. Verteilter und gemeinsamer Speicher

D. Fazit

A. Motivation

C. MPI

D. Fazit

Klassifizierung von Parallelrechnern2. Parallele und …

3. MPI4. Fazit

1. Motivation

Single Instruction Multiple Instruction

Single Data SISD MISD

Multiple Data SIMD MIMD

SISD Ein Prozessor mit einem Programmspeicher

Einprozessorsysteme (klassische Von-Neumann-Architektur)

SIMD Mehrere Prozessoren Zugriff auf gemeinsamen Programm-/Datenspeicher

Vektor- und Feldrechner

Flynnsche Klassifikation

Klassifizierung von Parallelrechnern2. Parallele und …

3. MPI4. Fazit

1. Motivation

Single Instruction Multiple Instruction

Single Data SISD MISD

Multiple Data SIMD MIMD

MISD Jeweils eigener Programm-, aber gemeinsamer Datenspeicher Jeder Prozessor erhält das selbe Datum aus dem Datenspeicher

wenig sinnvoll

MIMD Jeweils eigener Programm-, aber gemeinsamer Datenspeicher Jeder Prozessor erhält ein separates Datum

alle Arten von Multicomputer-/Multiprozessorsystemen

Flynnsche Klassifikation

A. Motivation

C. MPI

D. Fazit

Verteilter und gemeinsamer Speicher2. Parallele und …

3. MPI4. Fazit

1. Motivation

Multiprozessorsysteme Gemeinsamer Speicher

Multicomputersysteme Verteilter Speicher

Gemeinsamer Speicher shared memory machine (SMM) Speicher kann zum Datenaustausch genutzt werden Anwendungsgebiet für OpenMP

Verteilter Speicher distributed memory machine (DMM) Keine gemeinsame Datenablage, somit Zwang zum Nachrichtenaustausch Anwendungsgebiet für MPI

Verteilter und gemeinsamer Speicher2. Parallele und …

3. MPI4. Fazit

1. Motivation

ProzessorProgrammspeicher

Netzwerk

Message Passing Programmiermodell System der Klasse MIMD

Kollektion von Prozessoren Je eigener Programmspeicher Verteilter Speicher

Nachrichtenaustausch erfolgt über ein Netzwerk

A. Motivation

D. Fazit

1. Grundlagen2. Prozessgruppen

C. MPI

3. Kommunikatoren4. Einzeltransfer-Operationen5. Globale Kommunikations-Operationen6. Zeitmessung

A. Motivation

D. Fazit

C. MPI

Grundlagen

MPI Spezifikation, die den Nachrichtenaustausch auf verteilten Systemen

beschreibt Legt Programm-Bindings (Sprachkonstrukte) fest Implementierungen für C und Fortran (mittlerweile auch Java) Durch einheitliche Schnittstellen portabel

Versions-Historie 1994 MPI-1 Standard 1995 MPI-1.1 (Fehlerbereinigung) 1997 MPI-1.2 (Fehlerbereinigung) 1997 MPI-2 Standard (Erweiterung um dynamische Prozessverwaltung,

parallele Ein/Ausgabe und einseitige Kommunikationsoperationen)

3. MPI2. Parallele und …

4. Fazit

1. Motivation

Grundlagen

Programmaufbau Innerhalb eines Programms müssen MPI-Funktionen von MPI_Init und MPI_Finalize umschlossen sein MPI_Init

Muss die erste aufgerufene MPI-Funktion sein Veranlasst notwendige Vorbereitungen für den Einsatz von MPI

MPI_Finalize Muss die letzte aufgerufene MPI-Funktion sein Gibt reservierte Ressourcen wieder frei Sorgt für eine saubere Umgebung (behandelt z.B. nicht zugestellte Nachrichten)

4. Fazit

1. Motivation

A. Motivation

D. Fazit

C. MPI

Menge von geordneten Prozessen Ein Prozess kann mehreren Gruppen angehören

MPI stellt Funktionen bereit für: Vereinigung / Löschen Schnitt- / Differenz- / Untermengenbildung Anzahl der Prozesse / Bestimmung des Indizes des aufrufenden Prozesses Gleichheitsprüfung zweier Gruppen

Das Kommunikationsumfeld einer Prozessgruppe nennt sich Kommunikationsgebiet

Prozessgruppen 3. MPI2. Parallele und …

4. Fazit

1. Motivation

Prozess A

Prozess B

Prozess C

Rang 0 à

Rang 1 à ß Rang 0

ß Rang 1

Gruppe 1

A. Motivation

D. Fazit

C. MPI

Kommunikatoren

Treten nur in Verbindung mit einer Prozessgruppe auf Lokale Darstellung eines Kommunikationsgebiets

Inter-Kommunikator: Kommunikation zwischen Gruppen Intra-Kommunikator: Kommunikation innerhalb einer Gruppe

MPI stellt Funktionen bereit für: Erzeugung Duplizierung Aufspaltung

4. Fazit

1. Motivation

A. Motivation

D. Fazit

C. MPI

Einzeltransfer-Operationen

Kommunikation zwischen zwei Prozessen (klassische Sender/Empfänger-Beziehung) Sendeoperation MPI_Send Empfangsoperation MPI_Recv Misch-Operation MPI_Sendrecv Beteiligte Prozesse rufen entsprechende Funktion auf

4. Fazit

1. Motivation

Einzeltransfer-Operationen

#include <stdio.h>

#include <string.h>

#include “mpi.h”

int main (int argc, char *argv[])

int my_rank, source, dest, tag=0;

char msg [20];

MPI_Status status;

// MPI Initialisieren

MPI_Init (&argc, &argv);

// Eigenen Rang bestimmen

MPI_Comm_rank (MPI_COMM_WORLD, &my_rank);

// Der Prozess mit Rang 0 sendet eine Nachricht...

if (my_rank == 0){

strcpy (msg, “Testnachricht”);

MPI_Send (msg, strlen(msg)+1, MPI_Char, 1, tag, MPI_COMM_WORLD); }

// ...und Prozess 1 empfängt sie

if (my_rank == 1){

MPI_Recv (msg, 20, MPI_Char, 0, tag, MPI_COMM_WORLD, &status); }

// MPI beenden

MPI_Finalize();

4. Fazit

1. Motivation

A. Motivation

D. Fazit

C. MPI

Globale Kommunikations-Operationen

Kommunikation zwischen mehreren Prozessen Beteiligte Prozesse rufen die gleiche Funktion mit ggf. unterschiedlichen

Parametern auf Welche Funktionalitäten können durch solche Funktionen abgedeckt

werden? Broadcast Akkumulation Gather (Unterschiedliche Daten sammeln) Scatter (Unterschiedliche Daten verteilen) Multi-Broadcast Multi-Akkumulation Totaler Austausch

4. Fazit

1. Motivation

Globale Kommunikations-Operationen 3. MPI2. Parallele und …

4. Fazit

1. Motivation

Ap1 Empfangspuffer

Ap2 Empfangspuffer

Ap3 Empfangspuffer

Ap4 Empfangspuffer

p0 Sendepuffer

Broadcast MPI_Bcast Der Wurzelprozess beschickt die beteiligten Prozesse mit den selben Daten

4. Fazit

1. Motivation

Akkumulation MPI_Reduce Der Wurzelprozess empfängt Daten von den beteiligten Prozessen Auf diese Daten wendet er eine Reduktionsoperation an

8p0 Empfangspuffer

p1 Sendepuffer

p2 Sendepuffer

p3 Sendepuffer

p4 Sendepuffer

(Anwendung von MAXIMUM als Reduktionsoperation)

4. Fazit

1. Motivation

Gather MPI_Gather Der Wurzelprozess sammelt Daten von den beteiligten Prozessen

A B C Dp0 Empfangspuffer

p1 Sendepuffer

p2 Sendepuffer

p3 Sendepuffer

p4 Sendepuffer

4. Fazit

1. Motivation

Scatter MPI_Scatter Entspricht grundlegend einem Broadcast Es kann aber an jeden Prozess eine separate Nachricht verschickt werden

A B C D

Ap1 Empfangspuffer

Bp2 Empfangspuffer

Cp3 Empfangspuffer

Dp4 Empfangspuffer

p0 Sendepuffer

4. Fazit

1. Motivation

Multi-Broadcast MPI_Allgather Die beteiligten Prozesse beschicken sich gegenseitig mit Nachrichten Jeder Prozess erhält jede versandte Nachricht Kommt somit ohne ausgezeichneten Wurzelprozess aus

A B C Dp1 EmpfangspufferA

p1 Sendepuffer

p2 Sendepuffer

p3 Sendepuffer

p4 Sendepuffer

A B C D

A B C D A B C Dp3 Empfangspuffer

p2 Empfangspuffer

p4 Empfangspuffer

4. Fazit

1. Motivation

Multi-Akkumulation MPI_Allreduce Entspricht einer Akkumulation gefolgt von einem Broadcast Benötigt einen Wurzelprozess, der die Reduktionsoperation vornimmt

p1 Sendepuffer

p2 Sendepuffer

p3 Sendepuffer

p4 Sendepuffer

(Anwendung von MAXIMUM als Reduktionsoperation)

p1 Empfangspuffer

p2 Empfangspuffer

p3 Empfangspuffer

p4 Empfangspuffer

4. Fazit

1. Motivation

Totaler Austausch MPI_Alltoall Alle beteiligten Prozesse tauschen sich gegenseitig mit Nachrichten aus Jeder Prozess erhält eine für ihn explizit bestimmte Nachricht

p1 Sendepuffer

p2 Sendepuffer

p3 Sendepuffer

p1 Empfangspuffer

A2 C2B2

A3 C3B3

p2 Empfangspuffer

p3 Empfangspuffer

A. Motivation

D. Fazit

C. MPI

Zeitmessung

Typische Fragestellungen Wie lange nimmt die Bearbeitung eines speziellen Problems in Anspruch? Welcher Zeitvorteil ergibt sich durch zusätzliche Hardware? Identifizierung und Quantifizierung von brachliegenden Ressourcen

MPI_Wtime liefert einen Zeitstempel MPI_Wtick gibt die Genauigkeit von MPI_Wtime an. Beispielcode

Differenz zwischen end und start ergibt benötigte Zeit in Sekunden:...

start = MPI_Wtime();

... // zu messender Programmteilend = MPI_Wtime();

4. Fazit

1. Motivation

A. Motivation

C. MPI

D. Fazit

MPI ist Spezifikation zur Datenübertragung auf nachrichtengekoppelten Systemen

Die Kommunikation erfolgt über Kommunikatoren innerhalb von bzw. zwischen Prozessgruppen

Eine Kommunikation kann zwischen zwei (Einzeltransfer) oder mehreren (globaler Transfer) Prozessen stattfinden

4. Fazit

2. Parallele und …3. MPI

1. Motivation

Vortragender

Themensteller

Betreuer

Julian Pascal Werra

Message Passing Interface (MPI)Im Rahmen des Seminars „Parallele und Verteilte Programmierung“

Prof. Dr. Herbert Kuchen

Dipl.-Wirt.-Inform. Philipp Ciechanowicz

Message Passing Interface (MPI)

Documents

ScatterNetz-Routing - Multihopkommunikation für ...telematics.tm.kit.edu/publications/Files/205/vortrag.pdf · Routing gegeben L2CAP BTNodes Multihop Message Passing statt Routing,

Runs With Message

DAS CRIMSON CIRCLE MATERIAL Präsentiert vom Crimson Circle ... · d. Übers.: ein kleines Wortspiel im Englischen zwischen „passing out“ = ohnmächtig werden“ und „passing

Parallele Programmierung mit OpenMP und MPI - clug.de · Fahrplan Einfuhrung / Umfrage Parallelrechner OpenMP (Open)MPI Fazit Robin Geyer Parallele Programmierung mit OpenMP und MPI

MPI Präsentation Leon und Lukas

MPI - cs.hs-rm.deweber/sysprog/proj09/MPI.pdf · MPI steht für Message Passing Interface und ist eine Realisierung eines Programmiermodells für die parallele Programmierung durch

netLINK NL 50-MPI und netTAP NT 50-MPI - hilscher.com · Benutzerhandbuch netLINK NL 50-MPI und netTAP NT 50-MPI Installation, Bedienung und Hardwarebeschreibung Hilscher Gesellschaft

Seminar Parallele und Verteilte Programmierung Julian Pascal Werra Message Passing Interface (MPI)

Message Of Founders De[1]

Kosmische Sternexplosionen Wolfgang Hillebrandt MPI für Astrophysik MPI für AstrophysikGarching Wissenschaft für jedermann Deutsches Museum 10. Dezember

Wind loads on flat boards and walls induced by passing vehicles

Praktikum Parallele Programmierungschaefer/Parallel09/aufgaben.pdf · nitionen der Standards MPI-1.1 und MPI-2.0) und frei verf¨ugbaren MPI-Implementierungen (u.a. f¨ur Linux)

Parallele Programmierung mit MPI

Musik + Message 2_2013

MPI Grenzfläche Karte-RZ · MPI für Kolloid- und Grenzflächenforschung MPI für Gravitationsphysik Zentralgebäude MPI für molekulare Pflanzenphysiologie. Title: MPI_Grenzfläche_Karte-RZ.indd

MPI – Message Passing Interface · MPI_Datatype sendtype, void* recvbuf, int recvcount, MPI_Datatype recvtype, MPI_Comm comm) Parallele und verteilte Algorithmen. 16 All to all

performance analysis mpi - High Performance Computing

IPv6-Message-Passing mit Open MPI · 2007. 6. 14. · IPv6-Message-Passing mit Open MPI DIPLOMARBEIT zur Erlangung des akademischen Grades Diplom-Informatiker FRIEDRICH-SCHILLER-UNIVERSITAT

Passing by - Promenade - BLUES EN LA - piano - Klavier

GWDG – Kurs Parallelrechner-Programmierung mit MPI MPI Kollektive Operationen Oswald Haan ohaan@gwdg.de