6
Schnellere Erkenntnisse durch maschinelles Lernen in SAP HANA ® und Intel ® Prozessoren Die Machine-Learning-Fähigkeiten der In-Memory-Datenbank SAP HANA auf Hardware mit Intel ® Xeon ® Prozessoren bildet die Grundlage für den Einsatz von maschinellem Lernen in kritischen, hochleistungsfähigen Produktivumgebungen Solution Brief In der datengetriebenen Wirtschaft ist Zeit Geld – und Latenz kostet Zeit. Wieviel kostet also Latenz Ihr Unternehmen? Damit ist nicht nur die Latenz des Netzwerks oder des Speichers gemeint, sondern auch die Latenz zwischen Erkenntnis und Ausführung, zwischen Vorhersage und Handlung. Vermutlich kostet Latenz Sie mehr, als es Ihnen recht ist. Hier können die skalierbaren Intel ® Xeon ® Prozessoren und die Machine Learning-Fähigkeiten der In-Memory-Datenbank SAP HANA ® Abhilfe schaffen. Maschinelles Lernen und Predictive Analytics verbessern Geschäftsprozesse, indem sie diese intelligenter machen. Diese Intelligenz ermöglicht es Unternehmen, Geschäftsergebnisse zu prognostizieren. Maschinelles Lernen kann jedoch nur dann Teil des Geschäftsprozesses werden, wenn es mit minimaler Ausführungslatenz und in Echtzeit arbeitet, unabhängig vom Umfang der Daten und der Komplexität des Vorhersagemodells. Erst wenn diese Bedingungen erfüllt sind, können User und Rechner unmittelbar bei Eintritt von Ereignissen handeln – und nicht erst danach. Wenn Machine Learning-Algorithmen dort ausgeführt werden, wo sich die Daten befinden – nämlich in der Datenbank –, dann eliminiert das die Latenz. Ebenso werden andere Verzögerungen ausgeschlossen, die entstehen können, wenn die Daten auf einen anderen Server kopiert werden, um dort die Machine Learning-Algorithmen auszuführen. Das maschinelle Lernen in einer In-Memory-Datenbank stellt sicher, dass das Modelltraining und die Vorhersagen schnell sind und Entscheidungen zeitnah getroffen werden. Darüber hinaus sorgt es auch dafür, dass Sie die Datengravitation zu Ihrem Vorteil nutzen können. Da das maschinelle Lernen in einer In-Memory-Datenbank die Notwendigkeit eines Datentransfers vermeidet, werden diese Daten in der Nähe all jener Anwendungen gespeichert, die diese Daten noch wertvoller machen. Und eine leistungsfähige Methode, das maschinelle Lernen in einer In-Memory-Datenbank produktiv einzusetzen, ist die Nutzung der SAP HANA Plattform und von skalierbaren Intel Xeon Prozessoren.

Solution Brief Schnellere Erkenntnisse durch maschinelles ......die hauptsächlich für Business- und Datenanalytiker gedacht ist • Predictive Analysis Library (PAL), eine Bibliothek

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Solution Brief Schnellere Erkenntnisse durch maschinelles ......die hauptsächlich für Business- und Datenanalytiker gedacht ist • Predictive Analysis Library (PAL), eine Bibliothek

Schnellere Erkenntnisse durch maschinelles Lernen in SAP HANA® und Intel® Prozessoren Die Machine-Learning-Fähigkeiten der In-Memory-Datenbank SAP HANA auf Hardware mit Intel® Xeon® Prozessoren bildet die Grundlage für den Einsatz von maschinellem Lernen in kritischen, hochleistungsfähigen Produktivumgebungen

Solution Brief

In der datengetriebenen Wirtschaft ist Zeit Geld – und Latenz kostet Zeit. Wieviel kostet also Latenz Ihr Unternehmen? Damit ist nicht nur die Latenz des Netzwerks oder des Speichers gemeint, sondern auch die Latenz zwischen Erkenntnis und Ausführung, zwischen Vorhersage und Handlung. Vermutlich kostet Latenz Sie mehr, als es Ihnen recht ist. Hier können die skalierbaren Intel® Xeon® Prozessoren und die Machine Learning-Fähigkeiten der In-Memory-Datenbank SAP HANA® Abhilfe schaffen.

Maschinelles Lernen und Predictive Analytics verbessern Geschäftsprozesse, indem sie diese intelligenter machen. Diese Intelligenz ermöglicht es Unternehmen, Geschäftsergebnisse zu prognostizieren. Maschinelles Lernen kann jedoch nur dann Teil des Geschäftsprozesses werden, wenn es mit minimaler Ausführungslatenz und in Echtzeit arbeitet, unabhängig vom Umfang der Daten und der Komplexität des Vorhersagemodells. Erst wenn diese Bedingungen erfüllt sind, können User und Rechner unmittelbar bei Eintritt von Ereignissen handeln – und nicht erst danach.

Wenn Machine Learning-Algorithmen dort ausgeführt werden, wo sich die Daten befinden – nämlich in der Datenbank –, dann eliminiert das die Latenz. Ebenso werden andere Verzögerungen ausgeschlossen, die entstehen können, wenn die Daten auf einen anderen Server kopiert werden, um dort die Machine Learning-Algorithmen auszuführen. Das maschinelle Lernen in einer In-Memory-Datenbank stellt sicher, dass das Modelltraining und die Vorhersagen schnell sind und Entscheidungen zeitnah getroffen werden. Darüber hinaus sorgt es auch dafür, dass Sie die Datengravitation zu Ihrem Vorteil nutzen können. Da das maschinelle Lernen in einer In-Memory-Datenbank die Notwendigkeit eines Datentransfers vermeidet, werden diese Daten in der Nähe all jener Anwendungen gespeichert, die diese Daten noch wertvoller machen. Und eine leistungsfähige Methode, das maschinelle Lernen in einer In-Memory-Datenbank produktiv einzusetzen, ist die Nutzung der SAP HANA Plattform und von skalierbaren Intel Xeon Prozessoren.

Page 2: Solution Brief Schnellere Erkenntnisse durch maschinelles ......die hauptsächlich für Business- und Datenanalytiker gedacht ist • Predictive Analysis Library (PAL), eine Bibliothek

Schnelleres maschinelles Lernen mit der SAP HANA PlattformDie SAP HANA Plattform bietet Data Scientists, Datenanalysten und Entwicklern Machine Learning-Fähigkeiten in einer In-Memory-Datenbank. Die SAP HANA Plattform bietet:

• Funktionen von Predictive Analytics, einschließlich:• Automated Predictive Library (APL),

die hauptsächlich für Business- und Datenanalytiker gedacht ist

• Predictive Analysis Library (PAL), eine Bibliothek von Anwendungsfunktionen, die für Data Scientist maßgeschneidert ist

• Integration von R* und TensorFlow*, die es ermöglicht, Modelle dieser populären Open Source-Frameworks in die SAP HANA Plattform zu integrieren

• Leistungsstarke Machine Learning-Funktionen, einschließlich:• Echtzeit-Scoring• SAP HANA Streaming Analytics –

Analytics für Ereignis-Streams

Dieser Artikel beschäftigt sich in erster Linie mit bestimmten Aspekten dieser Technologien. Einen Überblick über maschinelles Lernen in der SAP HANA Plattform finden Sie unter sap.com/germany/products/hana/features/advanced-analytics.html.

Funktionen von Predictive Analytics in SAP HANASAP® Predictive Analytics dient hauptsächlich Business- und Datenanalytikern. Diese werden damit in die Lage versetzt, auf einfache Weise Antworten auf geschäftliche Fragen zu finden, ohne dazu eine umfangreiche Ausbildung oder Kenntnisse im Bereich Data Science zu benötigen. Es gibt jedoch auch einen „Experten“-Modus für User, die Predictive Analytics für konkretere Zwecke nutzen wollen, wie beispielweise Data Scientists.

Das Kernstück von SAP Predictive Analytics sind proprietäre automatisierte Machine Learning-Algorithmen. Diese sind darauf ausgelegt, vorausschauende Technologien leichter zugänglich und einfacher nutzbar zu machen. Die assistentenbasierte Benutzeroberfläche der Lösung führt User durch den prognostischen Modellierungsprozess von Datenaufbereitung, Modellerstellung und Modelleinsatz.

SAP Predictive Analytics ist für die SAP HANA Plattform optimiert und unterstützt große Datenmengen und In-Memory-Verarbeitung. Die User können die SAP HANA Plattform entweder in einem automatischen Modus

verwenden, der mit APL verbindet oder in einem Expertenmodus, der mit PAL verbindet. Sowohl der automatische als auch der Expertenmodus laufen innerhalb der SAP HANA Plattform. Das bedeutet, dass die User auf ihrem Rechner keine Daten extrahieren oder Berechnungen durchführen müssen. Sie müssen auch keine Daten transferieren, um Predictive Analytics-Workloads laufen zu lassen. Nur die Vorhersageergebnisse werden nach der Verarbeitung an einen Desktop-Client zurückgesendet.

Die automatisierte Analytics Oberfläche innerhalb von SAP Predictive Analytics bietet Datenanalytikern und Entwicklern automatisierte Machine Learning-Funktionen. Sie kann dazu genutzt werden, Vorhersagemodelle zu erstellen, ohne dass Kenntnisse im Bereich Data Science erforderlich sind. SAP Predictive Analytics bietet eine Vielzahl an Machine

Learning-Funktionen. Dazu gehören:

• Klassifizierung• Regression• Clustering• Zeitreihen• Key Influencer• Empfehlungen• Linkanalyse

SAP Predictive Analytics benötigt keine komplexen Vorhersagemodelle als Input. Es muss einfach nur konfiguriert werden und benötigt Angaben dazu, welche Arten von Data Mining-Funktionen auf die Daten angewendet gehören. Die User legen die Parameter für die Analyse fest, damit das System mit einem Eingabedatensatz trainieren kann. Darüber hinaus bildet SAP Predictive

Solution Brief

Anwendungen von maschinellem LernenMaschinelles Lernen nutzt statistische Beziehungen in historischen Daten, um die Wahrscheinlichkeit zukünftiger Ereignisse vorherzusagen. Es ermöglicht die Entwicklung von Vorhersagemodellen, ohne dass diese explizit programmiert werden müssen. Auf diese Weise entwickelte Modelle erfassen eine grundlegende Entscheidungslogik und ermöglichen es Anwendungen, sich anzupassen. Wenn Modelle nochmals mit neuen Daten trainiert werden, wird die Entscheidungslogik automatisch aktualisiert und ist auf dem letzten Stand. Diese Anpassungsfähigkeit ermöglicht die Entwicklung neuer Anwendungsklassen, deren Prognosen durch Anpassung der zugrundeliegenden Modelle stetig verbessert werden können. Ein Umschreiben des Codes ist dazu nicht nötig.

Maschinelles Lernen ist eine transformative Kraft bei einer Vielzahl von Anwendungsfällen. Intel prognostiziert, dass bis 2020 die folgenden Branchensegmente bei der Einführung von maschinellem Lernen eine führende Rolle einnehmen werden:1

Verbraucherindustrie

• Smart Assistants• Chatbots• Personalisierung von

Sucherergebnissen• Augmented Reality• Roboter

Gesundheitsbranche

• Erweiterte Diagnostik• Wirkstoffentdeckung • Patientenversorgung• Forschung• Sensorische Hilfen

Finanzwesen

• Algorithmischer Handel• Betrugserkennung• Forschung• Private Finanzplanung• Risikominimierung

Einzelhandel

• Kundenbetreuung• Kundenerlebnis • Marketing• Verkaufsförderung• Kundenbindung• Lieferkette• Sicherheit

Behörden/öffentliche Verwaltung

• Verteidigungssektor• Einblicke in Daten• Sicherheit und Schutz• Bewohnerinitiativen• Intelligentere Städte

Energiewirtschaft

• Förderung von Öl und Gas• Intelligentes Stromnetz

(Smart Grid)• Operative Verbesserungen• Energiesparen

Verkehrswesen

• Autonomes Fahren• Autonome LKWs• Luft- und Raumfahrt• Schifffahrt• Such- und Rettungsdienste

Industrie

• Fertigungsautomation• Vorausschauende

Instandhaltung• Präzisionslandwirtschaft• Feldautomatisierung

Sonstige

• Werbung• Bildungswesen• Gaming• Fachdienstleistungen und

IT-Dienste• Telekommunikation/Medien• Sport

Page 3: Solution Brief Schnellere Erkenntnisse durch maschinelles ......die hauptsächlich für Business- und Datenanalytiker gedacht ist • Predictive Analysis Library (PAL), eine Bibliothek

Analytics mittels ausgefeilter Techniken für das automatisierte maschinelle Lernen seine eigenen Modelle. Auch erstellt es je nach Bedarf Metadaten (und löscht diese selektiv), um optimale, algorithmisch robuste Modelle zu bilden. Die User können diese Modelle dann an einem Zieldatensatz anwenden und die Ergebnisse der Berechnungen in ihren Anwendungen oder Analysen nutzen. Dass diese Modellierungsfunktion ohne Kenntnisse im Bereich Mathematik oder Data Science genutzt werden kann, erlaubt es einer größeren Anzahl von Usern sie zu nutzen. Es werden mit minimalem Aufwand zusätzliche Vorhersageerkenntnisse geschaffen. Dadurch erhöht sich wiederum der Wert der Datenplattform.

Abgesehen von der Modellbildung ist die SAP® Predictive Factory innerhalb von SAP Predictive Analytics zu automatischem Performance-Tuning fähig. Das stellt sicher, dass die Modelle darauf abgestimmt sind, mit höchster Performance zu arbeiten, selbst wenn die dafür genutzten Daten sich mit der Zeit ändern. Die Predictive Factory bietet eine browserbasierte Single-Sign-On-Umgebung und eine userfreundliche Planungsoberfläche für Datenanalysten. Damit können die User verschiedenste Szenarien ausprobieren und schrittweise in Echtzeit Verbesserungsmöglichkeiten in den Modellen umsetzen. Die User können auch Modell-Aktualisierungen planen, Modelle nach dem Ausnahmeprinzip verwalten und Scores unmittelbar einsetzen, um die Ergebnisse in Anwendungen und bei der Echtzeit-Analyse zu verwenden. Nähere Informationen über SAP Predictive Analytics und die Predictive Factory finden Sie unter https://www.sap.com/germany/products/predictive-analytics.html

SAP HANA für Data ScientistsDie SAP HANA Plattform bietet Data Scientists die PAL und die Integration von R und TensorFlow. Außerdem können Data Scientist in PAL erstellte Machine Learning-Modelle einsetzen – nicht nur für statische Daten sondern auch für Daten von SAP HANA Streaming Analytics. So gewinnen sie in Echtzeit Erkenntnisse aus übertragenen Live-Daten. Eine benutzerdefinierte Logik für die Verarbeitung von Ereignis-Streams kann in der SAP HANA Streaming Analytics Engine ebenfalls entwickelt und eingesetzt werden.

Die SAP HANA Plattform bietet Data Scientists eine Vielzahl an Funktionen zur Implementierung von maschinellem Lernen in Produktivumgebungen. Die SAP HANA PAL umfasst mehr als 90 Machine Learning-Algorithmen aus den folgenden Kategorien:

• Klassifizierung• Clustering• Regression• Zeitreihenprognosen • Ausreißererkennung• Empfehlungssysteme

Trainingsmodelle lassen sich unkompliziert mit der SAP HANA PAL bilden und benötigen nur drei primäre Datenstrukturen:

1. Eine Input-Tabelle, welche die für das Training benutzten Daten enthält2. Eine Parameter-Tabelle, welche spezifische Daten für das trainierte Modell enthält, z. B.

die Anzahl der gewünschten Bäume im Modell, die Baumtiefe oder Abbruchkriterien im Falle von zufälligen Entscheidungsbäumen sowie allgemeine Informationen, wie die Anzahl der zu nutzenden Threads

3. Output-Tabellen, um alle Ausführungsergebnisse zu speichern, wie beispielswiese die Modell-Performance

Analytische Modelle, die mit SAP HANA PAL entwickelt wurden, können auf verschiedenste Art genutzt werden. So können die Modelle zum Beispiel von SQL-basierten Anwendungen oder clientseitigem Code, der in Python* oder anderen Programmiersprachen geschrieben wurde, abgerufen werden. Anwendungen, die auf dem SAP HANA XS-Advanced (XSA) Applikationsserver entwickelt wurden, können diese Machine Learning-Modelle nutzen.

Solution Brief

Einsatz von SAP HANA® APL ModellenDie auf der SAP HANA Plattform laufende Automated Predictive Library (APL) bietet hohe Performance. User können APL-Modelle auf zwei Arten einsetzen, sobald diese trainiert sind:

1. Die Scoring-Gleichung einer Klassifizierung, Regression oder eines Clustering-Modells kann in der Codeart erstellt werden, die sich für die jeweilige Produktivumgebung eignet. Dazu gehören: • SAP HANA SQL-Statements • SAP HANA nutzerdefinierte Funktionen (UDFs) • Continuous Computation Language (CCL) • Java* Auf diese Weise eingesetzte Modelle werden dort ausgeführt, wo sich die Daten befinden.

2. Ein Modell wird in der Datenbank angewendet, um Prognosen zu erstellen, die dann in Datenbanktabellen abgelegt werden.

In Situationen, in denen partitionierte Tabellen zum Einsatz kommen, können APL-Modelle parallel laufen und auf eine Tabelle angewendet werden, die über mehrere Nodes verteilt ist. Dass diese Bibliotheken höchstmögliche Performance bieten ist entscheidend dafür, dass das Training und Scoring der Modelle schnell, auf Geschäftsprozesse ausgerichtet und in Echtzeit geschieht.

Page 4: Solution Brief Schnellere Erkenntnisse durch maschinelles ......die hauptsächlich für Business- und Datenanalytiker gedacht ist • Predictive Analysis Library (PAL), eine Bibliothek

Die SAP HANA Plattform kann auch eine Vielzahl von Frameworks für maschinelles Lernen und Programmiersprachen von Drittanbietern nutzen. So könnten zum Beispiel Data Scientists die umfangreichen Sammlungen von Modellen und Scripts nutzen wollen, die bereits in R entwickelt wurden, einer beliebten statistischen Open-Source-Programmiersprache. Für solche Situationen können die User R Code in der SAP HANA Plattform schreiben. Diese Algorithmen können sie mit der SAP HANA PAL frei kombinieren. Der R Code wird extern auf einem eigenen Rserve* (Abbildung 1) ausgeführt.

Abbildung 1: Diagramm der SAP HANA® Plattform und deren Integration in SAP® Predictive Analytics, Rserve* und den TensorFlow* Serving-Server

User können ihre Modelle auch in TensorFlow entwickeln, einer beliebten Open-Source-Softwarebibliothek für maschinelles Lernen. In TensorFlow entwickelte Modelle können auf einen TensorFlow Serving-Server geladen werden und von der SAP HANA Plattform (Abbildung 1) abgerufen werden.

Machine Learning-Performance mit In-Memory-Datenbank in der SAP HANA PlattformDas maschinelle Lernen mit In-Memory-Datenbank in der SAP HANA Plattform bietet leistungsstarkes Training und Scoring für Modelle sowohl mit großen als auch kleinen Datenmengen, die statisch sind oder übertragen werden.

Scoring von großen Datenmengen

Stellen Sie sich eine Bank vor, die ein Machine Learning-Vorhersagemodell nutzt, um Anträge auf Kreditkarten zu priorisieren. In einer solchen Situation sind die Daten des Unternehmens umfangreich: hunderttausende Anträge, mit einer jeweils langen Einkaufs- und Kredithistorie, die analysiert werden muss Trotzdem muss die Bank dazu in der Lage sein, die Daten unabhängig vom Umfang schnell zu verarbeiten. Algorithmen in der SAP HANA PAL sind daraufhin optimiert, dass sie parallel auf partitionierten Tabellen ausgeführt werden, die auf mehrere Server verteilt sind. Diese Parallelisierung sorgt dafür, dass die SAP HANA Plattform die verfügbare Rechenleistung der Hardware in vollem Umfang nutzen kann. Das ist unerlässlich, um den Antragsstellern zeitnah schnelle Ergebnisse zu liefern.

Dieser Fähigkeit der SAP HANA Plattform zum beschleunigten Scoring von großen Datenmengen beschränkt sich nicht auf PAL-basierte Modelle. In TensorFlow oder R erstellten Modellen bietet die SAP HANA Plattform Funktionen zur Lastverteilung (Load Balancing). Wenn TensorFlow Modelle so konfiguriert sind, dass sie auf mehreren Servern laufen, dann wird ihre Last mittels eines zufälligen Rundlauf-Verfahrens (Round-Robin) verteilt. Im Falle von R können die User mehrere Maschinen aufsetzen, auf denen Rserve läuft. Der R Code wird dann auf der Maschine mit der geringsten Last ausgeführt. Die SAP HANA Plattform erlaubt außerdem bestimmten Datenbanknutzern die Kopplung an eine bestimmte Instanz von Rserve, damit alle Ausführungen für eine bestimmte Datenbank auf diesem bestimmten Rserve stattfinden. Die SAP HANA Plattform bietet eine leistungsstarke Ausführung von Modellen aus einer Vielzahl von Quellen.

Solution Brief

SAP® PREDICTIVE ANALYTICS

EINE OFFENE PLATTFORM

ANWENDUNGSENTWICKLUNG

Web-Server

Spaltenorientiertes OLTP und OLAP

Grafischer Modellierer

Application Lifecycle Management

Text- Analytik

Serien- daten

Streaming Analytics

Geschäfts- funktionen

Integration von Apache Hadoop*

und Apache Spark*

Remote- Datensynchronisation

JavaScript*

Multicore und Parallelisierung

SAP Fiori® UX

Advanced Compression

Mandantenfähigkeit Multi-Tier- Storage

Daten- modellierung

Offenheit Admin und Sicherheit

Hochverfügbarkeit und Notfallwiederherstellung

Räumlich PrognostischGraph Suche Daten- virtualisierung

ELT und Replikation

Daten- qualität

ERWEITERTE ANALYTISCHE VERARBEITUNG

DATENBANKVERWALTUNG

DATENINTEGRATION UND -QUALITÄT

OLTP + OLAP EINE KOPIE DER DATEN

SAP HANA® PLATTFORM

TENSORFLOW* SERVING-SERVER

RSERVE*

Page 5: Solution Brief Schnellere Erkenntnisse durch maschinelles ......die hauptsächlich für Business- und Datenanalytiker gedacht ist • Predictive Analysis Library (PAL), eine Bibliothek

Echtzeit-Scoring

Nicht alle Aspekte des maschinellen Lernens beinhalten die Verarbeitung von extrem großen Datenbeständen. Einige Modelle brauchen nur eine kleine Datenmenge wiederholt und mit minimaler Latenz zu scoren. Stellen Sie sich zum Beispiel ein Produktionsunternehmen vor, das ein Entscheidungsbaummodell nutzt, um eine prognostische Qualitätssicherung vorzunehmen, die auf Bauteilabmessungen basiert, welche während verschiedener Phasen der Produktion gesammelt werden. Das Unternehmen möchte schon während der Fertigung einer bestimmten Komponente eine Prognose über deren voraussichtliche Fehlerhaftigkeit, damit ein Mangel sofort behoben werden kann. Das erfordert ein Scoring des Machine Learning-Modells durch die schnelle Verwendung neuer Daten, die sich auf die Bauteilabmessungen beziehen. Die SAP HANA Plattform bewältigt diese Aufgabe, indem es ein Modell einmal parst und für nachfolgende Ausführungen im Speicher behält. Der Overhead, der entsteht, wenn das Modell jedes Mal neu in den Speicher geladen wird, wird so eliminiert. Große und komplexe Modelle können in Echtzeit und innerhalb von Geschäftsprozessen gescort werden. Das ermöglicht schnelles Handeln und erhöht die Agilität des Unternehmens.

Training und Scoring von Modellen mit Streaming Analytics

Manche Geschäftsprozesse nutzen Streaming-Daten aus Ereignisquellen wie zum Beispiel Clickstreams oder Sensoren. Stellen Sie sich zum Beispiel einen Einzelhändler vor, der ein Modell erstellt hat, das voraussagt, wann einem Kunden, der auf einer Website surft, ein Gutschein angeboten werden soll. Das Unternehmen will den Clickstream verarbeiten sobald dieser erfasst wird, und sofort entscheiden, ob der Interessent einen Gutschein erhalten soll, solange er auf der Website ist. Die SAP HANA Plattform ist dazu imstande, maschinelles Lernen und Streaming Analytics zu kombinieren. Die SAP HANA Streaming Analytics Engine scort das Machine Learning-Modell anhand eingehender Clickstreams und ermöglicht es der Anwendung sofort, den Website-Besuchern die entsprechenden Gutscheine auszustellen.

Modell-Training in Multicore-Umgebungen

Der Löwenanteil der Zeit im Lebenszyklus des maschinellen Lernens wird für das Training der Modelle aufgewendet. Daher ist es von entscheidender Bedeutung, den Trainingsprozess zu beschleunigen, um die gesamte Bereitstellungszeit zu minimieren. Maschinelles Lernen mit der SAP HANA Plattform ist so konstruiert, dass eine Multicore-Serverarchitektur genutzt wird. Diese Funktion ermöglicht es, die Anzahl an Threads für das Training eines Modells zu spezifizieren, wodurch von der Parallelverarbeitung profitiert wird. Diese Threadzuweisung ermöglicht schnelleres Modell-Training und gibt gleichzeitig den Usern die Kontrolle über den Teil der Systemressourcen, die auf einem Server genutzt werden.

Nächste SchritteDer wachsende Datenbedarf bestimmt die Wirtschaft. Die Geschwindigkeit, mit der Unternehmen die Beziehungen zwischen Daten analysieren und aufgrund dieser Erkenntnisse handeln können, wird den Erfolg von Unternehmen gegenüber ihren Mitbewerbern entscheiden. Maschinelles Lernen ist ein wesentlicher Bestandteil beim Aufbau intelligenter Geschäftsprozesse und maschinelles Lernen ist schneller, wenn es dort erfolgt, wo sich die Daten befinden: in der Datenbank. Funktionen und Verbesserungen in der SAP HANA Plattform bieten eine leistungsfähige Grundlage für das Training und Scoring von Machine Learning-Modellen in Produktivumgebungen. Verbesserungen und Optimierungen an Intel® Xeon® Platinum Prozessoren bieten die ideale Grundlage, um Machine Learning-Workloads auszuführen.

Nähere Informationen darüber, wie die SAP HANA Plattform und die skalierbaren Intel Xeon Prozessoren maschinelles Lernen in Ihrem Unternehmen beschleunigen, finden Sie unter:

intel.com/sap saphana.com

Solution Brief

Skalierbare Intel® Xeon® Prozessoren: Schnelleres Training für maschinelles Lernen auf der SAP HANA® PlattformDie Intel® Xeon® Platinum Prozessoren sind Teil der skalierbaren Intel Xeon Prozessorreihe. Sie bieten mehr Arbeitsspeicher, mehr Kerne und mehr Threads als die früheren Generationen der Intel Xeon Prozessoren. Das erhöht die Performance beim maschinellen Lernen. Die Intel Xeon Platinum Prozessoren unterstützen bis zu 1,5 TB Arbeitsspeicher, 28 Kerne und 56 Threads pro Sockel. Das ermöglicht ein schnelleres Training der Modelle, bevor diese in die Produktivumgebung kommen. Ebenso wird ein schnelleres Scoring der Modelle möglich, wenn diese sich in der Produktivumgebung befinden.2 Außerdem bieten Intel Xeon Platinum Prozessoren die folgenden Funktionen, die für rechenintensive SAP HANA Workloads wie beispielsweise maschinelles Lernen optimiert wurden:

• Intel® Advanced Vector Extensions 512 (Intel® AVX-512), eine Erweiterung des Befehlssatzes. Diese erhöht die Machine Learning-Performance noch weiter, da doppelt so viele Daten wie bei Intel AVX und Intel AVX2 verarbeitet werden können.

• Intel® Ultra Path Interconnect (Intel® UPI), der Nachfolger von Intel® QuickPath Interconnect (Intel® QPI), bietet bis zu drei Kanäle, mit denen Intel Xeon Prozessoren über einen schnellen Link mit niedriger Latenz verbunden werden können. Das ermöglicht eine Skalierung auf bis zu acht Sockel und die Verbesserung der Bandbreite für I/O-intensive Workloads.

Der Intel® Nervana™ Neural Network Processor (NNP) ist ein neues Produkt von Intel für Workloads im Bereich künstliche Intelligenz (KI). Der Intel Nervana NNP bietet eine speziell entwickelte Architektur für Deep Learning, die dazu konzipiert ist, KI-Workloads noch stärker zu beschleunigen. Ziel dieser neuen Architektur ist es, die notwendige Flexibilität zu bieten, um alle Deep Learning-Stammfunktionen zu unterstützen und gleichzeitig den Intel Nervana NNP von den Beschränkungen zu befreien, die ihm durch bestehende Hardware, die nicht explizit für KI konzipiert wurde, auferlegt werden.

Page 6: Solution Brief Schnellere Erkenntnisse durch maschinelles ......die hauptsächlich für Business- und Datenanalytiker gedacht ist • Predictive Analysis Library (PAL), eine Bibliothek

Solution Brief

1 Einschätzung basiert auf interner Forschung von Intel.

2 Ausgewählte Varianten (SKUs) des Intel® Xeon® Platinum Prozessors bieten eine Arbeitsspeicherkapazität von bis zu 1,5 TB. Alle anderen bieten 768 GB.

Intel hat keinen Einfluss auf und keine Aufsicht über die Benchmarkdaten Dritter oder die Websites, auf die in diesem Dokument Bezug genommen wird. Besuchen Sie die genannten Websites, um sich davon zu überzeugen, dass die angeführten Benchmarkdaten zutreffen.

Die Funktionsmerkmale und Vorteile von Intel Technologien hängen von der Systemkonfiguration ab und können entsprechend geeignete Hardware, Software oder die Aktivierung von Diensten erfordern. Die Performance kann je nach verwendeter Systemkonfiguration unterschiedlich ausfallen. Kein Computersystem bietet absolute Sicherheit. Informieren Sie sich beim Systemhersteller oder Fachhändler oder auf www.intel.de.

Ausführlichere Angaben über die Performance und Benchmarkergebnisse finden Sie unter intel.com/benchmarks.

Intel schließt sämtliche ausdrücklichen oder impliziten Garantien aus, einschließlich der impliziten Garantie der Marktgängigkeit oder der Eignung für einen bestimmten Zweck sowie der Nichtverletzung von Rechten, sowie Garantien, die aus einer Leistungserbringung, aus dem Handel oder der Verwendung im Handel entstehen.

Kein Teil dieser Publikation darf ohne ausdrückliche Genehmigung der SAP SE oder einer SAP Tochtergesellschaft in irgendeiner Form oder zu irgendwelchem Zweck reproduziert oder übertragen werden.

Einige Software-Produkte, die von SAP SE und seinen Distributoren vermarktet werden, enthalten proprietäre Software-Komponenten anderer Software-Hersteller. Die Produkteigenschaften können sich von Land zu Land unterscheiden.

Diese Materialien werden von SAP SE oder einer SAP Tochtergesellschaft ohne Zusicherungen oder Garantien jedweder Art ausschließlich zu Informationszwecken zur Verfügung gestellt. SAP SE und seine Tochtergesellschaften übernehmen keine Haftung für Fehler oder Auslassungen in diesen Materialien. SAP SE oder eine SAP Tochtergesellschaft übernimmt lediglich diejenige Garantie für Produkte und Dienstleistungen, die in den gegebenenfalls mit den jeweiligen Produkten und Dienstleistungen gelieferten ausdrücklichen Garantiererklärungen festgelegt sind. Aus den Informationen in diesem Dokument ergeben sich keine zusätzlichen Gewährleistungsansprüche.

Intel, das Intel Logo, Intel Inside, Intel Nervana und Xeon sind Marken der Intel Corporation in den USA und/oder anderen Ländern.

SAP und andere SAP Produkte und Dienstleistungen sowie deren jeweilige Logos sind Marken oder eingetragene Marken der SAP SE (oder einer SAP Tochtergesellschaft) in Deutschland und anderen Ländern. Unter https://www.sap.com/corporate/de/legal/copyright.html finden Sie zusätzliche Informationen und Hinweise zu den Marken.

Copyright © 2018 Intel Corporation. Alle Rechte vorbehalten.

*Andere Marken oder Produktnamen sind Eigentum der jeweiligen Inhaber.

Gedruckt in den USA 0218/TA/PRW/PDF Gedruckte Exemplare nach Gebrauch bitte recyceln. 336864-001US