12
SAS ® HIGH-PERFORMANCE ANALYTICS Ergebnisse in Minuten und Sekunden statt in Stunden und Tagen

Ergebnisse in Minuten und Sekunden statt in Stunden und Tagen · Mit der In-Memory-Lösung SAS Visual Analytics können Unternehmen beliebig große Datenmengen in kürzester Zeit

Embed Size (px)

Citation preview

SAS® HigH-PerformAnce AnAlyticS

Ergebnisse in Minuten und Sekunden statt in Stunden und Tagen

b.guenter
accantec Logo

SAS® ViSuAl AnAlyticS

Mit der In-Memory-Lösung SAS Visual Analytics können Unternehmenbeliebig große Datenmengen in kürzester Zeit visualisieren, analysierenund die Ergebnisse via Internet oder über Mobilgeräte bereitstellen.

FACT SHEET

In den IT-Systemen der Unternehmen sammeln sich ungeheure Datenmengen an. Die heutigen Infrastrukturen und Architekturen sind jedoch nicht darauf ausgelegt, diese Daten in ihrer Gesamt-heit zeitnah auszuwerten.

Dessen ungeachtet gehen in der IT- Abteilung immer mehr Anfragen nach Daten, Ad-hoc-Analysen oder Sonder-berichten ein. Entscheider aus den operativen Ressorts reagieren frustriert, weil sie zu lange auf Antworten oder Berichte warten müssen oder sich wichtige Fragen mit der verfügbaren Technik nicht beantworten lassen. Zu-dem steigt der Druck, Informationen über Mobilgeräte wie das iPad bereit-zustellen.

Mit In-Memory-Technik und spezieller Hardware hilft SAS Visual Analytics Mitarbeitern im ganzen Unternehmen, nahezu beliebig große Datenmengen zu visualisieren, Milliarden Datenzeilen binnen Minuten oder Sekunden zu kor-relieren, die Befunde zu interpretieren und die Ergebnisse ihrer Analysen via Internet oder über Mobilgeräte überall verfügbar zu machen.

Nutzen

• VisualisierungbeliebigerDatenmen-gen und intuitiv anwendbare Analyse -tools als Entscheidungshilfen für Mitarbeiter aller Ressorts. Mit SAS Visual Analytics können Experten und operative Nutzer alle verfügba-ren Daten schnell und gründlich auswerten. Eine Beschränkung auf Stichproben oder Teilmengen des Datenbestands erübrigt sich. Ein -fach zu bedienende, interaktive Web -Oberflächen ermöglichen einem erweiterten Nutzerkreis, durch Da ten - analyse betriebswirtschaftlich rele-

vante Erkenntnisse zu gewinnen. Führungs- und Fachkräfte können damit mehr Optionen prüfen, auf einer solideren Grundlage entschei-den und schneller handeln.

• SchnelleAntwortenaufkomplexeFragen, höhere Produktivität der Analytiker. Mit SAS Visual Analytics lassen sich beliebige Datenmengen in kürzester Zeit visualisieren und sondieren. Dabei werden Muster, Trends und Zusammenhänge sicht-bar, die ihrerseits auf Chancen oder Risiken hindeuten. Analytisch ver-sierte Nutzer erkennen solche Auf-fälligkeiten sofort und können sie mit weiterführenden Verfahren genauer untersuchen.

• EinfacheBereitstellungderErgeb-nisse, allseitiger Zugriff. Via Internet, PDF-Download oder per iPad kann ein großer Nutzerkreis auch ohne statistische Vorkenntnisse Diagramme und Berichte interaktiv studieren. Für die Verwaltung und den Schutz der Daten bleibt das IT-Personal zuständig. Weil sich somit alle Mitarbeiter jederzeit umfassend informieren können, nehmen die Produktivität und das kollektive Wis-sen des Unternehmens zu.

• Entlastung der IT von Anfragen aus operativen Ressorts. SAS entlastet das IT-Personal von den ständigen Anfragen aus den operativen Ab-teilungen nach bestimmten Daten, anderen Datensichten, Ad-hoc-Be-richten oder einzelnen Informationen. Mit Hilfe von SAS Visual Analytics stellt die IT-Abteilung des Unterneh-mens den Datenbestand im Haupt-speicher für verschiedene Ziel-gruppen zur Verfügung. Die Nutzer können die Daten anschließend selbst auswerten, in Berichten ver-wenden und diese weiterleiten.

nWozu dient SAS Visual Analytics?Mit der In-Memory-Lösung SAS Visual Analytics können Unternehmen nahezu beliebig große Datenmengen gründlicher und deutlich schneller visualisieren und analysieren als je zuvor. Eine Beschrän-kung auf Stichproben oder Teilmengen des Datenbestands erübrigt sich.

nWie profitieren Unternehmen von SAS Visual Analytics?

Über SAS Visual Analytics können viele Nutzer simultan extreme Datenmengen visualisieren und mit der Hochleistungs-analytik von SAS auswerten. So gewinnen Unternehmen aus ihren exponentiell wach -senden Datenbeständen in kürzester Zeit bislang verborgene Erkenntnisse, die ih-nen helfen, komplexe Probleme zu lösen und Handlungsalternativen zu entwickeln. Zu Diagrammen oder Kennzahlen aufbe-reitet, können diese Erkenntnisse via Inter-net oder über Mobilgeräte überall abge-rufen werden.

nFür wen wurde SAS Visual Analyt- ics entwickelt?

SAS Visual Analytics ermöglicht Mitarbei-tern aller Ressorts, Daten zu sichten und auszuwerten: Führungskräften, Analyti-kern, Statistikern, Datenspezialisten. Dem IT-Personal hilft die Software, Daten und Systeme zu pflegen und zu schützen.

b.guenter
accantec Logo

• NachBedarfskalierbar.SASVisualAnalytics läuft auf Standard-Hard-ware, die sich entsprechend dem Datenaufkommen und der Nach-frage nach Zugriff darauf kurzfristig erweitern lässt. Dem gleichen Ziel dient die Nutzung des Dateisystems HDFS (Hadoop Distributed File Sys-tem) in der Lösung.

Produktüberblick

SAS Visual Analytics verbindet Hoch-leistungsanalytik mit einer grafischen, intuitiv bedienbaren Benutzeroberfläche zur visuellen Datenexploration. Unter-nehmen können damit nahezu beliebig große Datenmengen schneller als je zu-vor auf Erkenntnisse durchforsten, die ihnen helfen, komplexe betriebswirt-schaftliche Probleme zu lösen, mehr zu leisten und Risiken im Griff zu behalten.

Hochleistungs-Server SAS LASR

Als Herzstück der Lösung setzt der SAS LASR Analytic Server beim Rechen tem -po Maßstäbe. Da SAS Visual Analytics die zu verarbeitenden Daten in den Hauptspeicher lädt, wird bereits in der Standardkonfiguration ein extrem hoher Durchsatz erreicht. Zur weiteren Leis-tungssteigerung setzt die Lösung auf die Integration des Dateisystems HDFS,

das die Parallelverarbeitung extremer Datenmengen auf vernetzten Rechnern unterstützt.

Arbeitsumgebung für Administratoren

Mit den Administrations-Tools aus SAS Visual Analytics kann die IT-Abteilung eine universelle Arbeitsumgebung für operative Nutzer, Datenspezialisten sowie Zielgruppen mit Lesezugriff ein-richten. Administratoren und Infor-mationsarchitekten können mit diesen Werkzeugen Daten laden und für die einzelnen Nutzertypen aufbereiten, Da-tenstrukturen in gemeinverständliche Begriffe übersetzen sowie Verarbeitungs -regeln formulieren und anwenden. In-dem die IT-Abteilung festlegt, welche Quellen in welchem Umfang angezapft werden dürfen, behält sie die Kontrolle über die Daten, ohne die Produktivität der Nutzer einzuschränken. Sobald die Daten geladen und freigeschaltet sind, kann der Verwender sie nach Bedarf sondieren und Abfragen darüberlaufen lassen. Weil somit jede Abteilung die von ihr benötigten Datensichten und Ad-hoc-Berichte selbst erzeugen kann, wird das IT-Personal nachhaltig entlastet.

Visuelle Datenexploration

Sobald die IT-Abteilung Daten aus der jeweiligen Quelle in den SAS LASR Analytic Server geladen hat, kann ein

großer Nutzerkreis diese Daten am in-teraktiven Webclient der Lösung visua-lisieren, auf Muster und Trends unter-suchen und solche Auffälligkeiten näher analysieren. Auch statistisch weniger versierten Mitarbeitern gelingt es mühe-los, Abfragen zu for mulieren oder zu ändern, indem sie beispielsweise Ele-mente, die sie einer Sicht hinzufügen möchten, aus einer Seitenleiste aus-wählen, die angezeig ten Daten filtern oder Datenelemente gruppieren.

Weitere Merkmale, die die Datenana-lyse vereinfachen, sind die Bedienung per Drag-and-drop sowie die Autochar-ting-Funktion. Letztere wählt automa-tisch den Diagrammtyp, der sich zur Visualisierung der vorliegenden Daten am besten eignet. Per Mouseover ein-geblendete Erklärungsfenster machen komplizierte Analysemethoden und Korrelationen auch Nutzern ohne ein-schlägige Vorkenntnisse verständlich.

Gestandene Analytiker profitieren eben-falls von dieser Funktion: Statt sich in extremen Datenmengen über Versuch und Irrtum an verborgene Erkenntnisse heranzutasten, spüren sie schnell die-jenigen Trends, Muster und sonstigen Auffälligkeiten auf, bei denen sich eine nähere Analyse lohnt. Zur Veranschau-lichung der Befunde bietet SAS Visual

Mit SAS Visual Analytics können Mitarbeiter aller Ressorts beliebig große Datenmengen in kürzester Zeit visualisieren und auf Muster oder Trends untersuchen.

Analytics eine große Auswahl an Gra-fiken wie Boxplots, Heatmaps und ani-mierte Blasendiagramme.

Intuitiv anwendbare Analyse-Tools

Mit der In-Memory-Technik des SAS LASR Analytic Server werten Unterneh-men ihre exponentiell wachsenden Datenbestände systematisch aus. Das Funktionsspektrum ist so ausgelegt, dass Mitarbeiter damit auch bei gerin-ger Vorkenntnis Daten selbständig visu-alisieren und eine Vielzahl an Variablen korrelieren können. Da Analytiker in SAS Visual Analytics zudem die Mög-lichkeit haben, Hierarchien selbst anzu-legen, brauchen sie kaum noch Hilfe-stellung durch IT-Personal. Operationen wie Drill-down, Drill-up, Slicing und Di-cing erleichtern Anfängern die Orientie-rung in komplexen Datenstrukturen und helfen versierten Nutzern, große Daten-mengen schneller zu erforschen.

Webreporting und Verteilung

SAS Visual Analytics enthält Reporting-Funktionen für Anfänger und für ver-sierte Nutzer. Wer auf welche Daten und Werkzeuge zugreifen darf, regelt die IT-Abteilung. Layoutvorlagen be-schleunigen die Arbeit am Bericht. Mit einem umfangreichen Grafikarsenal kann der Autor Diagramme erzeugen, an das Corporate Design anpassen und in den Report einfügen. Die Adres-saten der Berichte können diese wahl-

weise per Viewer am Webclient oder auf dem iPad lesen.

Berichte abrufen

Via Internet, PDF-Download oder per iPad kann ein großer Nutzerkreis Be-richte von jedem Standort aus abrufen. Künftige Versionen von SAS Visual Analytics werden weitere Mobilgeräte unterstützen. Versierte Analytiker kön-nen große Datenmengen aus verschie-denen Blickwinkeln betrachten und bearbeiten, Nutzer mit Lesezugriff die ihnen zugänglichen Berichte interaktiv studieren.

Zentraler Einstieg

Die zentrale Anmeldung in SAS Visual Analytics eröffnet den Zugang zu allen Modulen und angeschlossenen Daten-quellen. Auf der Einstiegsseite werden die zuletzt geöffneten Objekte ange-zeigt. Der Nutzer kann Favoriten hinzu-fügen und die ihm freigegebenen Daten maschinell durchsuchen.

Technische Voraussetzungen

Angaben zu den technischen Voraus-setzungen des Einsatzes von SAS Visu-al Analytics, White Papers, Screenshots und wei tere Informationen finden Sie im Internet unter: www.sas.de/visual analytics

Hochleistungs-Server SAS LASR

• EntwickeltzurParallelverarbeitungauf mehreren Rechnerknoten. Der SAS LASR Analytic Server vernetzt verteilte IT-Ressourcen zu einem virtuellen Supercomputer.

• ZurMaximierungderLeistungundSkalierbarkeit auf Hadoop-Integra-tion ausgelegt.

Arbeitsumgebung für Administratoren

• DieimRahmenderIT-Richtlinienund der Data Governance des Un-ternehmens vorgesehene Zugangs-prüfung und Rechtevergabe wird auf alle Bestandteile von SAS Visual Analytics angewandt.

• DatenwerdenjenachMenge,Aktu-alisierungstakt und Skalierungsbe-darf in die Hauptspeicher der ange-schlossenen Rechner geladen.

• Web-basierteAdministrationvonNutzerkonten, Servern und Daten.

Visuelle Datenexploration

• MitarbeiterallerAbteilungenkönnenDatenbestände am Webclient inter-aktiv erkunden.

• DieAutocharting-Funktionwählt automatisch den Diagrammtyp, der sich zur Visualisierung der vorliegen-den Daten am besten eignet: So er-gibt etwa eine einzelne Messgröße eine Darstellung als Histogramm,

SAS Visual Analytics enthält eine App für das Apple iPad zum Herunterladen und zur

interaktiven Anzeige von Berichten.

P12

0 1

2-01

87

SAS and all other SAS Institute Inc. product or service names are registered trademarks or trademarks of SAS Institute Inc. in the USA and other countries. ® indicates USA registration. Other brand and product names are trademarks of their respective companies. Copyright © 2012, SAS Institute Inc. All rights reserved.

zwei Messgrößen ergeben ein Streu -diagramm, drei ein Blasendiagramm.

• AussagekräftigeKartensichtenzurDarstellung von Geodaten.

• EineintegrierteErklärungsfunktionerkennt und erläutert Zusammen-hänge zwischen Variablen.

• FunktionenzurErschließungspei-cherresidenter Datenquellen.

• SkinszurAnreicherungderGrafikenmit 3-D- und Lichteffekten.

• VisualisierungunteranderemalsBoxplot, Heatmap oder Blasendia-gramm.

• Ein-undAusblendeneinesGitter-netzes sowie Anpassung der Achsen zur optimalen Darstellung am Bildschirm.

• VariationvonAnfragendurchAus-wahl von Elementen aus einer Seitenleiste, dynamisches Filtern und Gruppieren.

• AnpassendesangezeigtenTeilseiner Datenmenge mit hoher Kardinalität per Schieberegler in der Übersichts-leiste.

• OptionaleAnzeigedeskriptiv-statis-tischer Größen wie Minimum, Maxi-mum und Mittel.

Intuitiv anwendbare Analysen

• SondierungundKorrelationbeliebiggroßer Datenmengen in vernetzten Hauptspeichern.

• SlicingundDicingvonDatenwürfelndurch Filtern an beliebigen Knoten der Hierarchie.

• Auf-undAbnavigationinnerhalbderHierarchie, Ein- oder Ausblenden ganzer Ebenen.

• ErweiterungbeliebigerSichtenumneue Messgrößen.

• SpeichernmehrererSichtenalsBe-richtspaket, Weiterleitung an Kollegen als Web-Report, Bilddatei oder App.

• KomplexitätderDatenstrukturenbleibt operativen Nutzern verborgen.

Webreporting und Verteilung

• InteraktiveWeb-SchnittstellezumVerf assen und Verteilen von Berichten.

• AssistentunterstütztVorschau,Filternsowie Entnahme von Stichproben.

• ZumEinbauvonDrill-down-Funktio- nen in Grafiken und Berichte kann der Nutzer eigene Hierarchien anlegen.

• VorkonfigurierteFilter,Gruppierungenund Sortierfolgen.

• AnpassungvoreingestellterFormate.

• Diagrammauswahl:Säulen,Balken,Kreis (jeweils auch in 3-D), Linien, Säulen plus Linien, Streudiagramm, Heatmap, Blasen, Treemap. In alle Diagrammtypen lassen sich Hilfs linien einfügen und beschriften.

Berichte abrufen

• InteraktiveWeb-Schnittstellezum Abrufen von Berichten am PC.

• InteraktiveBerichtsanzeigeaufdemiPad.

• VorschauaufDarstellungdes Berichts am Mobilgerät.

• OberflächeähneltDesktop,ange-zeigte Objekte lassen sich per Drag-and-drop vergrößern, verkleinern und verschieben.

• NutzerkannBerichtealsPDF-oderPNG-Dateien speichern.

Mobiler Zugriff

• OptimaleErgonomieundNutzerpro-duktivität durch eingebaute Unter-stützung von iPad-Funktionen und Gesten wie Zoom oder Swipe.

• BrushingundLinking:DerAutoreines Berichts kann visuelle Darstel-lungen miteinander verbinden. Wählt er dann in einer Grafik oder Liste einen oder mehrere Datenpunkte aus, werden diese in den verbundenen Darstellungen ebenfalls markiert. Änderungen der Datenauswahl oder darauf angewandte Filter werden in allen Sichten nachvollzogen. Auch auf dem iPad lassen sich so viele Details sichtbar machen.

• BerichtekönnenzurOffline-Anzeigeauf dem Mobilgerät gespeichert werden.

Zentraler Einstieg

• SchnellzugriffaufFavoritenundzu-letzt geöffnete Dateien oder Quellen über Miniaturbilder (Thumbnails).

• Zentraler,direkterZugangzuallenArbeitsobjekten vom Bericht über visuelle Darstellungen bis hin zu den einzelnen Datenquellen.

• Anzeigedeskriptiv-statistischer Größen wie Minimum, Maximum und Mittel.

b.guenter
accantec Logo mit Adresse

SAS® HIGH-PERFORMANCE ANALYTICS

Inhalt

Der Anlass

Wachsende Datenmengen – Big Data ...................................................................................................... 4

Die Lösung

High-Performance Analytics .................................................................................................................. 4

Strategie für Daten: Information Management ................................................................................. 4

Neue Technologien: Grid, In-Database, In-Memory ........................................................................... 4

Grid – Rechenlast besser verteilen........................................................................................ 5

In-Database – Analytics zu den Daten bringen...................................................................... 5

In-Memory – blitzschnelle Analysen im Hauptspeicher .......................................................... 6

Analysen einfacher machen: SAS® Visual Analytics .......................................................................... 6

Anwendungsbeispiele

High-Performance Analytics in der Praxis ................................................................................................ 7

Risikoberechnung ...................................................................................................................... 7

Kampagnenoptimierung ............................................................................................................. 7

Fazit ............................................................................................................................................ 8

b.guenter
accantec Logo

3

Mit High-Performance Analytics schafft SAS einen Durchbruch in der Bearbeitung komplexer

analytischer Probleme, die in vielen Branchen zu den Hauptherausforderungen zählen.

Was bisher Tage oder Stunden Berechnungszeit in Anspruch genommen hat, ist nun in Minuten

und Sekunden machbar. Bisher mussten Geschäftsprozesse so organisiert werden, dass

diese Wartezeiten eingehalten wurden. Jetzt können auch anspruchsvolle Fragestellungen

im Bereich von Fraud, Optimierung, Risiko und vielen anderen Bereichen nahezu in Echtzeit

angegangen werden.

Möglich wird dies durch eine Reihe von technologischen Innovationen wie verteiltem Rechnen

(Grid), Vermeidung von Datenbewegungen (In-Database) und Hochgeschwindigkeitsanalytik

im Hauptspeicher (In-Memory). Gleichzeitig stehen neue Werkzeuge zur explorativen Erkun-

dung und Mustererkennung von großen Datenmengen zur Verfügung. Damit wird der Fach-

anwender erstmals in die Lage versetzt, Advanced Analytics fast spielerisch auszuprobieren

und sehr schnell zu Ergebnissen zu kommen.

Executive SummaryInhalt

Der Anlass

Wachsende Datenmengen – Big Data ...................................................................................................... 4

Die Lösung

High-Performance Analytics .................................................................................................................. 4

Strategie für Daten: Information Management ................................................................................. 4

Neue Technologien: Grid, In-Database, In-Memory ........................................................................... 4

Grid – Rechenlast besser verteilen........................................................................................ 5

In-Database – Analytics zu den Daten bringen...................................................................... 5

In-Memory – blitzschnelle Analysen im Hauptspeicher .......................................................... 6

Analysen einfacher machen: SAS® Visual Analytics .......................................................................... 6

Anwendungsbeispiele

High-Performance Analytics in der Praxis ................................................................................................ 7

Risikoberechnung ...................................................................................................................... 7

Kampagnenoptimierung ............................................................................................................. 7

Fazit ............................................................................................................................................ 8

4

SAS® HIGH-PERFORMANCE ANALYTICS

verhalten, Stromertrag und vieles ande-re mehr. Aufgrund dieser Informationen ist es über analytische Verfahren mög-lich, den Zeitpunkt der nächsten War-tung abzuschätzen. Man nimmt dazu Daten aus der Vergangenheit, die ein Muster vor dem Ausfall einer Turbine gezeigt haben. Taucht dieses gleiche Muster nun erneut auf, kann bereits vor dem Ausfall der Turbine gehandelt wer-den. Umgekehrt lassen sich Wartungs-zyklen auch verlängern, wenn eben kein Anzeichen für eine anstehende Störung ersichtlich ist.

Die Lösung

High-Performance Analytics

Um mit immer mehr Daten zurechtzu-kommen, gibt es nicht eine einzige Ant-wort. Die eine Big-Data-Technologie gibt es nicht. Neben organisatorischen und strategischen Entscheidungen, die hier nicht im Fokus stehen, verfolgt SAS im Wesentlichen drei Strategien:

1. verbessertes Information Manage-ment durch automatisierte, einge-bettete Analytik

2. technologische Quantensprünge im Bereich paralleler Verarbeitung

3. völlig neue Visualisierungen, um Analytics einfacher und umsetzbarer zu machen

In allen drei Bereichen hat SAS in den letzten Jahren massiv in die Entwick-lung neuer Produkte und Herangehens-

weisen investiert. Das Ergebnis steht nun als „SAS High-Performance Analy-tics“ zur Verfügung.

Strategie für Daten: Information Management

Wenn immer mehr Daten auf die Un-ternehmen einströmen, lässt sich das Para digma eines zentralen Data Ware-house nicht mehr lange aufrechter-halten. Die gigantischen Ströme von Maschinendaten in einem Enterprise Data Warehouse zu speichern ist auf die Dauer schlicht zu teuer. Gleichzei-tig handelt es sich dabei in den sel-tensten Fällen um relationale, in Zeilen und Spalten organisierte Daten. Den-noch stecken darin viele wichtige Infor-mationen.

Der entscheidende Schritt ist der, dass in die einlaufenden Datenströme bereits eine intelligente Analytik eingebaut wird. Diese entscheidet nicht nach einfachen Regeln, sondern nach auftretenden Mus tern, welche Daten auf welche Wei -se behandelt werden. Einzelne Daten-punkte verlangen danach, sofort Ereig-nisse auszulösen. Bei bestimmten Konstellationen wird es angebracht sein, eine Maschine kontrolliert herunter-zufahren und auszuschalten. Dieses „Complex Event Processing“ ist in der Lage, innerhalb einer einzigen Sekunde hunderte von Ereignissen zu prüfen und darauf zu reagieren. Teile des Da-tenstroms werden nach wie vor in das Data Warehouse laufen und dort zentrale Berichte befüllen.

Der Anlass

Wachsende Datenmengen – Big Data

In einer Welt stetig wachsender Daten-mengen stehen potenziell immer mehr Messdaten aus immer mehr Prozessen zur Verfügung. So lassen sich nun Lie-fer- und Verkaufsprozesse auf Einzelpro -duktebene überwachen und damit auch besser steuern. Eine immer günstiger einzusetzende Sensortechnik erlaubt das Erfassen von immer mehr einzelnen Daten auf immer breiterer Basis. Die Kunst besteht nun darin, relevante Er-kenntnisse schnell zu gewinnen und für bessere Entscheidungen auf allen Ebenen zu nutzen.

Einfache Aggregationen, die im Nach-hinein wichtige Trends zusammen fas-sen, sind dabei nicht mehr ausreichend. Dieses klassische Verständnis von Business Intelligence wird nach wie vor für viele Bereiche seine Berechtigung haben. Analytisch geprägte Unterneh-men gehen aber darüber hinaus und erzielen echte Wettbewerbsvorteile. Wenn es gelingt, aus der Masse von Daten die wirklich relevanten Muster und Zusammenhänge zu erkennen und in Vorhersagemodelle zu bringen, wird ein immer genauerer Ausblick auf die Zu-kunft möglich.

So liefern beispielsweise Windkraftan-lagen eine Vielzahl von Sensordaten über Luftdruck, Feuchtigkeit, Rotations -

SAS High-Performance Analytics

5

Neue Technologien: Grid, In-Database, In-Memory

Wenn immer mehr Daten gleichzeitig bearbeitet werden müssen, läuft dies zwangsläufig auf Parallelisierung hinaus. Ergänzend steht der Versuch, zeitauf-wändige Datenbewegungen generell zu vermeiden und stattdessen die Analytik zu den Daten zu bringen. Die Technolo-gien, die SAS dazu einsetzt, waren bisher wenigen Spezialfällen im Super-computing-Umfeld vorbehalten. Wegen günstigerer Hardware- und insbeson-dere Arbeitsspeicherpreise kann Soft-ware heute anders geschrieben und eingesetzt werden.

Grid – Rechenlast besser verteilen

SAS Grid Computing ermöglicht es, große Mengen an Daten und analyti-schen Berechnungen effizienter zu ver-arbeiten. Leistungsstarke Instrumente zur strategischen Steigerung der Per-formance wie Lastverteilung oder Prio-risierung von einzelnen Abfragen sowie Hochverfügbarkeit und Ausfallsicher heit geben den Anwendern eine zuverlässi-ge Infrastruktur an die Hand. Intelligente Verteilung und parallele Verarbei tung von Business Analytics-Aufgaben stel-len den Betrieb einer großen Infrastruk-tur auch bei kleinen Batch-Fenstern und hohen Anforderungen an Aktualität und Usability sicher.

Multiprozessor-Ressourcen erlauben das Aufteilen von Aufgaben in Teilauf-gaben, die parallel abgearbeitet werden

können. Am besten geeignet für eine solche Parallelisierung sind Rechenpro-zeduren, die eine große Datenmenge mit langen Laufzeiten mit sich bringen, sowie solche, in denen unabhängige Aufgaben an große Daten mengen heran -getragen werden. Die schnellere Da-tenintegration, das raschere Analysieren und das beschleunigte Reporting er-höhen die Geschwindigkeit in der Ent-scheidungsfindung im gesamten Unter-nehmen.

Ein wesentlicher Vorteil des SAS Grid-Managers ist die einfache und kosten-günstige Skalierung. Bei Bedarf können weitere Computing-Einheiten zum Grid geschaltet werden. Dabei handelt es sich um preiswerte Standardhardware. Die Leistungsaufstockung ist dabei schrittweise ohne große Sprünge mög-lich und kann damit sehr flexibel genau dann erfolgen, wenn der Bedarf da ist. Große und teure Infrastrukturen „auf Vorrat“ aufzubauen ist nicht mehr nötig.

In-Database – Analytics zu den Daten bringen

Mit SAS In-Database lassen sich auch größte Datenmengen flexibel und effizi-ent analysieren und produktiv nutzen. SAS In-Database setzt die massiv-par-allele (MPP-)Architektur der Datenbank respektive des Data Warehouse ein – für Skalierbarkeit und bessere Perfor-mance. Der sonst notwendige Transfer der Daten in ein Analysesystem entfällt, lediglich die Ergebnisse der Berechnung

Eine Trennung von zwar wichtigen, aber für das Tagesgeschäft unbedeutenden Daten ist angebracht, vor allem um das Data Warehouse zu entlasten und zur Datenhaltung auf kostengünstigere Va-rianten zu setzen.

In der Welt der großen Datenmengen hat sich dazu das Framework „Hadoop“ etabliert. Es wurde maßgeblich von Google industrialisiert und wird seit 2008 als Open-Source-Software innerhalb der Apache Foundation weiterentwickelt. Zahlreiche Unternehmen aus nahezu allen Branchen leisten dazu Bei träge und setzen Hadoop und seine zahlreichen Tochterprojekte bereits produktiv ein. Wesentliches Kennzeichen ist die unbe -grenzte Parallelisierung der Datenhal-tung mittels Standardhardware und eines eigenen Filesystems. Damit bietet sich Hadoop an, einen kostengüns-tigen Storage bereitzustellen.

SAS hat im März 2012 in sein etablier-tes Datenmanagement-Werkzeug eine vollumfängliche Hadoop-Unterstützung implementiert. Schreibend und lesend sowie mit Anbindung an SAS Meta-daten lassen sich nun auch Hadoop-Cluster mit SAS Werkzeugen verwalten. Ein entscheidender Vorteil für die Ein-setzbarkeit – denn Hadoop-Know-how ist in der Breite heute noch gar nicht verfügbar. Mit SAS kann aber bereits jetzt schon Nutzen daraus gezogen werden.

SAS stellt eine ganze Reihe von neu entwickelten Technologien unter dem Begriff High-Performance Analytics zur Verfügung.

ANALYTICS INFRASTRUCTURE

SAS® Grid Computing

SAS® In-MemoryAnalytics

SAS® In-Database

SAS® HIGH-PERFORMANCE ANALYTICS

6

SAS® HIGH-PERFORMANCE ANALYTICS

nungen noch bessere Reaktionszeiten haben. Diese Konfigura tion ist vor allem bei rechenintensiven Aufgaben von großem Vorteil, etwa bei der Neuberech -nung eines kompletten Risikoportfolios oder der Preisoptimierung umfangrei-cher Warensortimente.

Die genannten Technologien bringen, auch im Zusammenspiel, nicht nur klei-ne Performancesteigerungen, sondern dramatische Beschleunigungen. Die Erfahrungen der Early Adopters, die SAS im Entwicklungsprozess geholfen ha-ben, sind 1000fache und noch höhere Beschleunigungen – und das bei sehr komplexen analytischen Verfahren wie etwa dem Berechnen eines Modells zur Analyse der Kreditausfallwahrschein-lichkeit. Der Pilotkunde konnte die Zeit zur Erstellung dieses Modells von 167 Stunden auf lediglich 84 Sekun den reduzieren. Das ermöglicht es nun, Pro -zesse, die bisher rund um die tech-nischen Limitationen gestrickt waren, komplett neu zu designen.

Analysen einfacher machen: SAS Visual Analytics

Die wachsenden Datenmengen ergeben nur dann neue Möglichkeiten, wenn sie auch von entsprechend kundi gem Personal durchforstet und bewertet werden können. Der Mangel an qualifi-zierten Experten für die Durchführung von Analytics wird in vielen Studien und Presseberichten als ein wesentli ches Hemmnis zur weiteren Verbreitung ana-lytischer Verfahren in den Unternehmen beschrieben. Ein Problem, das in den nächsten Jahren weiter wachsen wird.

Die SAS Strategie dazu ist es, die Be-dienung und Nutzung von Analytics zu vereinfachen. Ende März 2012 hat SAS ein bahnbrechendes neues Produkt vorgestellt, das genau diese Herausfor-derung adressiert: SAS Visual Analytics.

SAS Visual Analytics lädt riesige Daten-mengen in die Hauptspeicher vernetzter Rechner und wertet sie dort mit extrem

hoher Geschwindigkeit aus. Unterneh-men können damit ihre Datenbestände auf Trends und Muster untersuchen und gewinnen Anhaltspunkte für nähere Analysen. Die Ergebnisse lassen sich grafisch aufbereiten und per Web-Re-porting oder Tablet abrufen.

Herzstück der Lösung ist der SAS® LASR™ Analytic Server. Er liest die Da-ten in den Speicher ein und stellt sie grafisch dar. Milliarden Datenzeilen wer-den binnen Minuten oder Sekunden sondiert und korreliert. In der Visualisie-rung der Ergebnisse erkennt der Nut-zer Muster, Trends und bislang verbor-gene Zusammenhänge.

SAS Visual Analytics richtet sich an den Business-Analysten, der nicht notwen-digerweise über statistische Kenntnisse verfügt, aber sich in Geschäftsprozes-sen auskennt. Er hat nun ein leicht zu bedienendes und dennoch sehr mäch-tiges Werkzeug zur Verfügung, mit dem er kontrolliert ausprobieren kann, wel-che Erkenntnisse in den Daten verbor-gen liegen. Damit wird Analytics für große Unternehmensbereiche erstmals überhaupt greifbar.

werden weiterverarbeitet. Die Geschwin -digkeit von Analysen wird vervielfacht, relevante Aussagen und verwertbare Erkenntnisse stehen viel schneller zur Verfügung und beschleunigen damit den Entscheidungsprozess im Unterneh -men.

Besonders im Bereich von Echtzeitsze-narien, etwa der Missbrauchserkennung bei Kreditkartentransaktionen, lässt sich In-Database-Technik gut einsetzen. Zu-vor in längeren Berechnungen model-lierte Muster werden dabei mit eintreffen-den Datenströmen verglichen und es wird sofort eine Bewertung – ein Sco-ring – erstellt. Je nach Scoringwert werden Aktionen ausgelöst, etwa eine Weiterleitung zu einer tieferen Prüfung oder eine Zahlungsverweigerung. Etwas weiter gehende Ansätze bringen auch umfangreichere analytische Berech-nungen direkt in die Datenbank und pro fitieren dort von der häufig sehr per-formant ausgelegten Hardware. Im Zusammenhang mit Hadoop lassen sich auch dort vorhandene Rechenmetho-den ausnutzen (Map/Reduce).

In-Memory – blitzschnelle Analysen im Hauptspeicher

Der Bedarf an kürzeren Antwortzeiten für komplexe Business-Szenarien und an topaktuellen und zuverlässigen Er-kenntnissen steigt. Gleich zeitig werden Server und Arbeitsspeicher immer leis-tungsfähiger und kosten günstiger. SAS macht sich diese Entwicklung zunutze und entwickelt hochleistungsfähige In-Memory Analytics-Lösungen.

SAS In-Memory Analytics führt Berech-nungen im Speicher auf jedem Server-knoten durch – in einem entsprechend konfigurierten Verband von Servern. Durch eine Optimierung der Algorithmen auf die neue Hardware-Infrastruktur wird ein extrem hoher Grad an Paralle-lisierung erreicht. Die Ergebnisse und die zugehörigen Daten verbleiben im gemeinsamen Speicher, sodass neue Szenarien oder zusätz li che Berech-

7

de daher vor allem dann durchgeführt, wenn entsprechen de Berichtszwänge vorlagen.

Mit einer neuen SAS High-Performance Analytics-Lösung konnte dieselbe Be-rechnung auf wenige Minuten gesenkt werden. Die bisherige Pflichtübung auf Drängen der Aufsichtsbehörden kann nun im operativen Geschäft genutzt werden. So kann etwa bei der Gestal-tung neuer Finanzinstrumente deren Auswirkung auf das Gesamtrisikoport-folio simuliert und das Produkt entspre-chend optimiert werden.

Kampagnenoptimierung

Viele Unternehmen im Handel verfügen über sehr große Kundendatenbanken und stehen regelmäßig vor der Frage-stellung, welchem Kunden sie welches Angebot über welchen Kanal unterbrei-ten sollen. Gleichzeitig stehen im Ideal-fall historische Daten über vergangene Aktionen zur Verfügung. Die Komplexität einer entsprechenden Optimierung liegt in der großen Datenmenge. In einem konkreten Kundenbeispiel ging es um einen großen Händler, der 25 Millionen Kunden in der Ansprache hat und die-

sen etwa 20 verschiedene Produkte über 40 verschiedene Kanäle anbieten will. Es gilt also, etwa 800 Kombinatio nen aus Ansprachekanal und Produktange-bot zu optimieren. Eine ganze Reihe von Restriktionen sind gegeben: nur eine E-Mail pro Woche, nur ein Brief pro Monat, Budget für maximal 7 Millionen SMS und maximal 300.000 MMS.

Gesucht ist die optimale Kampagne: Welche Kunden sind für welches Pro-dukt auf welchem Kanal besonders affin? Die Optimierung ist eine komplexe Analyseaufgabe, in der Millionen von Berechnungen durchgeführt werden. Bisher dauerte das in diesem speziellen Fall etwa fünfeinhalb Stunden.

Mit einer neuen SAS High-Performance Analytics-Lösung dauert die gleiche Analyse nur noch wenige Minuten. Das erlaubt es, noch mehr Daten und noch mehr Varianten zu berechnen und etwa mit den Restriktionen zu „spielen“: „Wäre die Kampagne profitabler, wenn mehr als 300.000 MMS eingesetzt werden könnten?“

Anwendungsbeispiele

High-Performance Analytics in der Praxis

Abschließend sollen zwei Beispiele kon-krete Anwendungsszenarien beschrei-ben, um den Nutzen von High-Perfor-mance Analytics zu demonstrieren.

Risikoberechnung

Die Berechnung aller vorhandenen Ri-siken im Portfolio einer Bank ist fachlich wie technisch anspruchsvoll. Im Fall eines Entwicklungspartners für SAS High-Performance Analytics verteilen sich Risiken auf etwa 45.000 verschie-dene Finanzinstrumente und werden bestimmt über etwa 100.000 Marktpa-rameter (Preise, Fristen, Fälligkeiten etc.). Die Berechnung des Gesamtrisi-kos setzt etwa 8,8 Milliarden einzelne hochkomplexe Value-at-Risk-Berech-nungen voraus.

Im Rahmen eines Stresstests sollen nun Marktauswirkungen auf das Ge-samtrisiko der Bank untersucht wer-den. Bisher nahm diese Berechnung etwa 18 Stun den in Anspruch und wur-

Merkmal Nutzen

Grid Computing • Dynamische Verteilung der Rechenlast

• Hohe Verfügbarkeit

• Verteilte Verarbeitung

• Einsatz von Standardhardware

• Effiziente Verarbeitung der Rechenaufträge

und Anfragen

• Vermeidung von Arbeitsausfall und Informa-

tionslücken

• Höherer Durchsatz, kürzere Antwortzeit

• Kostenvorteile

In-Database • Datenverarbeitung und Analyse innerhalb der

Datenbank ohne Datenbewegung

• Beschleunigte Modellierung und Analyse

• Integration in bisherige Datenbankarchitektur

• Programmcode unverändert einsetzbar

• Bessere Data Governance

• Ergebnisse liegen schneller vor

• Investitionsschutz

• Effizienzgewinn

In-Memory • Datenverarbeitung und Analyse im

Hauptspeicher

• Hochperformante Analysefunktionen in aus-

gewählte SAS Lösungen integriert

• Robuste Infrastruktur und Datenbanken zur

Dauerspeicherung und Ausfallsicherung

• Zeitnahe Lösung hochkomplexer Probleme

• Zuverlässige Ergebnisse durch verfeinerte

Modellierung

• Beseitigung von Engpässen

P12

120

199

SAS and all other SAS Institute Inc. product or service names are registered trademarks or trademarks of SAS Institute Inc. in the USA and other countries. ® indicates USA registration. Other brand and product names are trademarks of their respective companies. Copyright © 2012, SAS Institute Inc. All rights reserved.

SAS ist Marktführer bei Business Analytics-Software und weltweit größter unabhängiger Anbieter im Business

Intelligence-Markt. Die SAS Lösungen für eine integrierte Unternehmenssteuerung helfen Unternehmen an

insgesamt mehr als 55.000 Standorten dabei, aus ihren vielfältigen Geschäftsdaten konkrete Informationen

für strategische Entscheidungen zu gewinnen und damit ihre Leistungsfähigkeit zu steigern. Mit den Software-

lösungen von SAS entwickeln Unternehmen Strategien und setzen diese um, messen den eigenen Erfolg,

gestalten ihre Kunden- und Lieferantenbeziehungen profitabel, steuern die gesamte Organisation und erfüllen

regulatorische Vorgaben. 90 der Top 100 der Fortune-500-Unternehmen vertrauen auf SAS. Firmensitz der 1976

gegründeten US-amerikanischen Muttergesellschaft ist Cary, North Carolina (USA). SAS Deutschland hat seine

Zentrale in Heidelberg und weitere Niederlassungen in Berlin, Frankfurt am Main, Hamburg, Köln und München.

Fazit

„Big Data“ steht als Schlagwort für die wachsende Bedeutung des Rohstoffs „Daten“ in den Unternehmen. In erster Linie gilt es, die bereits intern vorhan-denen Datentöpfe besser zu nutzen, indem diese zusammengeführt und auf sinnvolle Muster untersucht werden. In einem zweiten Schritt können gezielt weitere externe Datenquellen erschlos-

SAS® HIGH-PERFORMANCE ANALYTICS

sen werden. Es gibt keine eindimensio -nale Antwort auf die Herausforderungen, die dadurch entstehen. Im Gegenteil, es geht darum, je nach Anforderung und geplanter Nutzung die jeweils passende Antwort zu finden – die nur zu einem Teil aus Technologie besteht. SAS un-terstützt seine Kunden in der Entwick-lung und Anwendung von Big-Data-Strategien mit einem ganzen Bündel von bahnbrechenden Innovationen.

Über SAS

Gleichzeitig wächst insgesamt die Be-deutung von Analytics, der angestamm -ten Kernkompetenz von SAS.

Wie auch immer man es dreht und wendet: Die Reduktion des Information Overload auf die wirklich relevanten Daten gelingt nicht mit rückwärtsge-wandtem, klassischem Reporting – sondern nur mit Analytics, die direkt in die Geschäftsprozesse eingebettet ist.

b.guenter
accantec Logo mit Adresse