43
<Insert Picture Here> Product Data Quality Verbesserung der Artikel-Stammdatenqualität, automatisch und in Echtzeit Ralf Kittel, Oracle „Die Pflege von Stammdaten ist die Grundlage für wichtige Geschäftsprozesse und entscheidungen.“

die Grundlage für wichtige · Montaje de Yugo, hp = 10 Item Motor Classification 26101600 Power 10 horsepower Voltage 115 Mounting Yoke. Artikelstammdaten Wie sie in IT-Systemen

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

<Insert Picture Here>

Product Data Quality

Verbesserung der Artikel-Stammdatenqualität,

automatisch und in Echtzeit

Ralf Kittel, Oracle

„Die Pflege von Stammdaten ist

die Grundlage für wichtige

Geschäftsprozesse und –

entscheidungen.“

The following is intended to outline our general

product direction. It is intended for information

purposes only, and may not be incorporated into

any contract. It is not a commitment to deliver any

material, code, or functionality, and should not be

relied upon in making purchasing decisions. The

development, release, and timing of any features

or functionality described for Oracle’s products

remains at the sole discretion of Oracle.

Safe Harbor Statement

Agenda

1. Datenqualität – Status Quo

2. Produkt-Stammdaten

3. Möglichkeiten der Qualitätssteigerung

4. Nutzen von semantischen Technologien

5. Integration in bestehende IT-Systeme

6. Beispiele aus Retail, High-Tech, Life Science, Public

7. Demo

Jede Firma braucht saubere Daten.

Viele glauben, sie trifft es nicht.

Doch es kann schon

zu spät sein.

Datenqualität

Quelle: Autobild.de

Warum kann ich nicht die

Berichtsergebnisse sehen, die ich

brauche?

Warum habe ich so viele doppelte

Daten? Die meinsten sind

inkorrekt.

Warum greifen meine

Anwendungen auf veraltete Daten

zurück?

Herausforderungen des Information Managements

Kontinuierliches Steigern der Datenqualität

Wie kommen schlechte Stammdaten in eine IT-

Applikation?

„SAP-Anwender vertrauen der Qualität der eigenen

Daten nicht!“ Quelle: http://www.e3cms.de/index.php?id=3223

Neue Barc-Studie (Februar 2010) untersucht

Wahrnehmung von Datenqualität bei Anwendern von

SAP-Systemen.

Bild: Die wichtigsten Daten im Unternehmen

Quelle: BARC Institut, Würzburg, März 2011

Wie kritisch ist die Qualität Ihrer Unternehmensdaten

für unternehmerische Entscheidungen?

Quelle: BARC Institut, Würzburg, März 2011

Top 5 Probleme beim Einsatz von BI-SoftwareQuelle: The BI Survey 9 und BARC Institut, Würzburg, März 2011

Was sind Produktdaten?

Bei Datenqualität denken viele zunächst

nur an KundenstammdatenKunde

(PLZ, Ort, etc.)

Produkt (Benennung, Klassifizierung, Artikelnummer, Lieferant, Preis, Verfügbarkeit, Lagerort, Stückliste, SKU, Betriebsmittel, Verpackung, etc.)

Over 30,000 categories …Single format/ country

Kundenstammdaten

• Relativ feste Syntax

• Schreibfehler

• Namen Äquivalenten

• Abgleich basierend auf Wahrscheinlichkeiten

Artikelstammdaten

• Haben keine fixe Syntax – wenige Standards

• Unendliche Variabilität - Format, Inhalt, Syntax

• Haben unterschiedliche Regelungen für die einzelnen Artikelkategorien

• werden oft von mehreren Anwendungen bzw. Abteilungen verwendet/erzeugt

• sind bei analytischen Auswertungen oft die Kriterien, nach denen ausgewertet wird.

• werden meistens langfristig gehalten.

• Komplexe Lieferkette (Hersteller, Distributor, Zulieferer, …)

Artikelstammdaten

Unstrukturiert & nicht standardisiert

Was ist das?

10hp motor 115V Yoke mount

mtr, ac(115) 10 horsepower 115volts

MOT-10,115V, 48YZ,YOKE

This 10hp yoke mounted motor is rated for 115V with a 5 year warranty

10 Caballos, Motor, 115 Voltios

TEAO HP = 10.0 1725RPM 115V 48YZ YOKE MTR

Motor, TEAO, 1725 RPM, 48YZ, 15 Voltios, Montaje de Yugo, hp = 10

Item Motor

Classification 26101600

Power 10 horsepower

Voltage 115

Mounting Yoke

Artikelstammdaten

Wie sie in IT-Systemen zu finden sind

Product IDManufa-

cturerDescription Product Type Power Voltage Mount

ABC123 AA Inc. 10hp motor 115V Yoke mount Motor, AC/DC 10hp 115V Yoke

abc-123 A.A. mtr, ac(115) 10 horsepower 115volts AC/DC Motor 10 115 AC.

ABC/123/Q AA/Craft 10 Caballos, Motor, 115 Voltios Mot-AC 10 H-pow 115

QA-ST5 Craft TEAO HP = 10.0 1725RPM 115V 48YZ YOKE MTR 26101604

Z99 Z99 MOT-10,115V,48YZ,YOKE Z99

Motor powered pulley, 3/4" Motor

Inkonsistente

Namen

Viele Informationen, aber

meistens nicht

standardisiert und

unberechenbar

Attribute nicht

standardisiert,

fehlend oder falsch

Falsch

klassifiziert

Inkonsisten

tes Format

Inkonsistente und

fehlerhafte

Klassifizierung

Vielfache

Dubletten

(oft schwer

zu

entdecken)

Verwendung von Produktdaten im

Order to Cash ProzessVertrieb, Entwicklung, Beschaffung, Planung, Herstellung …

• Lieferantendaten sind

oft nicht standardisiert.

• Produktdaten werden

oft in verschiedenen

Systemen geführt.

• Ungenaue Daten führen

zu Fehlern in der

Planung und in der

Fertigung.

• Bestellung auf Grund

von Fehlern im

Produktkatalog.

met

Asia OperationsEuropean Ops Service Providers Supply Network

Folgen schlechter Produktdaten

Allgemein

Folgen schlechter Produktdaten

Kaizen: 7 Verschwendungsarten

7 Mudas

BeständeEnd-, Halbfertigprodukte,

Zulieferteile u. Materialien die als Bestände lagern sind nicht

wertschöpfend

7

TransportBewegung von Materialien

oder Produkten ist nicht wertschöpfend

5

Überproduktionmehr als notwendig fertigen

1

BewegungJede Körperbewegung, die

nicht zum Wertzuwachs beiträgt ist unproduktiv

4

Nacharbeit/FehlerFehlerhafte Produkte stören

den Produktionsfluss und erfordern teure Nachbesserung

3

2

Wartenuntätige Hände eines

Mitarbeiters. Prozesstaktung nicht optimiert

6Herstellung

Unzureichende Technologieoder Konstruktion

Muda = japanisch für Verschwendung

Häufige Lösungsstrategien …

reichen bei Artikelstammdaten nicht aus

Manual

– Viel zu teuer

– Viel zu langsam

– Nicht wirklich skalierbar

;3.5 MM 20 MM

* ^ | G = "MM" | ^ | G = "MM" | [{FM}="CATHETER" ] |

[{T1}="BALLOON"]| [{BR}!="OPTIPLAST"]

COPY [1] temp1

COPY_A [2] {Q1}

COPY "X" {C1}

COPY [3] temp2

COPY_A [4] {Q2}

RETYPE [1] 0

RETYPE [2] 0

RETYPE [3] 0

RETYPE [4] 0

CALL Ballon_Measurements

Individual-

programmierung

– Zeitaufwändig

– Zu viele

Ausnahmen

– Unvollständige /

zweideutige

Antworten

“Massenexport nach

Excel”

– Zu teuer

– Zu langasam

– Keine kontinuierliche

Kontrolle

SAP Excel-Export/Import für Stammdatenpflege

Manuelle StammdatenPflege mit Excel-Unterstützung

Quelle: http://www.e-3.de/

Der Lösungsansatz:

Automatisches Extrahieren, Aufbereiten, Validieren und

Speichern von Stammdaten

Extrahieren

SpeichernValidieren / Testen

Aufbereiten

Die Lösung: Oracle Product Data Quality Lifecycle

Iterativer Prozess zur langfristigen Verbesserung der

Datenqualität

Überwachen Analysieren

BereinigenAnreichern

Die Lösung: DataLens™

Automatisches Aufbereiten & Validieren

• DateLens™ entspricht einer optischen Linse

• Zeigt die Daten so an, wie gewünscht (eingestellt)

• keine „dauerhafte“ Datenhaltung

• Automatisch und in Echtzeit

• Enthält Kontextwissen über z.B.:

• verschiedenen Produktkategorien

• Vokabular

• Abkürzungen

• Regeln

• Attribute

• gültige Werte

• Übersetzungen

• Standards

• Klassifizierungen

• Informationserkennung im Zusammenhang (Kontext) und mit der richtigen

Bedeutung(Semantik)

• selbstlernend

• in jeden beliebigen Prozess integrierbar (z.B. Stammdatenanlage)

Aufbereiten & Validieren

Semantik macht den Unterschied.

Wikipedia: Semantik nennt man die Wissenschaft von

der Bedeutung der Zeichen und Wörter.

• Die Bank, 1000$

– Geldinstitut oder Sitzgelegenheit?

• 3M, Medizin

– 3 Meter oder Unternehmen?

• Schuh, 4 polig

– Laufschuh oder Klemmenschuh?

Was leistet die Semantische Erkennung von

Product Data Quality?

• Standardisieren von Attributen - jeder Standard

• Standardisieren von Beschreibungen - beliebige Länge oder Norm

• Übersetzen - von jeder Sprache in jede Sprache

• Klassifizieren mit jedem beliebigen Schema - UNSPSC, eClass, Zoll, etc.

• Validieren – Attributwerte

• Anreichern - aus externen Quellen

• Abgleichen - ID Prüfung, funktionelle Übereinstimmung, usw.

• Merge – Regelbasiertes Zusammenführen

• Gap-Analyse – Erkennen von fehlenden Informationen und ggf. anreichern

• Verbesserungsvorschläge

Beispiel Product Data Quality Console

Real-time interactive User Interface spart Zeit beim Testen

Standardisieren von Varianten in ein Format

• Standardformat kann jederzeit geändert werden

• Standardformat kann allgemeingültig sein oder z.B. für einen speziellen Artikel-Typ

Oracle Product Data QualityErkennen von Standards & Konvertierung/Umrechnung

Data StandardizationAutomatisches Data-Cleansing

Keine Standarddaten (vorher)

Data

StandardizationEngine

Standardisierte Data (nachher)

Standardisierung der Item Beschreibung

Übersetzen von jeder Sprache in jede Sprache

Attribute extrahieren und standardisieren

Klassifizierung

Industrie-und Unternehmensstandards anwenden

1

2

3

4

5

RESPCF AX300OHM1/4W5%

220 ohm CF AX 0.5W 10 % ress

English

Spanish

Russian

Description

Resistance Power Tolerance

Catalog Category UNSPSC Procurement Class

1

2

4

3

5

300 Ohm 0.25 Watt 5%

Resistor 32121609 R-I

Resistor 300 Ohm 5% 0.25 Watt Axial Carbon Film

Resistor 300 Ohmio 5% 1/4 Vatio Película Axial de Carbón

Резистор 300 Ом 5% 1/4 Ватт Аксиальная Карбонная Пленка

English

Spanish

Russian

Description

Resistance Power Tolerance

Catalog Category UNSPSC Procurement Class

220 Ohm 0.5 Watt 10%

Resistor 32121609 R-X

Resistor 220 Ohm 10% 0.5 Watt Axial Carbon Film

Resistor 220 Ohmio 10% 0.5 Vatio Película Axial de Carbón

Резистор 220 Ом 10% 0.5 Ватт Аксиальная Карбонная Пленка

Die Lösung: Oracle Product Data Quality (PDQ)

Extrahieren und Publizieren von Stammdaten

Extrahieren Speichern/Publizieren

CRM

EBS

SAP

GDSN

Other

Users

CRM

EBS

SAP

Custom Apps

BI

Extrahieren: Oracle PDQ kann Daten aus vielen verschiedenen Datenquellen extrahieren, z.B. Texte, Microsoft Excel-Tabellen, Web Services, XML und Datenbanken. Dabei kann PDQ sogar auf implementierte DB-Funktionen/Prozeduren zugreifen.

Publizieren: Oracle PDQ kann die bearbeiteten Daten in verschiedenen Zielsysteme speichern - auch gleichzeitig in mehrere Zielsysteme z.B. im XML-, Excel- oder Text-Format. Die Daten können auch automatisch an einen FTP-Server versendet werden.

CRM

EBS

SAP

GDSN

Other

Users

CRM

EBS

SAP

Custom Apps

BI

Prozessintegration Oracle PDQ Integration in ein MDM/PIM-System und Prozess

Product Data HubRecord

Sh

are

Co

nso

lid

ate

Govern

Cleanse

Integration in jedes beliebige MDM/PIM-System.

Standardintegrationen verfügbar, oder via Web-Services u/o

SOA-Architektur.

Product Data Quality – Anwendungsbeispiel

Prozess-/ Situationsabhängiger

Workflow

Typische Einsatzgebiete

• Migrations-/Systemharmonisierungsprojekte

• Datenintegrationsprojekte

„Wie sehen die Daten aus, die zusammengeführt werden sollen“

• Business Intelligence („Garbage in garbage out“)

• Kostenreduktion im Beschaffungswesen, z.B.

Lieferantenreduktion – Wer liefert was? Ausgabenanalysen, etc.

• Reduktion Time-to-Market, z.B. Teilereduktion

• User Experience im Webshop steigern

• Stammdatenübersetzung/-normierung

• Funktionserhöhung innerhalb IT-Anwendungen (z.B. ERP, PLM, SCM)

• Governance und Compliance

• Integration in MDM/PIM

• Risikomanagement

• Fehlermanagement

• Vollständigkeitsprüfung

• Data Quality Firewall /-Lifecycle

Product Data Quality – Auszug aus unsere Kundenliste

Manufacturing & Distribution Healthcare Retail

MC Healthcare/ Nihon Hospital

BEISPIELE

Beispiel: Elektronische Komponenten - WiderstandAnalysieren, Extrahieren, Transformieren, Standardisieren -

pro Produktkategorie

Sehr variable Syntax (Muster)

DataLens

Semantische Erkennung identifiziert die

Artikelkategorie und die Attribute mit sehr variablen

Daten.

Der Artikel kann dann wie gewünscht gereinigt

(standardisierten) werden.

Extraktion und Standardisierung

der Attribute

Klassifikation gemäß verfügbaren Schemas

und Industrie- oder eigene Standards

Normierte Beschreibungen passen zu allen Standards und

Formate

Übersetzung in jede beliebige Sprache (inkl. double-byte

Sprache)

DataLens™

Beispiel: BüroordnerAnalysieren, Extrahieren, Transformieren, Standardisieren -

pro Produktkategorie

Description

GLOVE PROTEGRITY SMTH GRIP MICRO PF LATEX SURG 6.0" LRG 100 / BX 5LBS

GLOVE LARGE 100EA PROTEGRITY PF LATEX SURGICAL 6.0" TEXTURE GRIP

GLVS LINER PWD 6.0" FR LTX SUG TEXT GRP ULTRATUFF CUT RESIST STRL LG

PROTE GLVS SURG LARGE PF SMTH GRIP CASE OF 1000 LTX BLU 9.0IN.

GLVE PROTGRITY TEXT SMT PF LATX SURG 7.5IN MD 250 CTN 10LBS

GLVE PROTEGRITY TEXT 100 BOX PF LATEX SURGICAL 5.5IN 20-LBS. MEDIUM

LF GLOVES TEXT ESTM SMT PF SYNTHETIC XLG SURG 7.5IN. 500 / CASE 20 LBS.

GLOV EXAM LTX 7.5IN FREE SYN ( VINYL ) VHA+ PF N/S SM 17.5 LBS.

XLRG GLOVES SMTH STERILE PWD LTX PROCEDURE 8.0IN

GLOVE EXAM TEXT 6.5" LTX FR N/S PWD VINYL INSTAGARD SM TEXT GRIP

GLOVE 8IN. SMTH MD NOVA PLUS PF NITRILE EXAM TEXTURE

CR100BT BROWN 8" SMOOTH GRIP LATEX MED CLEANRM GLOVE 5.5 IN 10 LBS TUFFY

ESTEEM 6.5" GLOVE EXAM BOX OF 100 LATEX VHA+ TEXT PF N/S LG 50LBS

SMTH GRIP ESTM 7.5" GLOVE LF EXAM SYN VHA+ PF N/S MED 12 DOZ 100OZ.

GLV PF ESTEEM NEU-THERA 8.5IN. NITRILE EX SZ XL 5PDS

GLV EXAM PF SYN ESTEEM W/NEU-THERA 7.0" SZ MD 200/BOX 20-LBS

MED GLVE EXAM N/S PF 500 COUNT LATEX POSITIVE TOUCH ESTEEM 7.5"

GLV EXAM ESTEEM LATEX VHA+ TXT PWDRLESS N/S 5.5" XS 100 PER CTN

TUFFY CR100BT BROWN LATEX CLEANROOM GLOVE 8.5 " SMOOTH GRP 10LBS. XLRG

XS GLV CLN PROCES TXT GRP ULTRACLEAN 100 PER BX STER SYN DURAPRENE CP 7.5IN 12LBS.

Beispiel: Medizinische Handschuhe (Life Science)

Item Type Size Materials Grip Brand Length Shipping Weight

Surgical Large Latex Smooth Protegrity 6.0 IN. 5 LBS.

Surgical Large Latex Textured Protegrity 6.0 IN.

Surgical Large Latex Textured Ultratuff 6.0 IN.

Surgical Large Latex Smooth Protegrity 9.0 IN.

Surgical Medium Latex Smooth Protegrity 7.5 IN. 10 LBS.

Surgical Medium Latex Textured Protegrity 5.5 IN. 20 LBS.

Surgical Extra Large Synthetic Textured Esteem 7.5 IN. 20 LBS.

Exam Small Latex 7.5 IN. 17.5 LBS.

Procedure Extra Large Latex Smooth 8.0 IN.

Exam Small VINYL Textured Instagard 6.5 IN.

Exam Medium Nitrile Smooth Nova Plus 8 IN.

Cleanroom Medium Latex Smooth Tuffy 8 IN. 10 LBS.

Exam Large Latex Textured Esteem 6.5 IN. 50 LBS.

Exam Medium Synthetic Smooth Esteem 7.5 IN. 100 OZ.

Exam Extra Large Nitrile Esteem 8.5 IN. 5 LBS.

Exam Medium Synthetic Esteem 7.0 IN. 20 LBS.

Exam Medium Latex Positve Esteem 7.5 IN.

Exam Extra Small Latex Textured Esteem 5.5 IN.

Cleanroom Extra Large Latex Smooth Tuffy 8.5 IN. 10 LBS.

Cleanroom Extra Small Synthetic Textured Ultraclean 7.5 IN. 12 LBS.

Extract & Standardize

Sehr variable Syntax (Muster)

Beispiel: Grundbuch Dokumente (Freitext)

Beispiel:

Grundbuchinformationen in Freitext. Wichtige Informationen sind aus dem Text extrahiert worden, um strukturierte Suche zu unterstützen.

KUNDENBEISPIELE

39

Data Mastering in Action

Sampled 28k items across 20 categories

2120 Capacitors:

11976 Resistors:

Corrected, enriched, standardized

…in real-time

Primary Resistor Attributes

Before

% Populated

Resistance 39%

Tolerance 36%

Power 35%

Classification - DRI 40%

Classification - HTS 15%

Classification - UNSPSC 0%

After

% Populated

96%

98%

98%

100%

100%

100%

Primary Capacitor

Attributes

Before

% Populated

Capacitance 23%

Tolerance 23%

Voltage 21%

Classification - DRI 40%

Classification - HTS 15%

Classification - UNSPSC 0%

After

% Populated

98%

99%

98%

100%

100%

100%

40

Standardize & validate for load

ItemHub

Search

X-RefExternalDB

Cleanup legacy

Transform and integrate between systems

Drive Standards System-by-System, Process-by-Process

41

Data Challenges – How Many Ways Can You Say “3M”?

42

Data Challenges – Same Product, Different Numbers

3M™ DuraPrep™ Surgical Solution (Iodine Povacrylex [0.7% available Iodine] and Isopropyl Alcohol, 74% w/w) Patient Preoperative Skin Preparation

Allegiance - M8630

Owens & Minor - 4509008630

BBMC-Colonial - 045098630

BBMC-Durr - 081048

Kreisers - MINN8630

Midwest - TM-8630

Pacific - 3/M8630

UnitedUMS - 001880

Industry Distributor Numbers

for 3M Product # 8630:

Different distributors and hospitals

use different identification numbers

Oracle PDQ - Zusammenfassung

Quality Governance – Data Steward Dashboard

Standardize• Std. Classification(s)

• Std. Attributes

• Std. Descriptions

• Translate (inbound)

Match• De-duplicate

• Merge

Repurpose• Translate (outbound)

• (Re-)classify

• (Re-)standardize

• (Re-)format

Exception Management – Validation & Remediation

Enrich• Classify

• Extract/append info

Semantic Recognition – Contextual understanding & learning

Fragen