Transcript
Page 1: De 910HF1 DataExplorer Getting Started Guide De

Informatica Data Explorer (Fassung 9.1.0 HotFix 1)

Kurzanleitung

Page 2: De 910HF1 DataExplorer Getting Started Guide De

Informatica Data Explorer Kurzanleitung

Fassung 9.1.0 HotFix 1Juni 2011

Copyright (c) 1998-2011 Informatica. Alle Rechte vorbehalten.

Diese Software und die zugehörige Dokumentation enthalten proprietäre Informationen der Informatica Corporation, werden im Rahmen eines Lizenzvertrages mitEinschränkungen hinsichtlich Verwendung und Veröffentlichung zur Verfügung gestellt und sind urheberrechtlich geschützt. Das Zurückentwickeln der Software istuntersagt. Ohne ausdrückliche schriftliche Genehmigung der Informatica Corporation darf kein Teil dieses Dokuments zu irgendeinem Zweck vervielfältigt oderübertragen werden, unabhängig davon, auf welche Art und Weise oder mit welchen Mitteln (elektronisch, mechanisch, durch Fotokopieren, Aufzeichnen usw.) diesgeschieht. Diese Software ist möglicherweise durch US-amerikanische und/oder internationale Patente und weitere anhängige Patente geschützt.

Die Verwendung, Vervielfältigung oder Veröffentlichung der Software durch die US-Regierung unterliegt den Bestimmungen des jeweiligen Softwarelizenzvertrags sowieggf. den Bestimmungen in DFARS 227.7202-1(a) und 227.7702-3(a) (1995), DFARS 252.227-7013©(1)(ii) (OKT 1988), FAR 12.212(a) (1995), FAR 52.227-19 oder FAR52.227-14 (ALT III).

Die in diesem Produkt und in dieser Dokumentation enthaltenen Informationen können jederzeit ohne vorherige Ankündigung geändert werden. Sollten Sie mit diesemProdukt oder dieser Dokumentation Probleme haben, teilen Sie uns dies bitte schriftlich mit.

Informatica, Informatica Platform, Informatica Data Services, PowerCenter, PowerCenterRT, PowerCenter Connect, PowerCenter Data Analyzer, PowerExchange,PowerMart, Metadata Manager, Informatica Data Quality, Informatica Data Explorer, Informatica B2B Data Transformation, Informatica B2B Data Exchange InformaticaOn Demand, Informatica Identity Resolution, Informatica Application Information Lifecycle Management, Informatica Complex Event Processing, Ultra Messaging undInformatica Master Data Management sind Warenzeichen oder eingetragene Warenzeichen der Informatica Corporation in den USA und anderen Ländern. Alle weiterenFirmen- und Produktnamen sind möglicherweise Markennamen oder Warenzeichen der jeweiligen Eigentümer.

Teile dieser Software und/oder Dokumentation sind durch die Urheberrechte Dritter geschützt, und zwar einschließlich, ohne Einschränkung: Copyright DataDirectTechnologies. Alle Rechte vorbehalten. Copyright © Sun Microsystems. Alle Rechte vorbehalten. Copyright © RSA Security Inc. Alle Rechte vorbehalten. Copyright ©Ordinal Technology Corp. Alle Rechte vorbehalten. Copyright © Aandacht c.v. Alle Rechte vorbehalten. Copyright Genivia, Inc. Alle Rechte vorbehalten. CopyrightIsomorphic Software. Alle Rechte vorbehalten. Copyright © Meta Integration Technology, Inc. Alle Rechte vorbehalten. Copyright © Intalio. Alle Rechte vorbehalten.Copyright © Oracle. Alle Rechte vorbehalten. Copyright © Adobe Systems Incorporated. Alle Rechte vorbehalten. Copyright © DataArt, Inc. Alle Rechte vorbehalten.Copyright © ComponentSource. Alle Rechte vorbehalten. Copyright © Microsoft Corporation. Alle Rechte vorbehalten. Copyright © Rouge Wave Software, Inc. AlleRechte vorbehalten. Copyright © Teradata Corporation. Alle Rechte vorbehalten. Copyright © Yahoo! Inc. Alle Rechte vorbehalten. Copyright Glyph & Cog, LLC. AlleRechte vorbehalten. Copyright © Thinkmap, Inc. Alle Rechte vorbehalten.. Copyright © Clearpace Software Limited. Alle Rechte vorbehalten. Copyright © InformationBuilders, Inc. Alle Rechte vorbehalten. Copyright © OSS Nokalva, Inc. Alle Rechte vorbehalten.. Copyright Edifecs, Inc. Alle Rechte vorbehalten.. Copyright CleoCommunications, Inc. Alle Rechte vorbehalten. Copyright © International Organization for Standardization 1986. Alle Rechte vorbehalten. Copyright © ej-technologiesGmbH . Alle Rechte vorbehalten. Copyright © Jaspersoft Corporation. Alle Rechte vorbehalten.

Dieses Produkt enthält Software, die von der Apache Software Foundation (http://www.apache.org/) entwickelt wurde, und andere Software, die unter den Bedingungendes Apache-Lizenzvertrags, Version 2.0, lizenziert ist („Lizenz“). Eine Kopie des Lizenzvertrags erhalten Sie unter http://www.apache.org/licenses/LICENSE-2.0. Dieunter dem Lizenzvertrag vertriebene Software wird „WIE BESEHEN“, OHNE JEGLICHE GEWÄHRLEISTUNG, weder ausdrücklich noch konkludent, vertrieben, es seidenn, dies wird durch anwendbares Recht angeordnet oder schriftlich vereinbart. Rechte und Einschränkungen für bestimmte Sprachen finden Sie in derentsprechenden Lizenzvereinbarung.

Dieses Produkt enthält Software, die von Mozilla (http://www.mozilla.org/) entwickelt wurde, Software Copyright The JBoss Group, LLC, Alle Rechte vorbehalten;Software Copyright © 1999-2006 by Bruno Lowagie und Paulo Soares, und andere Software, die gemäß dem GNU Lesser General Public License Agreement unterhttp://www.gnu.org/licenses/lgpl.html lizenziert ist. Die Unterlagen werden wie besehen kostenlos von Informatica bereitgestellt, ohne ausdrückliche oder konkludenteGarantie, einschließlich, aber nicht beschränkt auf konkludente Garantien der Handelsüblichkeit und/oder Eignung für einen bestimmten Zweck.

Das Produkt enthält ACE(TM) und TAO(TM) Software, Copyright Douglas C. Schmidt und seine Forschungsgruppe an der Washington University, University ofCalifornia, Irvine und Vanderbilt University, Copyright (©) 1993-2006, Alle Rechte vorbehalten.

Dieses Produkt enthält Software, die von OpenSSL Project zur Verwendung im OpenSSL Toolkit entwickelt wurde (Copyright The OpenSSL Project. Alle Rechtevorbehalten). Die erneute Verteilung dieser Software unterliegt den Bedingungen, die unter http://www.openssl.org und http://www.openssl.org/source/license.html.eingesehen werden können.

Dieses Produkt enthält urheberrechtlich geschützte Curl-Software (Copyright 1996-2007, Daniel Stenberg, <[email protected]>). Alle Rechte vorbehalten. Die mit dieserSoftware verbundenen Berechtigungen und Einschränkungen unterliegen den unter „http://curl.haxx.se/docs/copyright.html“ verfügbaren Bedingungen. Die Erlaubnis,diese Software für jeden beliebigen Zweck gegen Gebühr oder kostenlos zu verwenden, zu kopieren, zu ändern und zu verteilen, wird hiermit erteilt, sofern die obengenannten urheberrechtlichen Hinweise und diese Erlaubnis in allen Exemplaren angegeben werden.

Das Produkt enthält Software, Copyright 2001-2005 (©) MetaStuff, Ltd. Alle Rechte vorbehalten. Die mit dieser Software verbundenen Berechtigungen undEinschränkungen unterliegen den unter http:///www.dom4j.org/license.html einsehbaren Bedingungen.

Das Produkt enthält Software mit dem Copyright © 2004-2007, The Dojo Foundation. Alle Rechte vorbehalten. Die mit dieser Software verbundenen Berechtigungen undEinschränkungen unterliegen den unter http://dojotoolkit.org/license einsehbaren Bedingungen.

Dieses Produkt enthält urheberrechtlich geschützte ICU-Software, Copyright International Business Machines Corporation und andere. Alle Rechte vorbehalten. Die mitdieser Software verbundenen Rechte und Einschränkungen unterliegen den unter „http://source.icu-project.org/repos/icu/icu/trunk/license.html" einsehbarenBedingungen.

Dieses Produkt enthält Software, Copyright © 1996-2006 Per Bothner. Alle Rechte vorbehalten. Die Ihnen erteilte Berechtigung, diese Materialien zu verwenden,unterliegt den unter http://www.gnu.org/software/ kawa/Software-License.html einsehbaren Bedingungen.

Dieses Produkt enthält urheberrechtlich geschützte OSSP UUID-Software (Copyright © 2002 Ralf S. Engelschall, Copyright © 2002 The OSSP Project Copyright © 2002Cable & Wireless Deutschland). Die mit dieser Software verbundenen Berechtigungen und Einschränkungen unterliegen den unter http://www.opensource.org/licenses/mit-license.php einsehbaren Bedingungen.

Dieses Produkt enthält Software, die von Boost (http://www.boost.org/) oder unter der Softwarelizenz von Boost entwickelt wurde. Die mit dieser Software verbundenenBerechtigungen und Einschränkungen unterliegen den unter http://www.boost.org/LICENSE_1_0.txt einsehbaren Bedingungen. Dieses Produkt enthält Software,Copyright © 1997-2007 University of Cambridge. Die mit dieser Software verbundenen Berechtigungen und Einschränkungen unterliegen den unter http://www.pcre.org/license.txt einsehbaren Bedingungen.

Dieses Produkt enthält Software, Copyright © 2007 The Eclipse Foundation. Alle Rechte vorbehalten. Die mit dieser Software verbundenen Berechtigungen undEinschränkungen unterliegen den unter http://www.eclipse.org/org/documents/epl-v10.php einsehbaren Bedingungen.

Dieses Produkt enthält Software, deren Lizenzbedingungen einsehbar sind unter http://www.tcl.tk/software/tcltk/license.html, http://www.bosrup.com/web/overlib/?License, http://www.stlport.org/doc/ license.html, http://www.asm.ow2.org/license.html, http://www.cryptix.org/LICENSE.TXT, http://hsqldb.org/web/hsqlLicense.html,http://httpunit.sourceforge.net/doc/ license.html, http://jung.sourceforge.net/license.txt, http://www.gzip.org/zlib/zlib_license.html, http://www.openldap.org/software/release/license.html, http://www.libssh2.org, http://slf4j.org/license.html, http://www.sente.ch/software/OpenSourceLicense.html, http://fusesource.com/downloads/license-agreements/fuse-message-broker-v-5-3- license-agreement; http://antlr.org/license.html; http://aopalliance.sourceforge.net/; http://www.bouncycastle.org/licence.html;http://www.jgraph.com/jgraphdownload.html; http://www.jcraft.com/jsch/LICENSE.txt. http://jotm.objectweb.org/bsd_license.html; http://www.w3.org/Consortium/Legal/2002/copyright-software-20021231; http://www.slf4j.org/license.html; http://developer.apple.com/library/mac/#samplecode/HelpHook/Listings/HelpHook_java.html; http://www.jcraft.com/jsch/LICENSE.txt;http://nanoxml.sourceforge.net/orig/copyright.html; http://www.json.org/license.html; and http://forge.ow2.org/projects/javaservice/.

This product includes software licensed under the Academic Free License (http://www.opensource.org/licenses/afl-3.0.php), the Common Development and DistributionLicense (http://www.opensource.org/licenses/cddl1.php) the Common Public License (http://www.opensource.org/licenses/cpl1.0.php), the Sun Binary Code LicenseAgreement Supplemental License Terms, the BSD License (http://www.opensource.org/licenses/bsd-license.php) and the MIT License (http://www.opensource.org/licenses/mit-license.php).

Page 3: De 910HF1 DataExplorer Getting Started Guide De

Dieses Produkt enthält Software, Copyright © 2003-2006 Joe WaInes, 2006-2007 XStream Committers. Alle Rechte vorbehalten. Die mit dieser Software verbundenenBerechtigungen und Einschränkungen unterliegen den unter http://xstream.codehaus.org/license.html verfügbaren Bedingungen. Dieses Produkt enthält Software, dievon der Indiana University Extreme! Lab. entwickelt wurde. Weitere Informationen finden Sie unter http://www.extreme.indiana.edu/.

Diese Software ist durch die U.S.-Patente Nummer 5,794,246; 6,014,670; 6,016,501; 6,029,178; 6,032,158; 6,035,307; 6,044,374; 6,092,086; 6,208,990; 6,339,775;6,640,226; 6,789,096; 6,820,077; 6,823,373; 6,850,947; 6,895,471; 7,117,215; 7,162,643; 7,254,590; 7,281,001; 7,421,458; 7,496,588; 7,523,121; 7,584,422,7,720,842; 7,721,270 sowie 7,774,791; internationale Patente und andere beantragte Patente geschützt.

HAFTUNGSAUSSCHLUSS: Informatica Corporation stellt diese Dokumentation wie besehen bereit, ohne ausdrückliche oder konkludente Garantie, einschließlich, abernicht beschränkt auf konkludente Garantien der Nichtverletzung von Rechten Dritter, der Handelsüblichkeit und/oder Eignung für einen bestimmten Zweck. InformaticaCorporation gewährleistet nicht die Fehlerfreiheit dieser Software oder Dokumentation. Die in dieser Software oder Dokumentation bereitgestellten Informationen könnentechnische Ungenauigkeiten oder Druckfehler enthalten. Die in dieser Software und in diesem Dokument enthaltenen Informationen können jederzeit ohne vorherigeAnkündigung geändert werden.

HINWEISE

Dieses Informatica-Produkt (die „Software“) umfasst bestimmte Treiber (die „DataDirect-Treiber“) von DataDirect Technologies, einem Betreiber von Progress SoftwareCorporation („DataDirect“), die folgenden Bedingungen und Bestimmungen unterliegen:

1.DIE DATADIRECT-TREIBER WERDEN „WIE GESEHEN“ OHNE JEGLICHE GEWÄHRLEISTUNG, WEDER AUSDRÜCKLICH NOCH STILLSCHWEIGEND,BEREITGESTELLT, EINSCHLIESSLICH, JEDOCH NICHT BESCHRÄNKT AUF DIE STILLSCHWEIGENDEN GEWÄHRLEISTUNGEN DERHANDELSÜBLICHKEIT, EIGNUNG FÜR EINEN BESTIMMTEN ZWECK UND DER NICHTVERLETZUNG VON RECHTEN DRITTER.

2. IN KEINEM FALL SIND DATADIRECT ODER DRITTANBIETER DEM ENDBENUTZER GEGENÜBER HAFTBAR FÜR UNMITTELBARE, MITTELBARE,ZUFÄLLIGE, SPEZIELLE, FOLGE- ODER ANDERE SCHÄDEN, DIE SICH AUS DER VERWENDUNG DER ODBC-TREIBER ERGEBEN, UNABHÄNGIGDAVON, OB SIE IM VORAUS ÜBER DIE MÖGLICHKEIT SOLCHER SCHÄDEN INFORMIERT WORDEN SIND ODER NICHT. DIESE BESCHRÄNKUNGENGELTEN FÜR ALLE KLAGEGEGENSTÄNDE, EINSCHLIESSLICH, JEDOCH NICHT BESCHRÄNKT AUF VERTRAGSBRUCH, GEWÄHRLEISTUNGSBRUCH,FAHRLÄSSIGKEIT, KAUSALHAFTUNG, TÄUSCHUNG UND ANDERE UNERLAUBTE HANDLUNGEN.

Teilenummer: IN-PGS-91000-HF1-0001

Page 4: De 910HF1 DataExplorer Getting Started Guide De

Inhalt

Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ivInformatica-Ressourcen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv

Informatica-Kundenportal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv

Informatica-Dokumentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv

Informatica-Website. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv

Informatica-How-To-Bibliothek. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv

Informatica-Knowledge-Datenbank. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v

Informatica-Multimedia-Knowledge-Datenbank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v

Informatica – Weltweiter Kundensupport. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v

Kapitel 1: Erste Schritte - Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1Informatica-Domänenübersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

Verfügbarkeit von Funktionen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Einführen von Informatica Analyst. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

Informatica Developer - Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

Informatica Developer Begrüßungsseite. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

Spickzettel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Data Quality und Data Explorer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Die Tutorial-Story. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Die Tutorial-Struktur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Voraussetzungen des Tutorials. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Informatica Analyst-Tutorial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

Informatica Developer Tool. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

Teil I: Erste Schritte mit Informatica Analyst. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

Kapitel 2: Lektion 1. Einrichten von Informatica Analyst. . . . . . . . . . . . . . . . . . . . 11Einrichten von Informatica Analyst - Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

Aufgabe 1. Anmelden bei Informatica Analyst. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

Aufgabe 2. Ein Projekt erstellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

Aufgabe 3 Einen Ordner erstellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

Einrichten von Informatica Analyst - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

Kapitel 3: Lektion 2. Erstellen von Datenobjekten. . . . . . . . . . . . . . . . . . . . . . . . . 14Erstellen von Datenobjekten - Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Aufgabe 1 Erstellen der Einfachdatei-Datenobjekte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

Aufgabe 2 Datenvorschau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

Erstellen von Datenobjekten - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

Kapitel 4: Lektion 3. Erstellen von Schnellprofilen. . . . . . . . . . . . . . . . . . . . . . . . . 17Erstellen von Schnellprofilen - Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Aufgabe 1 Erstellen und Ausführen eines Schnellprofils. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

Aufgabe 2 Anzeigen der Profilergebnisse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

Inhalt i

Page 5: De 910HF1 DataExplorer Getting Started Guide De

Erstellen von Schnellprofilen - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Kapitel 5: Lektion 4. Erstellen von Kundenprofilen. . . . . . . . . . . . . . . . . . . . . . . . 20Erstellen von benutzerdefinierten Profilen - Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Aufgabe 1 Erstellen eines benutzerdefinierten Profils. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

Aufgabe 2 Ausführen des Profils. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

Aufgabe 3 Drilldown der Profilergebnisse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

Erstellen von benutzerdefinierten Profilen - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . 22

Kapitel 6: Lektion 5. Erstellen von Expressionsregeln. . . . . . . . . . . . . . . . . . . . . . 23Erstellen von Expressionsregeln - Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

Aufgabe 1 Erstellen von Expressionsregeln und Ausführen des Profils. . . . . . . . . . . . . . . . . . . . 24

Aufgabe 2 Anzeigen der Ausgabe der Expressionsregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

Aufgabe 3 Bearbeiten von Expressionsregeln. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

Erstellen von Expressionsregeln - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

Kapitel 7: Lektion 6. Erstellen und Ausführen von Scorecards. . . . . . . . . . . . . . . 26Erstellen und Ausführen von Scorecards - Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

Aufgabe 1 Erstellen einer Scorecard aus den Profilergebnissen. . . . . . . . . . . . . . . . . . . . . . . . 27

Aufgabe 2 Ausführen der Scorecard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

Aufgabe 3 Anzeigen der Scorecard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

Aufgabe 4 Bearbeiten der Scorecard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

Aufgabe 5 Konfigurieren von Schwellenwerten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

Aufgabe 6 Anzeigen von Score-Trenddiagrammen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

Erstellen und Ausführen von Scorecards - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . 29

Kapitel 8: Lektion 7. Erstellen von Referenztabellen aus Profilspalten . . . . . . . . 30Erstellen von Referenztabellen aus Profilspalten - Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . 30

Aufgabe 1 Erstellen einer Referenztabelle aus Profilspalten. . . . . . . . . . . . . . . . . . . . . . . . . . . 31

Aufgabe 2 Bearbeiten der Referenztabelle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

Erstellen von Referenztabellen aus Profilspalten - Zusammenfassung. . . . . . . . . . . . . . . . . . . . 32

Kapitel 9: Lektion 8. Erstellen von Referenztabellen. . . . . . . . . . . . . . . . . . . . . . . 33Erstellen von Referenztabellen - Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

Aufgabe 1 Erstellen einer neuen Referenztabelle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

Erstellen von Referenztabellen - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

Teil II: Inbetriebnahme des Informatica Developer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

Kapitel 10: Lektion 1. Einrichten von Informatica Developer. . . . . . . . . . . . . . . . . 36Einrichten von Informatica Developer - Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

Aufgabe 1 Informatica Developer starten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

Aufgabe 2 Eine Domäne hinzufügen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

Aufgabe 3 Ein Model Repository hinzufügen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

Aufgabe 4 Ein Projekt erstellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

Aufgabe 5 Einen Ordner erstellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

Aufgabe 6 Standard-Data Integration Service auswählen.. . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

ii Inhalt

Page 6: De 910HF1 DataExplorer Getting Started Guide De

Einrichten von Informatica Developer - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

Kapitel 11: Lektion 2. Importieren von physischen Datenobjekten . . . . . . . . . . . . 40Importieren von physischen Datenobjekten - Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

Aufgabe 1 Importieren des Einfachdatei-Datenobjekts Boston_Customers. . . . . . . . . . . . . . . . . . 41

Aufgabe 2 Import des Einfachdatei-Datenobjekts LA_Customers. . . . . . . . . . . . . . . . . . . . . . . . 41

Aufgabe 3 Importieren des Einfachdatei-Datenobjekts All_Customers. . . . . . . . . . . . . . . . . . . . . 42

Importieren von physischen Datenobjekten - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . 43

Kapitel 12: Lektion 3. Profiling von Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44Profiling von Daten - Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

Aufgabe 1 Durchführen einer Join-Analyse mit zwei Datenquellen . . . . . . . . . . . . . . . . . . . . . . 45

Aufgabe 2 Anzeigen der Ergebnisse einer Join-Analyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

Aufgabe 3 Ausführen eines Profils für eine Datenquelle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

Aufgabe 4 Anzeigen von Ergebnissen des Spalten-Profiling . . . . . . . . . . . . . . . . . . . . . . . . . . 47

Profiling von Daten - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

Anhang A: Häufig gestellte Fragen (FAQ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48Informatica Administrator - Häufig gestellte Fragen (FAQ). . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

FAQs zu Informatica Analyst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

Informatica Developer - Häufig gestellte Fragen (FAQ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

Inhalt iii

Page 7: De 910HF1 DataExplorer Getting Started Guide De

EinleitungDie Kurzanleitung des Informatica Date Explorer wurde für Entwickler und Analysten von Datenqualität undDatendiensten verfasst. Sie enthält ein Tutorial, um Einsteigern die Anwendung von Informatica Developerund Informatica Analyst zu erleichtern. Diese Anleitung geht davon aus, dass Ihnen dieDatenqualitäskonzepte, Konzepte von Einfachdateien und relationalen Datenbanken sowie die Datenbank-Engines in Ihrer Umgebung bekannt sind.

Informatica-Ressourcen

Informatica-KundenportalAls Informatica-Kunde können Sie auf die Website für das Informatica-Kundenportal unter http://mysupport.informatica.com zugreifen. Die Site enthält Produktinformationen,Benutzergruppeninformationen sowie Newsletters und bietet Zugriff auf das Informatica-Verwaltungssystemfür den Kundensupport (ATLAS), die Informatica-How-To-Bibliothek, die Informatica-Multimedia-Knowledge-Datenbank, die Informatica-Produktdokumentation und die Informatica User Community.

Informatica-DokumentationDas Informatica-Dokumentationsteam ist sehr um genaue, brauchbare Dokumentationen bemüht. Wenn SieFragen, Kommentare oder Ideen zu dieser Dokumentation haben, wenden Sie sich bitte per E-Mail an dasInformatica-Dokumentationsteam unter [email protected]. Mithilfe Ihrer Rückmeldungenkönnen wir unsere Dokumentationen verbessern. Bitte teilen Sie uns mit, ob wir Sie bezüglich IhrerKommentare kontaktieren dürfen.

Das Dokumentationsteam aktualisiert die Dokumentation nach Bedarf. Um die neueste Dokumentation zuerhalten, navigieren Sie von http://mysupport.informatica.com zur Produktdokumentation.

Informatica-WebsiteAuf die Unternehmenswebsite von Informatica können Sie unter http://www.informatica.com zugreifen. Auf derWebsite finden Sie Informationen über Informatica, seinen Hintergrund, bevorstehende Veranstaltungen undNiederlassungen. Darüber hinaus finden Sie dort Produkt- und Partnerinformationen. Der Bereich „Services“enthält wichtige Informationen zur technischen Unterstützung, zu Schulungen und zu denImplementierungsdienstleistungen.

Informatica-How-To-BibliothekAls Informatica-Kunde können Sie auf die Informatica-How-To-Bibliothek unter http://mysupport.informatica.com zugreifen. Die How-To-Bibliothek ist eine Ressourcensammlung, die Ihnenhilft, mehr über Informatica-Produkte und -Funktionen zu erfahren. Sie umfasst Artikel und interaktiveDemonstrationen, die Lösungen für häufige Probleme bieten, Funktionen und Verhaltensweisen vergleichenund Sie durch spezifische realitätsnahe Aufgaben führen.

iv

Page 8: De 910HF1 DataExplorer Getting Started Guide De

Informatica-Knowledge-DatenbankAls Informatica-Kunde können Sie auf die Informatica-Knowledge-Datenbank unter http://mysupport.informatica.com zugreifen. In der Knowledge-Datenbank können Sie nach dokumentiertenLösungen zu bekannten technischen Problemen mit Informatica-Produkten suchen. Außerdem finden Sie dortAntworten auf häufig gestellte Fragen sowie technische Whitepapers und Tipps. Wenn Sie Fragen,Kommentare oder Ideen zur Knowledge-Datenbank haben, wenden Sie sich bitte per E-Mail an dasInformatica-Knowledge-Datenbankteam unter [email protected].

Informatica-Multimedia-Knowledge-DatenbankAls Informatica-Kunde können Sie auf die Informatica-Multimedia-Knowledge-Datenbank unter http://mysupport.informatica.com zugreifen. Die Multimedia-Knowledge-Datenbank ist eine Sammlung vonMultimedia-Schulungsdateien, mit denen Sie häufig verwendete Konzepte erlernen können und die Sie durchspezifische Aufgaben führen. Wenn Sie Fragen, Kommentare oder Ideen zur Multimedia-Knowledge-Datenbank haben, wenden Sie sich bitte per E-Mail an das Informatica-Knowledge-Datenbankteam unter [email protected].

Informatica – Weltweiter KundensupportSie können sich telefonisch oder über den Online-Support an ein Kundensupport-Center wenden. Der Online-Support erfordert einen Benutzernamen und ein Passwort. Beides erhalten Sie unter http://mysupport.informatica.com.

Telefonisch können Sie den weltweiten Kundensupport von Informatica unter folgenden Telefonnummernerreichen:

Nordamerika / Südamerika Europa / Naher Osten / Afrika Asien / Australien

GebührenfreiBrasilien: 0800 891 0202Mexiko: 001 888 209 8853Nordamerika: +1 877 463 2435

GebührenfreiFrankreich: 0805 804632Deutschland: 0800 5891281Italien: 800 915 985Niederlande: 0800 2300001Portugal: 800 208 360Spanien: 900 813 166Schweiz: 0800 463 200Großbritannien und Nordirland: 0800 0234632 StandardtarifBelgien: +31 30 6022 797Frankreich: +33 1 4138 9226Deutschland: +49 1805 702 702Niederlande: +31 306 022 797Großbritannien und Nordirland: +44 1628511445

GebührenfreiAustralien: 1 800 151 830Neuseeland: 09 9 128 901 StandardtarifIndien: +91 80 4112 5738

Vorwort v

Page 9: De 910HF1 DataExplorer Getting Started Guide De

vi

Page 10: De 910HF1 DataExplorer Getting Started Guide De

K A P I T E L 1

Erste Schritte - ÜbersichtDieses Kapitel umfasst die folgenden Themen:

¨ Informatica-Domänenübersicht, 1

¨ Einführen von Informatica Analyst, 4

¨ Informatica Developer - Übersicht, 5

¨ Die Tutorial-Story, 7

¨ Die Tutorial-Struktur, 7

Informatica-DomänenübersichtInformatica verfügt über eine dienstorientierte Architektur, die die Fähigkeit zur Skalierung von Diensten undzum gemeinsamen Nutzen von Ressourcen über mehrere Rechner aufweist. Die Informatica-Domäne ist dieprimäre Einheit zur Verwaltung und Administration von Diensten.

Informatica enthält folgende Komponenten:

¨ Anwendungs-Clients. Eine Gruppe von Clients, die Sie nutzen, um auf die zu Grunde liegende Informatica-Funktionalität zuzugreifen. Anwendungs-Clients stellen Anfragen an den Service Manager oder anAnwendungsdienste.

¨ Anwendungsdienste. Eine Gruppe von Diensten, die Funktionalität auf Serverbasis repräsentieren. EineInformatica-Domäne kann eine Untergruppe von Anwendungsdiensten enthalten. Sie konfigurieren dieAnwendungsdienste, die von den eingesetzten Anwendungs-Clients benötigt werden.

¨ Repositories. Eine Gruppe relationaler Datenbanken, die Metadaten zu Objekten und Prozessenspeichern, die erforderlich sind, um Benutzeranfragen von Anwendungs-Clients abzuarbeiten.

¨ Service Manager. Ein Dienst, der in die Domäne integriert ist, um alle Domänenvorgänge zu verwalten.Der Service Manager führt die Anwendungsdienste aus und ist für Domänenfunktionen wieAuthentifizierung, Autorisierung und Anmeldung zuständig.

Sie können sich an Informatica Administrator (dem Administratortool) anmelden, nachdem Sie Informaticainstalliert haben. Das Administratortool dient zum Verwalten der Domäne und zum Konfigurieren derbenötigten Anwendungsdienste, bevor Sie auf die restlichen Anwendungs-Clients zugreifen können.

1

Page 11: De 910HF1 DataExplorer Getting Started Guide De

Die folgende Abbildung zeigt die Anwendungsdienste und die Repositories, die jeder Anwendungs-Client ineiner Informatica-Domäne verwendet:

Die folgende Tabelle präsentiert die Anwendungs-Clients (außer dem Administratortool) sowie dieAnwendungsdienste und die Repositories, die der Client benötigt:

Anwendungs-Client Anwendungsdienste Repositories

Data Analyzer Reporting Service Data Analyzer Repository

Informatica-Berichterstellung und -Dashboards

Berichterstellungs- undDashboarddienste

Jaspersoft-Repository

Informatica Analyst - Analyst Service- Data Integration Service- Model Repository Service

Model Repository

Informatica Developer - Analyst Service- Content Management Service- Data Integration Service- Model Repository Service

Model Repository

Metadata Manager - Metadata Manager Service- PowerCenter Integration Service- PowerCenter Repository Service

- Metadata Manager Repository- PowerCenter Repository

PowerCenter Client - PowerCenter Integration Service- PowerCenter Repository Service

PowerCenter Repository

Web Services Hub Console - PowerCenter Integration Service- PowerCenter Repository Service- Web Services Hub

PowerCenter Repository

2 Kapitel 1: Erste Schritte - Übersicht

Page 12: De 910HF1 DataExplorer Getting Started Guide De

Auf folgenden Anwendungsdienste kann ein Informatica Anwendungs-Client nicht zugreifen:

¨ PowerExchange Listener Service. Verwaltet den PowerExchange Listener zur Verschiebung von Bulkdatenund zur Änderung der Datenerfassung. Der PowerCenter Integration Service verbindet sich über denListener Service mit PowerExchange Listener.

¨ PowerExchange Logger Service. Verwaltet den PowerExchange Logger für Linux, UNIX und Windows, umsich ändernde Daten zu erfassen und in die Protokolldateien des PowerExchange Logger zu schreiben.Sich ändernde Daten können aus DB2-Wiederherstellungsprotokollen Oracle-Wiederherstellungsprotokollen, einer verteilten Microsoft-SQL-Server-Datenbank oder Datenquellen aufeinem i5/OS- oder z/OS-System stammen.

¨ SAP BW Service. Wartet auf RFC-Anfragen von SAP BI und fordert an, dass der PowerCenter IntegrationService Arbeitsabläufe durchführt, um von SAP BI Daten zu extrahieren oder Daten auf SAP BI zu laden.

Verfügbarkeit von FunktionenInformatica-9.1.0-Produkte verwenden einen gemeinsamen Satz von Anwendungen. Die Produktfunktionen,welche Sie nutzen können, sind von Ihrer Produktlizenz abhängig.

In der folgenden Tabelle finden Sie die Lizenzoptionen und die Funktionen der Anwendung, die bei jederOption zur Verfügung stehen.

Lizenzoption Informatica Developer-Funktionen Informatica Analyst-Funktionen

Data Explorer - Profiling, das die Nutzung desProfilmodells und die Bestimmungder Primärschlüssel-, Fremdschlüsselund funktionellen Abhängigkeitenumfasst

- Arbeiten mit Scorecards

- Profiling- Arbeiten mit Scorecards- Erstellen und Ausführen von

Profiling-Regeln- Referenztabellenverwaltung

Datenqualität - Erstellen und Ausführen vonMappings mit allen Umwandlungen

- Erstellen und Ausführen von Regeln- Profiling- Arbeiten mit Scorecards- Exportieren von Objekten an

PowerCenter

- Profiling- Arbeiten mit Scorecards- Referenztabellenverwaltung- Erstellen von Profiling-Regeln- Ausführen von Regeln in Profilen- Verwaltung fehlerhafter und

mehrfacher Datensätze

Datendienste - Erstellen logischerDatenobjektmodelle

- Erstellen und Ausführen vonMappings mit Datendienst-Umwandlungen

- Erstellen von SQL-Datendiensten- Erstellen von Web-Diensten- Exportieren von Objekten an

PowerCenter

- Referenztabellenverwaltung

Datendienste und Profiling-Option - Erstellen logischerDatenobjektmodelle

- Erstellen und Ausführen vonMappings mit Datendienst-Umwandlungen

- Erstellen von SQL-Datendiensten- Erstellen von Web-Diensten- Exportieren von Objekten an

PowerCenter- Erstellen und Ausführen von Regeln

mit Datendienst-Umwandlungen- Profiling

- Referenztabellenverwaltung

Informatica-Domänenübersicht 3

Page 13: De 910HF1 DataExplorer Getting Started Guide De

Einführen von Informatica AnalystInformatica Analyst ist ein Anwendungs-Client auf Web-Basis, mit dem Analysten Daten in einemUnternehmen analysieren, bereinigen, standardisieren, profilieren und bewerten können.

Wirtschaftsanalysten und Entwickler nutzen Informatica Analyst zur datenorientierten Zusammenarbeit. Siekönnen Spalten- und Regel-Profiling durchführen, mit Scorecards arbeiten und schlechte sowie doppelteDatensätze verwalten. Sie können auch Referenzdaten verwalten und die Daten Entwicklern in einer Data-Quality-Lösung zur Verfügung stellen.

Verwenden Sie Informatica Analyst zur Durchführung folgender Aufgaben:

¨ Profilieren von Daten. Erstellen und Ausführen eines Profils, um Struktur und Inhalt vonUnternehmensdaten zu analysieren und Stärken und Schwächen zu identifizieren. Nachdem Sie ein Profilausgeführt haben, können Sie ein selektives Drilldown durchführen, um die zu Grunde liegenden Reihenaus den Profilergebnissen amzuzeigen. Sie können Scorecards auch Spalten hinzufügen undReferenztabellen Spaltenwerte hinzufügen.

¨ Erstellen von Regeln in Profilen. Erstellen und Anwenden von Regeln innerhalb von Profilen. Eine Regel istwiederverwendbare Geschäftslogik, die Bedingungen definiert, welche auf Daten angewendet werden,wenn Sie ein Profil ausführen. Verwenden Sie Regeln zur weiteren Validierung von Daten in einem Profilund zur Messung des Fortschritts in der Datenqualität.

¨ Bewerten von Daten. Erstellen Sie Scorecards, um die gültigen Werte aus jedweder Spalte oder dieAusgabe von Regeln zu bewerten. Scorecards zeigen die Werthäufigkeit von Spalten in einem Profil alsScores (Punkte). Verwenden Sie Scorecards, um Fortschritte in der Datenqualität zu messen und visuelldarzustellen. Sie können auch Trenddiagramme anzeigen, um die Historie der Scores im Zeitverlaufanzuzeigen.

¨ Verwalten von Referenzdaten. Erstellen und Aktualisieren Sie Referenztabellen, die von Analytikern undEntwicklern zur Standardisierung der Datenqualität und zur Validierung von Regeln verwendet werden.Erstellen, bearbeiten und importieren Sie Datenqualitäts-Wörterbuchdateien als Referenztabellen.Erstellen Sie Referenztabellen, um Beziehungen zwischen Quelldaten und gültigen und Standard-Werteneinzurichten. Entwickler verwenden Referenztabellen zur Standardisierung und für Lookup-Umwandlungenin Informatica Developer.

¨ Verwalten von schlechten oder doppelten Datensätzen. Reparieren von schlechten Datensätzen undKonsolidieren von doppelten Datensätzen.

4 Kapitel 1: Erste Schritte - Übersicht

Page 14: De 910HF1 DataExplorer Getting Started Guide De

Informatica Developer - ÜbersichtInformatica Developer ist ein Anwendungs-Client, mit dem Entwickler Datenqualitäts- undDatendienstelösungen entwerfen und implementieren.

Die folgende Abbildung zeigt das Entwicklertool:

Das Entwicklertool enthält einen Editor, mit dem Sie Objekte bearbeiten können. In diesem Beispiel zeigt derEditor das logische Datenobjektmodell Customer_Objects. Je nach Objekt im Editor zeigt das EntwicklertoolAnsichten, wie die Standardansicht.

Das Entwicklertool umfasst auch die folgenden Ansichten, die unabhängig von den Objekten im Editoreingeblendet werden:

¨ Object Explorer. Zeigt Projekte, Ordner und die Objekte, die sie enthalten.

¨ Outline. Zeigt abhängige Objekte in einem Objekt.

¨ Eigenschaften. Zeigt Objekteigenschaften.

¨ Data Viewer. Zeigt die Ergebnisse eines Mappings, einer Datenvorschau oder SQL-Abfrage.

¨ Validierungsprotokoll. Zeigt Objektvalidierungsfehler.

¨ Spickzettel. Zeigt Spickzettel.

Sie können jede Ansicht ausblenden und jede Ansicht an einen anderen Ort im Entwicklertool verschieben.Sie können auch andere Ansichten anzeigen, wie die Such-Ansicht. Klicken Sie Fenster > Ansicht anzeigenan, um die Ansichten auszuwählen, die Sie anzeigen möchten.

Informatica Developer BegrüßungsseiteDie Begrüßungsseite erscheint, wenn Sie zum ersten Mal das Developer Tool öffnen. Auf derBegrüßungsseite erfahren Sie mehr über das Developer Tool, wie es eingerichtet wird und wie man beginnt,mit dem Developer Tool zu arbeiten.

Die Begrüßungsseite zeigt folgende Optionen:

¨ Übersicht. Klicken Sie auf Übersicht, um eine Übersicht über Datenqualitäts- und Datendienstelösungen zuerhalten.

¨ Erste Schritte. Klicken Sie auf die Schaltfläche Erste Schritte, um mehr über die Einrichtung des DeveloperTools zu erfahren.

¨ Tutorials. Klicken Sie auf Tutorials, um Tutoriallektionen zu Datenqualitäts- und Detendienstelösungenanzuzeigen.

Informatica Developer - Übersicht 5

Page 15: De 910HF1 DataExplorer Getting Started Guide De

¨ Internet-Ressourcen. Klicken Sie auf Internet-Ressourcen, um einen Link zu my.informatica.com zunutzen. Sie können über my.informatica.com auf die Informatica-How-To-Bibliothek zugreifen, die Artikelüber das Developer Tool, Informatica-Datenqualität und Informatica-Datendienste enthält.

¨ Workbench. Klicken Sie auf Workbench, um mit der Arbeit im Developer Tool zu beginnen.

SpickzettelDas Developer Tool umfasst Spickzettel als Teil der Online-Hilfe. Ein Spickzettel ist eine schrittweiseAnleitung, die Ihnen bei der Durchführung von einer oder mehreren Aufgaben im Developer Tool hilft.

Nachdem Sie einen Spickzettel vollständig ausgefüllt haben, führen Sie die Aufgaben aus und sehen dieErgebnisse. Nachdem Sie beispielsweise einen Spickzettel zum Import und zur Vorschau eines relationalenphysischen Datenobjekts vollständig ausgefüllt haben, haben Sie eine Tabelle einer relationalen Datenbankimportiert und die Vorschau der Daten im Developer Tool angezeigt.

Um auf die Spickzettel zuzugreifen, klicken Sie auf Hilfe > Spickzettel.

Data Quality und Data ExplorerVerwenden Sie die Datenqualitätsfunktionen des Entwicklertools, um den Inhalt und die Struktur Ihrer Datenzu analysieren und die Daten gemäß den Bedürfnissen Ihres Unternehmens besser nutzen zu können.

Verwenden Sie das Entwicklertool zum Konzipieren und Durchführen von Prozessen, mit denen die folgendenZiele erreicht werden können:

¨ Profilieren von Daten. Profiling macht den Inhalt und die Struktur Ihrer Daten erkennbar. Profiling ist einSchlüsselschritt in jedem Datenprojekt, da es Stärken und Schwächen in Ihren Daten identifizieren kannund Sie bei der Definition Ihres Projektplans unterstützt.

¨ Erstellen von Scorecards, um die Datenqualität zu prüfen. Eine Scorecard ist eine grafische Darstellungder Qualitätsmessungen in einem Profil.

¨ Standardisieren von Datenwerten. Standardisieren Sie Daten, um Fehler und Inkonsistenzen zu entfernen,die Sie finden, indem Sie ein Profil ausführen. Sie können Variationen der Zeichensetzung, Formatierungund Rechtschreibung standardisieren. Sie können beispielsweise sicherstellen, dass die Werte für Stadt,Staat und Postleitzahl konsistent sind.

¨ Parsen von Datensätzen. Parsen Sie Datensätze, um die Datensatzstruktur zu verbessern und weitereInformationen aus Ihren Daten abzuleiten. Sie können ein Einzelfeld mit Freiformdaten in Bereicher teilen,die unterschiedliche Informationstypen enthalten. Sie können Ihren Datensätzen auch Informationenhinzufügen. Sie können beispielsweise Datensätze von Kunden als persönliche oder Geschäftskundenmarkieren.

¨ Validieren von Postadressen. Die Adressvalidierung bewertet und verbessert die Genauigkeit undZustellbarkeit Ihrer Postadressendaten. Die Adressvalidierung korrigiert Fehler in Adressen undkomplettiert unvollständige Adressen, indem die Adressdatensätze mit Referenzdaten von nationalenZustellern verglichen werden. Die Adressvalidierung kann auch Postinformationen hinzufügen, die diePostzustellung beschleunigen und die Zustellkosten reduzieren.

¨ Nach doppelten Datensätzen suchen. Die Analyse auf doppelte Datensätze vergleicht einen Satz vonDatensätzen miteinander, um ähnliche oder übereinstimmende Werte in ausgewählten Datenspalten zufinden. Das Ähnlichkeitsniveau, welches eine gute Ähnlichkeit zwischen den Bereichwerten anzeigt, wirdvon Ihnen vorgegeben. Sie können auch die relative Gewichtung vorgeben, die jede Spalte in denÄhnlichkeitsberechnungen erhält. Sie können beispielsweise dem Nachnamen eine höhere Priorität alsdem Vornamen geben.

¨ Erstellen von Referenzdatentabellen. Referenzdatentabellen sind Schlüsselelemente in derDatenstandardisierung. Informatica verfügt über eine umfassende Palette von Referenzdatentabellen. Siekönnen benutzerdefinierte Referenztabellen aus Spalten in Ihren Quelldaten erstellen.

¨ Erstellen und Durchführen von Datenqualitätregeln. Informatica bietet vorgefertigte Regeln, die Sieausführen oder bearbeiten können, um Ihre Projektziele zu erreichen. Sie können im Entwicklertool Regelnerstellen.

6 Kapitel 1: Erste Schritte - Übersicht

Page 16: De 910HF1 DataExplorer Getting Started Guide De

¨ Zusammenarbeiten mit Informatica-Anwendern. Die Regeln und Referenzdatentabellen, die Sie dem ModelRepository zufügen, stehen den Anwendern im Entwicklertool und im Analysetool zur Verfügung. Benutzerkönnen in Projekten zusammenarbeiten, und in unterschiedlichen Stadien eines Projekts könnenunterschiedliche Benutzer den Eigentümerstatus von Objekten übernehmen.

¨ Exportieren von Mappings an PowerCenter. Sie können Mappings an PowerCenter exportieren, um dieMetadaten für die physische Datenintegration oder für die Erstellung von Internetdiensten zu verwenden.

Datenqualitätsbenutzer können alle obigen Aufgaben durchführen.

Benutzer des Data Explorers können Profildaten im Entwicklertool nutzen und Scorecards erstellen, die imAnalysetool laufen.

Die Tutorial-StoryHypoStores Corporation ist eine nationale Einzelhandelsorganisation mit Hauptquartieren in Boston undGeschäften in mehreren Bundesstaaten. Sie integriert regelmäßig Betriebsdaten aus den landesweitenGeschäften in den Datenspeicher im Hauptquartier. Vor kurzem wurde ein Geschäft in Los Angeles eröffnet.

Zum Hauptquartier gehört ein zentrales ICC-Team von Administratoren, Entwicklern und Architekten, die dafürverantwortlich sind, eine gemeinsame Datendienst-Ebene für alle Verbund- und BI-Anwendungen zurVerfügung zu stellen. Die BI-Anwendungen umfassen ein CRM-System, das die Dateien mit denKundenstammdaten enthält, die zur Abrechnung und zum Marketing verwendet werden.

HypoStores Corporation möchte die Daten aus Boston und Los Angeles profilieren, bevor die Datensätzeintegriert werden. Die Profiloperationen identifizieren Datenqualitätsprobleme, die HypoStores vor derIntegration beheben kann.

Die Tutorial-StrukturDie Kurzanleitung enthält Tutorials, die Lektionen und Aufgaben beinhalten.

LektionenIn jeder Lektion werden Konzepte vorgestellt, die Ihnen das Verständnis der Aufgaben erleichtern, die in derLektion bearbeitet werden. Die Lektion umfasst geschäftliche Anforderungen der gesamten Story. Die Zieleder Lektion erläutern die Aufgaben, die Sie durcharbeiten werden, um die geschäftlichen Anforderungen zuerfüllen. In jeder Lektion wird angegeben, wie viel Zeit ungefähr benötigt wird. Wenn Sie die Aufgaben in derLektion abgeschlossen haben, können Sie die Zusammenfassung der Lektion einsehen.

Wenn die Umgebung innerhalb des Tools nicht konfiguriert ist, finden Sie in der ersten Lektion jedes TutorialsHilfestellungen, wie dies erledigt wird.

AufgabenDie Aufgaben bestehen aus schrittweisen Anweisungen. Bearbeiten Sie alle Aufgaben in der angegebenenReihenfolge, um die Lektion abzuschließen.

Voraussetzungen des TutorialsBevor Sie mit mit den Lektionen des Tutorials beginnen, muss die Informatica-Domäne mit mindestens einemeingerichteten Knoten laufen.

Das Installationsprogramm umfasst Tutorialdateien, die Sie zur Bearbeitung der Lektionen verwenden. DieseDateien finden Sie sowohl in Client- als auch in Server-Installationen:

¨ Alle Tutorialdateien finden Sie an dem folgenden Speicherort im Installationspfad des Entwicklertools:

<Informatica Installation Directory>\clients\DeveloperClient\Tutorials

Die Tutorial-Story 7

Page 17: De 910HF1 DataExplorer Getting Started Guide De

¨ Die Tutorialdateien finden Sie an dem folgenden Speicherort im Services-Installationspfad:

<Informatica Installation Directory>\server\TutorialsFür die Tutoriallektionen benötigen Sie folgende Dateien:

¨ All_Customers.csv

¨ Boston_Customers.csv

¨ Customer_Order.xsd

¨ LA_customers.csv

¨ orders.csv

Informatica Analyst-TutorialWährend dieses Tutorials meldet sich ein Analyst am Analysetool an, erstellt Projekte und Ordner, Profile undRegeln, bewertet Daten und erstellt Referenztabellen.

Die Lektionen, welche Sie durchführen können, hängen davon ab, welches der Produkte Informatica DataQuality, Informatica Data Explorer, Informatica Data Services oder PowerCenter Sie haben.

In der folgenden Tabelle finden Sie die Lektionen, die Sie je nach Produkt durchführen können.

Lektion Beschreibung Produkt

Lektion 1. Einrichten von InformaticaAnalyst

Anmelden am Analysetool undErstellen eines Projekts und Ordnersfür die Tutoriallektionen.

Alle

Lektion 2. Erstellen von Datenobjekten Importieren einer Einfachdatei alsDatenobjekt und Vorschau der Daten.

Data QualityData Explorer

Lektion 3. Erstellen von Schnellprofilen Erstellen eines Schnellprofils, umschnell eine Vorstellung von DataQuality zu erhalten.

Data QualityData Explorer

Lektion 4. Erstellen von Kundenprofilen Erstellen eines benutzerdefiniertenProfils zum Konfigurieren von Spaltensowie für Stichproben- und Drilldown-Optionen.

Data QualityData Explorer

Lektion 5. Erstellen vonExpressionsregeln

Erstellen von Expressionregeln zumModifizieren und Profilieren vonSpaltenwerten

Data Quality

Lektion 6. Erstellen und Ausführenvon Scorecards

Erstellen und Ausführen einerScorecard, um den Fortschritt derDatenqualität im Zeitverlauf zumessen.

Data QualityData Explorer

Lektion 7. Erstellen vonReferenztabellen ausProfilergebnissen

Erstellen einer Referenztabelle, dieSie zum Standardisieren vonQuelldaten verwenden können.

Data QualityData ExplorerData Services

Lektion 8. Erstellen vonReferenztabellen

Erstellen einer Referenztabelle, umBeziehungen zwischen Quelldatensowie gültigen und Standard-Werteneinzurichten.

Alle

Hinweis: Dieses Tutorial enthält keine Lektionen zur Verwaltung von fehlerhaften Datensätzen und zurKonsolidierung von Datensätzen.

8 Kapitel 1: Erste Schritte - Übersicht

Page 18: De 910HF1 DataExplorer Getting Started Guide De

Informatica Developer ToolIn diesem Tutorial verwenden Sie das Entwicklertool, um mehrere Vorgänge zur Datenqualität durchzuführen.

Benutzer von Informatica Data Quality und Informatica Data Explorer verwenden das Entwicklertool, umProfile zu erstellen und auszuführen, die den Inhalt und die Struktur von Daten analysieren.

Anwender von Data Quality verwenden das Entwicklertool, um Prozesse zu entwerfen und auszuführen, diedie Datenqualität verbessern.

Arbeiten Sie folgende Lektionen im Tutorial Data Quality durch:

Lektion 1. Einrichten von Informatica DeveloperErstellen einer Verbindung zum Model Repository, das von einem Model Repository Service in einer Domäneverwaltet wird. Erstellen eines Projekts und eines Ordners, um Arbeit für die Lektionen im Tutorial zuspeichern. Auswählen eines Standard-Data Integration Service.

Lektion 2. Importieren von physischen DatenobjektenSie werden Datenqualitätsprozesse für die Kundendatendateien definieren, die mit diesen Objekten assoziiertsind.

Lektion 3. Profiling von DatenProfiling macht den Inhalt und die Struktur Ihrer Daten erkennbar.

Profiling umfasst Join-Analyse, eine Analyseform, die ermittelt, ob zwischen den beiden Datenspalten eingültiger Join möglich ist.

Lektion 4. Parsing von DatenParsing erhöht den Nutzen Ihrer Datensätze und verbessert die Struktur des Datensatzes. Durch Parsenkönnen Sie nützliche Informationen in Ihren Daten suchen und neue Informationen aus aktuellen Datenableiten.

Lektion 5. Standardisieren von DatenStandardisieren entfernt Datenfehler und Inkonsistenzen, die während des Profiling gefunden werden.

Lektion 6. Validieren von AdressdatenAdressvalidierung bewertet die Genauigkeit und Zustellbarkeit Ihrer Postadressen und behebt Adressfehlerund fehlende Angaben in Adressen.

Die Tutorial-Struktur 9

Page 19: De 910HF1 DataExplorer Getting Started Guide De

Teil I: Erste Schritte mitInformatica Analyst

Dieser Teil enthält die folgenden Kapitel:

¨ Lektion 1. Einrichten von Informatica Analyst, 11

¨ Lektion 2. Erstellen von Datenobjekten, 14

¨ Lektion 3. Erstellen von Schnellprofilen, 17

¨ Lektion 4. Erstellen von Kundenprofilen, 20

¨ Lektion 5. Erstellen von Expressionsregeln, 23

¨ Lektion 6. Erstellen und Ausführen von Scorecards, 26

¨ Lektion 7. Erstellen von Referenztabellen aus Profilspalten , 30

¨ Lektion 8. Erstellen von Referenztabellen, 33

10

Page 20: De 910HF1 DataExplorer Getting Started Guide De

K A P I T E L 2

Lektion 1. Einrichten vonInformatica Analyst

Dieses Kapitel umfasst die folgenden Themen:

¨ Einrichten von Informatica Analyst - Übersicht, 11

¨ Aufgabe 1. Anmelden bei Informatica Analyst, 12

¨ Aufgabe 2. Ein Projekt erstellen, 12

¨ Aufgabe 3 Einen Ordner erstellen, 12

¨ Einrichten von Informatica Analyst - Zusammenfassung, 13

Einrichten von Informatica Analyst - ÜbersichtBevor Sie mit den Lektionen in diesem Tutorial beginnen können, müssen Sie das Analyst Tool einrichten. Umdas Analyst Tool einzurichten, melden Sie sich beim Analyst Tool an und erstellen ein Projekt und einenOrdner, in dem Sie Ihre Arbeit speichern können.

Die Informatica-Domäne ist eine Sammlung von Knoten und Diensten, die die Informatica-Umgebungdefinieren. Zu den Diensten in der Domäne gehören der Analyst Service und der Model Repository Service.Der Analyst Service startet das Analyst Tool, und der Model Repository Service verwaltet das ModelRepository. Beim Arbeiten mit dem Analyst Tool speichert dieses die Objekte, die Sie im Model Repositoryerstellen.

Sie müssen ein Projekt erstellen, bevor Sie im Analyst Tool Objekte erstellen können. Ein Projekt enthältObjekte im Analyst Tool. Ein Projekt kann auch Ordner enthalten, in denen zugehörige Objekte gespeichertwerden, wie Objekte, die Teile derselben Geschäftsumgebung sind.

ZieleIn dieser Lektion führen Sie folgende Aufgaben durch:

¨ Melden Sie sich beim Analyst Tool an.

¨ Erstellen eines Projekts, um die Objekte zu speichern, die Sie im Analyst Tool erstellen.

¨ Erstellen eines Ordners im Projekt, in dem Sie zugehörige Objekte speichern können.

VoraussetzungenÜberprüfen Sie die folgenden Voraussetzungen, bevor Sie mit dieser Lektion beginnen:

¨ Ein Administrator hat einen Model Repository Service und einen Analyst Service im Administrator Toolkonfiguriert.

¨ Sie haben den Hostnamen und die Portnummer für das Analyst Tool.

¨ Sie haben einen Benutzernamen und ein Passwort, um auf den Analyst Service zuzugreifen. Sie erhaltendiese Informationen von einem Domänenadministrator.

11

Page 21: De 910HF1 DataExplorer Getting Started Guide De

ZeitplanDiese Lektion dauert ca. 5 bis 10 Minuten.

Aufgabe 1. Anmelden bei Informatica AnalystMelden Sie sich beim Analysetool an, um mit dem Tutorial zu beginnen.

1. Starten Sie einen Microsoft Internet Explorer- oder Mozilla Firefox-Browser.

2. Geben Sie in der Adresszeile die URL für Informatica Analyst ein.http[s]://<host name>:<port number>/AnalystTool

3. Geben Sie auf der Anmeldeseite Ihren Benutzernamen und Ihr Passwort ein.

4. Wählen Sie Nativ oder den Namen einer spezifischen Sicherheitsdomäne.

Das Feld Sicherheitsdomäne wird eingeblendet, wenn die Informatica-Domäne eine LDAP-Sicherheitsdomäne enthält. Wenn Sie die Sicherheitsdomäne, zu der Ihr Benutzerkonto gehört, nichtkennen, wenn Sie sich an den Domänenadministrator von Informatica.

5. Klicken Sie auf Anmelden.

Der Begrüßungsbildschirm wird geöffnet.

6. Klicken Sie auf Schließen, um den Begrüßungsbildschirm zu verlassen und das Analysetool zu öffnen.

Aufgabe 2. Ein Projekt erstellenIn dieser Aufgabe erstellen Sie ein Projekt, um Objekte zu speichern, die Sie im Analysetool erstellt haben.Erstellen eines Tutorialprojekts, um den Ordner für das Datenqualitätsprojekt zu speichern.

1. Wählen Sie im Analysetool den Ordner Projekte im Navigator.

Der Navigator stellt den linken Bereich in der Analyst-Schnittstelle dar.

2. Klicken Sie im Navigator auf Aktionen > Neues Projekt.

Das Fenster Neues Projekt wird geöffnet.

3. Geben Sie Ihren Namen mit vorangestelltem "Tutorial_" als Namen des Projekts ein.

4. Vergewissern Sie sich, dass Nicht freigegeben ausgewählt ist.

5. Klicken Sie auf OK.

Aufgabe 3 Einen Ordner erstellenIn dieser Aufgabe erstellen Sie einen Ordner, um zugehörige Objekte zu speichern. Sie können einen Ordnerin einem Projekt oder in einem anderen Ordner erstellen. Erstellen eines Ordners mit dem Namen Kunden,um die Objekte zu speichern, die zum Datenqualitätsprojekt gehören.

1. Wählen Sie im Navigator das Tutorialprojekt aus.

2. Klicken Sie auf Aktionen > Neuer Ordner.

3. Geben als Ordnername Kunden ein.

4. Klicken Sie auf OK.

Der Ordner steht jetzt im Tutorialprojekt.

12 Kapitel 2: Lektion 1. Einrichten von Informatica Analyst

Page 22: De 910HF1 DataExplorer Getting Started Guide De

Einrichten von Informatica Analyst -Zusammenfassung

In dieser Lektion haben Sie gelernt, dass das Analyst Tool Objekte in Projekten und Ordnern speichert. EinModel Repository enthält Projekte und Ordner. Der Analyst Service verwaltet das Analyst Tool. Der ModelRepository Service verwaltet das Model Repository. Der Analyst Service und der Model Repository Servicesind Anwendungsdienste in der Informatica-Domäne.

Sie haben sich beim Analyst Tool angemeldet und ein Projekt sowie einen Ordner erstellt.

Nun können Sie mit dem Analyst Tool weitere Lektionen in diesem Tutorial bearbeiten.

Einrichten von Informatica Analyst - Zusammenfassung 13

Page 23: De 910HF1 DataExplorer Getting Started Guide De

K A P I T E L 3

Lektion 2. Erstellen vonDatenobjekten

Dieses Kapitel umfasst die folgenden Themen:

¨ Erstellen von Datenobjekten - Übersicht, 14

¨ Aufgabe 1 Erstellen der Einfachdatei-Datenobjekte, 15

¨ Aufgabe 2 Datenvorschau, 15

¨ Erstellen von Datenobjekten - Zusammenfassung, 16

Erstellen von Datenobjekten - ÜbersichtEin Datenobjekt ist im Analysetool eine Darstellung von Daten, die auf einer Einfachdatei oder einer Tabelleeiner relationalen Datenbank basieren. Sie erstellen eine Einfachdatei oder ein Tabellenobjekt und führendann ein Profil mit den Daten in der Einfachdatei oder der Tabelle der relationalen Datenbank durch. WennSie im Analysetool ein Einfachdatei-Datenobjekt erstellen, können Sie die Datei in den Einfachdatei-Cachedes Rechners hochladen, auf dem das Analysetool läuft, oder Sie können den Speicherort für die Einfachdateiim Netzwerk angeben.

StoryHypoStores speichert die Kundendaten aus Los Angeles in Einfachdateien. HypoStores muss die Datenprofilieren und analysieren und Datenqualitätsaufgaben damit durchführen.

ZieleIn dieser Lektion führen Sie folgende Aufgaben durch:

1. Hochladen der Einfachdatei in den Einfachdatei-Cache und Erstellen eines Datenobjekts.

2. Vorschau der Daten des Einfachdatei-Datenobjekts.

VoraussetzungenÜberprüfen Sie die folgenden Voraussetzungen, bevor Sie mit dieser Lektion beginnen:

¨ Sie haben Lektion 1 in diesem Tutorial abgeschlossen.

¨ Sie haben die Einfachdatei LA_Customers.csv. Diese Datei ist im Ordner <Installation Root Directory>\<Release Version>\clients\DeveloperClient\Tutorials gespeichert.

ZeitplanRechnen Sie mit 5 bis 10 Minuten für diese Aufgabe.

14

Page 24: De 910HF1 DataExplorer Getting Started Guide De

Aufgabe 1 Erstellen der Einfachdatei-DatenobjekteIn dieser Aufgabe verwenden Sie den Assistenten Hinzufügen einer Einfachdatei, um Einfachdatei-Datenobjekte aus den Datendateien LA_Customers, Customers, Accounts und Account_Customers zuerstellen.

1. Wählen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt.

Hinweis: Sie müssen das Projekt oder den Ordner auswählen, in dem Sie das Einfachdatei-Datenobjekterstellen möchten, bevor Sie es erstellen können.

2. Klicken Sie auf Aktionen > Neu > Neue Einfachdatei.

Der Assistent Hinzufügen einer Einfachdatei wird eingeblendet.

3. Wählen Sie Durchsuchen und Hochladen , und klicken Sie dann auf Durchsuchen.

4. Blättern Sie bis zu LA_Customers.csv, und klicken Sie auf Öffnen.

5. Klicken Sie auf Weiter.

6. Wählen Sie unter Zeilen für den Import angeben Spaltennamen aus erster Zeile importieren, umSpaltennamen von der ersten Zeile zu importieren, die nicht leer ist.

7. Klicken Sie auf Anzeigen.

Der Bereich Details wird aktualisiert und zeigt die Spaltenüberschriften der ersten Zeile.

8. Klicken Sie auf Weiter.

Der Bereich Spaltenattribute zeigt Datentyp, Präzision, Größenordnung und Format für jede Spalte.

9. Klicken Sie für die Spalten CreateDate (Datum erstellen) und MiscDate (Sonstiges Datum) auf dieDatentypzelle, und ändern Sie den Datentyp auf Datetime.

10. Klicken Sie auf Weiter.

Der Bereich Name zeigt LA_Customers.

11. Ändern Sie gegebenenfalls den Namen der Datei, und fügen Sie eine Beschreibung hinzu.

Der Ordner Customers wird standardgemäß im linken unteren Bereich ausgewählt.

12. Klicken Sie auf Fertigstellen.

Das Datenobjekt erscheint im Ordnerinhalt des Ordners Customers.

13. Wiederholen Sie die Schritte 2 bis 12, um Einfachdatei-Datenobjekte für die Datendateien Customers,Accounts und Account_Customers zu erstellen.

Aufgabe 2 DatenvorschauIn dieser Aufgabe sehen Sie die Vorschau der Daten für das Einfachdatei-Datenobjekt, um Struktur und Inhaltder Daten zu prüfen.

1. Wählen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt.

Der Inhalt des Ordners wird im Bereich Inhalt eingeblendet.

2. Klicken Sie auf das Datenobjekt LA_Customers.

Das Datenobjekt wird in einer Registerkarte geöffnet. Das Analysetool zeigt die ersten 100 Zeilen desEinfachdatei-Datenobjekts in der Ansicht Datenvorschau.

3. Klicken Sie auf die Ansicht Eigenschaften des Einfachdatei-Datenobjekts.

Die Ansicht Eigenschaften zeigt Name, Beschreibung und Ort des Datenobjekts. Sie zeigt auch dieSpalten und Spalteneigenschaften für das Datenobjekt.

Aufgabe 1 Erstellen der Einfachdatei-Datenobjekte 15

Page 25: De 910HF1 DataExplorer Getting Started Guide De

Erstellen von Datenobjekten - ZusammenfassungIn dieser Lektion haben Sie erfahren, dass Datenobjekte Darstellungen von Daten sind, die auf einerEinfachdatei oder einer Quelle einer relationalen Datenbank basieren. Sie haben gelernt, dass Sie einEinfachdatei-Datenobjekt erstellen und die darin enthaltenen Daten in einer Vorschau anzeigen können.

Sie haben eine Einfachdatei hochgeladen und ein Einfachdatei-Datenobjekt erstellt, die Vorschau der Datendes Datenobjekts angezeigt und die Eigenschaften des Datenobjekts angezeigt.

Nachdem Sie ein Datenobjekt erstellt haben, erstellen Sie in Lektion 3 ein Schnellprofil für das Datenobjektund in Lektion 4 ein benutzerdefiniertes Profil für das Datenobjekt.

16 Kapitel 3: Lektion 2. Erstellen von Datenobjekten

Page 26: De 910HF1 DataExplorer Getting Started Guide De

K A P I T E L 4

Lektion 3. Erstellen vonSchnellprofilen

Dieses Kapitel umfasst die folgenden Themen:

¨ Erstellen von Schnellprofilen - Übersicht, 17

¨ Aufgabe 1 Erstellen und Ausführen eines Schnellprofils, 18

¨ Aufgabe 2 Anzeigen der Profilergebnisse, 18

¨ Erstellen von Schnellprofilen - Zusammenfassung, 19

Erstellen von Schnellprofilen - ÜbersichtEin Profil ist die Analyse der Datenqualität, bezogen auf den Inhalt und die Struktur der Daten. EinSchnellprofil ist ein Profil, das Sie mit Standardoptionen erstellen. Mit einem Schnellprofil können SieProfilergebnisse erhalten, ohne alle Spalten und Optionen für ein Profil zu konfigurieren.

Erstellen Sie ein Schnellprofil und führen Sie es aus, um die Qualität der Daten zu analysieren, wenn Sie einDatenqualitätsprojekt starten. Wenn Sie ein Schnellprofilobjekt erstellen, wählen Sie das Datenobjekt und dieSpalten des Datenobjekt , die Sie analysieren möchten. Ein Schnellprofil überspringt die Konfiguration derProfilspalten und -optionen. Das Analysetool führt ein Profiling mit der zwischengespeicherten Einfachdatei fürdas Einfachdatei-Datenobjekt durch.

StoryHypoStore möcte, dass Daten aus dem neu erworbenen Büro in Los Angeles in das Data Warehouseeingepflegt werden. Bevor diese Daten in das Data Warehouse eingepflegt werden können, müssen siebereinigt werden. Sie sind der Analyst, der für die Bewertung der Datenqualität und die Weitergabe derInformationen an den Entwickler zuständig ist, der für die Bereinigung der Daten verantwortlich ist. Siemöchten die Profilergebnisse rasch anzeigen und eine Grundvorstellung der Datenqualität erhalten.

ZieleIn dieser Lektion führen Sie folgende Aufgaben durch:

1. Erstellen und Ausführen eines Schnellprofils für das Einfachdatei-Datenobjekt Customers_LA.

2. Anzeigen der Profilergebnisse.

VoraussetzungenÜberprüfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:

¨ Sie haben die Lektionen 1 und 2 in diesem Tutorial abgeschlossen.

ZeitplanRechnen Sie mit 5 bis 10 Minuten für diese Lektion.

17

Page 27: De 910HF1 DataExplorer Getting Started Guide De

Aufgabe 1 Erstellen und Ausführen einesSchnellprofils

In dieser Aufgabe erstellen Sie ein Schnellprofil für alle Spalten in dem Datenobjekt und verwendenStandardoptionen für Stichproben und Drilldown.

1. Wählen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt.

2. Klicken Sie im Bereich Inhalte rechts von dem Link für das Datenobjekt _LA.

Klicken Sie nicht auf den Link des Objekts.

3. Klicken Sie auf Aktionen > Neu > Neues Profil.

Der Assistent Neues Profil wird eingeblendet.

4. Klicken Sie auf Speichern und Ausführen, um das Profil zu erstellen und auszuführen.

Das Analysetool erstellt das Profil in dem gleichen Projekt und Ordner wie das Datenobjekt.

Die Profilergebnisse für das Schnellprofil erscheinen in einer neuen Registerkarte, nachdem Sie dasProfil gespeichert und ausgeführt haben.

Aufgabe 2 Anzeigen der ProfilergebnisseIn dieser Aufgabe verwenden Sie Spalten-Profiling für das Profil LA_Customers, um einen raschen Überblicküber die Profilergebnisse zu erhalten.

In der folgenden Tabelle werden die Informationen wiedergegeben, die für jede Spalte in einem Profilangezeigt werden:

Eigenschaft Beschreibung

Name Name der Spalte in dem Profil.

Eindeutige Werte Anzahl der eindeutigen Werte in der Spalte

Eindeutig % Prozentsatz der eindeutigen Werte in der Spalte.

Null Anzahl der Null-Werte in der Spalte

Null % Prozentsatz der Spaltenwerte, die Null sind.

Datentyp Datentyp, der von den Werten in der Spalte abgeleitet ist. Das Analysetool kann diefolgenden Datentypen aus den Spaltenwerten ableiten:StringVarcharDezimalIntegerNull [-]

Gefolgert % Prozentsatz der Werte, die dem Datentyp entsprechen, der von dem Datentypgefolgert wurde

Dokumentierter Datentyp Datentyp, der für die Spalte in dem profilierten Objekt deklariert wurde.

Max. Wert Maximalwert in der Spalte.

Mindestwert Mindestwert in der Spalte.

18 Kapitel 4: Lektion 3. Erstellen von Schnellprofilen

Page 28: De 910HF1 DataExplorer Getting Started Guide De

Eigenschaft Beschreibung

Zuletzt profiliert Datum und Profil der letzten Profilausführung.

Drilldown Ermöglicht bei Aktivierung Drilldown mit Live-Daten für die Spalte.

1. Klicken Sie auf die Überschrift der Null-Wertspalte, um die Werte zu sortieren.

Achten Sie darauf, dass die Spalten Address2, Address3, City2, CreateDate und MiscDate 100 % Null-Werte aufweisen.

Sie erstellen in Lektion 4 ein benutzerdefiniertes Profil , um diese Spalten auszuschließen.

2. Klicken Sie auf die Spalte Full Name. Die Werte für die Spalte erscheinen in der Ansicht Werte.

Achten Sie darauf, dass Vorname und Nachname nicht in separaten Spalten erscheinen.

In Lektion 5 erstellen Sie eine Regel, um Vorname und Nachname in separate Spalten zu trennen.

3. Klicken Sie auf die Spalte CustomerTier .

Achten Sie darauf, dass die Werte für CustomerTier inkonsistent sind.

In Lektion 6 erstellen Sie eine Scorecard, um die Werte von CustomerTier zu beurteilen. In Lektion 7erstellen Sie eine Referenztabelle, die ein Entwickler verwenden kann, um die Werte von CustomerTierzu standardisieren.

4. Klicken Sie auf die Spalte State, und klicken Sie dann auf die Ansicht Muster.

Achten Sie darauf, dass 483 Spalten ein Muster von XX aufweisen, das gültige Werte angibt. SiebzehnWerte sind nicht gültig, weil sie dem gültigen Muster nicht entsprechen.

In Lektion 6 erstellen Sie eine Scorecard, um die Werte von State zu beurteilen.

Erstellen von Schnellprofilen - ZusammenfassungIn dieser Lektion haben Sie erfahren, dass ein Schnellprofil Profilergebnisse zeigt, ohne alleStichprobenoptionen der Spalten und Zeilen für ein Profil zu konfigurieren. Sie haben gelernt, ein Schnellprofilzu erstellen und auszuführen, um die Qualität der Daten zu analysieren, wenn Sie ein Datenqualitätsprojektstarten. Sie haben auch gelernt, dass das Analysetool Profiling mit der zwischengespeicherten Einfachdateifür das Einfachdatei-Datenobjekt durchführt.

Sie haben ein Schnellprofil erstellt und die Ergebnisse des Profils analysiert. Sie haben weitere Informationenzu den Spalten in dem Profil erhalten, einschließlich Nullwerten und Datentypen. Sie haben auch dieSpaltenwerte und Muster verwendet, um Datenqualitätsprobleme zu identifizieren.

Nachdem Sie die Ergebnisse eines Schnellprofils analysiert haben, können Sie die folgenden Aufgabenabschließen:

¨ Erstellen eines benutzerdefinierten Profils, um Spalten aus dem Profil auszuschließen und nur die Spalteneinzuschließen, an denen Sie interessiert sind.

¨ Erstellen einer Expressionsregel, um virtuelle Spalten zu erstellen und sie zu profilieren.

¨ Erstellen einer Referenztabelle, um gültige Werte für eine Spalte einzuschließen.

Erstellen von Schnellprofilen - Zusammenfassung 19

Page 29: De 910HF1 DataExplorer Getting Started Guide De

K A P I T E L 5

Lektion 4. Erstellen vonKundenprofilen

Dieses Kapitel umfasst die folgenden Themen:

¨ Erstellen von benutzerdefinierten Profilen - Übersicht, 20

¨ Aufgabe 1 Erstellen eines benutzerdefinierten Profils, 21

¨ Aufgabe 2 Ausführen des Profils, 21

¨ Aufgabe 3 Drilldown der Profilergebnisse, 22

¨ Erstellen von benutzerdefinierten Profilen - Zusammenfassung, 22

Erstellen von benutzerdefinierten Profilen - ÜbersichtEin Profil ist die Analyse der Datenqualität, bezogen auf den Inhalt und die Struktur der Daten. Einbenutzerdefiniertes Profil ist ein Profil, das Sie erstellen, wenn Sie die Spalten, Stichprobenoptionen undDrilldown-Optionen für ein schnelleres Profiling konfigurieren möchten. Konfigurieren Sie dieStichprobenoptionen, um die Stichprobenzeilen in der Einfachdatei auszuwählen. Konfigurieren Sie dieDrilldown-Optionen, um Drilldown auf Datensätze in den Profilergebnissen und Drilldown auf Datenzeilen inden Quelldaten oder zwischengespeicherten Daten durchzuführen.

Sie erstellen ein Profil und führen es aus, um die Qualität der Daten zu analysieren, wenn Sie einDatenqualitätsprojekt starten. Wenn Sie ein Profilobjekt erstellen, wählen Sie das Datenobjekt und die Spaltendes Datenobjekts, die Sie profilieren möchten, und konfigurieren die Stichprobenoptionen und die Drilldown-Optionen.

StoryHypoStore muss Daten aus dem neu erworbenen Büro in Los Angeles in das eigene Data Warehouseeinpflegen. HypoStores möchte die Qualität der Kundenebenendaten in der LA-Kundendatendatei bewerten.Sie sind der Analyst, der für die Bewertung der Datenqualität und die Weitergabe der Informationen an denEntwickler zuständig ist, der für die Bereinigung der Daten verantwortlich ist.

ZieleIn dieser Lektion führen Sie folgende Aufgaben durch:

1. Erstellen eines benutzerdefinierten Profils für das Einfachdatei-Datenobjekt und Ausschließen derSpalten mit Null-Werten.

2. Ausführen des Profils, um den Inhalt und die Struktur der Spalte CustomerTier zu analysieren.

3. Drilldown in die Zeilen für die Profilergebnisse.

VoraussetzungenÜberprüfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:

¨ Sie haben die Lektionen 1, 2 und 3 in diesem Tutorial abgeschlossen.

20

Page 30: De 910HF1 DataExplorer Getting Started Guide De

ZeitplanRechnen Sie mit 5 bis 10 Minuten für diese Lektion.

Aufgabe 1 Erstellen eines benutzerdefinierten ProfilsIn dieser Aufgabe verwenden Sie den Assistenten Neues Profil zur Erstellung eines benutzerdefiniertenProfils. Wenn Sie ein Profil erstellen, wählen Sie das Datenobjekt und die Spalten, die Sie profilieren möchten.Sie können auch die Stichproben- und Drilldown-Optionen konfigurieren.

1. Wählen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt.

2. Klicken Sie auf Aktionen > Neu > Neues Profil.

Der Assistent Neues Profil wird eingeblendet.

3. Im Bereich Quellen wählen Sie das Datenobjekt LA_Customers.

Der Bereich Spalten zeigt die Spalten für das Datenobjekt.

4. Klicken Sie auf Weiter.

5. Geben Sie als Namen Profile_LA_Customers_Custom ein.

6. Überprüfen Sie den Speicherort im Bereich Ordner. Der Speicherort zeigt das Tutorialprojekt und denOrdner Customers.

Der Bereich Profile zeigt Profile_LA_Customers.

7. Klicken Sie auf Weiter.

8. Löschen Sie im Bereich Spalten die Spalten Address2, Address3, City2, CreateDate und MiscDate.

9. Wählen Sie im Bereich Stichprobenoptionen die Option Alle Zeilen.

10. Überprüfen Sie im Bereich Drilldown-Optionen, dass Zeilen-Drilldown aktivieren ausgewählt ist, undwählen Sie mit zwischengespeicherten Daten für die Option Drilldown.

11. Klicken Sie auf Weiter.

12. Legen Sie gegebenenfalls einen Filter für das Profil fest.

13. Klicken Sie auf Speichern.

Das Analysetool erstellt das Profil und zeigt das Profil in einer anderen Registerkarte an.

Aufgabe 2 Ausführen des ProfilsIn dieser Aufgabe führen Sie ein Profil aus, um an dem Datenobjekt Profilierung durchzuführen und dieProfilergebnisse anzuzeigen. Das Analysetool führt ein Profiling mit der zwischengespeicherten Einfachdateifür das Einfachdatei-Datenobjekt durch.

1. Wählen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt.

2. Klicken Sie im Bereich Inhalte auf den Link Profile_LA_Customers_Custom.

Das Profil wird in einer Registerkarte eingeblendet.

3. Klicken Sie auf Aktionen > Profil ausführen.

Das Fenster Spaltenprofil wird eingeblendet.

4. Im Bereich Spalten aktivieren Sie das Kontrollkästchen Name, um alle zu profilierenden auszuwählen.

5. Behalten Sie im Fenster Stichprobenoptionen die Standardoptionen bei.

6. Behalten Sie im Fenster Drilldown-Optionen die Standardoptionen bei.

7. Klicken Sie auf Ausführen

Das Analysetool führt Profiling mit dem Datenobjekt durch und zeigt die Profilergebnisse an.

Aufgabe 1 Erstellen eines benutzerdefinierten Profils 21

Page 31: De 910HF1 DataExplorer Getting Started Guide De

Aufgabe 3 Drilldown der ProfilergebnisseIn dieser Aufgabe führen Sie ein Drilldown mit den Werten der Spalte CustomerTier durch, um die zu Grundeliegenden Zeilen in dem Datenobjekt für das Profil anzuzeigen.

1. Wählen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt.

2. Klicken Sie das Profil Profile_LA_Customers_Custom an.

Das Profil wird in einer Registerkarte geöffnet.

3. Wählen Sie in der Ansicht Spalten-Profiling die Spalte CustomerTier.

Die Werte für die Spalte erscheinen in der Ansicht Werte.

4. Verwenden Sie die Shift-Taste zur Auswahl der Werte Diamond, Ruby, Emerald und Bronze.

5. Klicken Sie mit der rechten Maustaste, und wählen Sie Drilldown.

Die Zeilen für die Spalten mit einem Wert von Diamond, Ruby, Emerald und Bronze erscheinen imBereich Drilldown. Nur die ausgewählten Spalten erscheinen im Bereich Drilldown . Die Titelleiste fürdas Bereich Drilldown zeigt die für die zu Grunde liegenden Spalten verwendete Logik.

Erstellen von benutzerdefinierten Profilen -Zusammenfassung

In dieser Lektion haben Sie erfahren, dass Sie die zu profilierenden Spalten und die Stichproben- undDrilldown-Optionen konfigurieren können. Sie haben gelernt, dass Sie ein Drilldown durchführen können, umdie zu Grunde liegenden Zeilen für die Spaltenwerte anzuzeigen, und dass Sie die Spalten konfigurierenkönnen, die eingeschlossen werden, wenn Sie die Spaltenwerte anzeigen.

Sie haben ein benutzerdefiniertes Profil erstellt, das die Spalte CustomerTier enthält, das Profil ausgeführtund ein Drilldown auf die zu Grunde liegenden Zeilen für die Spalte CustomerTier in den Ergebnissendurchgeführt.

Verwenden Sie das benutzerdefinierte Profil, um in Lektion 5 eine Expressionsregel zu erstellen. Wenn SieData Quality oder Data-Explorer haben, können Sie in Lektion 6 eine Scorecard erstellen.

22 Kapitel 5: Lektion 4. Erstellen von Kundenprofilen

Page 32: De 910HF1 DataExplorer Getting Started Guide De

K A P I T E L 6

Lektion 5. Erstellen vonExpressionsregeln

Dieses Kapitel umfasst die folgenden Themen:

¨ Erstellen von Expressionsregeln - Übersicht, 23

¨ Aufgabe 1 Erstellen von Expressionsregeln und Ausführen des Profils, 24

¨ Aufgabe 2 Anzeigen der Ausgabe der Expressionsregel , 24

¨ Aufgabe 3 Bearbeiten von Expressionsregeln, 25

¨ Erstellen von Expressionsregeln - Zusammenfassung, 25

Erstellen von Expressionsregeln - ÜbersichtExpressionsregeln verwenden Expressionsfunktionen und Quellspalten, um die Regellogik festzulegen. Siekönnen im Analysetool Expressionsregeln erstellen und einem Profil hinzufügen. Eine Expressionsregel kannmit einem oder mehreren Profilen assoziiert sein.

Die Ausgabe einer Expressionsregel ist eine virtuelle Spalte im Profil. Das Analysetool profiliert die virtuelleSpalte, wenn Sie das Profil ausführen.

Sie können Expressionsregeln verwenden, um Quellspalten zu validieren oder weitere Quellspalten bezogenauf den Wert der Quellspalten zu erstellen.

StoryHypoStore möchte, dass Daten aus dem neu erworbenen Büro in Los Angeles in das Data Warehouseeingepflegt werden. HypoStores möchte die Kundennamen analysieren und die Kundennamen in Vornameund Nachname trennen. HypoStores möchte Expressionsregeln verwenden, um eine Spalte, die Vornamenund Nachnamen enthält, in separate virtuelle Spalten zu parsen, und danach die Spalten profilieren.HypoStores möchte die Regeln auch anderen Analysten zur Verfügung stellen, die die Ausgabe dieser Regelnanalysieren müssen.

ZieleIn dieser Lektion führen Sie folgende Aufgaben durch:

1. Erstellen von Expressionsregeln, um die Spalte FullName (Vollständiger Name) in die Spalten fürVornamen und Nachnamen zu trennen. Sie erstellen eine Regel, die den Vornamen von demvollständigen Namen abtrennt. Sie erstellen eine weitere Regel, die den Nachnamen von dem Vornamenabtrennt. Sie erstellen diese Regeln für das Profil Profile_LA_Customers_Custom.

2. Führen Sie das Profil aus, und zeigen Sie die Ausgabe der Regeln im Profil an.

3. Bearbeiten Sie die Regeln, um sie für andere Benutzer des Analysetools nutzbar zu machen.

23

Page 33: De 910HF1 DataExplorer Getting Started Guide De

VoraussetzungenÜberprüfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:

¨ Sie haben die Lektionen 1, 2, 3 und 4 abgeschlossen.

ZeitplanRechnen Sie mit 10 bis 15 Minuten für diese Lektion.

Aufgabe 1 Erstellen von Expressionsregeln undAusführen des Profils

In dieser Aufgabe erstellen Sie zwei Expressionsregeln, um die Spalte FullName in zwei virtuelle Spalten mitden Bezeichnungen FirstName (Vorname) und LastName (Nachname) zu parsen. Die Spalten FirstName undLastName sind die Regelnamen.

1. Klicken Sie im Bereich Inhalte auf das Profil Profile_LA_Customers_Custom, um es zu öffnen.

Das Profil wird in einer Registerkarte eingeblendet.

2. Klicken Sie auf Aktionen > Regel hinzufügen.

Das Fenster Neue Regel wird eingeblendet.

3. Wählen Sie Regel erstellen.

4. Klicken Sie auf Weiter.

5. Geben Sie als Namen für die Regel FirstName ein.

6. Geben Sie im Bereich Expression folgende Expressionen ein, um den Vornamen von der Spalte Namezu trennen:

SUBSTR(FullName,1,INSTR(FullName,' ' ,-1,1 ) - 1)7. Klicken Sie auf Validieren.

8. Klicken Sie auf Weiter.

9. Konfigurieren Sie gegebenenfalls die Spalten-, Stichproben- und Drilldown-Optionen.

10. Klicken Sie auf Speichern.

Das Analysetool erstellt die Regel und zeigt sie in der Ansicht Spalten-Profiling an.

11. Wiederholen Sie die Schritte 2 bis 10, und erstellen Sie eine Regel namens LastName (Nachname).Geben Sie die folgende Expression ein, um den Nachnamen von der Spalte Name zu trennen:

SUBSTR(FullName,INSTR(FullName,' ',-1,1),LENGTH(FullName))

Aufgabe 2 Anzeigen der Ausgabe derExpressionsregel

In dieser Aufgabe zeigen Sie die Ausgabe von Expressionsregeln an, die nach Ausführung eines ProfilsVornamen und Nachnamen trennen.

1. Klicken Sie im Bereich Inhalte auf Aktionen > Profil ausführen.

2. Aktivieren Sie in der Ansicht Spalten-Profiling das Kontrollkästchen neben Name auf der Symbolleiste,um alle Spalten zu löschen.

3. Wählen Sie die Spalte FullName und die Regeln FirstName und LastName.

4. Klicken Sie auf Ausführen

5. Klicken Sie auf die Regel FirstName.

24 Kapitel 6: Lektion 5. Erstellen von Expressionsregeln

Page 34: De 910HF1 DataExplorer Getting Started Guide De

Die Werte erscheinen in der Ansicht Werte.

6. Wählen Sie einen beliebigen Wert in der Ansicht Werte.

7. Klicken Sie mit der rechten Maustaste, und wählen Sie Drilldown.

Die Werte für die Spalte FullName und die Regeln FirstName und LastName erscheinen im BereichDrilldown. Achten Sie darauf, dass die Spalte FullName nun in Vornamen und Nachnamen getrennt ist.

Aufgabe 3 Bearbeiten von ExpressionsregelnIn dieser Aufgabe machen Sie die Expressionsregeln wiederverwendbar und stellen Sie allen Benutzern desAnalysetools zur Verfügung.

1. Wählen Sie in der Ansicht Spalten-Profiling die Regel FirstName.

2. Klicken Sie auf Aktionen > Regel bearbeiten.

Das Fenster Regel bearbeiten wird eingeblendet.

3. Wählen Sie Als wiederverwendbare Regel speichern unter.

Das Analysetool speichert die Regel standardgemäß im aktuellen Profil und Ordner.

4. Klicken Sie auf Speichern.

5. Wiederholen Sie die Schritte 1 bis 4 für die Regel LastName.

Die Regeln FirstName und LastName können nun von jedem Benutzer des Analysetools verwendet werden,um eine Spalte mit Vor- und Nachnamen in separate Spalten zu teilen.

Erstellen von Expressionsregeln - ZusammenfassungIn dieser Lektion haben Sie erfahren, dass Expressionsregeln Expressionsfunktionen und Quellspalten zumDefinieren von Regellogik verwenden. Sie haben gelernt, dass die Ausgabe einer Expressionsregel einevirtuelle Spalte im Profil ist. Das Analysetool enthält die virtuelle Spalte, wenn Sie das Profil ausführen.

Sie haben zwei Expressionsregeln erstellt, diese zu einem Profil hinzugefügt und das Profil ausgeführt. Siehaben die Ausgabe der Regeln angezeigt und sie allen Benutzern des Analysetools zur Verfügung gestellt.

Aufgabe 3 Bearbeiten von Expressionsregeln 25

Page 35: De 910HF1 DataExplorer Getting Started Guide De

K A P I T E L 7

Lektion 6. Erstellen undAusführen von Scorecards

Dieses Kapitel umfasst die folgenden Themen:

¨ Erstellen und Ausführen von Scorecards - Übersicht, 26

¨ Aufgabe 1 Erstellen einer Scorecard aus den Profilergebnissen, 27

¨ Aufgabe 2 Ausführen der Scorecard, 27

¨ Aufgabe 3 Anzeigen der Scorecard, 28

¨ Aufgabe 4 Bearbeiten der Scorecard, 28

¨ Aufgabe 5 Konfigurieren von Schwellenwerten, 28

¨ Aufgabe 6 Anzeigen von Score-Trenddiagrammen, 29

¨ Erstellen und Ausführen von Scorecards - Zusammenfassung, 29

Erstellen und Ausführen von Scorecards - ÜbersichtEine Scorecard ist die grafische Darstellung von gültigen Werten für eine Spalte oder die Ausgabe einer Regelin Profilergebnissen. Verwenden Sie Scorecards zum Messen und Überwachen des Fortschritts derDatenqualität im Zeitverlauf.

Um eine Scorecard zu erstellen, fügen Sie einer Scorecard Spalten aus dem Profil hinzu und konfigurieren dieScorecard-Schwellenwerte. Um eine Scorecard auszuführen, wählen Sie die gültigen Werte für die Spalte undführen die Scorecard aus, um die Scores für die Spalten anzuzeigen.

Scorecards zeigen die Werthäufigkeit von Spalten in einem Profil als Scores (Punkte). Scores spiegeln denProzentsatz der gültigen Werte für eine Spalte wieder.

StoryHypoStore möchte, dass Daten aus dem neu erworbenen Büro in Los Angeles in das Data Warehouseeingepflegt werden. Bevor sie die Daten zusammenführen, möchten sie sicherstellen, dass die Daten in denunterschiedlichen Kundenebenen (CustomerTiers) und Bundesstaaten (State) auf Datenqualität analysiertwerden. Sie sind der Analyst, der für die Überwachung des Fortschritts bei der Durchführung derDatenqualitätsanalyse verantwortlich ist. Sie möchten eine Scorecard aus den Spalten "CustomerTier" und"State" erstellen, Schwellenwerte für die Datenqualität konfigurieren und die Score-Trenddiagrammeanzeigen, um zu ermitteln, wie sich die Scores im Zeitverlauf verbessern.

ZieleIn dieser Lektion führen Sie folgende Tasks durch:

1. Erstellen einer Scorecard aus den Ergebnissen des Profils Profile_LA_Customers_Custom, um dieScores für die Spalten Customer Tier und State anzuzeigen.

2. Ausführen der Scorecard, um die Scores für die Spalten CustomerTier und State zu erstellen.

26

Page 36: De 910HF1 DataExplorer Getting Started Guide De

3. Anzeigen der Scorecard, um die Scores für jede Spalte anzuzeigen.

4. Bearbeiten der Scorecard, um unterschiedliche gültige Werte für die Scores anzugeben.

5. Konfigurieren von Score-Schwellenwerten und Ausführen der Scorecard.

6. Anzeigen von Score-Trenddiagrammen, um zu ermitteln, wie sich die Scores im Zeitverlauf verbessern.

VoraussetzungenÜberprüfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:

¨ Sie haben die Lektionen 1 bis 5 in diesem Tutorial abgeschlossen.

ZeitplanPlanen Sie für die vollständige Durchführung der Tasks in dieser Lektion 15 Minuten ein.

Aufgabe 1 Erstellen einer Scorecard aus denProfilergebnissen

In dieser Aufgabe erstellen Sie eine Scorecard aus dem Profil Profile_LA_Customers_Custom, um dieSpaltenwerte von CustomerTier und State zu bewerten.

1. Öffnen Sie das Profil Profile_LA_Customers_Custom.

2. Klicken Sie auf Aktionen > Zu Scorecard zufügen.

Der Assistent Zu Scorecard zufügen wird eingeblendet.

3. Wählen Sie die Spalten CustomerTier und State, um sie der Scorecard hinzuzufügen.

4. Klicken Sie auf Weiter.

5. Klicken Sie auf Neu, um eine Scorecard zu erstellen.

Das Fenster Neue Scorecard wird eingeblendet.

6. Geben Sie als Namen für die Scorecard sc_LA_Customer ein, und navigieren Sie zum Ordner Customersfür den Scorecard-Speicherort.

7. Klicken Sie auf OK und dann auf Weiter.

8. Wählen Sie den Score CustomerTier im Bereich Scores und wählen Sie ist gültig für alle Werte imBereich Score verwendet: Werte.

9. Wählen Sie den Score State im Bereich Scores und wählen Sie die Spalte ist gültig für diejenigenWerte, die im Bereich Score verwendet: Werte Staatencodes mit zwei Buchstaben haben.

10. Akzeptieren Sie für jeden Score im Bereich Scores die Standardeinstellung für die Score-Schwellenwerteim BereichScore-Einstellungen.

11. Klicken Sie auf Fertigstellen.

Aufgabe 2 Ausführen der ScorecardIn dieser Aufgabe führen Sie die Scorecard sc_LA_Customer aus, um die Scores für die SpaltenCustomerTier und State zu erstellen.

1. Klicken Sie auf die Scorecard sc_LA_Customer, um sie zu öffnen.

Die Scorecard wird in einer Registerkarte eingeblendet.

2. Klicken Sie auf Aktionen > Scorecard ausführen.

Die Ansicht Scorecard zeigt die Scores für die Spalten CustomerTier und State.

Aufgabe 1 Erstellen einer Scorecard aus den Profilergebnissen 27

Page 37: De 910HF1 DataExplorer Getting Started Guide De

Aufgabe 3 Anzeigen der ScorecardIn dieser Aufgabe zeigen Sie die Scorecard sc_LA_Customer an, um die Scores für die Spalten CustomerTierund State zu sehen.

1. Wählen Sie die Spalte State, die den Score für State enthält, den Sie sehen möchten.

2. Klicken Sie auf Aktionen > Drilldown.

Die gültigen Scores für die Spalte State erscheinen in der Ansicht Gültig. Klicken Sie auf Ungültig, umdie Scores einzublenden, die nicht für die Statusspalte gültig sind. Im Bereich Scores können Sie denNamen des Scores und den Prozentsatz des Scores anzeigen. Sie können den als Balken angezeigtenScore, die Datenobjekte des Scores und die Quelle und die Quelltypen des Scores sehen.

3. Wiederholen Sie die Schritte 1 und 2 für die Spalte CustomerTier.

Alle Scores für die Spalte CustomerTier sind gültig.

Aufgabe 4 Bearbeiten der ScorecardIn dieser Aufgabe bearbeiten Sie die Scorecard sc_ LA_Customer, um anzugeben, dass der Wert Ruby nichtgültig für den Score CustomerTier ist.

1. Klicken Sie auf Aktionen > Bearbeiten.

Das Fenster Scorecard bearbeiten wird eingeblendet.

2. Wählen Sie den Score CustomerTier im Bereich Scores .

3. Löschen Sie im Bereich Score verwendet: Werte Ruby aus der Spalte ist gültig.

Akzeptieren Sie die Standardeinstellungen im Bereich Score-Einstellungen.

4. Klicken Sie auf Speichern, um die Änderungen an der Scorecard zu speichern und diese auszuführen.

5. Sehen Sie sich den Score CustomerTier erneut an.

Aufgabe 5 Konfigurieren von SchwellenwertenIn dieser Aufgabe konfigurieren Sie Schwellenwerte für den Score State in der Scorecard sc_LA_Customer,um die akzeptablen Bereiche für die Daten in der Spalte State zu ermitteln. Werte mit einem 2-Buchstaben-Code, wie CA, sind akzeptabel, und Codes mit mehr als zwei Buchstaben, wie Calif, sind nicht akzeptabel.

1. Wählen Sie im Fenster Scorecard bearbeiten den Score State im Bereich Scores.

2. Geben Sie im Bereich Score-Einstellungen folgende Bereiche für die Scores Gut und Inakzeptabel inBenutzerdef. Schwellenwerte für diesen Score festlegen ein: 90 bis 100 % Gut; 0 bis 50 %Inakzeptabel. 51 % bis 89 % sind Akzeptabel.

Die Schwellenwerte stehen für die unteren Grenzen der akzeptablen und guten Bereiche.

3. Klicken Sie auf Speichern, um die Änderungen an der Scorecard zu speichern und diese auszuführen.

Sehen Sie sich im Bereich Scores die Änderungen an den Score-Prozentsätzen und dem Score an, derals Balken für den Score State angezeigt wird.

28 Kapitel 7: Lektion 6. Erstellen und Ausführen von Scorecards

Page 38: De 910HF1 DataExplorer Getting Started Guide De

Aufgabe 6 Anzeigen von Score-TrenddiagrammenIn dieser Aufgabe zeigen Sie das Trenddiagramm für den Score State an. Sie können Trenddiagrammeanzeigen, um Scores im Zeitverlauf zu überwachen.

1. Wählen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt.

2. Klicken Sie auf die Scorecard sc_LA_Customer, um sie zu öffnen.

Die Scorecard wird in einer Registerkarte eingeblendet.

3. Wählen Sie in der Scorecard -Ansicht den Score State.

4. Klicken Sie auf Aktionen > Trenddiagramm anzeigen.

Der Trenddiagramm-Detailfenster wird eingeblendet. Sie können die Schwellenwerte Gut, Akzeptabelund Inakzeptabel für den Score anzeigen. Die Schwellenwerte ändern sich jedes Mal, wenn Sie dieScorecard ausführen, nachdem Sie die Werte für Scores in der Scorecard bearbeitet haben.

Erstellen und Ausführen von Scorecards -Zusammenfassung

In dieser Lektion haben Sie gelernt, dass Sie eine Scorecard aus den Ergebnissen eines Profils erstellenkönnen. Eine Scorecard enthält die Spalten aus einem Profil. Sie haben gelernt, dass Sie eine Scorecardausführen können, um Scores für Spalten zu erstellen. Sie haben eine Scorecard bearbeitet, um gültige Wertezu konfigurieren und Schwellenwerte für Scores festzulegen. Sie haben auch erfahren, wie das Score-Trenddiagramm angezeigt wird.

Sie haben eine Scorecard aus den Spalten CustomerTier und State in einem Profil erstellt, um dieDatenqualität für die Spalten CustomerTier und State zu analysieren. Sie haben die Scorecard ausgeführt, umScores für jede Spalte zu erstellen. Sie haben die Scorecard bearbeitet, um unterschiedliche gültige Werte fürScores anzugeben. Sie haben Schwellenwerte für einen Score konfiguriert und das Score-Trenddiagrammangezeigt.

Aufgabe 6 Anzeigen von Score-Trenddiagrammen 29

Page 39: De 910HF1 DataExplorer Getting Started Guide De

K A P I T E L 8

Lektion 7. Erstellen vonReferenztabellen aus Profilspalten

Dieses Kapitel umfasst die folgenden Themen:

¨ Erstellen von Referenztabellen aus Profilspalten - Übersicht, 30

¨ Aufgabe 1 Erstellen einer Referenztabelle aus Profilspalten, 31

¨ Aufgabe 2 Bearbeiten der Referenztabelle, 32

¨ Erstellen von Referenztabellen aus Profilspalten - Zusammenfassung, 32

Erstellen von Referenztabellen aus Profilspalten -Übersicht

Eine Referenztabelle enthält Referenzdaten, die zum Standardisieren von Quelldaten verwendet werdenkönnen. Referenzdaten können gültige und Standardwerte einschließen. Erstellen Sie Referenztabellen, umBeziehungen zwischen Quelldatenwerten und den gültigen und Standardwerten einzurichten.

Sie können eine Referenztabelle aus den Ergebnissen eines Profils erstellen. Nachdem Sie eineReferenztabelle erstellt haben, können Sie sie bearbeiten, um Spalten oder Zeilen hinzuzufügen oderStandard- und gültige Werte hinzuzufügen oder zu bearbeiten. Sie können die Änderungen, die an einerReferenztabelle vorgenommen wurden, in einem Audit-Trail anzeigen.

StoryHypoStores möchte die Daten profilieren, um Abweichungen aufzuzeigen und die Daten mit gültigen Wertenzu standardisieren. Sie sind der Analyst, der für die Standardisierung der gültigen Werte in den Datenverantwortlich ist. Sie möchten eine Referenztabelle auf Grundlage von gültigen Werten aus Profilspaltenerstellen.

ZieleIn dieser Lektion führen Sie folgende Aufgaben durch:

1. Erstellen einer Referenztabelle aus der Spalte CustomTier im Profil Profile_LA_Customers_Custom durchAuswahl von gültigen Werten für Spalten.

2. Bearbeiten der Referenztabelle, um unterschiedliche gültige Werte für die Spalten zu konfigurieren.

VoraussetzungenÜberprüfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:

¨ Sie haben die Lektionen 1 bis 6 in diesem Tutorial abgeschlossen.

ZeitplanRechnen Sie mit 15 Minuten, um die Aufgaben in dieser Lektion abzuschließen.

30

Page 40: De 910HF1 DataExplorer Getting Started Guide De

Aufgabe 1 Erstellen einer Referenztabelle ausProfilspalten

In dieser Aufgabe erstellen Sie eine Referenztabelle und fügen die Spalte CustomerTier aus dem ProfilProfile_LA_Customers_Custom zu der Referenztabelle hinzu.

1. Klicken Sie das Profil Profile_LA_Customers_Custom an.

Das Profil wird in einer Registerkarte eingeblendet.

2. Wählen Sie in der Ansicht Spalten-Profiling die Spalte CustomerTier, die Sie der Referenztabellehinzufügen möchten.

Sie können Drilldown bis zu dem Wert und den Musterhäufigkeiten für die Spalte CustomerTierdurchführen, um Datensätze zu untersuchen, die nicht standardgemäße Kundenkategoriewerteaufweisen.

3. In der Ansicht Werte wählen Sie die gültigen CustomerTier-Werte, die Sie hinzufügen möchten.Verwenden Sie die STRG- und die Umschalttaste, um folgende Mehrfachwerte auszuwählen: Diamond,Gold, Silver, Bronze, Emerald (Diamant, Gold, Silber, Bronze, Smaragd).

4. Klicken Sie auf Aktionen > Hinzufügen zu Referenztabelle.

Der Assistent Neue Referenztabelle wird eingeblendet.

5. Wählen Sie die Option Neue Referenztabelle erstellen.

6. Klicken Sie auf Weiter.

7. Geben Sie als Tabellennamen Reftab_CustTier_HypoStores ein.

8. Geben Sie eine Beschreibung ein, und legen Sie als Standardwert 0 fest.

Das Analysetool verwendet den Standardwert für jeden Datensatz der Tabelle, welcher keinen Wertenthält.

9. Klicken Sie auf Weiter.

10. Im Bereich Spaltenattribute konfigurieren Sie die folgenden Spalteneigenschaften für die SpalteCustomerTier:

Eigenschaft Beschreibung

Name CustomerTier

Datentyp String

Präzision 10

Größenordnung 0

Beschreibung Referenzwerte für CustomerTier

11. Erstellen Sie gegebenenfalls eine Beschreibungsspalte für Zeilen in der Referenztabelle. Geben Sie denNamen und die Präzision für die Spalte ein.

12. Erstellen Sie im Bereich Vorschau eine Vorschau für die Werte in der Spalte CustomerTier.

13. Klicken Sie auf Weiter.

Die Referenztabelle Reftab_CustomerTier_Hypostores wird eingeblendet. Sie können gegebenenfallseine Beschreibung eingeben.

14. Wählen Sie im Bereich Speichern unter Ihr Tutorialprojekt, in dem Sie die Referenztabelle erstellenmöchten.

Der Bereich Referenztabellen:zeigt die Referenztabellen an dem von Ihnen gewählten Speicherort.

15. Geben Sie eine optionale Audit-Anmerkung ein.

16. Klicken Sie auf Fertigstellen.

Aufgabe 1 Erstellen einer Referenztabelle aus Profilspalten 31

Page 41: De 910HF1 DataExplorer Getting Started Guide De

Aufgabe 2 Bearbeiten der ReferenztabelleSie bearbeiten in dieser Aufgabe die Tabelle Reftab_CustomerTier_Hypostores, um alternative Werte für dieKundenebenen hinzuzufügen.

1. Wählen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt.

2. Klicken Sie auf die Referenztabelle Reftab_CustomerTier_Hypostores.

Die Referenztabelle wird in einer Registerkarte geöffnet.

3. Um eine Zeile zu bearbeiten, wählen Sie die Zeile aus und klicken auf Aktionen > Bearbeitenoderklicken auf das Symbol Bearbeiten.

Das Fenster Zeile bearbeiten wird eingeblendet. Wählen Sie gegebenenfalls mehrere Zeilen, um jederZeile den gleichen alternativen Wert hinzuzufügen.

4. Geben Sie für die Zeilen Diamond, Emerald, Gold, Silver, and Bronze folgende alternative Werte ein: 1,2, 3, 4, 5.

Geben Sie eine optionale Audit-Anmerkung ein.

5. Klicken Sie auf Übernehmen, um die Änderungen zu übernehmen.

Erstellen von Referenztabellen aus Profilspalten -Zusammenfassung

Sie haben in dieser Lektion erfahren, wie Referenztabellen aus den Ergebnissen eines Profils erstellt werden,um gültige Werte für Quelldaten zu konfigurieren.

Sie haben eine Referenztabelle aus einer Profilspalte erstellt, indem gültige Werte für die Spalten ausgewähltwurden. Sie haben die Referenztabelle bearbeitet, um unterschiedliche gültige Werte für die Spalten zukonfigurieren.

32 Kapitel 8: Lektion 7. Erstellen von Referenztabellen aus Profilspalten

Page 42: De 910HF1 DataExplorer Getting Started Guide De

K A P I T E L 9

Lektion 8. Erstellen vonReferenztabellen

Dieses Kapitel umfasst die folgenden Themen:

¨ Erstellen von Referenztabellen - Übersicht, 33

¨ Aufgabe 1 Erstellen einer neuen Referenztabelle, 34

¨ Erstellen von Referenztabellen - Zusammenfassung, 34

Erstellen von Referenztabellen - ÜbersichtEine Referenztabelle enthält Referenzdaten, die zum Standardisieren von Quelldaten verwendet werdenkönnen. Referenzdaten können gültige und Standardwerte einschließen. Erstellen Sie Referenztabellen, umBeziehungen zwischen den Quelldatenwerten und den gültigen und Standard-Werten einzurichten.

Eine Referenztabelle kann manuell mit dem Referenztabellen-Editor erstellt werden. Verwenden Sie dieReferenztabelle, um die Quelldaten zu definieren und zu standardisieren. Sie können die Referenztabellegemeinsam mit einem Entwickler nutzen, um sie im Standardisierer und in Lookup-Transformationen imEntwicklertool zu verwenden.

StoryHypoStores möchte Daten mit gültigen Werten standardisieren. Sie sind der Analyst, der für dieStandardisierung der gültigen Werte in den Daten verantwortlich ist. Sie möchten eine Referenztabelleerstellen, um Standard-Tier-Codes für Kunden zu definieren, die die LA-Kundendaten referenzieren. Danachkönnen Sie die Referenztabelle gemeinsam mit einem Entwickler nutzen.

ZieleIn dieser Lektion führen Sie folgende Aufgabe durch:

¨ Erstellen einer Referenztabelle mit dem Referenztabellen-Editor, um Standard-Tier-Codes für Kunden zudefinieren, die die LA-Kundendaten referenzieren.

VoraussetzungenÜberprüfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:

¨ Sie haben die Lektionen 1 und 2 in diesem Tutorial abgeschlossen.

ZeitplanRechnen Sie mit 10 Minuten, um die Aufgabe in dieser Lektion abzuschließen.

33

Page 43: De 910HF1 DataExplorer Getting Started Guide De

Aufgabe 1 Erstellen einer neuen ReferenztabelleIn dieser Aufgabe erstellen Sie die Referenztabelle Reftab_CustomerTier_Codes, um die gültigen Werte fürdie CustomerTier-Daten zu standardisieren.

1. Wählen Sie im Navigator den Ordner Customer in Ihrem Tutorialprojekt, in dem Sie die Referenztabelleerstellen möchten.

2. Klicken Sie auf Aktionen > Neue Referenztabelle.

Der Assistent Neue Referenztabelle wird eingeblendet.

3. Wählen Sie die Option Referenztabellen-Editor verwenden.

4. Klicken Sie auf Weiter.

5. Geben Sie als Tabellename Reftab_CustomerTier_Codes an, und geben Sie ggf. eine Beschreibung ein.Setzen Sie den Standardwert auf 0.

Das Analysetool verwendet den Standardwert für jeden Datensatz der Tabelle, welcher keinen Wertenthält.

6. Klicken Sie für jede Spalte, die Sie in die Referenztabelle aufnehmen möchten, auf das Symbol NeueSpalte hinzufügen, und konfigurieren Sie die Spalteneigenschaften für jede Spalte.

Fügen Sie folgende Spaltennamen hinzu: CustomerID (Kunden-ID), CustomerTier (Kundenebene) undStatus. Sie können die Spalten neu ordnen oder Spalten löschen.

7. Klicken Sie auf Fertigstellen.

8. Öffnen Sie die Referenztabelle Reftab_CustomerTier_Codes, und klicken Sie auf Aktionen > Zeilehinzufügen, um jede Spalte der Referenztabelle mit vier Werten zu füllen.

CustomerID = LA1, LA2, LA3, LA4

CustomerTier = 1, 2, 3, 4, 5.

Status = Aktiv, Inaktiv

Erstellen von Referenztabellen - ZusammenfassungIn dieser Lektion haben Sie erfahren, wie Referenztabellen mit dem Referenztabellen-Editor erstellt werden,um gültige Standardwerte zu erstellen, die mit Quelldaten verwendet werden.

Sie haben eine Referenztabelle unter Verwendung des Referenztabellen-Editors erstellt, umKundenebenenwerte für die LA-Kundendaten zu standardisieren.

34 Kapitel 9: Lektion 8. Erstellen von Referenztabellen

Page 44: De 910HF1 DataExplorer Getting Started Guide De

Teil II: Inbetriebnahme desInformatica Developer

Dieser Teil enthält die folgenden Kapitel:

¨ Lektion 1. Einrichten von Informatica Developer, 36

¨ Lektion 2. Importieren von physischen Datenobjekten , 40

¨ Lektion 3. Profiling von Daten, 44

35

Page 45: De 910HF1 DataExplorer Getting Started Guide De

K A P I T E L 1 0

Lektion 1. Einrichten vonInformatica Developer

Dieses Kapitel umfasst die folgenden Themen:

¨ Einrichten von Informatica Developer - Übersicht, 36

¨ Aufgabe 1 Informatica Developer starten, 37

¨ Aufgabe 2 Eine Domäne hinzufügen, 37

¨ Aufgabe 3 Ein Model Repository hinzufügen, 37

¨ Aufgabe 4 Ein Projekt erstellen, 38

¨ Aufgabe 5 Einen Ordner erstellen, 38

¨ Aufgabe 6 Standard-Data Integration Service auswählen., 38

¨ Einrichten von Informatica Developer - Zusammenfassung, 39

Einrichten von Informatica Developer - ÜbersichtBevor Sie mit den Lektionen in diesem Tutorial beginnen können, müssen Sie das Entwicklertool starten undeinrichten. Fügen Sie eine Domäne hinzu, um das Entwicklertool einzurichten. Sie fügen ein Modell-Repository hinzu, das sich in der Domäne befindet, und Sie erstellen ein Projekt und einen Ordner, um IhreArbeit zu speichern. Außerdem wählen Sie einen Standard-Data Integration Service.

Die Informatica-Domäne ist eine Sammlung von Knoten und Diensten, die die Informatica-Umgebungdefinieren. Zu den Diensten in der Domäne gehören der Model Repository Service und der Data IntegrationService.

Der Model Repository Service verwaltet das Model Repository. Das Model Repository ist eine relationaleDatenbank, die die Metadaten für Projekte speichert, die Sie im Entwicklertool erstellen. In einem Projektwerden Objekte gespeichert, die Sie im Entwicklertool erstellen. Ein Projekt kann auch Ordner enthalten, indenen verwandte Objekte gespeichert werden, wie Objekte, die Teile der gleichen Geschäftsumgebung sind.

Der Data Integration Service führt Datenintegrationsaufgaben im Entwicklertool aus.

ZieleIn dieser Lektion führen Sie folgende Aufgaben durch:

¨ Entwicklertool starten und zur Entwicklertool-Workbench gehen.

¨ Hinzufügen einer Domäne im Entwicklertool.

¨ Hinzufügen eines Model Repository, damit Sie ein Projekt erstellen können.

¨ Erstellen eines Projekts, um die Objekte zu speichern, die Sie im Entwicklertool erstellen.

¨ Erstellen eines Ordners im Projekt, in dem Sie verwandte Objekte speichern können.

¨ Auswählen eines Standard-Data Integration Service zur Durchführung von Datenintegrationsaufgaben.

36

Page 46: De 910HF1 DataExplorer Getting Started Guide De

VoraussetzungenÜberprüfen Sie die folgenden Voraussetzungen, bevor Sie mit dieser Lektion beginnen:

¨ Sie haben das Entwicklertool installiert.

¨ Sie haben einen Domänennamen, einen Hostnamen und eine Portnummer, um sich mit einer Domäne zuverbinden. Sie erhalten diese Informationen von einem Domänenadministrator.

¨ Ein Domänenadministrator hat im Administratortool einen Model Repository Service konfiguriert.

¨ Sie haben einen Benutzernamen und ein Passwort, um auf den Model Repository Service zuzugreifen. Siekönnen diese Informationen von einem Domänenadministrator erhalten.

¨ Ein Domänenadministrator hat einen Data Integration Service konfiguriert.

¨ Der Data Integration Service wird ausgeführt.

ZeitplanRechnen Sie mit 5 bis 10 Minuten, um die Aufgaben in dieser Lektion abzuschließen.

Aufgabe 1 Informatica Developer startenStarten Sie das Entwicklertool, um mit dem Tutorial zu beginnen.

1. Starten Sie das Entwicklertool.

Die Begrüßungsseitedes Entwicklertools wird eingeblendet.

2. Klicken Sie auf Workbench.

Die Workbench des Entwicklertools wird eingeblendet.

Aufgabe 2 Eine Domäne hinzufügenIn dieser Aufgabe fügen Sie im Entwicklertool eine Domäne hinzu, um auf ein Model Repository zuzugreifen.

1. Klicken Sie auf Fenster > Einstellungen.

Das Dialogfeld Einstellungen wird eingeblendet

2. Wählen Sie Informatica > Domänen.

3. Klicken Sie auf Hinzufügen.

Das Dialogfeld Neue Domäne wird eingeblendet

4. Geben Sie den Domänennamen, den Hostnamen und die Portnummer ein.

5. Klicken Sie auf Fertigstellen.

6. Klicken Sie auf OK.

Aufgabe 3 Ein Model Repository hinzufügenIn dieser Aufgabe fügen Sie ein Modell-Repository zum Speichern von Projekten und Ordnern hinzu.

1. Klicken Sie auf Datei > Mit Repository verbinden.

Das Dialogfeld Mit Repository verbinden wird eingeblendet.

2. Klicken Sie auf Durchsuchen, um einen Model Repository Service auszuwählen.

3. Klicken Sie auf OK.

Aufgabe 1 Informatica Developer starten 37

Page 47: De 910HF1 DataExplorer Getting Started Guide De

4. Klicken Sie auf Weiter.

5. Geben Sie Ihren Benutzernamen und Ihr Passwort ein.

6. Wählen Sie einen Namespace aus.

7. Klicken Sie auf Fertigstellen.

Das Modell-Repository wird in der Ansicht Object Explorer angezeigt.

Aufgabe 4 Ein Projekt erstellenIn dieser Aufgabe erstellen Sie ein Projekt, um Objekte zu speichern, die Sie im Entwicklertool erstellt haben.Sie können ein Projekt für alle Tutorials in dieser Anleitung erstellen.

1. Wählen Sie in der Ansicht Object Explorer einen Model Repository Service.

2. Klicken Sie auf Datei > Neu > Projekt.

Das Dialogfeld Neues Projekt wird eingeblendet.

3. Geben Sie Ihren Namen mit vorangestelltem "Tutorial_" als Namen des Projekts ein.

4. Klicken Sie auf Fertigstellen.

Das Projekt wird unter dem Model Repository Service in der Ansicht Object Explorer angezeigt.

Aufgabe 5 Einen Ordner erstellenIn dieser Aufgabe erstellen Sie einen Ordner, um verwandte Objekte zu speichern. Sie können einen Ordnerfür alle Tutorials in dieser Anleitung erstellen.

1. Wählen Sie in der Ansicht Object Explorer das Projekt, dem Sie die Ordner hinzufügen möchten.

2. Klicken Sie auf Datei > Neu > Ordner.

3. Geben Sie einen Namen für den Ordner ein.

4. Klicken Sie auf Fertigstellen.

Das Entwicklertool fügt den Ordner unter dem Projekt in der Ansicht Object Explorer ein. Erweitern Siedas Projekt, um den Ordner zu sehen.

Aufgabe 6 Standard-Data Integration Serviceauswählen.

In dieser Aufgabe wählen Sie einen Standard-Data Integration Service aus, damit Sie Mappings ausführenund die Vorschau von Daten anzeigen können.

1. Klicken Sie auf Fenster > Einstellungen.

Das Dialogfeld Einstellungen wird eingeblendet

2. Wählen Sie Informatica > Data Integration Services.

3. Erweitern Sie die Domäne.

4. Wählen Sie einen Data Integration Service.

5. Klicken Sie auf Als Standard definieren.

6. Klicken Sie auf OK.

38 Kapitel 10: Lektion 1. Einrichten von Informatica Developer

Page 48: De 910HF1 DataExplorer Getting Started Guide De

Einrichten von Informatica Developer -Zusammenfassung

In dieser Lektion haben Sie erfahren, dass der Model Repository Service und der Data Integration Service zuder Informatica-Domäne gehören. Der Model Repository Service verwaltet das Model Repository. Ein ModelRepository enthält Projekte und Ordner. Der Data Integration Service führt Datenintegrationsaufgaben aus.

Sie haben das Entwicklertool gestartet und eingerichtet. Sie haben im Entwicklertool eine Domäne und einModel Repository hinzugefügt und ein Projekt sowie einen Ordner erstellt. Sie haben außerdem einenStandard-Data Integration Service ausgewählt.

Sie können nun das Entwicklertool verwenden, um weitere Lektionen in diesem Tutorial durchzuarbeiten.

Einrichten von Informatica Developer - Zusammenfassung 39

Page 49: De 910HF1 DataExplorer Getting Started Guide De

K A P I T E L 1 1

Lektion 2. Importieren vonphysischen Datenobjekten

Dieses Kapitel umfasst die folgenden Themen:

¨ Importieren von physischen Datenobjekten - Übersicht, 40

¨ Aufgabe 1 Importieren des Einfachdatei-Datenobjekts Boston_Customers, 41

¨ Aufgabe 2 Import des Einfachdatei-Datenobjekts LA_Customers, 41

¨ Aufgabe 3 Importieren des Einfachdatei-Datenobjekts All_Customers, 42

¨ Importieren von physischen Datenobjekten - Zusammenfassung, 43

Importieren von physischen Datenobjekten - ÜbersichtEin physisches Datenobjekt ist eine Darstellung von Daten, die auf einer Einfachdatei oder einer Tabelle einerrelationalen Datenbank basieren. Sie können eine Einfachdatei oder Tabelle einer relationalen Datenbank alsphysisches Datenobjekt importieren, um es als Quelle oder Ziel in einem Mapping einzusetzen.

StoryHypoStores Corporation speichert Kundendaten aus dem Büro in Los Angeles und dem Büro in Boston inEinfachdateien. Sie möchten mit diesen Kundendaten im Entwicklertool arbeiten. Dazu müssen Sie jedeEinfachdatei als physisches Datenobjekt importieren.

ZieleIn dieser Lektion importieren Sie Einfachdateien als physische Datenobjekte. Sie können dasQuelldateiverzeichnis auch so festlegen, dass der Data Integration Service die Quelldaten aus dem richtigenVerzeichnis lesen kann.

VoraussetzungenÜberprüfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:

¨ Sie haben Lektion 1 in diesem Tutorial abgeschlossen.

ZeitplanRechnen Sie mit 10 bis 15 Minuten, um die Aufgaben in dieser Lektion durchzuführen.

40

Page 50: De 910HF1 DataExplorer Getting Started Guide De

Aufgabe 1 Importieren des Einfachdatei-DatenobjektsBoston_Customers

In dieser Aufgabe importieren Sie ein physisches Datenobjekt aus einer Datei, die Kundendaten aus demBüro in Boston enthält.

1. Wählen Sie in der Ansicht Object Explorer das Tutorialprojekt aus.

2. Klicken Sie auf Datei > Neu > Datenobjekt.

Das Dialogfeld Neu wird eingeblendet.

3. Wählen Sie Physische Datenobjekte > Einfachdatei-Datenobjekt, und klicken Sie auf Weiter

Das Dialogfeld Neues Einfachdatei-Datenobjekt wird eingeblendet.

4. Wählen Sie Aus vorhandener Einfachdatei erstellen.

5. Klicken Sie auf Durchsuchen, und gehen Sie zu Boston_Customers.csv im Verzeichnis <InformaticaInstallation Directory>\clients\DeveloperClient\Tutorials.

6. Klicken Sie auf Öffnen.

Der Assistent benennt das Datenobjekt "Boston_Customers".

7. Klicken Sie auf Weiter.

8. Vergewissern Sie sich, dass die Codepage MS Windows Latin 1 (ANSI) ist, eine Obermenge von Latin 1.

9. Vergewissern Sie sich, dass das Format "delimited" ist.

10. Klicken Sie auf Weiter.

11. Vergewissern Sie sich, dass das Komma als Delimiter festgelegt ist.

12. Wählen Sie Spaltennamen aus erster Zeile importieren.

13. Klicken Sie auf Fertigstellen.

Das physische Datenobjekt Boston_Customers erscheint im Tutorialprojekt unter PhysischeDatenobjekte.

14. Klicken Sie auf die Ansicht Lesen, und wählen Sie die Ausgabeumwandlung.

15. Klicken Sie auf die Registerkarte Laufzeit in der Ansicht Eigenschaften.

16. Richten Sie das Quelldateiverzeichnis auf das folgende Verzeichnis des Rechners ein, auf dem der DataIntegration Service läuft: <Informatica Installation Directory>\server\Tutorials

17. Klicken Sie auf Datei > Speichern.

Aufgabe 2 Import des Einfachdatei-DatenobjektsLA_Customers

In dieser Aufgabe importieren Sie ein physisches Datenobjekt aus einer Einfachdatei, die Kundendaten ausdem Büro in Los Angeles enthält.

1. Wählen Sie in der Ansicht Object Explorer das Tutorialprojekt aus.

2. Klicken Sie auf Datei > Neu > Datenobjekt.

Das Dialogfeld Neu wird eingeblendet.

3. Wählen Sie Physische Datenobjekte > Einfachdatei-Datenobjekt, und klicken Sie auf Weiter.

Das Dialogfeld Neues Einfachdatei-Datenobjekt wird eingeblendet.

4. Wählen Sie Aus vorhandener Einfachdatei erstellen.

5. Klicken Sie auf Durchsuchen, und gehen Sie im Verzeichnis <Informatica Installation Directory>\clients\DeveloperClient\Tutorialszu LA_Customers.csv.

Aufgabe 1 Importieren des Einfachdatei-Datenobjekts Boston_Customers 41

Page 51: De 910HF1 DataExplorer Getting Started Guide De

6. Klicken Sie auf Öffnen.

Der Assistent benennt das Datenobjekt LA_Customers.

7. Klicken Sie auf Weiter.

8. Vergewissern Sie sich, dass die Codepage MS Windows Latin 1 (ANSI) ist, eine Obermenge von Latin 1.

9. Vergewissern Sie sich, dass das Format "delimited" ist.

10. Klicken Sie auf Weiter.

11. Vergewissern Sie sich, dass das Komma als Delimiter festgelegt ist.

12. Wählen Sie Spaltennamen aus erster Zeile importieren.

13. Klicken Sie auf Fertigstellen.

Das physische Datenobjekt LA_Customers erscheint im Tutorialprojekt unter PhysischeDatenobjekte.

14. Klicken Sie auf die Ansicht Lesen, und wählen Sie die Ausgabeumwandlung.

15. Klicken Sie auf die Registerkarte Laufzeit in der Ansicht Eigenschaften.

16. Richten Sie das Quelldateiverzeichnis auf das folgende Verzeichnis des Rechners ein, auf dem der DataIntegration Service läuft: <Informatica Installation Directory>\server\Tutorials .

17. Klicken Sie auf Datei > Speichern.

Aufgabe 3 Importieren des Einfachdatei-DatenobjektsAll_Customers

In dieser Aufgabe importieren Sie ein physisches Datenobjekt aus einer Einfachdatei, die Kunden-Auftragsdaten aus den Büros in Los Angeles und Bosten kombiniert.

1. Wählen Sie in der Ansicht Object Explorer das Tutorialprojekt aus.

2. Klicken Sie auf Datei > Neu > Datenobjekt.

Das Dialogfeld Neu wird eingeblendet.

3. Wählen Sie Physische Datenobjekte > Einfachdatei-Datenobjekt, und klicken Sie auf Weiter.

Das Dialogfeld Neue Einfachdatei-Datenquelle wird eingeblendet.

4. Wählen Sie Aus vorhandener Einfachdatei erstellen.

5. Klicken Sie auf Durchsuchen, und gehen Sie im Verzeichnis <Informatica-Installationsverzeichnis>\clients\DeveloperClient\Tutorials zu All_Customers.csv.

6. Klicken Sie auf Öffnen.

Der Assistent benennt das Datenobjekt "All_Customers".

7. Klicken Sie auf Weiter.

8. Vergewissern Sie sich, dass die Codepage MS Windows Latin 1 (ANSI) ist, eine Obermenge von Latin 1.

9. Vergewissern Sie sich, dass das Format "delimited" ist.

10. Klicken Sie auf Weiter.

11. Vergewissern Sie sich, dass das Komma als Delimiter festgelegt ist.

12. Wählen Sie Spaltennamen aus erster Zeile importieren.

13. Klicken Sie auf Fertigstellen.

Das physische Datenobjekt All_Customers erscheint im Tutorialprojekt unter Physische Datenobjekte.

14. Klicken Sie auf die Ansicht Lesen, und wählen Sie die Ausgabeumwandlung.

15. Klicken Sie auf die Registerkarte Laufzeit in der Ansicht Eigenschaften.

42 Kapitel 11: Lektion 2. Importieren von physischen Datenobjekten

Page 52: De 910HF1 DataExplorer Getting Started Guide De

16. Richten Sie das Quelldateiverzeichnis auf das folgende Verzeichnis des Rechners ein, auf dem der DataIntegration Service läuft: <Informatica Installation Directory>\server\Tutorials .

17. Klicken Sie auf Datei > Speichern.

Importieren von physischen Datenobjekten -Zusammenfassung

In dieser Lektion haben Sie erfahren, dass physische Datenobjekte Darstellungen von Daten sind, die aufeiner Einfachdatei oder einer Tabelle einer relationalen Datenbank basieren.

Sie haben physische Datenobjekte aus Einfachdateien erstellt. Sie können das Quelldateiverzeichnis auch sofestlegen, dass der Data Integration Service die Quelldaten aus dem richtigen Verzeichnis lesen kann.

Sie verwenden die Datenobjekte als Mapping-Quellen in den Datenqualitätslektionen.

Importieren von physischen Datenobjekten - Zusammenfassung 43

Page 53: De 910HF1 DataExplorer Getting Started Guide De

K A P I T E L 1 2

Lektion 3. Profiling von DatenDieses Kapitel umfasst die folgenden Themen:

¨ Profiling von Daten - Übersicht, 44

¨ Aufgabe 1 Durchführen einer Join-Analyse mit zwei Datenquellen , 45

¨ Aufgabe 2 Anzeigen der Ergebnisse einer Join-Analyse, 46

¨ Aufgabe 3 Ausführen eines Profils für eine Datenquelle, 46

¨ Aufgabe 4 Anzeigen von Ergebnissen des Spalten-Profiling , 47

¨ Profiling von Daten - Zusammenfassung, 47

Profiling von Daten - ÜbersichtEin Profil ist ein Satz von Metadaten, das den Inhalt und die Struktur eines Datensatzes zeigt.

Daten-Profiling ist oft der erste Schritt in einem Projekt. Sie können ein Profil ausführen, um die Struktur derDaten zu bewerten und sich zu vergewissern, dass Datenspalten mit den Typen von Informationen befülltsind, die Sie erwarten. Wenn ein Profil Probleme in den Daten aufzeigt, können Sie Schritte in Ihrem Projektfestlegen, um diese Probleme zu beheben. Wenn ein Profil beispielsweise aufzeigt, dass eine Spalte Werteenthält, die über der erwarteten Länge liegen, können Sie Datenqualitätsprozesse entwerfen, um dieproblematischen Werte zu entfernen oder zu entschärfen.

Ein Profil, das die Datenqualität von ausgewählten Spalten analysiert, wird als Spaltenprofil bezeichnet.

Hinweis: Sie können auch das Entwicklertool verwenden, um Beziehungen von Primärschlüssel,Fremdschlüssel und funktionaler Abhängigkeit zu erkennen und Join-Bedingungen an Datenspalten zuanalysieren.

Ein Spaltenprofil liefert die folgenden Fakten über Daten:

¨ Die Anzahl der eindeutigen und Null-Werte in jeder Spalte, angegeben als Zahl und als Prozentwert.

¨ Das Muster der Daten in jeder Spalte und die Häufigkeit, mit der diese Werte vorkommen.

¨ Statistiken zu den Spaltenwerten, wie Maximal- und Minimallänge der Werte und erster und letzter Wert injeder Spalte.

¨ Bei Join-Analyse-Profilen wird der Überlappungsgrad zwischen zwei Datenspalten als Venn-Diagramm undals Prozentwert angezeigt. Verwenden Sie Join-Analyse-Profile, um mögliche Profile mit Spalten-Joinbedingungen zu identifizieren.

Sie können in jedem Stadium eines Projekts ein Spaltenprofil ausführen und überprüfen, ob die Änderungenan den Daten Ihren Projektzielen entsprechen. Sie können ein Spaltenprofil an einer Umwandlung in einemMapping ausführen, um die Wirkung anzuzeigen, die die Umwandlung auf die Daten haben wird.

StoryHypoStores möchte sich vergewissern, dass die Kundendaten frei von Fehlern, Inkonsistenzen und doppeltenInformationen sind. Bevor HypoStores die Prozesse entwickelt, um die Datenqualitätsziele zu erreichen, mussdie Qualität ihrer Quelldatendateien gemessen werden und bestätigt werden, dass die Daten verarbeitetwerden können.

44

Page 54: De 910HF1 DataExplorer Getting Started Guide De

ZieleIn dieser Lektion führen Sie folgende Aufgaben durch:

¨ Durchführen einer Join-Analyse an der Datenquelle Boston_Customers und der Datenquelle LA_Customers.

¨ Anzeigen der Ergebnisse der Join-Analyse, um zu bestimmen, ob die Daten aus den beiden Büroserfolgreich zusammengeführt werden können oder nicht.

¨ Ausführen eines Spaltenprofils an der Datenquelle All_Customers.

¨ Anzeigen der Ergebnisse des Spaltenprofils, um die Werte und Muster anzusehen, die in den Datenenthalten sind.

VoraussetzungenÜberprüfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:

¨ Sie haben die Lektionen 1 und 2 in diesem Tutorial abgeschlossen.

Zeitbedarf¨ Rechnen Sie mit 20 Minuten für diese Lektion.

Aufgabe 1 Durchführen einer Join-Analyse mit zweiDatenquellen

In dieser Aufgabe führen Sie eine Join-Analyse der DatenquellenBostom_Customers und LA_Customers durch, umdie Join-Bedingungen anzuzeigen.

1. In der Object Explorer-Ansicht gehen Sie zu den Datenobjekten in Ihrem Tutorialprojekt.

2. Wählen Sie die Datenquellen Boston_Customers und LA_Customers.

Tipp: Halten Sie die Shift-Taste gedrückt, um mehrere Datenobjekte auszuwählen.

3. Klicken Sie mit der rechten Maustaste auf die ausgewählten Datenobjekte, und wählen Sie Profil.

Der Assistent Neues Profil wird geöffnet.

4. Wählen Sie Profil-Modell, und klicken Sie auf Weiter.

5. In das Bereich Namegeben Sie Tutorial_Model ein.

Klicken Sie auf Weiter.

6. Vergewissern Sie sich, dassBoston_Customers und LA_Customers in der Spalte Datenobjekt erscheinen.

7. Klicken Sie auf Fertigstellen.

Das Profilmodell Tutorial_Model erscheint im Object Explorer.

8. Verwenden Sie die Maus, um im Modellierungsbereich Boston_Customers und LA_Customers auszuwählen.

9. Klicken Sie mit der rechten Maustaste auf einen Datenobjektnamen, und wählen Sie Join-Profil.

Der Assistent Neues Join-Profil wird geöffnet.

10. Geben Sie in das Bereich Name JoinAnalysis ein.

11. Vergewissern Sie sich, dass Boston_Customers und LA_Customers als Datenobjekte erscheinen.

Klicken Sie auf Weiter.

12. Wählen Sie in beiden Datenquellen die Spalte CustomerID.Scrollen Sie im Assistentenbereich nach unten, um die Spalten in beiden Datensätzen anzuzeigen.

Klicken Sie auf Weiter.

13. Klicken Sie auf Hinzufügen, um Join-Bedingungen hinzuzufügen.

Das Fenster Join-Bedingung wird geöffnet.

14. Klicken Sie im Abschnitt Spalten auf die Schaltfläche "Neu".

Aufgabe 1 Durchführen einer Join-Analyse mit zwei Datenquellen 45

Page 55: De 910HF1 DataExplorer Getting Started Guide De

15. Doppelklicken Sie auf die erste Zeile in der linken Spalte, und wählen Sie CustomerID.

16. Doppelklicken Sie auf die erste Zeile in der rechten Spalte, und wählen Sie CustomerID.

17. Klicken Sie auf OK und dann auf Fertigstellen.

Das Profil JoinAnalysis wird im Editor geöffnet, und das Profil wird ausgeführt.

Hinweis: Schließen Sie das Profil nicht. In der nächsten Aufgabe zeigen Sie die Ergebnisse des Profils an.

Aufgabe 2 Anzeigen der Ergebnisse einer Join-Analyse

In dieser Aufgabe zeigen Sie die Ergebnisse der Join-Analyse in der Ansicht der Join-Ergebnisse des ProfilsJoinAnalysis

1. Klicken Sie auf die Registerkarte JoinAnalysis im Modellierungsbereich.

2. Klicken Sie im Abschnitt Join-Profil auf die erste Zeile.

Der Abschnitt Details zeigt ein Venn-Diagramm und einen Schlüssel, der die Ergebnisse der Join-Analyse detailliert angibt.

3. Vergewissern Sie sich, dass die Spalte Zeilen verbinden für die Anzahl der Zeilen, die einen Joinenthalten, Null enthält.Dies zeigt, dass keines der CustomerID-Bereicher Doppelwerte sind, wodurch naheliegt, dass Sie diebeiden Datenquellen erfolgreich zusammenführen können.

4. Um die CustomerID-Werte für das Datenobjekt LA_Customers anzuzeigen, doppelklicken Sie im Venn-Diagramm auf den Kreis mit der Bezeichnung LA_Customers.

Tipp: Doppelklicken Sie auf die Kreise im Venn-Diagramm, um die Datenzeilen anzuzeigen, die vondiesen Einträgen beschrieben werden. In Fällen, in denen sich im Venn-Diagramm Kreise schneiden,doppelklicken Sie auf den Schnittpunkt, um Datenwerte anzuzeigen, die in beiden Datensätzen enthaltensind.

Der Daten-Viewer zeigt die CustomerID-Werte an, die im Datenobjekt LA_Customers enthalten sind.

Aufgabe 3 Ausführen eines Profils für eineDatenquelle

In dieser Aufgabe führen Sie ein Profil für die Datenquelle All_Customers aus, um die Struktur und den Inhaltder Daten anzusehen.

1. Gehen Sie in der Ansicht Objekt-Explorer zu den Datenobjekten in Ihrem Tutorial-Projekt.

2. Wählen Sie die Datenquelle All_Customers aus.

3. Klicken Sie auf Datei > Neu > Profil.

Das Fenster Neues Profil wird geöffnet.

4. Geben Sie im Bereich Name All_Customers ein.

5. Klicken Sie auf Fertigstellen.

Das Profil All_Customers wird im Editor geöffnet und das Profil wird ausgeführt.

46 Kapitel 12: Lektion 3. Profiling von Daten

Page 56: De 910HF1 DataExplorer Getting Started Guide De

Aufgabe 4 Anzeigen von Ergebnissen des Spalten-Profiling

In dieser Aufgabe zeigen Sie die Ergebnisse des Spalten-Profiling für das Datenobjekt All_Customers an unduntersuchen die Werte und die in den Daten enthaltenen Muster.

1. Klicken Sie auf Fenster > Ansicht anzeigen > Fortschritt, um den Fortschritt des Profils All_Customerszu sehen.

Die Fortschritt-Ansicht wird geöffnet.

2. Wenn die Fortschritt-Ansicht angibt, dass die Ausführung des Profil All_Customers abgeschlossen ist,klicken Sie auf die Ansicht Ergebnisse im Editor.

3. Klicken Sie im Abschnitt Spalten-Profiling auf die Spalte CustomerTier.

Der Abschnitt Details zeigt alle Werte, die in der Spalte CustomerTier enthalten sind, und zeigtInformationen, wie häufig der Wert in dem Datensatz vorkommt.

4. Doppelklicken Sie in dem Abschnitt Details auf den Wert Ruby.

Der Daten-Viewer wird ausgeführt und zeigt die Datensätze, in denen die Spalte CustomerTier den WertRuby enthält.

5. Klicken Sie im Abschnitt Spalten-Profiling auf die Spalte OrderAmount (Bestellmenge).

6. Klicken Sie im Abschnitt Details auf die Liste Anzeigen, und wählen Sie Muster.

Der Abschnitt Details zeigt die Muster , die sich in der Spalte OrderAmount befinden. Der String 9((5) inder Spalte Musterbezieht sich auf Datensätze, die fünfstellige Bestellmengen enthalten. Der String 9((4bezieht sich auf Datensätze, die vierstellige Mengen enthalten.

7. Doppelklicken Sie in der Spalte Muster auf den String 9(4).

Der Daten-Viewer wird ausgeführt und zeigt die Datensätze an, in denen die Spalte OrderAmount einevierstellige Bestellmenge enthält.

8. Klicken Sie im Abschnitt Details auf die Liste Anzeigen, und wählen Sie Statistiken.

Der Abschnitt Details zeigt Statistiken für die Spalte OrderAmount einschließlich dem Durchschnittswert,der Standardabweichung, maximalen und Mindestlängen, den fünf häufigsten Werten und den fünfseltensten Werten.

Profiling von Daten - ZusammenfassungIn dieser Lektion haben Sie erfahren, dass ein Profil Informationen über den Inhalt und die Struktur der Datenliefert.

Sie haben gelernt, dass Sie mit zwei Datenobjekten eine Join-Analyse durchführen können und denÜberlappungsgrad zwischen den Datenobjekten anzeigen können. Sie haben auch erfahren, dass Sie einSpaltenprofil an einem Datenobjekt ausführen können und Werte, Muster und Statistiken anzeigen können,die jede Spalte in dem Datenobjekt betreffen.

Sie haben das Profil JoinAnalysis erstellt, um zu ermitteln, ob Daten aus dem Datenobjekt Bostom_Customersmit den Daten im Datenobjekt LA_Customers zusammengeführt werden können. Sie haben die Ergebnissedieses Profils angezeigt und ermittelt, dass alle Werte in der Spalte CustomerID eindeutig sind und dieDatenobjekte erfolgreich zusammengeführt werden können.

Sie haben das Profil All_Customers erstellt und ein Spaltenprofil mit dem DatenobjektAll_Customersausgeführt. Sie haben die Ergebnisse dieses Profils angezeigt, um Werte, Muster und Statistiken für dieSpalten im Datenobjekt All_Customers anzuzeigen. Sie haben schließlich den Daten-Viewer ausgeführt, umZeilen anzuzeigen, die die von Ihnen ausgewählten Werte und Muster enthalten, wodurch Sie die Qualität derDaten profen konnten.

Aufgabe 4 Anzeigen von Ergebnissen des Spalten-Profiling 47

Page 57: De 910HF1 DataExplorer Getting Started Guide De

A N H A N G A

Häufig gestellte Fragen (FAQ)Dieser Anhang umfasst die folgenden Themen:

¨ Informatica Administrator - Häufig gestellte Fragen (FAQ), 48

¨ FAQs zu Informatica Analyst , 49

¨ Informatica Developer - Häufig gestellte Fragen (FAQ), 49

Informatica Administrator - Häufig gestellte Fragen(FAQ)

Lesen Sie sich die häufig gestellten Fragen (FAQ) durch. Sie finden dort Antworten auf Fragen, die Siemöglicherweise zu Informatica Administrator haben.

Was ist der Unterschied zwischen Informatica Administrator und der PowerCenter Administration-Konsole?

Die PowerCenter Administration-Konsole ist in Informatica Administrator (das Administratortool)umbenannt worden. Das Administratortool hat eine neue Benutzeroberfläche. Einige der Eigenschaftenund Konfigurationsfunktionen der PowerCenter Administrator-Konsole haben im Administratortool anderePositionen erhalten. Das Administratortool wurde außerdem erweitert und umfasst jetzt neue Servicesund Objekte.

Kann ich ein einziges Benutzerkonto zum Zugriff auf das Administratortool und das Entwicklertool verwenden?

Ja Sie können einem Benutzer die Berechtigung zum Zugriff auf beide Tools geben. Es müssen keineseparaten Benutzerkonten für jeden Anwendungs-Client erstellt werden.

Was ist der Unterschied zwischen dem PowerCenter Repository Service und dem Model Repository Service?

Die PowerCenter-Anwendungsdienste und PowerCenter-Anwendungsclients verwenden denPowerCenter Repository Service. Das PowerCenter Repository verfügt über ordnerbezogene Sicherheit.

Die anderen Anwendungsdienste, wie Data Integration Service, Analyst Service, Entwicklertool undAnalysetool, verwenden den Model Repository Service. Der Model Repository Service verfügt überprojektbezogene Sicherheit.

Sie können einige Objekte des Model Repository in das PowerCenter Repository migrieren.

Wo kann ich Datenbankverbindungen verwenden, die ich im Informatica Administrator erstelle?

Sie können Datenbankverbindungen im Administratortool und im Entwicklertool erstellen, anzeigen undbearbeiten. Sie können Datenbankverbindungen im Analysetool erstellen und anzeigen. Sie könnenDatenbankverbindungspooling auch im Administratortool konfigurieren.

Was ist der Unterschied zwischen dem PowerCenter Integration Service und dem Data Integration Service?

Der PowerCenter Integration Service ist ein Anwendungsdienst, auf dem Sitzungen und Arbeitsabläufeausgeführt werden. Der Data Integration Service ist ein Anwendungsdienst, derDatenintegrationsaufgaben für das Analysetool, das Entwicklertool und externe Clients übernimmt. DasAnalysetool und das Entwicklertool senden Anfragen für Datenintegrationsaufgaben an den DataIntegration Service, um eine Vorschau oder Durchführung von Datenprofilen, SQL-Datendiensten und

48

Page 58: De 910HF1 DataExplorer Getting Started Guide De

Mappings zu erhalten. Befehle von der Befehlszeile oder externen Clients senden Anfragen fürDatenintegrationsaufgaben an den Data Integration Service, um SQL-Datendienste oder Web-Diensteauszuführen.

Warum kann ich keine Verbindung mit einem SQL-Datendienst herstellen, der auf einem Data Integration Servicebereitgestellt wird?

Um eine Verbindung zu einem SQL-Datendienst herzustellen, muss die Anwendung ausgeführt werden,die den SQL-Datendienst enthält. Sie können eine Anwendung in der Ansicht Anwendungen des DataIntegration Service starten.

FAQs zu Informatica AnalystIn den FAQs werden viele Fragen beantwortet, die Sie möglicherweise zu Informatica Analyst haben.

Welche Kombination von Produktfunktionen ist im Analysetool enthalten?

Das Analysetool enthält einige Funktionen, die in folgende Produkte integriert sind:

¨ Informatica Data Quality

¨ Informatica Data Explorer

¨ Data Quality Assistant

¨ PowerCenter Reference Table Manager

Kann ich ein einziges Benutzerkonto zum Zugriff auf das Administratortool, das Entwicklertool und das Analysetoolverwenden?

Ja Sie können einem Benutzer die Berechtigung zum Zugriff auf alle drei Tools geben. Es müssen keineseparaten Benutzerkonten für jede Client-Anwendung erstellt werden.

Was ist mit dem Reference Table Manager passiert? Wo sind meine Referenzdaten gespeichert?

Die Funktionen aus dem Reference Table Manager sind in das Analysetool integriert worden. Sie könnendas Analysetool zum Erstellen und gemeinsamen Nutzen von Referenzdaten verwenden. DieReferenzdaten sind in der Staging-Datenbank gespeichert, die Sie konfigurieren, wenn Sie einen AnalystService erstellen.

Informatica Developer - Häufig gestellte Fragen (FAQ)Lesen Sie sich die häufig gestellten Fragen (FAQ) durch. Sie finden dort Antworten auf Fragen, die Siemöglicherweise zu Informatica Developer haben.

Was ist der Unterschied zwischen einer Quelle und einem Ziel in PowerCenter und einem physischen Datenobjekt imDeveloper Tool?

In PowerCenter erstellen Sie eine Quelldefinition, die eine Mapping-Quelle einschließt. Sie erstellen eineZieldefinition, die ein Mapping-Ziel einschließt. Bei einem Neustart wird eventuell wieder eine neueAdresse vom Server zugewiesen.'Sie als Mapping-Quelle oder -Ziel verwenden können.

Was ist der Unterschied zwischen einem Mapping im Developer Tool und einem Mapping in PowerCenter?

Ein PowerCenter Mapping gibt an, wie Daten zwischen Quellen und Targets verschoben werden. EinDeveloper Tool Mapping gibt an, wie Daten zwischen der Mapping-Eingabe und -Ausgabe verschobenwerden.

Ein PowerCenter Mapping muss eine oder mehrere Quelldefinitionen, Quellen-Qualifikatoren undZieldefinitionen aufweisen. Eiin PowerCenter Mapping kann auch Verknüpfungen, Umwandlungen undMapplets enthalten.

FAQs zu Informatica Analyst 49

Page 59: De 910HF1 DataExplorer Getting Started Guide De

Ein Developer Tool Mapping muss Mapping-Eingabe und -Ausgabe enthalten. Ein Developer ToolMapping kann auch Umformungen und Mapplets enthalten.

Das Developer Tool beinhaltet folgende Mapping-Typen:

¨ Mapping, das Daten zwischen Quellen und Zielen verschiebt. Dieser Mapping-Typ unterscheidet sichvon einem PowerCenter Mapping nur darin, dass es keine Verknüpfungen verwenden kann undkeinen Quellen-Qualifikator verwendet.

¨ Zuordnung logisches Datenobjekt. Ein Mapping in einem logischen Datenobjektmodell. EineZuordnung logisches Datenobjekt kann ein logisches Datenobjekt als Mapping-Eingabe und einDatenobjekt als Mapping-Ausgabe enthalten. Sie kann auch ein oder mehrere logische Datenobjekteals Mapping-Eingabe und logische Datenobjekte als Mapping-Ausgabe enthalten.

¨ Virtuelle Tabellenzuordnung. Ein Mapping in einem SQL-Datendienst. Die Zuordnung enthält einDatenobjekt als Mapping-Eingabe und eine virtuelle Tabelle als Mapping-Ausgabe.

¨ Virtuelles gespeichertes Prozedur-Mapping. Definiert einen Unternehmenslogiksatz in einem SQL-Datendienst. Es enthält eine Eingabeparameterumwandlung oder ein physisches Datenobjekt alsMapping-Eingabe und eine Ausgabeparameterumwandlung oder physisches Datenobjekt als Mapping-Ausgabe.

Was ist der Unterschied zwischen einem Mapplet in PowerCenter und einem Mapplet im Developer Tool?

Ein Mapplet in PowerCenter und im Developer Tool ist ein wiederverwendbares Objekt, das einen Satzvon Umwandlungen enthält. Sie können die Umwandlungslogik in mehreren Mappings nutzen.

Ein Powercenter-Mapplet kann Quellendefinitionen oder Eingabeumwandlungen als Mapplet-Eingabeenthalten. Es muss Ausgabeumwandlungen als Mapplet-Ausgabe enthalten.

Ein Developer Tool Mapplet kann Datenobjekte oder Eingabeumwandlungen als Mapplet-Eingabeenthalten. Es kann Datenobjekte oder Ausgabeumwandlungen als Mapplet-Ausgabe enthalten. EinMapping im Developer Tool kann auch die folgenden Merkmale aufweisen:

¨ Sie können ein Mapplet als eine Regel validieren. Sie können eine Regel in einem Profil verwenden.

¨ Ein Mapplet kann andere Mapplets enthalten.

Was ist der Unterschied zwischen einem Mapplet und einer Regel?

Sie können ein Mapplet als eine Regel validieren. Eine Regel ist Geschäftslogik, die Bedingungendefiniert, welche auf Quelldaten angewendet werden, wenn ein Profil ausgeführt wird. Sie können einMapplet als eine Regel validieren, wenn das Mapplet folgende Anforderungen erfüllt:

¨ Es enthält eine Eingabe- und Ausgabeumwandlung.

¨ Das Mapplet enthält keine aktiven Umwandlungen.

¨ Sie gibt keine Kardinalität zwischen Eingabegruppen an.

50 Anhang A: Häufig gestellte Fragen (FAQ)


Recommended