IBM SPSS Direct Marketing 20 - math.uni-leipzig.de SPSS Direct Marketing.pdf · Vorwort IBM® SPSS® Statistics ist ein umfassendes System zum Analysieren von Daten. Das optionale

Embed Size (px)

Citation preview

  • i

    IBM SPSS Direct Marketing 20

  • Hinweis: Lesen Sie zunchst die allgemeinen Informationen unter Hinweise auf S. 108, bevor Siedieses Informationsmaterial sowie das zugehrige Produkt verwenden.

    Diese Ausgabe bezieht sich auf IBM SPSS Statistics 20 und alle nachfolgenden Versionensowie Anpassungen, sofern dies in neuen Ausgaben nicht anders angegeben ist.Screenshots von Adobe-Produkten werden mit Genehmigung von Adobe Systems Incorporatedabgedruckt.Screenshots von Microsoft-Produkten werden mit Genehmigung der Microsoft Corporationabgedruckt.

    Lizenziertes Material - Eigentum von IBM

    Copyright IBM Corporation 1989, 2011.

    Eingeschrnkte Rechte fr Benutzer der US-Regierung: Verwendung, Vervielfltigung undVerffentlichung eingeschrnkt durch GSA ADP Schedule Contract mit der IBM Corp.

  • VorwortIBM SPSS Statistics ist ein umfassendes System zum Analysieren von Daten. Das optionaleZusatzmodul Direct Marketing bietet die zustzlichen Analyseverfahren, die in diesem Handbuchbeschrieben sind. Die Prozeduren im Zusatzmodul Direct Marketing mssen zusammen mit SPSSStatistics Core verwendet werden. Sie sind vollstndig in dieses System integriert.

    Informationen zu IBM Business Analytics

    Die Software IBM Business Analytics liefert umfassende, einheitliche und korrekte Informationen,mit denen Entscheidungstrger die Unternehmensleistung verbessern knnen. Ein umfassendesPortfolio aus Business Intelligence, Vorhersageanalyse, Finanz- und Strategiemanagement sowieAnalyseanwendungen bietet Ihnen sofort klare und umsetzbare Einblicke in die aktuelle Leistungund gibt Ihnen die Mglichkeit, zuknftige Ergebnisse vorherzusagen. Durch umfassendeBranchenlsungen, bewhrte Vorgehensweisen und professionellen Service knnen Unternehmenjeder Gre die Produktivitt maximieren, Entscheidungen automatisieren und bessere Ergebnisseerzielen.

    Als Teil dieses Portfolios untersttzt IBM SPSS Predictive Analytics-Software Unternehmendabei, zuknftige Ereignisse vorherzusagen und proaktiv Manahmen zu ergreifen, umbessere Geschftsergebnisse zu erzielen. Kunden aus Wirtschaft, ffentlichem Dienst unddem Bildungsbereich weltweit nutzen IBM SPSS-Technologie als Wettbewerbsvorteil frKundengewinnung, Kundenbindung und Erhhung der Kundenumstze bei gleichzeitigerEindmmung der Betrugsmglichkeiten und Minderung von Risiken. Durch die Einbindungvon IBM SPSS-Software in ihre tglichen Operationen wandeln sich Organisationen zuPredictive Enterprises die Entscheidungen auf Geschftsziele ausrichten und automatisierenund einen messbaren Wettbewerbsvorteil erzielen knnen. Wenn Sie weitere Informationenwnschen oder Kontakt zu einem Mitarbeiter aufnehmen mchten, besuchen Sie die Seitehttp://www.ibm.com/spss.

    Technischer Support

    Kunden mit Wartungsvertrag knnen den technischen Support in Anspruch nehmen. Kundenknnen sich an den Technischen Support wenden, wenn sie Hilfe bei der Arbeit mit den Produktenvon IBM Corp. oder bei der Installation in einer der untersttzten Hardware-Umgebungenbentigen. Zur Kontaktaufnahme mit dem technischen Support besuchen Sie die Website vonIBM Corp. unter http://www.ibm.com/support. Wenn Sie Hilfe anfordern, halten Sie bitteInformationen bereit, um sich, Ihre Organisation und Ihren Supportvertrag zu identifizieren.

    Technischer Support fr Studenten

    Wenn Sie in der Ausbildung eine Studenten-, Bildungs- oder Grad Pack-Version eines IBMSPSS-Softwareprodukts verwenden, informieren Sie sich auf unseren speziellen Online-Seiten frStudenten zu Lsungen fr den Bildungsbereich (http://www.ibm.com/spss/rd/students/). WennSie in der Ausbildung eine von der Bildungssttte gestellte Version der IBM SPSS-Softwareverwenden, wenden Sie sich an den IBM SPSS-Produktkoordinator an Ihrer Bildungssttte.

    Copyright IBM Corporation 1989, 2011. iii

    http://www-01.ibm.com/software/data/businessintelligence/http://www-01.ibm.com/software/analytics/spss/http://www-01.ibm.com/software/data/cognos/financial-performance-management.htmlhttp://www-01.ibm.com/software/data/cognos/products/cognos-analytic-applications/http://www.ibm.com/spsshttp://www.ibm.com/supporthttp://www.ibm.com/spss/rd/students/

  • Kundendienst

    Bei Fragen bezglich der Lieferung oder Ihres Kundenkontos wenden Sie sich bitte an Ihre lokaleNiederlassung. Halten Sie bitte stets Ihre Seriennummer bereit.

    Ausbildungsseminare

    IBMCorp. bietet ffentliche und unternehmensinterne Seminare an. Alle Seminare beinhalten auchpraktische bungen. Seminare finden in greren Stdten regelmig statt. Weitere Informationenzu diesen Seminaren finden Sie unter http://www.ibm.com/software/analytics/spss/training.

    Weitere Verffentlichungen

    Die Handbcher SPSS Statistics: Guide to Data Analysis, SPSS Statistics: Statistical ProceduresCompanion und SPSS Statistics: Advanced Statistical Procedures Companion, die von MarijaNoruis geschrieben und von Prentice Hall verffentlicht wurden, werden als Quelle frZusatzinformationen empfohlen. Diese Verffentlichungen enthalten statistische Verfahrenin den Modulen Statistics Base, Advanced Statistics und Regression von SPSS. DieseBcher werden Sie dabei untersttzen, die Funktionen und Mglichkeiten von IBM SPSSStatistics optimal zu nutzen. Dabei ist es unerheblich, ob Sie ein Neuling im Bereich derDatenanalyse sind oder bereits ber umfangreiche Vorkenntnisse verfgen und damit in derLage sind, auch die erweiterten Anwendungen zu nutzen. Weitere Informationen zu denInhalten der Verffentlichungen sowie Auszge aus den Kapiteln finden Sie auf der folgendenAutoren-Website: http://www.norusis.com

    iv

    http://www.norusis.com

  • InhaltTeil I: Benutzerhandbuch

    1 Direct Marketing (Direktmarketing) 1

    2 RFM-Analyse 2

    RFM-Scores aus Transaktionsdaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3RFM-Scores aus Kundendaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5RFM-Klassifizierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6Speichern von RFM-Scores aus Transaktionsdaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9Speichern von RFM-Scores aus Kundendaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10RFM-Ausgabe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    3 Clusteranalyse 14

    Einstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    4 Profile ber potenzielle Kunden 19

    Einstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23Erstellen eines kategorialen Responsefelds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

    5 Responseraten nach Postleitzahlen 25

    Einstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29Erstellen eines kategorialen Responsefelds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

    6 Kaufneigung 32

    Einstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37Erstellen eines kategorialen Responsefelds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    v

  • 7 Kontrollpakettest 40

    Teil II: Beispiele

    8 RFM-Analyse aus Transaktionsdaten 44

    Transaktionsdaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44Durchfhren der Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44Bewerten der Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46Kombinieren von Score-Daten mit Kundendaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    9 Clusteranalyse 51

    Durchfhren der Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51Ausgabe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53Auswahl von Datenstzen auf der Basis von Clustern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

    Erstellen eines Filters in der Cluster-Modellanzeige . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62Auswahl von Datenstzen auf der Basis von Clusterfeldwerten . . . . . . . . . . . . . . . . . . . . . . . 64

    Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

    10 Profile ber potenzielle Kunden 68

    Erluterung der Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68Durchfhren der Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68Ausgabe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

    11 Responseraten nach Postleitzahlen 75

    Erluterung der Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75Durchfhren der Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75Ausgabe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

    vi

  • 12 Kaufneigung 82

    Erluterung der Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82Aufbau eines Vorhersagemodells . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

    Bewertung des Modells. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86Anwendung des Modells . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

    13 Kontrollpakettest 94

    Durchfhren der Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94Ausgabe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

    Anhnge

    A Beispieldateien 97

    B Hinweise 108

    Index 111

    vii

  • Teil I:Benutzerhandbuch

  • Kapitel

    1Direct Marketing (Direktmarketing)

    Die Option Direktmarketing bietet eine Reihe von Werkzeugen zur Verbesserung der Ergebnissevon Direktmarketing-Kampagnen durch die Identifizierung von Demografie-, Einkaufs- undanderen Merkmalen, die unterschiedliche Kundengruppen definieren, sowie durch Konzentrationauf bestimmte Gruppen zur Maximierung positiver Responseraten.

    RFM-Analyse. Dieses Verfahren identifiziert bestehende Kunden, die sehr wahrscheinlich auf einneues Angebot antworten. Fr weitere Informationen siehe Thema RFM-Analyse in Kapitel 2 aufS. 2.

    Cluster-Analyse. Hierbei handelt es sich um eine explorative Prozedur zum Ermitteln vonnatrlichen Gruppierungen (Clustern) innerhalb Ihrer Daten. Damit knnen beispielsweiseverschiedene Kundengruppen auf der Basis unterschiedlicher demographischer undKaufverhaltensmerkmale ausgemacht werden. Fr weitere Informationen siehe ThemaClusteranalyse in Kapitel 3 auf S. 14.

    Profile ber potenzielle Kunden. Bei dieser Technik werden Ergebnisse aus einer frherenKampagne oder einer Testkampagne verwendet, um beschreibende Profile zu erstellen. DieseProfile knnen bei zuknftigen Kampagnen fr das Targeting bestimmter Gruppen von Kontaktenverwendet werden. Fr weitere Informationen siehe Thema Profile ber potenzielle Kunden inKapitel 4 auf S. 19.

    Responseraten nach Postleitzahlen. Bei dieser Technik werden Ergebnisse aus einer frherenKampagne verwendet, um Responseraten nach Postleitzahlen zu berechnen. Diese Raten knnenbei zuknftigen Kampagnen fr das Targeting bestimmter Postleitzahlbereiche verwendet werden.Fr weitere Informationen siehe Thema Responseraten nach Postleitzahlen in Kapitel 5 auf S. 25.

    Kaufneigung. In diesem Verfahren werden Ergebnisse einer Testsendung oder einer frherenKampagne verwendet, um Bewertungen zu erstellen. Die Bewertungen zeigen an, bei welchenKontakten die Wahrscheinlichkeit einer Antwort am hchsten ist. Fr weitere Informationen sieheThema Kaufneigung in Kapitel 6 auf S. 32.

    Kontrollpakettest. Dieses Verfahren vergleicht Marketingkampagnen, um herauszufinden, ob eshinsichtlich der Effektivitt signifikante Unterschiede zwischen verschiedenen Paketen oderAngeboten gibt. Fr weitere Informationen siehe Thema Kontrollpakettest in Kapitel 7 auf S. 40.

    Copyright IBM Corporation 1989, 2011. 1

  • Kapitel

    2RFM-Analyse

    Die RFM-Analyse (Recency Aktualitt, Frequency Hufigkeit, Monetary Geldwert) ist eineTechnik, die verwendet wird, um bestehende Kunden zu identifizieren, die am wahrscheinlichstenauf ein neues Angebot reagieren werden. Diese Technik wird hufig im Direktmarketingeingesetzt. RFM-Analyse basiert auf der folgenden einfachen Theorie: Der wichtigste Faktor bei der Identifizierung von Kunden, die wahrscheinlich auf ein

    neues Angebot reagieren, ist Aktualitt. Kunden, die krzlich gekauft haben, kaufenwahrscheinlicher wieder ein, als Kunden, die weiter zurck in der Vergangenheit gekaufthaben.

    Der zweitwichtigste Faktor ist Hufigkeit. Kunden, die in der Vergangenheit hufiger gekaufthaben, kaufen wahrscheinlicher wieder ein, als Kunden, die weniger gekauft haben.

    Der drittwichtigste Faktor ist der ausgegebene Betrag, der als Geldwert bezeichnet wird.Kunden, die in der Vergangenheit (fr alle Einkufe insgesamt) mehr ausgegeben haben,reagieren wahrscheinlicher, als Kunden, die weniger ausgegeben haben.

    Funktionsweise der RFM-Analyse

    Kunden wird basierend auf dem Datum des letzten Kaufs bzw. des Zeitintervalls seit demletzten Kauf ein Aktualitts-Score zugewiesen. Dieser Score basiert auf einer einfachenEinstufung von Aktualittswerten in eine kleine Zahl von Kategorien. Wenn Sie zumBeispiel fnf Kategorien verwenden, erhalten die Kunden mit den neuesten Kaufdaten eineAktualittseinstufung von 5 und die mit den am weitesten zurckliegenden Kaufdaten eineAktualittseinstufung von 1.

    Auf hnliche Weise wird Kunden dann eine Hufigkeitseinstufung zugewiesen, wobei hhereWerte eine hhere Kaufhufigkeit bedeutet. In einem Einstufungsschema mit fnf Kategorienerhalten Kunden, die am hufigsten einkaufen, eine Hufigkeitseinstufung von 5.

    Schlielich werden die Kunden nach Geldwert eingestuft, wobei die hchsten Geldwerte diehchste Einstufung erhalten. In dem Beispiel mit fnf Kategorien wrden die Kunden, dieden hchsten Betrag aufwenden, eine Geldwerteinstufung von 5 erhalten.

    Das Ergebnis sind vier Scores fr jeden Kunden: der Aktualitts-, der Hufigkeits-, der Geldwert-und der kombinierte RFM-Score, bei dem einfach die drei einzelnen Scores in einem einzigenWert aneinandergehngt werden. Die besten Kunden (die am wahrscheinlichsten auf einAngebot reagieren) sind diejenigen Kunden mit den hchsten kombinierten RFM-Scores. Ineiner Einstufung mit fnf Kategorien gibt es zum Beispiel insgesamt 125 mgliche, kombinierteRFM-Scores, der hchste kombinierte RFM-Score ist 555.

    Copyright IBM Corporation 1989, 2011. 2

  • 3

    RFM-Analyse

    Erluterung der Daten

    Wenn Datenzeilen Transaktionen darstellen (jede Zeile reprsentiert eine einzelne Transaktionund es kann mehrere Transaktionen fr jeden Kunden geben), verwenden Sie RFM ausTransaktionen. Fr weitere Informationen siehe Thema RFM-Scores aus Transaktionsdatenauf S. 3.

    Wenn Datenzeilen Kunden mit Auswertungsinformationen fr alle Transaktionen darstellen(mit Spalten, die Werte fr den Gesamtkaufbetrag, die Gesamtzahl der Transaktionen unddas letzte Transaktionsdatum enthalten), verwenden Sie RFM aus Kundendaten. Fr weitereInformationen siehe Thema RFM-Scores aus Kundendaten auf S. 5.

    Abbildung 2-1Transaktion im Vergleich zu Kundendaten

    RFM-Scores aus Transaktionsdaten

    Erluterung der Daten

    Das Daten-Set muss Variablen enthalten, die die folgenden Informationen enthalten: Eine Variable oder eine Kombination von Variablen, die jeden Fall (Kunden) identifizieren Eine Variable mit dem Datum jeder Transaktion Eine Variable mit dem Geldwert jeder Transaktion

  • 4

    Kapitel 2

    Abbildung 2-2RFM-Transaktionsdaten

    Erstellen von RFM-Scores aus Transaktionsdaten

    E Whlen Sie die folgenden Befehle aus den Mens aus:Option Direct Marketing (Direktmarketing) > Verfahren whlen

    E Whlen Sie Hilfe bei der Erkennung meiner besten Kontakte (RFM-Analyse) und klicken Sie aufWeiter.

    E Whlen Sie Transaktionsdaten und klicken Sie auf Weiter.

    Abbildung 2-3Transaktionsdaten, Registerkarte Variable

    E Whlen Sie die Variable aus, die Transaktionsdaten enthlt.

    E Whlen Sie die Variable, die den Geldwertbetrag fr jede Transaktion enthlt.

  • 5

    RFM-Analyse

    E Whlen Sie die Methode fr die Zusammenfassung der Transaktionsbetrge fr jedenKunden: Summe (Summe aller Transaktionen), Mittelwert, Median oder Maximum (hchsterTransaktionsbetrag).

    E Whlen Sie die Variable oder die Kombination von Variablen, die jeden Kunden eindeutigidentifiziert. Zum Beispiel knnten Flle durch einen eindeutigen Schlsselcode oder eineKombination aus Nachname und Vorname identifiziert werden.

    RFM-Scores aus Kundendaten

    Erluterung der Daten

    Das Daten-Set muss Variablen enthalten, die die folgenden Informationen enthalten: Das letzte Kaufdatum oder ein Zeitintervall seit dem letzten Kaufdatum. Dies wird zur

    Berechnung der Aktualitts-Scores verwendet. Gesamtzahl von Kufen. Dies wird zur Berechnung der Hufigkeits-Scores verwendet. Gesamtgeldwertbetrag fr alle Kufe. Dies wird zur Berechnung der Geldwert-Scores

    verwendet. In der Regel ist dies die Summe aller Kufe, knnte jedoch auch der Mittelwert(Durchschnitt), das Maximum (grter Betrag) oder eine andere Auswertungskennzahl sein.

    Abbildung 2-4RFM-Kundendaten

    Wenn Sie die RFM-Scores in ein neues Daten-Set schreiben mchten, muss das aktive Daten-Setauch eine Variable oder eine Kombination aus Variablen enthalten, die jeden Fall (Kunden)identifizieren.

    Erstellen von RFM-Scores aus Kundendaten

    E Whlen Sie die folgenden Befehle aus den Mens aus:Option Direct Marketing (Direktmarketing) > Verfahren whlen

    E Whlen Sie Hilfe bei der Erkennung meiner besten Kontakte (RFM-Analyse) und klicken Sie aufWeiter.

    E Whlen Sie Kundendaten und klicken Sie auf Weiter.

  • 6

    Kapitel 2

    Abbildung 2-5Kundendaten, Registerkarte Variable

    E Whlen Sie die Variable, die das letzte Transaktionsdatum oder eine Zahl enthlt, die einZeitintervall seit der letzten Transaktion darstellt.

    E Whlen Sie die Variable, die die Gesamtzahl der Transaktionen fr jeden Kunden enthlt.

    E Whlen Sie die Variable, die den Gesamtgeldwertbetrag fr jeden Kunden enthlt.

    E Wenn Sie die RFM-Scores in ein neues Daten-Set schreiben mchten, whlen Sie die Variableoder die Kombination aus Variablen, die jeden Kunden eindeutig identifiziert. Zum Beispielknnten Flle durch einen eindeutigen Schlsselcode oder eine Kombination aus Nachnameund Vorname identifiziert werden.

    RFM-Klassifizierung

    Der Prozess der Gruppierung einer groen Zahl von numerischen Werten in eine kleine Zahl vonKategorien wird manchmal als Klassifizierung (Binning) bezeichnet. Bei der RFM-Analyse sinddie Klassen Einstufungskategorien. Sie knnen die Registerkarte Klassifizierung verwenden,um die zur Zuweisung von Aktualitts-, Hufigkeits- und Geldwertwerten zu diesen Klassenverwendete Methode zu ndern.

  • 7

    RFM-Analyse

    Abbildung 2-6Registerkarte RFM-Klassierung

    Klassifizierungsmethode

    Verschachtelt. Bei der verschachtelten Klassifizierung wird den Aktualittswerten eineeinfache Einstufung zugewiesen. Innerhalb jeder Aktualittseinstufung wird Kunden eineHufigkeitseinstufung zugewiesen. Innerhalb jeder Hufigkeitseinstufung wird Kunden eineGeldwerteinstufung zugewiesen. Diese neigt dazu, eine gleichmigere Verteilung vonkombinierten RFM-Scores bereitzustellen, hat jedoch den Nachteil, dass sich die Interpretationder Hufigkeits- und Geldwerteinstufungs-Scores schwieriger gestaltet. Zum Beispiel kanneine Hufigkeitseinstufung von 5 fr einen Kunden mit einer Aktualittseinstufung von 5nicht das Gleiche bedeuten wie eine Hufigkeitseinstufung von 5 fr einen Kunden mit einerAktualittseinstufung von 4, denn die Hufigkeitseinstufung hngt von der Aktualittseinstufungab.

    Unabhngig. Aktualitts-, Hufigkeits- und Geldwerte werden einfachen Einstufungenzugewiesen. Die drei Einstufungen werden unabhngig zugewiesen. Die Interpretation jeder derdrei RFM-Komponenten ist daher eindeutig. Ein Hufigkeits-Score von 5 fr einen Kundenbedeutet das Gleiche wie ein Hufigkeits-Score von 5 fr einen anderen Kunden, unabhngigvon ihren Aktualitts-Scores. Bei kleineren Stichproben hat dies den Nachteil, dass es zu einerweniger gleichmigen Verteilung der kombinierten RFM-Scores kommt.

    Anzahl an Klassen

    Die Anzahl der Kategorien (Klassen) fr jede Komponente fr die Erstellung der RFM-Scores.Die Gesamtzahl der mglichen kombinierten RFM-Scores ist das Produkt der drei Werte. ZumBeispiel wrden 5 Aktualittsklassen, 4 Hufigkeitsklassen und 3 Geldwertklassen insgesamt 60mgliche kombinierte RFM-Scores zwischen 111 und 543 erzeugen.

  • 8

    Kapitel 2

    Standard fr jede Komponente ist 5, so dass 125 mgliche, kombinierte RFM-Scores zwischen111 und 555 erzeugt werden.

    Die maximale Zahl an zulssigen Klassen fr jede Score-Komponente ist neun.

    Bindungen

    Eine Bindung sind einfach zwei oder mehr gleiche Aktualitts-, Hufigkeits- oder Geldwerte.Idealerweise wnscht man sich ungefhr die gleiche Zahl an Kunden in jeder Klasse, aber einegrere Zahl an Bindungswerten kann sich auf die Klassenverteilung auswirken. Es gibt zweiAlternativen fr die Handhabung von Bindungen: Bindungen der gleichen Klasse zuweisen. Diese Methode weist unabhngig von der

    Auswirkung auf die Klassenverteilung gebundene Werte stets der gleichen Klasse zu. Soergibt sich eine konsistente Klassifizierungsmethode: Wenn zwei Kunden den gleichenAktualittswert besitzen, werden sie stets dem gleichen Aktualitts-Score zugewiesen. Ineinem extremen Beispiel haben Sie vielleicht 1.000 Kunden, von denen 500 ihren letztenEinkauf am gleichen Tag ttigen. In einer 5-Klassen-Einstufung wrden 50 % der Kundendaher anstelle der gewnschten 20 % einen Aktualitts-Score von 5 erhalten.Beachten Sie, dass es bei der verschachtelten Klassifizierungsmethode Konsistenz beiHufigkeits- und Geldwert-Scores etwas komplizierter ist, da Hufigkeits-Scores innerhalbvon Aktualitts-Score-Klassen und Geldwert-Scores innerhalb von Hufigkeits-Score-Klassenzugewiesen werden. So haben zwei Kunden mit dem gleichen Hufigkeitswert ggf. nicht dengleichen Hufigkeits-Score, wenn sie nicht, unabhngig von der Handhabung gebundenerWerte, auch ber den gleichen Aktualitts-Score verfgen.

    Bindungen willkrlich zuweisen. Hierber wird eine gleichmige Klassenverteilunggewhrleistet, indem Bindungen vor der Einstufung ein sehr kleiner Varianzfaktor zugewiesenwird, so dass es zum Zweck der Zuweisung von Werten an die eingestuften Klassen keinegebundenen Werte gibt. Dieser Prozess hat keine Auswirkungen auf die Originalwerte. Erwird nur eingesetzt, um Bindungen eindeutig zu machen. Zwar erzeugt dies eine gleichmigeKlassenverteilung (ungefhr die gleiche Anzahl an Kunden in jeder Klasse), es kann aberauch zu vollstndig unterschiedlichen Score-Ergebnissen fr Kunden fhren, die hnlicheoder identische Aktualitts-, Hufigkeits- oder Geldwerte haben, speziell, wenn die Anzahlder Kunden relativ klein und/oder die Anzahl der Bindungen relativ hoch ist.

    Tabelle 2-1Bindungen der gleichen Klasse zuweisen im Vergleich mit Bindungen willkrlich zuweisen

    ID Letzter Kauf(Aktualitt)

    Bindungender gleichenKlassezuweisen

    Bindungenwillkrlichzuweisen

    1 10/29/2006 5 52 10/28/2006 4 43 10/28/2006 4 44 10/28/2006 4 55 10/28/2006 4 36 9/21/2006 3 37 9/21/2006 3 28 8/13/2006 2 2

  • 9

    RFM-Analyse

    ID Letzter Kauf(Aktualitt)

    Bindungender gleichenKlassezuweisen

    Bindungenwillkrlichzuweisen

    9 8/13/2006 2 110 6/20/2006 1 1

    In diesem Beispiel fhrt die Zuweisung von Bindungen der gleichen Klasse zu einerungleichmigen Klassenverteilung: 5 (10%), 4 (40%), 3 (20%), 2 (20%), 1 (10%).

    Das willkrlich Zuweisen von Bindungen fhrt zu 20 % in jeder Klasse. Um dieses Ergebnisaber zu erreichen, werden die vier Flle mit dem Datumswert 28.10.2006 3 verschiedenenKlassen zugewiesen und die 2 Flle mit einem Datumswert von 13.8.2006 werden ebenfallsunterschiedlichen Klassen zugewiesen.Beachten Sie, dass die Art, mit der Bindungen unterschiedlichen Klassen zugewiesen werden,absolut zufllig erfolgt innerhalb der Einschrnkung, dass das Endergebnis eine gleicheAnzahl von Fllen in jeder Klasse hat). Wenn Sie eine zweite Menge an Scores mit dergleichen Methode berechnet haben, knnte sich die Einstufung fr einen bestimmten Fall miteinem gebundenen Wert ndern. Zum Beispiel knnten sich die Einstufungen von 5 und 3 frdie Flle 4 und 5 beim zweiten Mal vertauschen.

    Speichern von RFM-Scores aus Transaktionsdaten

    RFM aus Transaktionsdaten erstellt stets ein neues aggregiertes Daten-Set mit einer Zeile jeKunde. Verwenden Sie die Registerkarte Speichern, um anzugeben, welche Scores und anderenVariablen Sie speichern mchten und wo Sie sie speichern mchten.

    Abbildung 2-7Transaktionsdaten, Registerkarte Speichern

  • 10

    Kapitel 2

    Variablen

    Die Schlsselvariablen, die jeden Kunden eindeutig identifizieren, werden automatisch imneuen Daten-Set gespeichert. Die folgenden zustzlichen Variablen knnen im neuen Daten-Setgespeichert werden: Datum der letzten Transaktion fr jeden Kunden.

    Anzahl der Transaktionen. Die Gesamtzahl an Transaktionszeilen je Kunde. Betrag. Der Gesamtbetrag fr jeden Kunden, basierend auf der in der Registerkarte

    Variablen gewhlten Auswertungsmethode. Aktualitts-Score. Der jedem Kunden zugewiesene Score, basierend auf dem letzten

    Transaktionsdatum. Hhere Scores geben aktuellere Transaktionsdaten an. Hufigkeits-Score. Der jedem Kunden zugewiesene Score, basierend auf der Gesamtzahl an

    Transaktionen. Hhere Scores stehen fr mehr Transaktionen. Geldwert-Score. Der jedem Kunden zugewiesene Score, basierend auf der ausgewhlten

    Geldwert-Auswertungskennzahl. Hhere Scores stehen fr einen hheren Wert fr dieGeldwert-Auswertungskennzahl.

    RFM-Score. Die drei Einzel-Scores, zu einem einzigen Wert kombiniert: (Aktualitt x 100)+ (Hufigkeit x 10) + Geldwert.

    Standardmig werden alle verfgbaren Variablen in das neue Daten-Set aufgenommen.Deaktivieren Sie die, die Sie nicht aufnehmen mchten. Optional knnen Sie Ihre eigenenVariablennamen angeben. Die Variablennamen mssen den Regeln zum Benennen von Variablenentsprechen.

    Ort

    RFM aus Transaktionsdaten erstellt stets ein neues aggregiertes Daten-Set mit einer Zeileje Kunde. Sie knnen ein neues Daten-Set in der aktuellen Sitzung erstellen oder dieRFM-Score-Daten in einer externen Datendatei speichern. Die Namen von Daten-Sets mssenden Regeln zum Benennen von Variablen entsprechen. (Diese Beschrnkung gilt nicht fr Namenvon externen Datendateien.)

    Speichern von RFM-Scores aus Kundendaten

    Fr Kundendaten knnen Sie die RFM-Score-Variablen dem aktiven Daten-Set hinzufgen oderein neues Daten-Set erstellen, das die ausgewhlten Score-Variablen enthlt. Verwenden Siedie Registerkarte Speichern, um anzugeben, welche Score-Variablen Sie speichern mchtenund wo Sie sie speichern mchten.

  • 11

    RFM-Analyse

    Abbildung 2-8Kundendaten, Registerkarte Speichern

    Name der gespeicherten Variablen

    Generieren Sie automatisch eindeutige Namen. Wenn Sie Score-Variablen dem aktivenDaten-Set hinzufgen, stellt diese Option sicher, dass neue Variablennamen eindeutig sind.Dies ist besonders ntzlich, wenn Sie dem aktiven Daten-Set mehrere unterschiedliche Setsan RFM-Scores (basierend auf unterschiedlichen Kriterien) hinzufgen mchten.

    Benutzerdefinierte Namen. ber diese Option knnen Sie den Score-Variablen Ihre eigenenVariablennamen zuweisen. Die Variablennamen mssen den Regeln zum Benennen vonVariablen entsprechen.

    Variablen

    Whlen (aktivieren) Sie die Variablen, die Sie speichern mchten: Aktualitts-Score. Der jedem Kunden zugewiesene Score, basierend auf dem Wert des

    Transaktionsdatums oder der Intervallvariablen, die in der Registerkarte Variablenausgewhlt ist. Hhere Scores werden neueren Daten bzw. niedrigeren Intervallwertenzugewiesen.

    Hufigkeits-Score. Der jedem Kunden zugewiesene Score, basierend auf der VariablenAnzahl der Transaktionen, die in der Registerkarte Variablen ausgewhlt ist. HhereScores werden hheren Werten zugewiesen.

    Geldwert-Score. Der jedem Kunden zugewiesene Score, basierend auf der Variablen Betrag,die in der Registerkarte Variablen ausgewhlt ist. Hhere Scores werden hheren Wertenzugewiesen.

    RFM-Score. Die drei Einzel-Scores, zu einem einzigen Wert kombiniert:(Aktualitt*100)+(Hufigkeit*10)+Geldwert.

  • 12

    Kapitel 2

    Ort

    Fr Kundendaten gibt es drei Alternativen fr den Speicherort von neuen RFM-Scores: Aktives Daten-Set. Ausgewhlte RFM-Score-Variablen werden dem aktiven Daten-Set

    hinzugefgt. Neues Daten-Set. Ausgewhlte RFM-Score-Variablen und die Schlsselvariablen, die jeden

    Kunden (Fall) eindeutig identifizieren, werden in ein neues Daten-Set in der aktuellenSitzung geschrieben. Die Namen von Daten-Sets mssen den Regeln zum Benennenvon Variablen entsprechen. Diese Option ist nur verfgbar, wenn Sie eine oder mehrereKunden-ID-Variablen in der Registerkarte Variablen whlen.

    Datei. Ausgewhlte RFM-Scores und die Schlsselvariablen, die jeden Kunden (Fall)eindeutig identifizieren, werden in einer externen Datendatei gespeichert. Diese Optionist nur verfgbar, wenn Sie eine oder mehrere Kunden-ID-Variablen in der RegisterkarteVariablen whlen.

    RFM-AusgabeAbbildung 2-9Registerkarte RFM-Ausgabe

    Klassifizierte Daten

    Diagramme und Tabellen fr klassifizierte Daten basieren auf den berechneten Aktualitts-,Hufigkeits- und Geldwert-Scores.

    Verteilung des mittleren Geldwerts nach Aktualitt und Hufigkeit. Die Verteilung des mittlerenGeldwerts zeigt den durchschnittlichen Geldwert fr Kategorien, die durch Aktualitts- undHufigkeits-Scores definiert sind. Dunklere Bereiche zeigen einen hheren durchschnittlichenGeldwert an.

  • 13

    RFM-Analyse

    Diagramm der Klassenhufigkeiten. Das Diagramm der Klassenhufigkeiten zeigt dieKlassenverteilung fr die ausgewhlten Klassifizierungsmethoden an. Jeder Balken steht fr dieAnzahl der Flle, die jedem kombinierten RFM-Score zugewiesen werden. Auch wenn Sie sich in der Regel eine relativ gleichmige Verteilung wnschen, bei der alle

    (oder die meisten) Balken ungefhr die gleiche Hhe haben, sollte eine gewisse Varianzerwartet werden, wenn die Standard-Klassifizierungsmethode verwendet wird, die gebundeneWerte der gleichen Klasse zuweist.

    Extreme Schwankungen in der Klassenverteilung und/oder viele leere Klassen knnenanzeigen, dass Sie eine andere Klassifizierungsmethode (weniger Klassen und/oder zuflligeZuweisung von Bindungen) versuchen oder die Eignung der RFM-Analyse berdenkensollten.

    Tabelle der Klassenhufigkeiten. Die gleichen Informationen, die sich im Diagramm derKlassenhufigkeiten finden, nur in Form einer Tabelle mit Klassenhufigkeiten in jeder Zelle.

    Unklassifizierte Daten

    Diagramme und Tabellen fr unklassifizierte Daten basieren auf den Originalvariablen, die fr dieErstellung der Aktualitts-, Hufigkeits- und Geldwert-Scores verwendet wurden.

    Histogramme. Die Histogramme zeigen die relative Verteilung von Werten fr die drei Variablen,die fr die Berechnung der Aktualitts-, Hufigkeits- und Geldwert-Scores verwendet wurden.Diese Histogramme zeigen oftmals etwas verzerrte Verteilungen anstelle einer normalen odersymmetrischen Verteilung an.

    Die horizontale Achse jedes Histogramms ist stets von niedrigeren Werten links zu hohen Wertenrechts geordnet. Bei der Aktualitt hngt jedoch die Interpretation des Diagramms vom Typ derAktualittsmessung ab: Datum und Zeitintervall. Fr Daten stellen die Balken links Werte dar, dieweiter in der Vergangenheit liegen (ein weniger aktuelles Datum hat einen geringeren Wert als einaktuelleres Datum). Fr Zeitintervalle stellen die Balken links aktuellere Werte dar (je kleiner dasZeitintervall, umso aktueller die Transaktion).

    Streudiagramme von Variablenpaaren. Diese Streudiagramme zeigen die Beziehungen zwischenden drei Variablen, die fr die Berechnung der Aktualitts-, Hufigkeits- und Geldwert-Scoresverwendet wurden.

    Es ist blich, eine wahrnehmbare lineare Gruppierung der Punkte auf der Hufigkeitsskalafestzustellen, da die Hufigkeit oftmals einen relativ kleinen Bereich diskreter Werte darstellt.Wenn zum Beispiel die Gesamtzahl der Transaktionen 15 nicht berschreitet, gibt es nur 15mgliche Hufigkeitswerte (auer Sie zhlen teilweise Transaktionen), whrend es Hunderte vonmglichen Aktualitts- und Tausende von Geldwerten geben kann.

    Die Interpretation der Aktualittsachsen hngt jedoch vom Typ der Aktualittsmessung ab: Datumund Zeitintervall. Bei Daten stellen Punkte nher am Ursprung Daten dar, die weiter in derVergangenheit liegen. Bei Zeitintervallen stellen Punkte nher am Ursprung aktuellere Werte dar.

  • Kapitel

    3Clusteranalyse

    Bei der Cluster-Analyse handelt es sich um eine explorative Prozedur zum Ermitteln vonnatrlichen Gruppierungen (Clustern) innerhalb Ihrer Daten. Damit knnen beispielsweiseverschiedene Kundengruppen auf der Basis unterschiedlicher demographischer undKaufverhaltensmerkmale ausgemacht werden.

    Beispiel.In Einzel- und Fachhandel werden Cluster-Methoden regelmig auf Datenangewendet, die Kaufgewohnheiten, Geschlecht, Alter und Einkommensniveau der Kundschaftbeschreiben. Ziel der Analyse ist eine Ausrichtung der unternehmenseigenen Marketing- undProduktentwicklungsstrategien auf einzelne Konsumentengruppen, um Umsatzsteigerungen undMarkentreue zu erreichen.

    Erluterungen der Daten fr die Clusteranalyse

    Daten. Mit dieser Prozedur knnen sowohl stetige als auch kategoriale Felder analysiert werden.Jeder Datensatz (Zeile) stellt einen Kunden dar, der gruppiert werden soll, whrend die Felder(Variablen) die Attribute darstellen, auf deren Grundlage die Gruppierung erfolgt.

    Datensatz-Reihenfolge. Beachten Sie, dass die Ergebnisse von der Reihenfolge der Datenstzeabhngen knnen. Um die Auswirkungen der Reihenfolge zu minimieren, sollten Sie versuchen,die Datenstze in zuflliger Reihenfolge zu mischen. Prfen Sie daher die Stabilitt einerbestimmten Lsung, indem Sie die Analyse mehrmals durchfhren, wobei die Datenstze in einerunterschiedlichen, zufllig ausgewhlten Reihenfolge sortiert sind.

    Messniveau. Es ist wichtig, das korrekte Messniveau zuzuweisen, da sich dieses auf dieBerechnung der Ergebnisse auswirkt. Nominal. Eine Variable kann als nominal behandelt werden, wenn ihre Kategorien sich

    nicht in eine natrliche Reihenfolge bringen lassen, z. B. die Firmenabteilung, in dereine Person arbeitet. Beispiele fr nominale Variablen sind Region, Postleitzahl oderReligionszugehrigkeit.

    Ordinal. Eine Variable kann als ordinal behandelt werden, wenn ihre Werte fr Kategorienstehen, die eine natrliche Reihenfolge aufweisen (z. B. Grad der Zufriedenheit mitKategorien von sehr unzufrieden bis sehr zufrieden). Ordinale Variablen treten beispielsweisebei Einstellungsmessungen (Zufriedenheit oder Vertrauen) und bei Prferenzbeurteilungenauf.

    Kontinuierlich. Eine Variable kann als metrisch (stetig) behandelt werden, wenn ihreWerte geordnete Kategorien mit einer sinnvollen Metrik darstellen, sodass man sinnvolleAussagen ber die Abstnde zwischen den Werten machen kann. Metrische Variablen sindbeispielsweise Alter (in Jahren) oder Einkommen (in Geldeinheiten).

    Copyright IBM Corporation 1989, 2011. 14

  • 15

    Clusteranalyse

    Ein Symbol neben jedem Feld zeigt das aktuelle Messniveau an.

    Numerisch Zeichenfolge Datum ZeitMetrisch (stetig) entfllt

    Ordinal

    Nominal

    Sie knnen das Messniveau in der Variablenansicht des Daten-Editors ndern oder das DialogfeldVariableneigenschaften definieren verwenden, um ein geeignetes Messniveau fr jedes Feldanzugeben .

    Felder mit unbekanntem Messniveau

    Die Messniveau-Warnmeldung wird angezeigt, wenn das Messniveau fr mindestens eine Variable(ein Feld) im Datenblatt unbekannt ist. Da sich das Messniveau auf die Berechnung der Ergebnissefr diese Prozedur auswirkt, mssen alle Variablen ein definiertes Messniveau aufweisen.Abbildung 3-1Messniveau-Warnmeldung

    Daten durchsuchen. Liest die Daten im aktiven Datenblatt (Arbeitsdatei) und weist allenFeldern, deren Messniveau zurzeit nicht bekannt ist, das Standardmessniveau zu. Bei groenDatenblttern kann dieser Vorgang einige Zeit in Anspruch nehmen.

    Manuell zuweisen. ffnet ein Dialogfeld, in dem alle Felder mit unbekanntem Messniveauaufgefhrt werden. Mit diesem Dialogfeld knnen Sie diesen Feldern ein Messniveauzuweisen. Auerdem knnen Sie in der Variablenansicht des Daten-Editors ein Messniveauzuweisen.

    Da das Messniveau fr diese Prozedur bedeutsam ist, knnen Sie erst dann auf das Dialogfeld zurAusfhrung dieser Prozedur zugreifen, wenn fr alle Felder ein Messniveau definiert wurde.

    So fhren Sie eine Clusteranalyse durch:

    Whlen Sie die folgenden Befehle aus den Mens aus:Option Direct Marketing (Direktmarketing) > Verfahren whlen

    E Whlen Sie Meine Kontakte in Cluster segmentieren aus.

  • 16

    Kapitel 3

    Abbildung 3-2Registerkarte Clusteranalysefelder

    E Whlen Sie die kategorialen (nominalen, ordinalen) und stetigen (metrischen) Felder aus, die Siezum Erstellen von Segmenten verwenden mchten.

    E Klicken Sie auf Ausfhren, um die Prozedur auszufhren.

  • 17

    Clusteranalyse

    EinstellungenAbbildung 3-3Registerkarte Clusteranalyseeinstellungen

    Auf der Registerkarte Einstellungen knnen Sie Diagramme und Tabellen, die die Segmentebeschreiben, anzeigen oder unterdrcken, ein neues Feld im Daten-Set speichern, das das Segment(Cluster) fr jeden Datensatz im Daten-Set identifiziert, und festlegen, wie viele Segmente dieCluster-Lsung enthalten soll.

    Diagramme und Tabellen anzeigen. Zeigt Tabellen und Diagramme an, die die Segmentebeschreiben.

    Segment-Zugehrigkeit. Speichert ein neues Feld bzw. eine neue Variable, das bzw. die dasSegment identifiziert, zu dem jeder Datensatz gehrt. Die Feldnamen mssen den Benennungsregeln von IBM SPSS Statistics entsprechen. Der Feldname der Segment-Zugehrigkeit kann kein Duplikat eines Feldnamens sein, der

    bereits im Daten-Set vorhanden ist. Falls Sie diese Prozedur also mehr als einmal mitdemselben Daten-Set ausfhren, mssen Sie jedes Mal einen anderen Namen angeben.

  • 18

    Kapitel 3

    Anzahl der Segmente. Legt fest, wie die Anzahl der Segmente ermittelt wird. Automatisch ermitteln. Die Prozedur ermittelt automatisch die beste Anzahl der Segmente

    bis zum angegebenen Hchstwert.

    Feste Anzahl angeben. Die Prozedur erzeugt die angegebene Anzahl der Segmente.

  • Kapitel

    4Profile ber potenzielle Kunden

    Bei dieser Technik werden Ergebnisse aus einer frheren Kampagne oder einer Testkampagneverwendet, um beschreibende Profile zu erstellen. Diese Profile knnen bei zuknftigenKampagnen fr das Targeting bestimmter Gruppen von Kontakten verwendet werden. DasResponsefeld zeigt, wer auf die frhere Kampagne bzw. die Testkampagne reagiert hat. Die ListeProfile enthlt die Merkmale, die Sie zur Erstellung des Profils verwenden mchten.

    Beispiel. Anhand der Ergebnisse einer Testsendung mchte die Marketing-Abteilung einesUnternehmens auf Basis von demographischen Informationen Profile der Typen von Kundenerstellen, bei denen die Wahrscheinlichkeit einer Antwort auf ein Angebot am hchsten ist.

    Ausgabe

    Die Ausgabe enthlt eine Tabelle, die eine Beschreibung jeder Profilgruppe enthlt und inder Responseraten (Prozentsatz der positiven Antworten), kumulative Responseraten sowieein Diagramm der kumulativen Responseraten angezeigt werden. Wenn Sie eine minimaleZielresponserate einschlieen, wird die Tabelle farbkodiert, so dass erkennbar ist, welche Profileder Mindestanforderung an die kumulative Responserate entsprechen. Das Diagramm enthlt eineBezugslinie, die den Wert der minimalen Responserate kenntlich macht.

    Copyright IBM Corporation 1989, 2011. 19

  • 20

    Kapitel 4

    Abbildung 4-1Tabelle und Diagramm fr die Responserate

    Erluterung der Daten fr Profile ber potenzielle Kunden

    Responsefeld. Das Responsefeld muss nominal oder ordinal sein. Es kann ein numerisches Feldoder ein String-Feld sein. Falls dieses Feld einen Wert enthlt, der die Anzahl von Kufen anzeigt,mssen Sie ein neues Feld erstellen, in dem ein einzelner Wert smtliche positiven Antwortenreprsentiert. Fr weitere Informationen siehe Thema Erstellen eines kategorialen Responsefeldsauf S. 24.

    Wert fr positive Antworten. Der Wert fr positive Antworten bezeichnet diejenigen Kunden,die positiv reagiert haben (zum Beispiel, indem sie einen Kauf gettigt haben). Es wirddavon ausgegangen, dass alle anderen nicht fehlenden Responsewerte eine negative Antwortanzeigen. Falls es definierte Wertelabels fr das Responsefeld gibt, werden diese Labels in derDropdown-Liste angezeigt.

    Profile erstellen mit. Diese Felder knnen nominal, ordinal oder stetig (metrisch) sein. Es knnennumerische Felder oder String-Felder sein.

  • 21

    Profile ber potenzielle Kunden

    Messniveau. Es ist wichtig, das korrekte Messniveau zuzuweisen, da sich dieses auf dieBerechnung der Ergebnisse auswirkt. Nominal. Eine Variable kann als nominal behandelt werden, wenn ihre Kategorien sich

    nicht in eine natrliche Reihenfolge bringen lassen, z. B. die Firmenabteilung, in dereine Person arbeitet. Beispiele fr nominale Variablen sind Region, Postleitzahl oderReligionszugehrigkeit.

    Ordinal. Eine Variable kann als ordinal behandelt werden, wenn ihre Werte fr Kategorienstehen, die eine natrliche Reihenfolge aufweisen (z. B. Grad der Zufriedenheit mitKategorien von sehr unzufrieden bis sehr zufrieden). Ordinale Variablen treten beispielsweisebei Einstellungsmessungen (Zufriedenheit oder Vertrauen) und bei Prferenzbeurteilungenauf.

    Kontinuierlich. Eine Variable kann als metrisch (stetig) behandelt werden, wenn ihreWerte geordnete Kategorien mit einer sinnvollen Metrik darstellen, sodass man sinnvolleAussagen ber die Abstnde zwischen den Werten machen kann. Metrische Variablen sindbeispielsweise Alter (in Jahren) oder Einkommen (in Geldeinheiten).

    Ein Symbol neben jedem Feld zeigt das aktuelle Messniveau an.

    Numerisch Zeichenfolge Datum ZeitMetrisch (stetig) entfllt

    Ordinal

    Nominal

    Sie knnen das Messniveau in der Variablenansicht des Daten-Editors ndern oder das DialogfeldVariableneigenschaften definieren verwenden, um ein geeignetes Messniveau fr jedes Feldanzugeben .

    Felder mit unbekanntem Messniveau

    Die Messniveau-Warnmeldung wird angezeigt, wenn das Messniveau fr mindestens eine Variable(ein Feld) im Datenblatt unbekannt ist. Da sich das Messniveau auf die Berechnung der Ergebnissefr diese Prozedur auswirkt, mssen alle Variablen ein definiertes Messniveau aufweisen.

    Abbildung 4-2Messniveau-Warnmeldung

  • 22

    Kapitel 4

    Daten durchsuchen. Liest die Daten im aktiven Datenblatt (Arbeitsdatei) und weist allenFeldern, deren Messniveau zurzeit nicht bekannt ist, das Standardmessniveau zu. Bei groenDatenblttern kann dieser Vorgang einige Zeit in Anspruch nehmen.

    Manuell zuweisen. ffnet ein Dialogfeld, in dem alle Felder mit unbekanntem Messniveauaufgefhrt werden. Mit diesem Dialogfeld knnen Sie diesen Feldern ein Messniveauzuweisen. Auerdem knnen Sie in der Variablenansicht des Daten-Editors ein Messniveauzuweisen.

    Da das Messniveau fr diese Prozedur bedeutsam ist, knnen Sie erst dann auf das Dialogfeld zurAusfhrung dieser Prozedur zugreifen, wenn fr alle Felder ein Messniveau definiert wurde.

    So erhalten Sie Profile ber potenzielle Kunden:

    Whlen Sie die folgenden Befehle aus den Mens aus:Option Direct Marketing (Direktmarketing) > Verfahren whlen

    E Whlen Sie Profile fr die Kontakte erstellen, die auf ein Angebot reagiert haben.

    Abbildung 4-3Profile ber potenzielle Kunden, Registerkarte Felder

    E Whlen Sie das Feld aus, das anzeigt, welche Kontakte auf das Angebot reagiert haben. DiesesFeld muss nominal oder ordinal sein.

    E Geben Sie den Wert an, der eine positive Antwort anzeigt. Fr Werte mit definierten Wertelabelsknnen Sie das Wertelabel aus der Dropdown-Liste auswhlen, woraufhin der entsprechendeWert angezeigt wird.

  • 23

    Profile ber potenzielle Kunden

    E Whlen Sie die Felder aus, die Sie verwenden mchten, um die Profile zu erstellen.

    E Klicken Sie auf Ausfhren, um die Prozedur auszufhren.

    EinstellungenAbbildung 4-4Profile ber potenzielle Kunden, Registerkarte Einstellungen

    Auf der Registerkarte Einstellungen knnen Sie die Mindestgre der Profilgruppe angebenund eine minimale Responseratenschwelle in die Ausgabe einschlieen.

    Minimale Profilgruppengre. Jedes Profil reprsentiert die gemeinsamen Merkmale einer Gruppevon Kontakten im Daten-Set (z.B. Frauen unter 40 Jahren, die im Westen leben). Standardmigist 100 der kleinste Wert fr die Gre der Profilgruppe. Kleinere Gruppengren knnen zu einergreren Anzahl von Gruppen fhren, grere Gruppengren liefern jedoch verlsslichereErgebnisse. Dieser Wert muss eine positive Ganzzahl sein.

    Informationen ber minimale Responseratenschwelle in Ergebnissen einschlieen. Die Ergebnisseenthalten eine Tabelle, in der Responseraten (Prozentsatz der positiven Antworten), kumulativeResponseraten sowie ein Diagramm der kumulativen Responseraten angezeigt werden. WennSie eine minimale Zielresponserate eingeben, wird die Tabelle farbkodiert, so dass erkennbarist, welche Profile der Mindestanforderung an die kumulative Responserate entsprechen. DasDiagramm enthlt eine Bezugslinie, die den Wert der minimalen Responserate kenntlich macht.Der Wert muss grer als 0 und kleiner als 100 sein.

  • 24

    Kapitel 4

    Erstellen eines kategorialen Responsefelds

    Das Responsefeld sollte kategorial sein, wobei ein Wert alle positiven Reaktionen darstellensollte. Es wird davon ausgegangen, dass alle anderen nicht fehlenden Werte eine negative Antwortanzeigen. Falls das Responsefeld einen stetigen (metrischen) Wert enthlt, beispielsweise dieAnzahl oder den Geldwert der Kufe, mssen Sie ein neues Feld erstellen, das allen von Nullabweichenden Responsewerten eine einzelne positive Antwort zuweist. Falls negative Antworten als 0 (nicht leer, was als fehlender Wert aufgefasst wird)

    aufgezeichnet werden, kann dies anhand der folgenden Formel berechnet werden:NewName=OldName>0,wobei NewName der Name des neuen Felds und OldName der Name des neuen Felds ist. Diesist ein logischer Ausdruck, der allen nicht fehlenden Werten grer 0 einen Wert von 1 undallen nicht fehlenden Werten kleiner oder gleich 0 den Wert 0 zuweist.

    Falls fr negative Antworten kein Wert aufgezeichnet wird, werden diese Werte als fehlendbehandelt und die Formel ist etwas komplizierter:NewName=NOT(MISSING(OldName))Bei diesem logischen Ausdruck wird allen nicht fehlenden Responsewerten ein Wert von 1und allen fehlenden Responsewerten ein Wert von 0 zugewiesen.

    Falls Sie zwischen negativen (0) Responsewerten und fehlenden Werten nicht unterscheidenknnen, kann kein korrekter Responsewert berechnet werden. Falls es nur relativ wenigtatschlich fehlende Werte gibt, muss dies jedoch keine groen Auswirkungen auf dieberechneten Responseraten haben. Falls es jedoch viele fehlende Werte gibt z. B. wenn dieResponseinformationen nur fr eine kleine Teststichprobe des gesamten Daten-Sets berechnetwerden , wird dies dazu fhren, dass die berechneten Responseraten bedeutungslos sind, dasie deutlich niedriger sein werden als die tatschlichen Responseraten.

    So erstellen Sie ein kategoriales Responsefeld

    E Whlen Sie die folgenden Befehle aus den Mens aus:Transformieren > Variable berechnen

    E Geben Sie fr Zielvariable einen neuen Feld-(Variablen-)Namen ein.

    E Falls negative Reaktionen als 0 aufgezeichnet werden, geben Sie als numerischen AusdruckOldName>0 ein, wobei OldName der ursprngliche Feldname ist.

    E Falls negative Reaktionen als fehlend (leer) aufgezeichnet werden, geben Sie als numerischenAusdruck NOT(MISSING(OldName)) ein, wobei OldName der ursprngliche Feldname ist.

  • Kapitel

    5Responseraten nach Postleitzahlen

    Bei dieser Technik werden Ergebnisse aus einer frheren Kampagne verwendet, um Responseratennach Postleitzahlen zu berechnen. Diese Raten knnen bei zuknftigen Kampagnen fr dasTargeting bestimmter Postleitzahlbereiche verwendet werden. Das Responsefeld zeigt an, werauf die frhere Kampagne reagiert hat. Das Postleitzahlfeld kennzeichnet das Feld, das diePostleitzahlen enthlt.

    Beispiel. Anhand der Ergebnisse einer frheren Postsendungs-Kampagne erzeugt dieMarketing-Abteilung eines Unternehmens Responseraten nach Postleitzahlen. Auf Basisverschiedener Kriterien wie der minimalen akzeptablen Responserate und/oder der maximalenAnzahl von Kontakten, die in die Postsendungs-Kampagne eingeschlossen werden sollen, knnendaraufhin bestimmte Postleitzahlbereiche fr die Kampagne bestimmt werden.

    Ausgabe

    Zur Ausgabe dieser Prozedur gehrt ein neues Daten-Set, das die Responseraten nachPostleitzahl sowie eine Tabelle und ein Diagramm enthlt, die die Ergebnisse nach Dezil-Rangzusammenfassen (oberste 10 %, oberste 20 % usw.). Die Tabelle kann auf Basis einer vomBenutzer festgelegten minimalen kumulativen Responserate oder maximalen Anzahl vonKontakten farbkodiert werden.

    Abbildung 5-1Daten-Set mit Responseraten nach Postleitzahlen

    Copyright IBM Corporation 1989, 2011. 25

  • 26

    Kapitel 5

    Abbildung 5-2Tabelle und Diagramm mit Zusammenfassung

    Das neue Datenblatt enthlt folgende Felder: Postleitzahl. Falls die Postleitzahl-Gruppen auf nur einem Teil des Gesamtwerts basieren,

    ist dies der Wert dieses Teils der Postleitzahl. Das Kopfzeilenlabel fr diese Spalte in derExcel-Datei ist der Name des Postleitzahlfelds im ursprnglichen Daten-Set.

    Responserate. Der Prozentsatz der positiven Antworten in jeder Postleitzahl-Gruppe. Antworten. Der Anzahl der positiven Antworten in jeder Postleitzahl-Gruppe.

  • 27

    Responseraten nach Postleitzahlen

    Kontakte. Die Gesamtanzahl von Kontakten in jedem Postleitzahlbereich, die einen nichtfehlenden Wert fr das Responsefeld enthalten.

    Index. Die gewichtete Antwort auf Basis der Formel N x P x (1-P), wobei N die Anzahl vonKontakten und P die als Anteil ausgedrckte Responserate ist.

    Rang. Dezil-Rang (oberste 10 %, oberste 20 % usw.) der kumulativenPostleitzahl-Responseraten in absteigender Reihenfolge.

    Erluterung der Daten fr Responseraten nach Postleitzahlen

    Responsefeld. Das Responsefeld kann ein String-Feld oder ein numerisches Feld sein. Falls diesesFeld einen Wert enthlt, der die Anzahl von Kufen oder ihren Geldwert anzeigt, mssen Sie einneues Feld erstellen, in dem ein einzelner Wert smtliche positiven Antworten reprsentiert. Frweitere Informationen siehe Thema Erstellen eines kategorialen Responsefelds auf S. 31.

    Wert fr positive Antworten. Der Wert fr positive Antworten bezeichnet diejenigen Kunden,die positiv reagiert haben (zum Beispiel, indem sie einen Kauf gettigt haben). Es wirddavon ausgegangen, dass alle anderen nicht fehlenden Responsewerte eine negative Antwortanzeigen. Falls es definierte Wertelabels fr das Responsefeld gibt, werden diese Labels in derDropdown-Liste angezeigt.

    Postleitzahlfeld. Das Postleitzahlfeld kann ein String-Feld oder ein numerisches Feld sein.

    So erhalten Sie Responseraten nach Postleitzahlen

    Whlen Sie die folgenden Befehle aus den Mens aus:Option Direct Marketing (Direktmarketing) > Verfahren whlen

    E Whlen Sie Postleitzahlbereiche mit den meisten Antworten identifizieren.

  • 28

    Kapitel 5

    Abbildung 5-3Responseraten nach Postleitzahlen, Registerkarte Felder

    E Whlen Sie das Feld aus, das anzeigt, welche Kontakte auf das Angebot reagiert haben.

    E Geben Sie den Wert an, der eine positive Antwort anzeigt. Fr Werte mit definierten Wertelabelsknnen Sie das Wertelabel aus der Dropdown-Liste auswhlen, woraufhin der entsprechendeWert angezeigt wird.

    E Whlen Sie das Feld, das die Postleitzahl enthlt.

    E Klicken Sie auf Ausfhren, um die Prozedur auszufhren.

    Auerdem sind die folgenden Optionen verfgbar: Anstelle des vollstndigen Werts knnen Sie Responseraten auf Basis der ersten n Zeichen

    oder Stellen der Postleitzahl generieren. Sie knnen die Ergebnisse automatisch als Excel-Datei speichern. Anzeigeoptionen der Ausgabe anpassen

  • 29

    Responseraten nach Postleitzahlen

    EinstellungenAbbildung 5-4Responseraten nach Postleitzahlen, Registerkarte Einstellungen

    Postleitzahlen gruppieren nach

    Dadurch wird festgelegt, wie Datenstze gruppiert werden, um Responseraten zu berechnen.Standardmig wird dazu die gesamte Postleitzahl verwendet und alle Datenstze mit derselbenPostleitzahl werden zur Berechnung der Gruppen-Responserate gruppiert. Alternativ knnen SieDatenstze auch anhand eines Teils der vollstndigen Postleitzahl gruppieren, welcher aus denersten n Stellen oder Zeichen besteht. Dies ist ntzlich, wenn Sie beispielsweise nur die erstenfnf Zeichen einer Postleitzahl aus zehn Zeichen oder die ersten drei Stellen einer fnfstelligenPostleitzahl fr die Gruppierung verwenden mchten. Das Ausgabe-Daten-Set wird einenDatensatz fr jede Postleitzahl-Gruppe enthalten. Falls Sie einen Wert eingeben, muss es sichdabei um eine positive ganze Zahl handeln.

    Numerisches Format von Postleitzahlen

    Wenn das Postleitzahlfeld numerisch ist und Sie die Postleitzahlen auf Basis der ersten nStellen anstatt des Gesamtwerts gruppieren mchten, mssen Sie die Anzahl von Stellen desursprnglichen Werts angeben. Die Anzahl von Stellen ist die maximal mgliche Anzahl von

  • 30

    Kapitel 5

    Stellen der Postleitzahl. Falls das Postleitzahlenfeld beispielsweise sowohl fnfstellige als auchneunstellige Postleitzahlen enthlt, sollten Sie als Anzahl von Stellen 9 eingeben.

    Anmerkung: Abhngig vom Anzeigeformat werden manche fnfstelligen Postleitzahlen unterUmstnden mit nur vier Stellen angezeigt, wobei aber eine fhrende Null impliziert ist.

    Ausgabe

    Neben dem neuen Daten-Set, das die Responseraten nach Postleitzahl enthlt, knnen Sie aucheine Tabelle und ein Diagramm anzeigen, die die Ergebnisse nach Dezil-Rang zusammenfassen(oberste 10 %, oberste 20 % usw.). In der Tabelle werden Responseraten, kumulativeResponseraten, die Anzahl von Datenstzen sowie die kumulative Anzahl von Datenstzen injedem Dezil angezeigt. Im Diagramm werden kumulative Responseraten sowie die kumulativeAnzahl von Datenstzen in jedem Dezil angezeigt.

    Akzeptable Mindest-Responserate. Wenn Sie eine akzeptable Mindest-Responserate oder eineBreak-Even-Formel eingeben, wird die Tabelle farbkodiert, so dass erkennbar ist, welche Dezileder Mindestanforderung an die kumulative Responserate entsprechen. Das Diagramm enthlt eineBezugslinie, die den Wert der Mindest-Responserate kenntlich macht. Zielresponserate. In Prozent ausgedrckte Responserate (Prozentsatz der positiven Antworten

    in jeder Postleitzahl-Gruppe). Der Wert muss grer als 0 und kleiner als 100 sein. Gewinnrate aus Formel berechnen. Berechnen Sie die minimale kumulative Responserate

    anhand dieser Formel: (Kosten der Postsendung/Nettoertrag pro Antwort) x 100. Beide Wertemssen positive Zahlen sein. Das Ergebnis sollte ein Wert grer 0 und kleiner als 100 sein.Falls die Kosten einer Postsendung beispielsweise 0,75 Euro und der Nettoertrag pro Antwort56 Euro betragen, betrgt die Mindest-Responserate: (0,75/56) x 100 = 1,34%.

    Maximale Anzahl an Kontakten. Wenn Sie eine maximale Anzahl von Kontakten angeben, wirddie Tabelle farbkodiert, so dass erkennbar ist, welche Dezile die kumulative maximale Anzahlvon Kontakten (Datenstzen) nicht bersteigen. Das Diagramm enthlt eine Bezugslinie, diediesen Wert kenntlich macht. Prozentzahl der Kontakte. Das in Prozent ausgedrckte Maximum. Dies ist ntzlich, wenn Sie

    beispielsweise die Dezile mit den hchsten Responseraten ermitteln mchten, die nicht mehrals 50 % aller Kontakte enthalten. Der Wert muss grer als 0 und kleiner als 100 sein.

    Anzahl der Kontakte. Das als Anzahl der Kontakte angegebene Maximum. Dies ist ntzlich,wenn Sie beispielsweise nicht mehr als 10.000 Sendungen verschicken mchten; in diesemFall wrden Sie den Wert auf 10.000 festlegen. Der Wert muss eine positive ganze Zahlsein (ohne Gruppierungssymbole).

    Wenn Sie sowohl eine minimale akzeptable Responserate als auch eine maximale Anzahl vonKontakten angeben, erfolgt die Farbkodierung der Tabelle abhngig davon, welche Bedingungals erste erfllt wird.

  • 31

    Responseraten nach Postleitzahlen

    Nach Excel exportieren

    Bei dieser Prozedur wird automatisch ein neues Daten-Set erstellt, das Responseraten nachPostleitzahlen enthlt. Jeder Datensatz (Zeile) im Daten-Set steht dabei fr eine Postleitzahl. Sieknnen dieselben Informationen automatisch als Excel-Datei speichern. Sie wird im FormatExcel 97-2003 gespeichert.

    Erstellen eines kategorialen Responsefelds

    Das Responsefeld sollte kategorial sein, wobei ein Wert alle positiven Reaktionen darstellensollte. Es wird davon ausgegangen, dass alle anderen nicht fehlenden Werte eine negative Antwortanzeigen. Falls das Responsefeld einen stetigen (metrischen) Wert enthlt, beispielsweise dieAnzahl oder den Geldwert der Kufe, mssen Sie ein neues Feld erstellen, das allen von Nullabweichenden Responsewerten eine einzelne positive Antwort zuweist. Falls negative Antworten als 0 (nicht leer, was als fehlender Wert aufgefasst wird)

    aufgezeichnet werden, kann dies anhand der folgenden Formel berechnet werden:NewName=OldName>0,wobei NewName der Name des neuen Felds und OldName der Name des neuen Felds ist. Diesist ein logischer Ausdruck, der allen nicht fehlenden Werten grer 0 einen Wert von 1 undallen nicht fehlenden Werten kleiner oder gleich 0 den Wert 0 zuweist.

    Falls fr negative Antworten kein Wert aufgezeichnet wird, werden diese Werte als fehlendbehandelt und die Formel ist etwas komplizierter:NewName=NOT(MISSING(OldName))Bei diesem logischen Ausdruck wird allen nicht fehlenden Responsewerten ein Wert von 1und allen fehlenden Responsewerten ein Wert von 0 zugewiesen.

    Falls Sie zwischen negativen (0) Responsewerten und fehlenden Werten nicht unterscheidenknnen, kann kein korrekter Responsewert berechnet werden. Falls es nur relativ wenigtatschlich fehlende Werte gibt, muss dies jedoch keine groen Auswirkungen auf dieberechneten Responseraten haben. Falls es jedoch viele fehlende Werte gibt z. B. wenn dieResponseinformationen nur fr eine kleine Teststichprobe des gesamten Daten-Sets berechnetwerden , wird dies dazu fhren, dass die berechneten Responseraten bedeutungslos sind, dasie deutlich niedriger sein werden als die tatschlichen Responseraten.

    So erstellen Sie ein kategoriales Responsefeld

    E Whlen Sie die folgenden Befehle aus den Mens aus:Transformieren > Variable berechnen

    E Geben Sie fr Zielvariable einen neuen Feld-(Variablen-)Namen ein.

    E Falls negative Reaktionen als 0 aufgezeichnet werden, geben Sie als numerischen AusdruckOldName>0 ein, wobei OldName der ursprngliche Feldname ist.

    E Falls negative Reaktionen als fehlend (leer) aufgezeichnet werden, geben Sie als numerischenAusdruck NOT(MISSING(OldName)) ein, wobei OldName der ursprngliche Feldname ist.

  • Kapitel

    6Kaufneigung

    Fr die Kaufneigung werden Ergebnisse einer Testsendung oder einer frheren Kampagneverwendet, um Bewertungen zu erstellen. Die Bewertungen zeigen an, bei welchen Kontaktendie Wahrscheinlichkeit einer Antwort am hchsten ist. Das Responsefeld zeigt, wer auf dieTestsendung oder die frhere Kampagne reagiert hat. Die Neigungsfelder sind die Merkmale,die Sie verwenden, um die Wahrscheinlichkeit einer Antwort seitens Kontakten mit hnlichenEigenschaften vorherzusagen.

    Diese Technik verwendet die binre logistische Regression fr den Aufbau einesVorhersagemodells. Der Prozess des Aufbaus und der Anwendung eines Vorhersagemodellsumfasst die folgenden beiden Schritte:

    E Erstellen des Modells und Speichern der Modelldatei. Sie erstellen das Modell mithilfe einesDaten-Sets, fr das das relevante Ergebnis (oft als Ziel) bezeichnet) bekannt ist. Wenn Siebeispielsweise ein Modell erstellen mchten, mit dem vorhergesagt wird, welche Personenvermutlich auf eine Direktmailing-Aktion reagieren, mssen Sie mit einem Daten-Set beginnen,das bereits Informationen ber die Personen enthlt, die reagierten und die nicht reagierten. Dabeikann es sich beispielsweise um die Ergebnisse eines Testmailings an eine kleine Gruppe vonKunden oder um Informationen zu Reaktionen auf eine hnliche Kampagne in der Vergangenheithandeln.

    E Anwenden des Modells auf ein anderes Daten-Set (fr das das relevante Ergebnis nicht bekanntist), um die vorhergesagten Ergebnisse zu ermitteln.

    Beispiel. Die Direktmarketing-Abteilung eines Unternehmens verwendet die Ergebnisse einerTestsendung, um den brigen Kontakten in ihrer Datenbank Neigungsbewertungen zuzuweisen,wobei verschiedene demographische Merkmale eingesetzt werden, um Kontakte zu ermitteln, beidenen die Wahrscheinlichkeit einer Antwort und eines Kaufs am grten ist.

    Ausgabe

    Mit diesem Verfahren wird automatisch ein neues Feld im Datenblatt (Daten-Set) erstellt,das Neigungsbewertungen fr die Testdaten und eine XML-Modelldatei enthlt, die zurBewertung anderer Datenbltter verwendet werden kann. In der optionalen Diagnosenausgabesind ein Diagramm zur Gesamtmodellqualitt sowie eine Klassifikationsmatrix enthalten, dievorhergesagte Antworten mit tatschlichen Antworten vergleicht.

    Copyright IBM Corporation 1989, 2011. 32

  • 33

    Kaufneigung

    Abbildung 6-1Diagramm zur Gesamtmodellqualitt

    Erluterung der Daten zur Kaufneigung

    Responsefeld. Das Responsefeld kann ein String-Feld oder ein numerisches Feld sein. Falls diesesFeld einen Wert enthlt, der die Anzahl von Kufen oder ihren Geldwert anzeigt, mssen Sie einneues Feld erstellen, in dem ein einzelner Wert smtliche positiven Antworten reprsentiert. Frweitere Informationen siehe Thema Erstellen eines kategorialen Responsefelds auf S. 39.

    Wert fr positive Antworten. Der Wert fr positive Antworten bezeichnet diejenigen Kunden,die positiv reagiert haben (zum Beispiel, indem sie einen Kauf gettigt haben). Es wirddavon ausgegangen, dass alle anderen nicht fehlenden Responsewerte eine negative Antwortanzeigen. Falls es definierte Wertelabels fr das Responsefeld gibt, werden diese Labels in derDropdown-Liste angezeigt.

    Neigung vorhersagen durch. Die Felder, die verwendet werden, um die Neigung vorherzusagen,knnen String-Felder oder numerische Felder und auerdem nominal, ordinal oder stetig(metrisch) sein es ist jedoch wichtig, allen Feldern fr Einflussgren das geeignete Messniveauzuzuweisen.

    Messniveau. Es ist wichtig, das korrekte Messniveau zuzuweisen, da sich dieses auf dieBerechnung der Ergebnisse auswirkt. Nominal. Eine Variable kann als nominal behandelt werden, wenn ihre Kategorien sich

    nicht in eine natrliche Reihenfolge bringen lassen, z. B. die Firmenabteilung, in dereine Person arbeitet. Beispiele fr nominale Variablen sind Region, Postleitzahl oderReligionszugehrigkeit.

    Ordinal. Eine Variable kann als ordinal behandelt werden, wenn ihre Werte fr Kategorienstehen, die eine natrliche Reihenfolge aufweisen (z. B. Grad der Zufriedenheit mitKategorien von sehr unzufrieden bis sehr zufrieden). Ordinale Variablen treten beispielsweise

  • 34

    Kapitel 6

    bei Einstellungsmessungen (Zufriedenheit oder Vertrauen) und bei Prferenzbeurteilungenauf.

    Kontinuierlich. Eine Variable kann als metrisch (stetig) behandelt werden, wenn ihreWerte geordnete Kategorien mit einer sinnvollen Metrik darstellen, sodass man sinnvolleAussagen ber die Abstnde zwischen den Werten machen kann. Metrische Variablen sindbeispielsweise Alter (in Jahren) oder Einkommen (in Geldeinheiten).

    Ein Symbol neben jedem Feld zeigt das aktuelle Messniveau an.

    Numerisch Zeichenfolge Datum ZeitMetrisch (stetig) entfllt

    Ordinal

    Nominal

    Sie knnen das Messniveau in der Variablenansicht des Daten-Editors ndern oder das DialogfeldVariableneigenschaften definieren verwenden, um ein geeignetes Messniveau fr jedes Feldanzugeben .

    Felder mit unbekanntem Messniveau

    Die Messniveau-Warnmeldung wird angezeigt, wenn das Messniveau fr mindestens eine Variable(ein Feld) im Datenblatt unbekannt ist. Da sich das Messniveau auf die Berechnung der Ergebnissefr diese Prozedur auswirkt, mssen alle Variablen ein definiertes Messniveau aufweisen.

    Abbildung 6-2Messniveau-Warnmeldung

    Daten durchsuchen. Liest die Daten im aktiven Datenblatt (Arbeitsdatei) und weist allenFeldern, deren Messniveau zurzeit nicht bekannt ist, das Standardmessniveau zu. Bei groenDatenblttern kann dieser Vorgang einige Zeit in Anspruch nehmen.

    Manuell zuweisen. ffnet ein Dialogfeld, in dem alle Felder mit unbekanntem Messniveauaufgefhrt werden. Mit diesem Dialogfeld knnen Sie diesen Feldern ein Messniveauzuweisen. Auerdem knnen Sie in der Variablenansicht des Daten-Editors ein Messniveauzuweisen.

  • 35

    Kaufneigung

    Da das Messniveau fr diese Prozedur bedeutsam ist, knnen Sie erst dann auf das Dialogfeld zurAusfhrung dieser Prozedur zugreifen, wenn fr alle Felder ein Messniveau definiert wurde.

    So erhalten Sie Kaufneigungsbewertungen:

    Whlen Sie die folgenden Befehle aus den Mens aus:Direct Marketing (Direktmarketing) > Verfahren whlen

    E Whlen Sie Kontakte mit hchster Kaufneigung auswhlen.

    Abbildung 6-3Kaufneigung, Registerkarte Felder

    E Whlen Sie das Feld aus, das anzeigt, welche Kontakte auf das Angebot reagiert haben.

    E Geben Sie den Wert an, der eine positive Antwort anzeigt. Fr Werte mit definierten Wertelabelsknnen Sie das Wertelabel aus der Dropdown-Liste auswhlen, woraufhin der entsprechendeWert angezeigt wird.

  • 36

    Kapitel 6

    E Whlen Sie die Felder aus, die Sie verwenden mchten, um die Neigung vorherzusagen.

    So speichern Sie eine XML-Modelldatei zur Bewertung anderer Datendateien:

    E Aktivieren Sie die Option Modellinformation in XML-Datei exportieren.

    E Geben Sie einen Verzeichnispfad und einen Dateinamen ein oder klicken Sie auf Durchsuchen, umzu dem Speicherort zu navigieren, unter dem Sie die XML-Modelldatei speichern mchten.

    E Klicken Sie auf Ausfhren, um die Prozedur auszufhren.

    So verwenden Sie eine Modelldatei zur Bewertung anderer Daten-Sets:

    E ffnen Sie das zu bewertende Daten-Set (Datenblatt).

    E Verwenden Sie den Scoring-Assistenten, um das Modell auf das Daten-Set anzuwenden. WhlenSie die folgenden Befehle aus den Mens aus:Extras > Scoring-Assistent.

  • 37

    Kaufneigung

    EinstellungenAbbildung 6-4Kaufneigung, Registerkarte Einstellungen

    Modellvalidierung

    Bei der Modellvalidierung werden zu Diagnosezwecken Trainings- und Testgruppen erstellt. FallsSie die Klassifikationsmatrix im Abschnitt Diagnoseausgabe auswhlen, wird die Tabelle zuVergleichszwecken in (ausgewhlte) Trainings- und (nicht ausgewhlte) Testabschnitte unterteilt.Whlen Sie die Modellvalidierung nur aus, wenn Sie auch die Klassifikationsmatrix auswhlen.Die Bewertungen erfolgen auf Basis des Modells, das aus der Trainings-Stichprobe erstellt wurde,deren Anzahl enthaltener Datenstze stets niedriger als die Gesamtanzahl verfgbarer Datenstzeist. Ein Beispiel: Die Standardgre fr Trainings-Stichproben ist 50 %, und ein Modell, das aufBasis der Hlfte aller verfgbaren Datenstze erstellt wird, kann nicht so zuverlssig sein, wie einModell auf Basis aller verfgbaren Datenstze.

  • 38

    Kapitel 6

    Partitionsgre der Lernstichprobe (%). Legen Sie den Prozentsatz der Datenstze fest, die derTrainings-Stichprobe zugewiesen werden sollen. Die brigen Datenstze mit nicht fehlendenWerten fr das Responsefeld werden der Test-Stichprobe zugewiesen. Der Wert muss grerals 0 und kleiner als 100 sein.

    Startwert zur Replikation von Ergebnissen festlegen. Da die Zuweisung von Datenstzen zu denTrainings- und Test-Stichproben auf Zufallsbasis geschieht, erhalten Sie unter Umstnden beijeder Durchfhrung der Prozedur unterschiedliche Ergebnisse, es sei denn, Sie geben jedesMal denselben Startwert fr Zufallszahlen an.

    Diagnosenausgabe

    Gesamtmodellqualitt. Zeigt ein Balkendiagramm der Gesamtmodellqualitt an, die als ein Wertzwischen 0 und 1 ausgedrckt wird. Ein gutes Modell sollte einen Wert grer 0,5 aufweisen.

    Klassifikationsmatrix. Zeit eine Matrix an, die die vorhergesagten positiven und negativenAntworten mit den tatschlichen positiven und negativen Antworten vergleicht. DieGesamtgenauigkeitsrate kann Aufschluss darber geben, die gut das Modell funktioniert, abermglicherweise interessieren Sie sich mehr fr den Prozentsatz korrekt vorhergesagter positiverAntworten. Minimale Wahrscheinlichkeit. Weist der Kategorie fr vorhergesagte positive Antworten

    in der Klassifikationsmatrix Datenstze mit einem Bewertungswert zu, der hher als derangegebene Wert ist. Die Bewertungen, die durch die Prozedur erstellt werden, stehen fr dieWahrscheinlichkeit, dass der Kontakt positiv reagieren wird (zum Beispiel indem er einenKauf ttigt). Allgemein sollten Sie einen Wert angeben, der in der Nhe Ihrer minimalen, alsAnteil ausgedrckten Zielresponserate liegt. Falls Sie zum Beispiel an einer Responseratevon mindestens 5 % interessiert sind, geben Sie 0,05 an. Der Wert muss grer als 0 undkleiner als 1 sein.

    Name und Beschriftung des umkodierten Responsefelds

    Dieses Verfahren kodiert das Responsefeld automatisch in ein neues Feld um, in dem 1 positivenAntworten und 0 negativen Antworten entspricht. Die Analyse wird fr das umkodierte Felddurchgefhrt. Sie knnen den Standardnamen und die Standardbeschriftung durch eigene Angabenersetzen. Die Namen mssen den Benennungsregeln von IBM SPSS Statistics entsprechen.

    Werte speichern

    Im ursprnglichen Daten-Set wird automatisch ein neues Feld mit Neigungsbewertungengespeichert. Die Bewertungen stehen fr die Wahrscheinlichkeit einer positiven Antwort, welcheals Anteil ausgedrckt wird. Die Feldnamen mssen den Benennungsregeln von SPSS Statistics entsprechen. Der Feldname kann kein Duplikat eines Feldnamens sein, der bereits im Daten-Set vorhanden

    ist. Falls Sie diese Prozedur also mehr als einmal mit demselben Daten-Set ausfhren, mssenSie jedes Mal einen anderen Namen angeben.

  • 39

    Kaufneigung

    Erstellen eines kategorialen Responsefelds

    Das Responsefeld sollte kategorial sein, wobei ein Wert alle positiven Reaktionen darstellensollte. Es wird davon ausgegangen, dass alle anderen nicht fehlenden Werte eine negative Antwortanzeigen. Falls das Responsefeld einen stetigen (metrischen) Wert enthlt, beispielsweise dieAnzahl oder den Geldwert der Kufe, mssen Sie ein neues Feld erstellen, das allen von Nullabweichenden Responsewerten eine einzelne positive Antwort zuweist. Falls negative Antworten als 0 (nicht leer, was als fehlender Wert aufgefasst wird)

    aufgezeichnet werden, kann dies anhand der folgenden Formel berechnet werden:NewName=OldName>0,wobei NewName der Name des neuen Felds und OldName der Name des neuen Felds ist. Diesist ein logischer Ausdruck, der allen nicht fehlenden Werten grer 0 einen Wert von 1 undallen nicht fehlenden Werten kleiner oder gleich 0 den Wert 0 zuweist.

    Falls fr negative Antworten kein Wert aufgezeichnet wird, werden diese Werte als fehlendbehandelt und die Formel ist etwas komplizierter:NewName=NOT(MISSING(OldName))Bei diesem logischen Ausdruck wird allen nicht fehlenden Responsewerten ein Wert von 1und allen fehlenden Responsewerten ein Wert von 0 zugewiesen.

    Falls Sie zwischen negativen (0) Responsewerten und fehlenden Werten nicht unterscheidenknnen, kann kein korrekter Responsewert berechnet werden. Falls es nur relativ wenigtatschlich fehlende Werte gibt, muss dies jedoch keine groen Auswirkungen auf dieberechneten Responseraten haben. Falls es jedoch viele fehlende Werte gibt z. B. wenn dieResponseinformationen nur fr eine kleine Teststichprobe des gesamten Daten-Sets berechnetwerden , wird dies dazu fhren, dass die berechneten Responseraten bedeutungslos sind, dasie deutlich niedriger sein werden als die tatschlichen Responseraten.

    So erstellen Sie ein kategoriales Responsefeld

    E Whlen Sie die folgenden Befehle aus den Mens aus:Transformieren > Variable berechnen

    E Geben Sie fr Zielvariable einen neuen Feld-(Variablen-)Namen ein.

    E Falls negative Reaktionen als 0 aufgezeichnet werden, geben Sie als numerischen AusdruckOldName>0 ein, wobei OldName der ursprngliche Feldname ist.

    E Falls negative Reaktionen als fehlend (leer) aufgezeichnet werden, geben Sie als numerischenAusdruck NOT(MISSING(OldName)) ein, wobei OldName der ursprngliche Feldname ist.

  • Kapitel

    7Kontrollpakettest

    Dieses Verfahren vergleicht Marketingkampagnen, um herauszufinden, ob es hinsichtlich derWirksamkeit signifikante Unterschiede zwischen verschiedenen Paketen oder Angeboten gibt. DieKampagnenwirksamkeit wird anhand von Antworten gemessen. Das Kampagnenfeld identifiziertunterschiedliche Kampagnen, zum Beispiel Angebot A und Angebot B. Das Responsefeld zeigtan, wenn ein Kontakt auf die Kampagne geantwortet hat. Whlen Sie Kaufbetrag aus, wenndie Antwort als Kaufbetrag aufgezeichnet wird, zum Beispiel 99.99. Whlen Sie Antwortaus, wenn die Antwort nur angibt, ob der Kontakt positiv reagiert hat oder nicht, zum BeispielJa oder Nein.

    Beispiel. Die Direktmarketing-Abteilung eines Unternehmens mchte herausfinden, ob eineneue Verpackungsgestaltung mehr positive Antworten erzeugt als die bestehende Verpackung.Daher verschicken sie Testsendungen, um zu ermitteln, ob die neue Verpackung eine deutlichhhere positive Responserate erzeugt. Die Testsendung besteht aus einer Kontrollgruppe, diedie aktuelle Verpackung erhlt, und einer Testgruppe, an die die neue Verpackungsgestaltunggeschickt wird. Die Ergebnisse der zwei Gruppen werden dann miteinander verglichen, um zusehen, ob ein deutlicher Unterschied besteht.

    Ausgabe

    Die Ausgabe enthlt eine Tabelle, in der Hufigkeiten und Prozentwerte von positiven undnegativen Antworten fr jede anhand des Kampagnenfelds definierte Gruppe sowie eine Tabelle,in der festgehalten wird, welche Gruppen stark voneinander abweichen.

    Abbildung 7-1Ausgabe des Kontrollpakettests

    Erluterungen und Annahmen der Daten des Kontrollpakettests

    Kampagnenfeld. Das Kampagnenfeld sollte kategorial (nominal oder ordinal) sein.

    Wirksamkeits-Responsefeld. Wenn Sie fr das Wirksamkeitsfeld Kaufbetrag auswhlen, mussdas Feld numerisch sein und das Messniveau sollte stetig (metrisch) sein.

    Copyright IBM Corporation 1989, 2011. 40

  • 41

    Kontrollpakettest

    Falls Sie nicht zwischen negativen (fr den Kaufbetrag ein Wert von 0) Responsewerten undfehlenden Werten unterscheiden knnen, kann keine korrekte Responserate berechnet werden.Falls es nur relativ wenig tatschlich fehlende Werte gibt, muss dies jedoch keine groenAuswirkungen auf die berechneten Responseraten haben. Falls es jedoch viele fehlende Wertegibt z. B. wenn die Responseinformationen nur fr eine kleine Teststichprobe des gesamtenDaten-Sets berechnet werden , wird dies dazu fhren, dass die berechneten Responseratenbedeutungslos sind, da sie deutlich niedriger sein werden als die tatschlichen Responseraten.

    Annahmen. Diese Prozedur geht davon aus, dass jeder Kampagnengruppe zufllig Kontaktezugewiesen wurden. Anders ausgedrckt besteht keine spezielle Gruppenzuweisunghinsichtlich Demografie, Kaufverlauf oder anderen Merkmalen und bei allen Kontakten ist dieWahrscheinlichkeit, einer beliebigen Gruppe zugewiesen zu werden, gleich hoch.

    So fhren Sie einen Kontrollpakettest durch

    Whlen Sie die folgenden Befehle aus den Mens aus:Option Direct Marketing (Direktmarketing) > Verfahren whlen

    E Whlen Sie Wirksamkeit der Kampagnen vergleichen aus.

  • 42

    Kapitel 7

    Abbildung 7-2Dialogfeld Kontrollpakettest

    E Whlen Sie das Feld aus, das anzeigt, zu welcher Kampagnengruppe jeder Kontakt gehrt (zumBeispiel Angebot A, Angebot B etc.). Dieses Feld muss nominal oder ordinal sein.

    E Whlen Sie das Feld aus, das die Responsewirksamkeit anzeigt.

    Wenn das Responsefeld ein Kaufbetrag ist, muss das Feld numerisch sein.

    Whlen Sie Antwort aus, wenn das Responsefeld nur angibt, ob der Kontakt positiv reagiert hatoder nicht (zum Beispiel Ja oder Nein), und geben Sie den Wert ein, der eine positiveAntwort darstellt. Fr Werte mit definierten Wertelabels knnen Sie das Wertelabel aus derDropdown-Liste auswhlen, woraufhin der entsprechende Wert angezeigt wird.

    Es wird automatisch ein neues Feld erstellt, in dem 1 positiven Antworten und 0 negativenAntworten entspricht; die Analyse wird in dem neuen Feld durchgefhrt. Sie knnen denStandardnamen und die Standardbeschriftung durch eigene Angaben ersetzen. Die Namen mssenden Benennungsregeln von IBM SPSS Statistics entsprechen.

    E Klicken Sie auf Ausfhren, um die Prozedur auszufhren.

  • Teil II:Beispiele

  • Kapitel

    8RFM-Analyse aus Transaktionsdaten

    In einer Transaktionsdatei stellt jede Zeile eine eigene Transaktion anstelle eines eigenen Kundendar. Es kann mehrere Transaktionszeilen fr jeden Kunden geben. Dieses Beispiel verwendetdie Datendatei rfm_transactions.sav. Fr weitere Informationen siehe Thema Beispieldateien inAnhang A auf S. 97.

    Transaktionsdaten

    Das Daten-Set muss Variablen enthalten, die die folgenden Informationen enthalten: Eine Variable oder eine Kombination von Variablen, die jeden Fall (Kunden) identifizieren Eine Variable mit dem Datum jeder Transaktion Eine Variable mit dem Geldwert jeder Transaktion

    Abbildung 8-1RFM-Transaktionsdaten

    Durchfhren der Analyse

    E Um RFM-Scores zu berechnen, whlen Sie in den Mens folgende Optionen aus:Option Direct Marketing (Direktmarketing) > Verfahren whlen

    E Whlen Sie Hilfe bei der Erkennung meiner besten Kontakte (RFM-Analyse) und klicken Sie aufWeiter.

    E Klicken Sie auf Transaktionsdaten und anschlieend auf Weiter.

    Copyright IBM Corporation 1989, 2011. 44

  • 45

    RFM-Analyse aus Transaktionsdaten

    Abbildung 8-2RFM aus Transaktionen, Registerkarte Variablen

    E Klicken Sie auf Zurcksetzen, um frhere Einstellungen zu lschen.

    E Whlen Sie fr das Transaktionsdatum Kaufdatum [Datum].

    E Whlen Sie fr den Transaktionsbetrag Kaufbetrag [Betrag].

    E Whlen Sie fr die Auswertungsmethode Insgesamt.

    E Whlen Sie fr Kunden-ID Kunden-ID [ID].

    E Klicken Sie anschlieend auf die Registerkarte Ausgabe.

  • 46

    Kapitel 8

    Abbildung 8-3RFM fr Transaktionen, Registerkarte Ausgabe

    E Whlen (markieren) Sie Diagramm der Klassenhufigkeiten.

    E Klicken Sie dann auf OK, um die Prozedur auszufhren.

    Bewerten der Ergebnisse

    Wenn Sie RFM-Scores aus Transaktionsdaten berechnen, wird ein neues Daten-Set erstellt, dasdie neuen RFM-Scores enthlt.

    Abbildung 8-4RFM aus Daten-Set Transaktionen

    Standardmig enthlt das Daten-Set die folgenden Informationen fr jeden Kunden: Kunden-ID-Variable(n) Datum der letzten Transaktion Gesamtzahl der Transaktionen

  • 47

    RFM-Analyse aus Transaktionsdaten

    Auswertung Transaktionsbetrag (Standard ist Insgesamt) Aktualitt, Hufigkeit, Geldwert und kombinierte RFM-Scores

    Das neue Daten-Set enthlt nur eine Zeile (Datensatz) fr jeden Kunden. DieOriginaltransaktionsdaten wurden durch die Werte der Kunden-ID-Variablen aggregiert. DieID-Variablen sind stets in dem neuen Daten-Set enthalten; anderenfalls htten Sie keineMglichkeit, die RFM-Scores den Kunden zuzuordnen.Der kombinierte RFM-Score fr jeden Kunden ist einfach die Konkatenation der drei einzelnen

    Scores berechnet als: (Aktualitt x 100) + (Hufigkeit x 10) + Geldwert.

    Das Diagramm der Klassenhufigkeiten, das im Viewer-Fenster angezeigt wird, zeigt die Anzahlder Kunden in jeder RFM-Kategorie an.Abbildung 8-5Diagramm der Klassenhufigkeiten

    Die Standardmethode von fnf Score-Kategorien fr jede der drei RFM-Komponenten fhrt zu125 mglichen RFM-Score-Kategorien. Jeder Balken im Diagramm stellt die Anzahl der Kundenin jeder RFM-Kategorie dar.Idealerweise wnschen Sie sich eine relativ gleichmige Verteilung der Kunden ber

    alle RFM-Score-Kategorien. In der Realitt tritt in der Regel eine gewisse Variation wie indiesem Beispiel auf. Wenn es viele leere Kategorien gibt, sollten Sie in Erwgung ziehen, dieKlassifizierungsmethode zu ndern.Es gibt eine Reihe von Strategien fr den Umgang mit ungleichmigen Verteilungen von

    RFM-Scores wie: Verwendung verschachtelter anstelle von unabhngiger Klassifizierung Verringerung der Anzahl mglicher Score-Kategorien (Klassen) Wenn es eine groe Anzahl an gebundenen Werten gibt, ordnen Sie Flle mit den gleichen

    Scores zufllig unterschiedlichen Kategorien zu.

  • 48

    Kapitel 8

    Fr weitere Informationen siehe Thema RFM-Klassifizierung in Kapitel 2 auf S. 6.

    Kombinieren von Score-Daten mit KundendatenNachdem Sie jetzt ber ein Daten-Set verfgen, das RFM-Scores enthlt, mssen Sie diese Scoresden Kunden zuordnen. Sie knnten die Scores zurck in die Transaktionsdatendatei einflieenlassen, typischerweise wollen Sie die Score-Daten aber mit einer Datendatei kombinieren, die wiedas RFM-Score-Daten-Set eine Zeile (Datensatz) fr jeden Kunden und auch Informationen wieKundenname und Adresse enthlt.

    Abbildung 8-6RFM-Score-Daten-Set in der Variablenansicht

    E Machen Sie das Daten-Set, das die RFM-Scores enthlt, zum aktiven Daten-Set. (Klicken Sie aneine beliebige Stelle im Fenster Daten-Editor eines Daten-Sets.)

    E Whlen Sie die folgenden Befehle aus den Mens aus:Daten > Dateien zusammenfgen > Variablen hinzufgen

    Abbildung 8-7Variablen hinzufgen, Dialogfeld Dateien auswhlen

    E Whlen Sie Externe Datendatei.

    E Verwenden Sie die Schaltflche Durchsuchen, um zum Ordner Samples zu wechseln, und whlenSie customer_information.sav aus. Fr weitere Informationen siehe Thema Beispieldateien inAnhang A auf S. 97.

    E Klicken Sie dann auf Weiter.

  • 49

    RFM-Analyse aus Transaktionsdaten

    Abbildung 8-8Variablen hinzufgen, Dialogfeld Variablen auswhlen

    E Whlen (aktivieren) Sie Flle mittels Schlsselvariablen verbinden.

    E Whlen Sie Beide Dateien liefern Flle.

    E Whlen Sie ID fr die Liste Schlsselvariablen.

    E Klicken Sie auf OK.

    Abbildung 8-9Warnmeldung Variablen hinzufgen

    Achten Sie auf die Meldung, die Sie darauf hinweist, dass beide Dateien in aufsteigenderReihenfolge der Schlsselvariablen sortiert sein mssen. In diesem Beispiel sind beide Dateienbereits in aufsteigender Reihenfolge der Schlsselvariablen (die Kunden-ID-Variable, diebei der Berechnung der RFM-Scores ausgewhlt wurde) sortiert. Wenn Sie RFM-Scores ausTransaktionsdaten berechnen, wird das neue Daten-Set automatisch in aufsteigender Reihenfolgeder Kunden-ID-Variablen sortiert. Wenn Sie die Sortierfolge des Score-Daten-Sets ndern oder dieDatendatei, mit der Sie das Score-Daten-Set zusammenfgen, nicht in dieser Reihenfolge sortiertist, mssen Sie zuerst beide Dateien in aufsteigender Reihenfolge der Kunden-ID-Variablensortieren.

  • 50

    Kapitel 8

    E Klicken Sie auf OK, um die beiden Daten-Sets zusammenzufgen.

    Das Daten-Set, das die RFM-Scores enthlt, enthlt jetzt auch Name, Adresse und andereInformationen zu jedem Kunden.

    Abbildung 8-10Zusammengefgte Daten-Sets

  • Kapitel

    9Clusteranalyse

    Bei der Cluster-Analyse handelt es sich um eine explorative Prozedur zum Ermitteln vonnatrlichen Gruppierungen (Clustern) innerhalb Ihrer Daten. Damit knnen beispielsweiseverschiedene Kundengruppen auf der Basis unterschiedlicher demographischer undKaufverhaltensmerkmale ausgemacht werden.Zum Beispiel mchte die Direktmarketing-Abteilung eines Unternehmens demografische

    Gruppierungen in ihrer Kundendatenbank identifizieren, um geeignete Strategien fr ihreMarketingkampagnen zu ermitteln und neue Produktangebote zu entwickeln.Diese Informationen finden Sie in der Datei dmdata.sav. Fr weitere Informationen siehe

    Thema Beispieldateien in Anhang A auf S. 97.

    Durchfhren der AnalyseE Zum Ausfhren einer Cluster-Analyse whlen Sie die folgenden Menbefehle aus:

    Option Direct Marketing (Direktmarketing) > Verfahren whlen

    E Whlen Sie Meine Kontakte in Cluster segmentieren aus und klicken Sie auf Weiter.

    Die Messniveau-Warnmeldung wird angezeigt, wenn das Messniveau fr mindestens eine Variable(ein Feld) im Datenblatt unbekannt ist. Da sich das Messniveau auf die Berechnung der Ergebnissefr diese Prozedur auswirkt, mssen alle Variablen ein definiertes Messniveau aufweisen.Abbildung 9-1Messniveau-Warnmeldung

    Daten durchsuchen. Liest die Daten im aktiven Datenblatt (Arbeitsdatei) und weist allenFeldern, deren Messniveau zurzeit nicht bekannt ist, das Standardmessniveau zu. Bei groenDatenblttern kann dieser Vorgang einige Zeit in Anspruch nehmen.

    Manuell zuweisen. ffnet ein Dialogfeld, in dem alle Felder mit unbekanntem Messniveauaufgefhrt werden. Mit diesem Dialogfeld knnen Sie diesen Feldern ein Messniveauzuweisen. Auerdem knnen Sie in der Variablenansicht des Daten-Editors ein Messniveauzuweisen.

    Da das Messniveau fr diese Prozedur bedeutsam ist, knnen Sie erst dann auf das Dialogfeld zurAusfhrung dieser Prozedur zugreifen, wenn fr alle Felder ein Messniveau definiert wurde.

    Copyright IBM Corporation 1989, 2011. 51

  • 52

    Kapitel 9

    In dieser Beispieldatei gibt es keine Felder mit unbekanntem Messniveau und alle Felder weisendas richtige Messniveau auf. Daher sollte die Messniveau-Warnmeldung nicht angezeigt werden.

    Abbildung 9-2Cluster-Analyse, Registerkarte Felder

    E Whlen Sie die folgenden Felder aus, um Segmente zu erstellen: Alter, Einkommensklasse,Schulbildung, Jahre an aktuellem Wohnort, Geschlecht, Verheiratet und Kinder.

    E Klicken Sie auf Ausfhren, um die Prozedur auszufhren.

  • 53

    Clusteranalyse

    AusgabeAbbildung 9-3Cluster-Modellzusammenfassung

    Die Ergebnisse werden in der Cluster-Modellanzeige angezeigt. Die Modellzusammenfassung zeigt, dass vier Cluster auf der Basis der sieben von Ihnen

    ausgewhlten Eingabefunktionen (Eingabefelder) gefunden wurden. Das Diagramm zur Cluster-Qualitt zeigt, dass die Gesamtqualitt fr das Modell im mittleren

    Bereich von Fair (Mittelmig) liegt.

  • 54

    Kapitel 9

    E Doppelklicken Sie auf die Ausgabe der Cluster-Modellanzeige, um die Modellanzeige zuaktivieren.

    Abbildung 9-4Aktivierte Cluster-Modellanzeige

    E Whlen Sie Cluster aus der Dro