15
Universit¨ at Konstanz Fachbereich Informatik & Informationswissenschaft Seminar Business Intelligence Wintersemester 06/07 Business Applications of Data Mining Seminararbeit Christian Rohrdantz Matrikelnummer: 554861

Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

Embed Size (px)

Citation preview

Page 1: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

Universitat Konstanz

Fachbereich Informatik

& Informationswissenschaft

Seminar Business Intelligence

Wintersemester 06/07

Business Applicationsof Data Mining

Seminararbeit

Christian Rohrdantz

Matrikelnummer: 554861

Page 2: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

Inhaltsverzeichnis

1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.1 Was ist Data Mining . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2 Methoden und Werkzeuge des Data Mining . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Business Intelligence und Data Mining . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42.1 Data Mining vs. KDD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42.2 Data Mining in der Business Intelligence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.3 Herausforderungen an Data Mining . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3 Different Business Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63.1 Predictive Modeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63.2 Transaction Data & Predictive Profiling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93.3 Pre- und Postprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

4 Schlussfolgerung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Page 3: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

Business Applications of Data Mining 3

1 Einleitung

”We are data rich, but information poor“[1]

Dieses Zitat ist gut geeignet um die Notwendigkeit von Datenanalyse in der Unternehmenswelt deutlichzu machen. Die Datenakquise stellt heutzutage kein Problem mehr dar, wie auch Ganguly und Gupta [2]feststellen, ”Billions of business transactions are recorded in enterprise scale data warehouses every day“.Die Herausforderung besteht vielmehr in der Auswertung dieser Unmengen von Daten, um so sinnvollereEntscheidungen treffen zu konnen: ”important decisions are often made based not on the information-richdata stored in data repositories, but rather on a decision makers intuition, simply because the decisionmaker does not have the tools to extract the valuable knowledge embedded in the vast amounts of data“[1]Mit der Bereitstellung und Anwendung solcher Tools beschaftigt sich das Feld des Data Mining.Die vorliegende Arbeit soll beleuchten, vor welchem Hintergrund und mit welchen Zielen verschiedeneBestandteile des Data Mining in der Geschaftswelt eingesetzt werden. Dazu wird zuerst ein Versuch zurformalen Einordnung des Data Mining in den Zusammenhang der Business Intelligence vorgenommen.Danach werden zahlreiche Beispiele aus der Praxis vorgestellt und erlautert.Zunachst einmal gilt es aber einige grundsatzliche Begrifflichkeiten zu klaren.

1.1 Was ist Data Mining

Laut Han und Kamber [1] kann der Ausdruck ”Data Mining“ oftmals auch alternativ umschrieben werdenals ”knowledge mining from data“, ”knowledge extraction“, ”data/pattern analysis“, ”data archaeology“oder ”data dredging“. Eine geeignete Erlauterung von Data Mining Technologien bietet diese rechte all-gemein gehaltene Definition:

Data Mining Technologies (generally speaking):All types of data-dictated analytical tools and technologies that can detect generic and interesting pat-terns, scale (or can be made to scale) to large data volumes and help in automated knowledge discoveryand prediction tasks [2]

Hervorzuheben sind dabei folgende Schlagworte:

”data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um siespater auszuwerten. Vielmehr nimmt das Data Mining die zu analysierenden Daten als gegeben hin. Esbesteht kein Einfluss darauf in welcher Art, welchem Umfang und welchem Format die Daten anfallen.

”detect generic and interesting patterns“ - Das Ziel des Data Mining ist es zusatzliche Erkenntnissezu gewinnen, die nicht offensichtlich waren (”detect“), die im Bezug auf das vorliegende Aufgabenfeld in-teressant sind (”interesting“) und die eine gewisse Allgemeingultigkeit besitzen bzw. sich verallgemeinernlassen (”generic“).

”scale to large volumes“ - Dieser Punkt lasst wiederum eine Abgrenzung zum Feld der Statistik zu.Wahrend dort reprasentative Stichproben ausgewertet werden, verarbeitet Data Mining alle angefallenenDaten. Diese konnen sowohl hochdimensional als auch von der Anzahl her umfangreich sein.

”automated knowledge discovery“ - Das in den Eingabedaten verborgene Wissen soll moglichst au-tomatisiert, d.h. ohne großere manuelle Interventionen, extrahiert werden.

”prediction tasks“ - Wissen soll nicht zum Selbstzweck gewonnen werden, sondern im Hinblick darauf,zukunftige Entwicklungen vorhersehen zu konnen.

Eine weitere Definition, die versucht Data Mining im Zusammenhang der Business Intelligence zu be-schreiben, lautet wie folgt:

Data Mining is a method of searching data with mathematical algorithms to identify trends and hid-den patterns, profile customers, and then predict how these trends or customers will behave in the future.[3]

Page 4: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

4 Business Applications of Data Mining

Diese Definition zeigt welche Art von Erkenntnissen sich ein Unternehmen vom Data Mining erhofft.Man ist bestrebt zukunftige Trends zu identifizieren und vor allem mehr uber die Kunden zu erfahren.Besonders interessant ist es, Vorhersagen daruber treffen zu konnen, wie sich Kunden in der Zukunftverhalten werden, um sich auf ihr Verhalten besser einstellen zu konnen.Außerdem verrat diese Definition, dass man im Speziellen an versteckten Mustern interessiert ist. Daslasst sich damit erklaren, dass in der Geschaftswelt nicht Wissen per se zahlt. Man ist vorwiegend daraninteressiert, Erkenntnisse zu gewinnen, die der Konkurrenz fehlen. Dies kann in vielen Geschaftsfeldernzu einem entscheidenden und geldwerten Vorteil werden, sofern dieses zusatzliche Wissen es einem Un-ternehmen erlaubt, eine bessere Geschaftsstrategie zu entwickeln als seine Kontrahenten.

1.2 Methoden und Werkzeuge des Data Mining

Um Wissen und Informationen in Daten zu entdecken und extrahieren, werden beim Data Mining ver-schiedene Formen der Analyse durchgefuhrt. Dazu zahlen unter anderem die Assoziationsanalyse, Korre-lationsanalyse, Regressionsanalyse, Clusteranalyse, Klassifikation und Predictive Modeling.Eine Vielzahl von Algorithmen finden dabei Anwendung (z.B. Clusteralgorithmen). Vor allem zur Klas-sifikation und Vorhersage (”Prediction“) werden teils sehr komplexe Datenstrukturen eingesetzt, wieNeuronale Netze, Entscheidungsbaume und Support Vector Machines.Eine nahere Beschreibung dieser Methoden und Werkzeuge findet sich in zahlreichen Literaturquellen,unter anderem auch bei Han und Kamber [1].

2 Business Intelligence und Data Mining

2.1 Data Mining vs. KDD

”Many people treat data mining as a synonym for another popularly used term, Knowledge Discoveryfrom Data, or KDD. Alternatively, other view data mining as simply an essential step in the process ofknowledge discovery“ [1].Wie man der Abbildung 1 entnehmen kann, gliedert sich der gesamte KDD Prozess in mehrere Teile auf:Selection, Preprocessing, Transformation, Data Mining und Interpretation/Evaluation. Mit Data Miningwird ausschließlich ein - wenn auch zentraler - Teilschritt des KDD Prozesses bezeichnet. Dieser ist abermit den anderen Schritten stark verwoben, vorallem mit der Datentransformation und der Darstellungder Ergebnisse. Im Weiteren werde ich mich mit dem Begriff ”Data Mining“ lediglich auf das Kernstuckdes KDD Prozesses beziehen und nicht auf den KDD Prozess als ganzem. Trotzdem ist zu beachten,dass Data Mining nicht ganzlich losgelost aus dem KDD Zusammenhang betrachtet werden kann und derBegriff daher immer auch moglicherweise notwendige Vor- und Nachverarbeitungsschritte impliziert.

Abbildung 1. KDD-Pipeline [4]

Page 5: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

Business Applications of Data Mining 5

2.2 Data Mining in der Business Intelligence

Business Intelligence (systematische Unternehmensanalyse) lasst sich in drei Phasen einteilen [5]:

1. Data Delivery: Datenerfassung in einem operativen System (OLTP) oder in einem Data-Warehouse.2. Discovery of relations, patterns and principles: Durch eine geeignete Kombination und Analyseder Daten versucht man (verborgene) Muster und Diskontinuitaten sichtbar zu machen. Diese konnendann mit evtl. vorher aufgestellten Hypothesen verglichen werden. Die notwendige Datenanalyse geschiehtvorwiegend durch Data Mining.3. Knowledge Sharing: Es erfolgt eine Verbreitung der Erkenntnisse im Unternehmen und man inte-griert sie in das Wissensmanagement. So will man Entscheidungstragern eine solide Grundlage fur ihreArbeit bieten.

Data Mining ist also in der Regel ein essentieller Bestandteil der Business Intelligence. Der Einsatz-bereich erstreckt sich dabei uber Finanzplanung, Risikoanalyse und Supply Chain Planning bis hin zuMarketing Angelegenheiten. Typische Ziele sind dabei die Identifizierung von Kundenprofilen und Trends,das Aufdecken von Betrug und generell naturlich das Vorhersagen zukunftiger Entwicklungen.

2.3 Herausforderungen an Data Mining

Data Mining und KDD werden in einer Vielzahl von verschiedenen Bereichen angewandt und jedes Feldbringt spezielle Anforderungen mit sich, auf die es sich einzustellen gilt. Das ist auch fur den Einsatz inder Business Intelligence so.Traditionell fuhrte in Unternehmen das Zusammenspiel von Expertenwissen und statistischen Modellie-rungstechniken zu maßgeschneiderten Losungen fur jeweilig anfallende Aufgaben. Diese Praxis befindetsich aber auf dem Ruckmarsch, da man so den neu aufkommenden Herausforderungen immer schwierigerHerr wird:

– Man kann sich uber eine steigende Verfugbarkeit von großvolumigen hochdimensionalen Daten freuen.Diese bestehen in der Regel aus Millionen von Zeilen und tausenden Spalten, was eine effizienteVerarbeitung schwierig werden lasst.

– Eine große Automatisierbarkeit der Auswertung ist bei den heute anfallenden Datenmengen unver-zichtbar.

– Die Darstellung der Analyseergebnisse ist am Endnutzer auszurichten. Nicht nur Data Mining Ex-perten sollten damit etwas anfangen konnen. Vielmehr ist es wunschenswert, dass die gewonnenenErkenntnisse fur einen bestimmten durchschnittlichen Anwender verstandlich und hilfreich sind.

– KDD Techniken haben bewiesen, dass sie ”Experten-intensive“ Analysetechniken unterstutzen undmanchmal auch ersetzen konnen. So konnen teure Arbeitsplatze eingespart werden. Als Konsequenzdavon kann Data Mining in großerem Umfang auch dort eingesetzt werden, wo man sich solche teurenArbeitskrafte nicht leisten kann.

Im Rahmen der Business Intelligence erhofft man sich, durch den Einsatz von Data Mining Technikenmessbare Mehrwerte zu erzielen. Dabei geht es meist darum den Profit zu erhohen, die Kosten zu senkenoder die Servicequalitat zu verbessern. Im Folgenden seien einige Branchen aufgelistet, in denen derEinsatz von Data Mining eine Schlusselrolle spielt:

– Versicherungen: Zu hohe Tarife fur Versicherte mit geringem Schadensrisiko sorgen fur eine massiveAbwanderung dieser Klientel zu Konkurrenten und damit zu einem Einbruch der Beitragseinnahmen.Zu niedrige Tarife fur Versicherte mit hohem Schadensrisiko sorgen fur einen starken Zustrom dieserKunden, welche dann mehr Kosten verursachen als ihr Beitrag abdeckt. Data Mining hilft bei der Er-stellung von Tarifsystemen bzw. Feinjustierung dieser. Das geschieht in der Regel durch eine Analysevon Schadensfallen aus der Vergangenheit.

Page 6: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

6 Business Applications of Data Mining

– Direkt-Post Marketing: Beim Direkt-Post Marketing wird Werbung gezielt an (potentielle) Kun-den verschickt. Dabei mochte man naturlich nur demjenigen Werbung zukommen lassen, der daraufauch durch einen Erwerb reagiert. Da sich dies nur vermuten lasst, gilt es - basierend auf Datenaus der Vergangenheit - fur jeden Kunden vorherzusagen, welchen Gewinn er mit welcher erwartetenWahrscheinlichkeit generieren wird. Schließlich versucht man seine Briefempfanger so auszuwahlen,dass der erwartete Gewinn abzuglich der Arbeits-, Druck- und Versandkosten maximiert wird.

– Telekommunikation: In der Telekommunikation wird Data Mining unter anderem zur Erstellungvon Tarifsystemen verwendet. Der Spagat besteht dabei darin, Kunden durch fur sie attraktiv wir-kende Tarife anzulocken und sie dabei trotzdem zu moglichst hohen Ausgaben zu verleiten.

– Einzelhandel: Eine klassische Data Mining Anwendung ist hier die sog. Warenkorbanalyse, beider man erkundet, welche Artikel haufig zusammen erworben werden. Mit dem daraus gewonnenenWissen versucht man, mit dem Ziel einer Umsatzsteigerung, das Angebot noch gezielter auf dieKunden abzustimmen.

– Gesundheitsversorgung: Man analysiert Patientendaten aus der Vergangheit, um Vorhersagenuber die Erfolgsaussichten von bestimmten Therapien und den Verlauf von Krankheiten treffen zukonnen.

Abgesehen vom letzten Beispiel, wo es in erster Linie um das Wohl von Patienten geht, versucht mandurch Data Mining in der freien Wirtschaft, seinen Gewinn zu erhohen. Den aufgezeigten Branchen sindgewisse Charakteristika gemeinsam: Es fallen automatisiert und ohne großen Aufwand betrachtliche Men-gen an Daten an. Ein Unternehmen in einer dieser Branchen ist stark kundenorientiert und einem großenKonkurrenzdruck ausgesetzt. Je besser es seine Kunden kennt und deren Verhalten vorhersagen kann,desto großer ist der Vorteil, den es sich gegenuber seinen Mitbewerbern verschaffen kann. Der Unterneh-mensgewinn hangt daher unmittelbar von der Gute der Data Mining Erkenntnisse ab.Im Umkehrschluss konnte man nun einen Wert fur ein Data Mining Werkzeug angeben. Es ist genau soviel Wert, wie es bei einem Unternehmen an zusatzlichem Gewinn verursacht.Fur Unternehmen vieler Branchen ist Data Mining keine Option, sondern ein unverzichtbarer Bausteinzur Festlegung der Geschaftsstrategien.

3 Different Business Applications

Um eine nahere Vorstellung davon zu vermitteln, wie Data Mining und KDD in Unternehmen konkreteingesetzt werden, wird im Weiteren auf einige Anwendungen genauer eingegangen. Die Beispiele folgender Zusammenstellung von Apte et al. [6]

3.1 Predictive Modeling

Beim Predictive Modeling geht es in der Praxis vorallem darum, Vorhersagemodelle (Predictive Models)fur Kundensegmente zu erstellen. Dazu werden so viele Informationen wie moglich uber die Kundengesammelt. Als Informationsquellen dienen dazu die Kundenhistorie und von externen Datenprovidernzugekaufte Daten, welche dann in Data Warehouses gespeichert werden. Da man keine Vorhersagen furjeden einzelnen Kunden generieren kann, muss man die Kunden in Segmente eingeteilt zusammenfassen.Die Einteilung sollte dabei so erfolgen, dass man von den Mitgliedern eines Segments (im Bezug aufdie Anwendungsdomane) ahnliches Verhalten erwarten kann. Fur jedes Segment wird dann ein separatesPredictive Model erstellt, wobei die jeweiligen Vorhersagen naturlich stark von der vorherigen Segmen-tierung abhangen. Gute Ergebnisse erhalt man nur durch ein Trial-and-Error Vorgehen mit variierendenSegmentierungen. Die Qualitat einer Segmentierung lasst sich erst an den darauf basierenden Vorhersa-gen messen. Das geschieht beispielsweise indem man die vorliegenden Daten in zwei disjunkte Mengeneinteilt, die Trainingsdaten und die Testdaten. Segmentierung und Vorhersagemodelle werden mit denTrainingsdaten aufgebaut. Die Qualitat der Predictive Models wird anhand des Korrektheitsgrades derVorhersagen fur die Testdaten gemessen.

Page 7: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

Business Applications of Data Mining 7

Der sequentielle Ablauf dieser Trial-and-Error Vorgehensweise ist leider ineffizient. Um den Aufwandeines sequentiellen Vorgehens zu vermeiden, muss man die Segmentierung und Vorhersage simultandurchfuhren, so dass dabei die Gesamtvorhersage-Qualitat maximiert wird. Ein Tool in dem diese Ar-beitsweise implementiert ist, ist der IBM ProbE (Probabilistic Estimation data mining server). ProbEbedient sich eines Baum basierten Top-down Algorithmus, um die Segmentierung vorzunehmen. Um diePredictive Models zu generieren, stehen verschiedene gangige Verfahren bereit. Laut IBM ist der Pro-bE damit fahig, automatisiert qualitativ hochwertige Vorhersagemodelle aus großen, hochdimensionalenDatenbanken zu erstellen. Zudem ist er darauf ausgelegt, ohne großen Aufwand erweitert werden zukonnen. Verschiedene Typen von Predictive Modeling Algorithmen fur die Segmente, sowie verschiede-ne Arten von Segmentierungsalgorithmen, konnen einfach integriert werden. Im Folgenden werden zweiKundenanwendungen vorgestellt, die auf ProbE aufbauend entwickelt wurden.

Advanced Targeted Marketing for Single Events: IBM ATM-SE (Advanced Targeted Marketingfor Single Events) ist eine auf IBM ProbE aufbauende Anwendung, die gemeinsam mit der Business Intel-ligence Abteilung von Fingerhut entwickelt wurde, einem großen US Katalog und Internet Einzelhandler.Das Ziel dahinter lautete: ”constructing customer-profitability and response-likelihood models for targe-ted marketing in the retail industry“ [6] [7]. Kunden wurden dabei in verschiedene Segmente eingeteilt.Die Mitglieder eines Segments sollten sich im Bezug auf die von ihnen erwartete Antwortwahrscheinlich-keit und Profitgenerierung (bei Marketingaktionen) ahnlich sein. Diese beiden Kennzahlen wollte mandann fur jedes Segment einzeln abschatzen.Die Einteilung in Segmente wurde durch eine Kombination von Linearer Regression und Naive BayesBaumen vorgenommen. Das erste fur kontinuierliche, das zweite fur kategorische Antwortvariabeln. De-tails dazu finden sich in Natarajan et al. [8]. Wie Abbildung 2 zu entnehmen ist, wurden so vier SegmentModell Typen erstellt, deren Output den erwarteten Gewinn, die Anwortwahrscheinlichkeit und eine Kom-bination daraus beschreibt. Wie der Baum zur Segmenteinteilung dabei aussieht, kann man beispielhaftfur Model A, in der Abbildung 3 sehen.

Abbildung 2. The segment model types and the model outputs of the four models constructed by Fingerhut BIusing the ATM-SE solution. [7]

Die Evaluation, der durch den ATM-SE Ansatz erstellten Vorhersagen, ergab, dass sie im Ergebnisimmer entweder gleich oder leicht besser waren, als jene von Fingerhuts eigenen Modellen. Das ist vondaher signifikant, als dass es bisher zahlreichen anderen Ansatzen nicht gelungen war, Fingerhuts interneModelle zu ubertreffen. Aus der festgestellten leichten Verbesserung durch ATM-SE, ergab sich eine hoch-gerechnete jahrliche Gewinnsteigerung von etwa einer Million US-Dollar. Eine prozentuale Verbesserungwird dabei nicht angegeben, vermutlich wird sie in einem sehr niedrigen Bereich liegen. Die absolutenZahlen sprechen jedoch fur sich und entscheiden letztlich uber den (Mehr-)Wert des Data Mining Tools.Der Einsatz hat sich daher gelohnt, vor allem in Anbetracht dessen, dass die Auswertung automatisiertvonstatten ging.

Underwriting Profitability Analysis: IBM UPA (Underwriting Profitability Analysis) ist eine wei-tere Anwendung, die auf IBM ProbE aufbaut. Sie wurde gemeinsam mit der Farmers Insurance Groupentwickelt, einer großen Auto und Haus Versicherungsgesellschaft aus den USA. Das konkrete Ziel der

Page 8: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

8 Business Applications of Data Mining

Abbildung 3. The decision tree that defines the population segments of ATM-SE Model A. [7]

Anwendung lautete: ”discovering homogeneous insurance risk groups“ [6] [9] [10]. Dazu war eine Seg-mentierung der Versicherten in homogene Risikogruppen notwendig, welche sich durch die Frequenz undHohe von Schadensfallen unterschieden. Danach wurde ein Algorithmus mit Versicherungsdaten aus derVergangenheit (von einem US-Staat) gefuttert, um daraus ”Regeln“ fur die identifizierten Segmente zuerstellen. In Abbildung 5 sieht man ein Beispiel fur solch eine generierte Regel. Dabei geht es um einFahrzeugsegment, dass sich dadurch charakterisiert, dass der Vehikeltyp ”Truck“ ist und uber eine ArtABS-System (”Antilock Brake“) verfugt. Fur dieses Segment wurden dann eine durchschnittliche Scha-densforderungsrate, eine durchschnittliche Schadenshohe etc. angegeben. Die Anzahl der durch die Regelbeschriebenen Trainingsfalle ist ein gutes Maß fur die Verlasslichkeit einer Regel. Da man im Beispiel abereine Vielzahl von Regeln erhalten hatte, galt es die interessanten bzw. wertvollen Regeln herauszufiltern.Dazu wurde ein Maß fur die Abweichung der Regel im Bezug auf vorher erstellte Hintergrundstatistiken(siehe Abbildung 4) definiert. Die sogenannte ”Loss Ratio“ misst dabei, ob das Verhaltnis, von eingenom-menen Versicherungspramien zu ausgezahlten Schadensleistungen eines Segments, stark vom Durchschnittabweicht. Auf diese Weise konnten unter den Regeln 43 ”Nuggets“ ausgemacht werden, womit vormalsunbekannte Regeln, mit einem signifikanten potentiellen Wert, bezeichnet werden. Ein Beispiel fur einidentifiziertes Nugget: Es war bekannt, dass Fahrer von schnellen Sportwagen eine erhohte Unfallwahr-scheinlichkeit haben. Neu herausgefunden wurde jedoch, dass wenn der Sportwagen nicht das einzige Autoin einem Haushalt war, die Unfallrate dafur nicht hoher war als bei ”normalen“ Autos. Diese Erkenntniskonnte man z.B. zum Anlass nehmen, einen neuen Versicherungstarif zu entwerfen, bei dem ein Haushalteinen Sportwagen relativ gunstig mitversichern kann, sofern er schon ein normales Auto versichert hat.So ließen sich der Konkurrenz Kunden abjagen und damit zusatzlicher Gewinn abschopfen. Sechs der 43Nuggets wurden daraufhin zu einer Mehrwertanalyse ausgewahlt. Durch Berucksichtigung dieser wurdeallein im ersten Jahr, fur nur einen US-Staat, ein Netto-Profitzuwachs von mehreren Millionen US-Dollarprognostiziert. Der ernorme Wert guter Data Mining Methoden wird also auch hier deutlich.

Resumee zu ProbE: Die segmentierungsbasierte Herangehensweise von ProbE ist geeignet, um daraufaufbauend Anwendungen fur spezifische Probleme zu entwerfen. Es lassen sich damit vollautomatischhochwertige und konsistente Modelle mit messbarem praktischen Nutzen erstellen. Diese Eigenschaften

Page 9: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

Business Applications of Data Mining 9

Abbildung 4. Background Statisticsfor a Data Mining Run [9]

Abbildung 5. Example: UPA generated rule [9]

lassen Data Mining auch fur Unternehmen mittlerer Große attraktiv werden. Vorallem die zunehmendeAutomatisierung, ohne dass dabei kostspielige Anpassungen der Modelle oder Data Mining Parameterdurch Experten notwendig sind, ist ein klarer Vorteil. Dadurch wird der Einsatz gunstiger und auch furUnternehmen lohnenswert, in denen eine geringe prozentuale Verbesserung noch keine absolute Steigerungim Millionenbereich ausmacht.

3.2 Transaction Data & Predictive Profiling

Bei Predictive Profiling handelt es sich um eine Beschreibung individuellen Kundenverhaltens, dass aufder Auswertung von sogenannten Transaction Data basiert. Solche Daten fallen z.B. im Einzelhandel undim E-Commerce an.

Transaction Data: Um Vorhersagemodelle erstellen zu konnen, braucht man geeignete Features, At-tribute oder Variablen, mit einer hohen Aussagekraft, als Modell Input. Datenbanken enthalten zwar oftgenugend Information, diese ist aber nicht immer in einer Form gespeichert, die man direkt als ModellInput verwenden kann. In solchen Fallen mussen die Daten transformiert werden, damit man spater akku-rate Modelle erhalt. Fur Transaktionsdaten ist eine solche Datentransformation typischerweise notwendig,danach jedoch eignen sie sich sehr gut zum Data Mining. Allgemein bezeichnet der Ausdruck TransactionData ”records of pairs of individuals and events“ [6]. Ein Beispiel fur Transaktionsdaten ist die Mengeeinzelner Artikel, die von einem Kunden erworben wurde und in einem sog. Warenkorb gruppiert ist. DieMenge von einzelnen Webseiten einer Webprasenz, die von einem bestimmten Surfer abgerufen wurde,gruppiert nach Session, ist ein weiteres Beispiel dafur. Die Fahigkeit von Firmen weltweit, große Mengenan Transaktionsdaten zu sammeln, ubersteigt bei weitem ihre Fahigkeit, diese auch auszuwerten. EinBeispiel fur Transaktionsdaten wird in Abbildung 6 gezeigt. Hier lasst sich leicht erkennen, warum dieseDaten hohe Anforderungen an die Verarbeitung stellen. Zum einen handelt es sich dabei stets um großeDatenmengen, große Einzelhandelsketten produzieren Millionen von Transaktionen taglich. Zum anderenhandelt es sich um sog. ”Sparse Data“, also sehr luckenhafte Daten. Ein typischer Warenkorb enthalt nureinen kleinen Bruchteil der moglichen Artikel. Zudem sind die Daten sehr heterogen, da Einkaufsverhaltenstark von individuellen Bedurfnissen, Einstellungen und Geschmackern gepragt und dementsprechend va-riabel ist. All diese Eigenschaften stellen traditionelle Datenanalysetechniken vor Probleme. Es gibt zwareffiziente Algorithmen fur die Ermittlung von Assoziationsregeln und Korrelationen zwischen Arktikeln,diese sind aber weniger geeignet um individuelles Kundenverhalten vorherzusagen.

Predictive Profiling: Predictive Profiling ist ein vor kurzem entwickeltes Framework zur Behandlungvon Transaction Data im Predictive Modeling. Im Einzelhandel dient es dazu, das zukunftige Einkaufs-verhalten eines individuellen Kundens vorherzusagen. Als Grundlage dafur dienen die Einkaufshistoriedes Kunden, sowie die Einkaufshistorie einer großeren Population (z.B. allen anderen Kunden des Un-ternehmens). In Abbildung 7 sieht man ein Beispiel fur einen, zu einem Kunden gehorigen, Warenkorb.

Page 10: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

10 Business Applications of Data Mining

Abbildung 6. Beispiel fur Transaktionen mehrerer Individuen. Die Zeilen entsprechen Warenkorben, die Spaltenbestimmten Artikeln. Die kleinen horizontalen Balken stehen fur das Vorkommen eines Artikels in einem Waren-korb. Je dunkler die Pixel sind, desto mehr Artikel wurden erworben, wobei Weiß fur 0 steht. Die durchgezogenenwaagerechten grauen Linien beschreiben keine Transaktionen, sondern dienen dazu, die Daten eines Individuums,von denen des nachsten Individuums abzugrenzen. Es sind die Warenkorbe von funf verschiedenen Indidividuenabgebildet. [11]

Dabei handelt es sich um einen d-dimensionalen Vektor (hier: d=50), bei dem jede Stelle einem Artikelentspricht. An dieser ist dann jeweils die Anzahl der davon erworbenen Stucke eingetragen.

Abbildung 7. Transaktionsdaten eines Individuums. [11]

Aus den Warenkorben aller Kunden, lasst sich dann eine hochdimensionale gemeinsame Verteilung(”joint distribution“) errechnen. Diese kann man wiederum mittels einer Expectation Maximization Me-thode durch k einfachere Modelle approximieren. Details dazu wie die Modelle aus den Daten gelernt wer-den, finden sich in Cadez et al. [11]. Jedes dieser k Modelle entspricht dann einer Prototyp-Kombinationvon Produkten in Warenkorben. Die Prototypen fur das aktuelle Beispiel finden sich in Abbildung 8.

Das Einkaufsverhalten eines jeden Kunden, dass zuvor durch einen Punkt in einem d-dimensionalen(hier: d=50) (Produkt)Raum beschrieben wurde, lasst sich nun durch die k Prototypen reprasentieren.Dazu werden die Daten transformiert und in den Prototypraum gemappt. Das Einkaufsverhalten einesKunden wird dabei nicht mehr exakt wiedergegeben, sondern durch die Prototypen etwas verallgemeinert.D.h. es entspricht nun einem Punkt (Vektor) in einem k-dimensionalen (hier: k=6) Raum. Jeder Eintrag

Page 11: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

Business Applications of Data Mining 11

Abbildung 8. Beispiel fur k=6 Prototypen. [11]

in diesem k-dimensionalen Vektor entspricht einem Prototypen und stellt ein ”Gewicht“ α dar. DasGewicht αik reprasentiert die Wahrscheinlichkeit, dass wenn ein Individuum i einen Laden betritt, seineTransaktionen von Komponente k generiert werden. In anderen Worten: Die Neigung des Individuumsi in ”shopping behaviour“ k zu verfallen. Die Gewichte aus dem Vektor eines Individuums sollen dabeiaufsummiert immer 1 ergeben. Der Vektor V der das Individuum mit der Verhaltensweise aus Abbildung7, in den Prototypraum aus Abbildung 8 mappt, lautet:V = (0.00, 0.47, 0.38, 0.00, 0.00, 0.15) [11]

So gelingt es, nicht alle Details individuellen Kundenverhaltens zu erfassen, sondern sich auf nutzliche

”first-order“ Charakteristika zu konzentrieren. Die wesentlichen Probleme der Transaktiondaten bekommtman damit in den Griff. Die Datenmenge verringert sich durch die Dimensionsreduktion (von d auf kDimensionen), wodurch gleichzeitig noch das Problem der Luckenhaftigkeit der Vektoren gelost wird. DiePrototypen bieten zudem eine interpretierbare Beschreibung der Heterogenitat des Kundenverhaltens,was eine explorative Visualisierung der Daten unterstutzen kann. Einen konzeptuellen Entwurf fur eineVisualisierung von Predictive Profiling Daten zeigt Abbildung 10. Einige grundsatzliche Zusammenhangelassen sich dort auf einen Blick einfach wahrnehmen: Anzahl, Ahnlichkeit, Haufigkeit und Charakteristikvon Prototypen.

Der Ansatz des Predictive Profiling wurde von der University of California getestet. Dazu wahlteman zwei Sets von Realwelt-Transaktionsdaten, die uber mehrere Jahre hinweg gesammelt wurden. Diesesetzten sich aus mehreren Millionen Warenkorben von ca. 500 000 Kunden zusammen. Mit Daten ausden fruhen Jahren wurden die Prototypen erstellt und mit Daten aus spateren Jahren dann getestet. DieAnzahl k der Prototypen wurde in mehreren Durchlaufen zwischen 20 und 100 gewahlt.Als Ergebnis wurde dem Predictive Modeling eine systematische Verbesserung der ”out-of-sample“ Vor-hersageperformanz gegenuber Standard-Alternativen bescheinigt. Die benotigte Rechenzeit verhielt sichdabei linear zur Anzahl von Warenkorben und Prototypen. Diese beiden Eigenschaften legen den Einsatz

Page 12: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

12 Business Applications of Data Mining

Abbildung 9. Hier sieht man k=20 Prototypen die mittels multidimensionalem Scaling in einen 2D Raum ge-mappt wurden. Die Prototyp-Warenkorbe wurden aus einer Menge von etwa 6 Millionen Warenkorben erstellt,die bei einer Drogeriekette in Japan erfasst wurden. Jeder abgebildete Kreis, entspricht einem der 20 Prototy-pen, die Zahl im Kreis ist die ID des entsprechenden Prototyps. Je naher zwei Prototypen raumlich beieinanderliegen, desto ahnlicher sind sie sich. Die absolute Positionierung und damit auch die Dimensionen im Schaubildsind allerdings nicht interpretierbar. Der Flacheninhalt eines Kreises beschreibt die Wahrscheinlichkeit mit derein zufallig ausgewahlter Warenkorb zu diesem Prototyp gehort. Bei einigen Prototypen sind exemplarisch auchnoch die Namen der Artikel mit dem großten

”lift“ vermerkt. Den

”lift“ eines Artikels in einem Prototypen erhalt

man, indem man die Wahrscheinlichkeit, dass der Artikel im Prototypen vorkommt, durch die Wahrscheinlichkeitteilt, dass der Artikel uberhaupt vorkommt. So haben nicht diejenigen Artikel einen hohen

”lift“, die insgesamt

oft gekauft wurden, sondern jene, deren relative Haufigkeit in einem Prototypen auffallig ist. Die drei Artikel mitdem großten lift, dienen gewissermaßen als Beschreibung/Label eines Prototypen.[6]

in Realtime-Anwendungen wie beispielsweise E-Commerce nahe. Der Test bescheinigte der Methode einenbedeutenden potentiellen okonomischen Nutzen, Details dazu waren aber leider nirgends verfugbar.

3.3 Pre- und Postprocessing

Wie die KDD-Pipeline in Abbildung 1 zeigt, ist Data Mining nicht losgelost von einer Vor- und Nachverar-beitung der Daten moglich. Das sogenannte Pre- und Postprocessing sind kritische Schritte innerhalb desKDD-Prozesses und wesentlich wenn es darum geht, die Effektivitat von real-life Data Mining Anwendun-gen zu bestimmen. Dies lasst sich an einem Beispiel aus der Gesundheitsversorgung, einer großangelegtenDiabetes Studie in Singapur [6] [12] [13], verdeutlichen.

Singapur Diabetes Beispiel: Im Jahre 1990 litten 10% der Bevolkerung von Singapur an Diabetes.Dabei handelt es sich um eine Krankheit mit vielen Nebenwirkungen, wie einem erhohten Risiko fur Auge-nerkrankungen, Nierenschaden und anderen Komplikationen. Dies ist nicht nur außerst unangenehm furdie Patienten, sondern auch sehr kostspielig fur ein Gesundheitssystem. Durch eine Fruherkennung undeine angemessene Behandlung konnen jedoch viele Nebenwirkungen vermieden werden. Deshalb hat die

Page 13: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

Business Applications of Data Mining 13

Singapurische Regierung 1992 in allen offentlichen Krankenhausern ein Screening-Programm eingefuhrt.Nach 10 Jahren hatte sich dadurch eine Fulle wertvoller Daten angestaut, die sich sehr dazu anboten, siemit Data Mining Techniken nach interessanten Erkenntnissen zu durchsuchen. Man wollte ein besseresVerstandnis davon entwickeln, wie Diabetes mit der Zeit fortschreitet und wie verschiedene Behandlungendieses Fortschreiten beeinflussen.Die Datenanalyse gestaltete sich schwieriger als gedacht, da die Datenbanken viele fehlerhafte Eintrageenthielten. Dabei handelte es sich um Tippfehler, fehlende Werte, inkorrekte Informationen und es tratenzahlreiche Duplikate auf. Es galt verschiedene Datenbanken aus unterschiedlichen Kliniken zu integrie-ren, die oftmals abweichende Attributnamen fur identische Attribute aufwiesen. Da die Abgleichung derAttribute medizinisches Sachverstandnis erforderte, entwickelte die National University of Singapur einsemi-automatisches data cleaning tool. Dieses wurde dann Arzten zur Verfugung gestellt, um damit Un-terschiede in den Datenbankformaten zu bereiningen.

Nachdem der Data Mining Schritt durchgefuhrt worden war, fuhlten sich die Arzte mit der großen Mengegenerierter Regeln uberfordert. Sie hatten sich praktische Hinweise erhofft, die ihre Arbeit unterstutzenkonnten. Stattdessen wurde ihnen eine unuberschaubare Vielzahl von Regeln prasentiert, die teilweise infur sie nicht verstandlicher Form dargelegt wurden.Daraufhin entwickelte wiederum ein Team von der National University of Singapur einen nutzerorien-tierten Ansatz zur Schritt-fur-Schritt Exploration der Daten und der entdeckten Muster. Abbildung 11zeigt einen Screenshot. Dieses Tool sollte den Arzten helfen einen ersten allgemeinen Uberblick uber dieResultate zu erhalten.

Abbildung 10. Screenshot: Tool fur Schritt-fur-Schritt Exploration der Daten [12].

Um die große Menge an Regeln zu reduzieren, wurde eine Pruning-Methode entwickelt, die insigni-fikante Regeln herauskurzt. Die endgultigen Regeln wurden dann in ”general rules“ und ”exceptions“eingeteilt. Die Vorgehensweise bei der Einteilung wird in Abbildung 12 erlautert.

Wie sich gezeigt hat, war die Einteilung der Erkenntnisse in generelle Regeln und Ausnahmen sehrnutzlich fur die Arzte. Viele generelle Regeln und kausale Beziehungen bestatigten ihre Erfahrungen inder Praxis und bestarkten sie somit in ihrem bisherigen Vorgehen. Viele Ausnahmen waren ihnen aber

Page 14: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

14 Business Applications of Data Mining

Abbildung 11. Der Entscheidungsbaum dient zur Einteilung der Daten in allgemeine Regeln und Ausnahmen: Eswird dargestellt wie die Auspragungen zweier Attribute Einfluss auf eine, in diesem Fall binare, Klasseneinteilunghaben. Die Attribute heißen A1 und A2. Sie entsprechen im linken Teil (A) den Achsen des Diagramms undim rechten Teil (B) den Knoten des Baums. Die zwei Klassen werden durch den weißen Kreis und das schwarzeRechteck gezeigt. In (A) und (B) wird auf zwei verschiedene Arten der gleiche Sachverhalt dargestellt, namlichwie sich durch eine Analyse der Attributauspragungen die zugehorige Klasse eines Objekts bestimmen lasst.Dabei lassen sich einfach globale Gesetzmaßigkeiten erkennen, in (A) durch große Rechteckseinteilungen und in(B) durch weit oben im Baum befindliche Knoten. Eine solche allgemeine Regel ware etwa: wenn A1 < 4, danngehort das Objekt zu Klasse

”schwarzes Rechteck“, wenn A1 > 4, dann zu Klasse

”weißer Kreis“. Ausnahmen

entsprechen dann lokalen Abweichungen von diesen globalen Regeln. Ein Ausnahme von der genannten Regelware beispielsweise: wenn A1 > 7 und A2 < 2.5, dann gehort ein Objekt zur Klasse

”schwarzes Rechteck“. So

lasst sich auch noch eine Ausnahme zur Ausnahme ausfindig machen: wenn A1 > 8.5 und 1.8 < A2 2.5, danngehort ein Objekt zur Klasse

”weißer Kreis“ [13]

neu und kamen teilweise uberraschend. Somit war es fur ihre Arbeit besonders wertvoll, Kenntnis vonAusnahmen zu erlangen. Diese konnten in der Praxis schwer ausgemacht werden, da sie bei jedem Arztin zu geringer Zahl auftraten, in der globalen Analyse wurden sie dann aber klar ersichtlich.

4 Schlussfolgerung

Die Entwicklung geht in zunehmendem Maße dahin, dass in Unternehmen immer großere Datenmen-gen anfallen. Diese konnen automatisch und kostengunstig erfasst werden, oftmals als Nebeneffekt desoperativen Geschafts. Die Herausforderung besteht darin, diese Daten zu einem Mehrwert fur das Un-ternehmen werden zu lassen, indem man sie gezielt auswertet. Eine solche Auswertung fallt dem Bereichder Business Intelligence zu und geschieht durch die Anwendung von Data Mining und KDD Techniken.Die vorgestellten Beispiele legen die Vermutung nahe, dass in der nahen Zukunft folgende Anforderungenverstarkt zu beachten sein werden:

– Automatisierung: Je mehr Teilschritte des KDD-Prozesses automatisiert werden konnen, desto kos-tengunstiger wird der Einsatz. Das kann dazu fuhren, dass Data Mining auch in Bereichen lohnens-wert wird, wo es bisher keine Anwendung findet, vor allem in kleineren und mittleren Betrieben. Dortwo eine vollstandige Automatisierung nicht moglich ist, sollten Tools zur effizienteren Bearbeitungbereitgestellt werden.

– Integration von Fachwissen: Das Data Mining sollte sich an klaren fachlichen Fragestellungen orien-tieren und diese moglichst berucksichtigen. Endnutzer verlangen anwendbare Erkenntnisse.

– Automatische Gutekriterien: In der Praxis will man keine unuberschaubar große Menge an Erkennt-nissen, sondern wenige, dafur aber pregnante und verstandliche, Hinweise auf Verbesserungspoten-

Page 15: Business Applications of Data Mining · data-dictated“ - Im Gegensatz zur Statistik erhebt man im Allgemeinen nicht gezielt Daten, um sie sp¨ater auszuwerten. Vielmehr nimmt das

Business Applications of Data Mining 15

tiale. Dafur ware es wunschenswert, dass ein System eine automatische und verlassliche Evaluationund Vorauswahl durchfuhren kann, um so den Arbeitsaufwand im Postprocessing zu verringern.

– Fokussierung auf Ausnahmen: In vielen Bereichen sind allgemeine Regeln bekannt und man ist mehran Ausnahmen zu diesen interessiert. Das lasst sich sowohl an dem Segment der Sportwagen mitniedrigen Unfallrisiko, also auch dem Diabetesbeispiel erkennen.

Literatur

[1] Jiawei Han, Micheline Kamber: Data Mining, Concepts and Techniques (Second Edition). The MorganKaufmann Series in Data Management Systems.

[2] Auroop R Ganguly, Amar Gupta: Data Mining Technologies and Decision Support Systems for Businessand Scientific Applications. Encyclopedia of Data Warehousing and Mining.

[3] Business Intelligence Knowledge Base (Professional IT Community). Business Intelligence Topics.http://businessintelligence.ittoolbox.com/topics/t.asp?t=312&p=312&h1=312

[4] Fayyad, Piatetsky-Shapiro, Smyth 1996: The kdd process for extracting useful knowledge from volumesof data. Commumications of the ACM 39(11).

[5] Wikipedia, die freie Enzyklopadie: Eintrag zu Business Intelligence.http://de.wikipedia.org/wiki/Business_Intelligence.

[6] Apte C., Liu B., Pednault E., Smyth P.: Business Applications of Data Mining. Communications of theacm, August 2002/Vol. 45, No.8, p. 49-53

[7] Apte C., Bibelnieks E., Natarajan R., Pednault E., Tipu F., Campbell D., Nelson B.: Segmentation-BasedModeling for Advanced Targeted Marketing. IBM Research Report RC 21982 (98791) 8 March 2001.

[8] Natarajan R., Pednault E.: Segmented Regression Estimators for Massive Data Sets. IBM Research.[9] Apte C., Grossman E., Pednault E., Rosen B., Tipu F., White B.: Insurance Risk Modeling Using Data

Mining Technology. IBM Research Report RC 21314 (94531) 31MAR98.[10] Apte C., Grossman E., Pednault E., Rosen B., Tipu F., White B.: Probabilistic Estimation Based Data

Mining for Discovering Insurance Risks. IBM Research Report RC-21483 September 13, 1999.[11] Cadez I., Smyth P., Mannila H.: Probabilistic modeling of transaction data with applications to profi-

ling, visualization and prediction. In Proceedings of the 7th ACM SIGKDD International Conference onKnowledge Discovery and Data Mining (KDD-2001) (San Francisco, Aug. 26-29). ACM Press, New York,2001, 37-46.

[12] Hsu W., Lee M., Liu B., Ling T.: Exploration mining in diabetic patient databases: Findings and conclu-sions. In Proceedings of the 6th ACM SIGKDD International Conference on Knowledge Discovery andData Mining (KDD-2000) (Boston, Aug. 20-23). ACM Press, New York, 2000, 430-436.

[13] Liu B., Hu M., Hsu W.: Multi-Level Organization and Summarization of the Discovered Rules. SIGKDDInternational Conference on Knowledge Discovery and Data Mining (KDD-2000) (Boston, Aug. 20-23).