50
Web Mining Web Mining Kundenpotentiale nutzen… Kundenpotentiale nutzen… Marko Lepage

Web Mining Kundenpotentiale nutzen… Marko Lepage

Embed Size (px)

Citation preview

Page 1: Web Mining Kundenpotentiale nutzen… Marko Lepage

Web MiningWeb Mining

Kundenpotentiale nutzen…Kundenpotentiale nutzen…

Marko Lepage

Page 2: Web Mining Kundenpotentiale nutzen… Marko Lepage

Web Mining im E – CRMWeb Mining im E – CRMBetreiber von Online – Angeboten besitzen eine Betreiber von Online – Angeboten besitzen eine umfangreiche Datenbasis, die Informationen über umfangreiche Datenbasis, die Informationen über

Verhaltensmuster und Interessen der Online Verhaltensmuster und Interessen der Online Kunden liefern kann.Kunden liefern kann.

diese Informationen beinhalten ein gewaltiges diese Informationen beinhalten ein gewaltiges Potential zur Anpassung des Internetauftrittes an Potential zur Anpassung des Internetauftrittes an individuelle Kundenbedürfnisse und damit zur individuelle Kundenbedürfnisse und damit zur Umsetzung eines individualisierten CRM im Umsetzung eines individualisierten CRM im Internet.Internet.

insbesondere mit Hilfe von Data – Mining – insbesondere mit Hilfe von Data – Mining – Verfahren lassen sich hier wertvolle Erkenntnisse Verfahren lassen sich hier wertvolle Erkenntnisse gewinnen.gewinnen.

Page 3: Web Mining Kundenpotentiale nutzen… Marko Lepage

DatenerhebungDatenerhebung Bewegungen der Besucher auf den Seiten des Bewegungen der Besucher auf den Seiten des

Internetangebots werden automatisch Internetangebots werden automatisch aufgezeichnet aufgezeichnet Web Server protokollieren Web Server protokollieren jeden Seitenaufruf jeden Benutzers in Logfiles.jeden Seitenaufruf jeden Benutzers in Logfiles.

diese geben Auskunft darüber welche Seiten, in diese geben Auskunft darüber welche Seiten, in welcher Reihenfolge, wie lange betrachtet welcher Reihenfolge, wie lange betrachtet werden und welche Inhalte besonders häufig werden und welche Inhalte besonders häufig abgefragt werden.abgefragt werden.

die anfallenden Datenmengen sind im die anfallenden Datenmengen sind im Rohzustand jedoch wenig aussagefähig und Rohzustand jedoch wenig aussagefähig und bedürfen daher einer geeigneten Aufbereitung bedürfen daher einer geeigneten Aufbereitung und Analyse…und Analyse…

Page 4: Web Mining Kundenpotentiale nutzen… Marko Lepage

Auswertung der DatenbasisAuswertung der Datenbasis deskriptive Logfile Statistiken geben erste deskriptive Logfile Statistiken geben erste

Anhaltspunkte zur Nutzung einer Site und Anhaltspunkte zur Nutzung einer Site und können Hinweise zur Verbesserung der können Hinweise zur Verbesserung der Seitenstruktur oder zur Positionierung wichtiger Seitenstruktur oder zur Positionierung wichtiger Inhalte geben.Inhalte geben.

insbesondere sind sie jedoch nicht in der Lage, insbesondere sind sie jedoch nicht in der Lage, selbständig Muster in den Nutzungsdaten selbständig Muster in den Nutzungsdaten aufzufinden.aufzufinden.

daher bietet es sich an, automatische daher bietet es sich an, automatische Mustererkennungsverfahren auf Internetdaten Mustererkennungsverfahren auf Internetdaten anzuwenden, um tiefergehende Informationen anzuwenden, um tiefergehende Informationen über die Besucher einer Website aufzuspüren.über die Besucher einer Website aufzuspüren.

Page 5: Web Mining Kundenpotentiale nutzen… Marko Lepage

Ausprägungsformen des Web Ausprägungsformen des Web MiningMining

Die Anwendung von Verfahren des Data Mining Die Anwendung von Verfahren des Data Mining auf Datenstrukturen des Internet wird allgemein auf Datenstrukturen des Internet wird allgemein

als Web Mining bezeichnet.als Web Mining bezeichnet.

Web Content Mining Web Content Mining Analyse von Analyse von SeiteninhaltenSeiteninhalten

Web Structure Mining Web Structure Mining Analyse von Analyse von SeitenstrukturenSeitenstrukturen

Web Usage Mining Web Usage Mining Untersuchung des Untersuchung des NutzerverhaltensNutzerverhaltens

Page 6: Web Mining Kundenpotentiale nutzen… Marko Lepage

Der Web Mining ProzessDer Web Mining Prozess

Page 7: Web Mining Kundenpotentiale nutzen… Marko Lepage

DatenauswahlDatenauswahl Primäre Datenquelle zur Untersuchung des Primäre Datenquelle zur Untersuchung des

Nutzerverhaltens sind die Web – Logfiles. Nutzerverhaltens sind die Web – Logfiles. Logfiles geben Auskunft darüber, von welchem Rechner Logfiles geben Auskunft darüber, von welchem Rechner

auf bestimmte Inhalte zugegriffen wurde, welcher auf bestimmte Inhalte zugegriffen wurde, welcher Browser benutzt wurde und welche Fehler bei der Browser benutzt wurde und welche Fehler bei der Übertragung aufgetreten sind.Übertragung aufgetreten sind.

Über die Auswertung der Logfiles lässt sich auch der Über die Auswertung der Logfiles lässt sich auch der Weg eines Besuchers beim Navigieren durch die Weg eines Besuchers beim Navigieren durch die Website, der sogenannte Clickstream nachvollziehen. Website, der sogenannte Clickstream nachvollziehen. Das Standardformat, nach dem Zugriffe auf einen Das Standardformat, nach dem Zugriffe auf einen Webserver aufgezeichnet werden, ist das Common – Webserver aufgezeichnet werden, ist das Common – Logfile Format (CLF).Logfile Format (CLF).

Page 8: Web Mining Kundenpotentiale nutzen… Marko Lepage

Felder des Common Logfile FormatFelder des Common Logfile Format

Page 9: Web Mining Kundenpotentiale nutzen… Marko Lepage

Beispielhafter Eintrag im Expanded Beispielhafter Eintrag im Expanded Common Logfile FormatCommon Logfile Format

Dieser Eintrag zeigt die Anfrage eines Besuchers, der über die Dieser Eintrag zeigt die Anfrage eines Besuchers, der über die IP - Adresse 123.456.78.9 am 25.04.1998 auf die Seite B.html IP - Adresse 123.456.78.9 am 25.04.1998 auf die Seite B.html zugriff. Die Seitenübertragung verlief erfolgreich (Statuscode zugriff. Die Seitenübertragung verlief erfolgreich (Statuscode 200), und es wurden 2050 Bytes übertragen. Der Besucher 200), und es wurden 2050 Bytes übertragen. Der Besucher verfolgte einen Link auf der Seite A.html und benutzte den verfolgte einen Link auf der Seite A.html und benutzte den Microsoft Internet Explorer in Verbindung mit Windows 95.Microsoft Internet Explorer in Verbindung mit Windows 95.

Page 10: Web Mining Kundenpotentiale nutzen… Marko Lepage

Datenbereinigung: Identifikation Datenbereinigung: Identifikation von Seitenaufrufenvon Seitenaufrufen

Die Anzahl der Logfile-Einträge lässt nur indirekt Die Anzahl der Logfile-Einträge lässt nur indirekt auf die Anzahl der angeforderten Seiten auf die Anzahl der angeforderten Seiten schließen:schließen:

jede Datei, also auch jede einzelne Graphik, die jede Datei, also auch jede einzelne Graphik, die für den Aufbau einer Webseite benötigt wird, für den Aufbau einer Webseite benötigt wird, führt zu einem eigenen Logfile-Eintrag.führt zu einem eigenen Logfile-Eintrag.

daher muss ein charakteristische Element daher muss ein charakteristische Element identifiziert werden (meist gifs bzw. jpgs) – alle identifiziert werden (meist gifs bzw. jpgs) – alle anderen Elemente werden aus der Logdatei anderen Elemente werden aus der Logdatei gestrichen.gestrichen.

Page 11: Web Mining Kundenpotentiale nutzen… Marko Lepage

Cache-MechanismenCache-Mechanismen Internet-Serviceprovider verwenden Proxy-Server Internet-Serviceprovider verwenden Proxy-Server

als Zwischenspeicher für häufig angeforderte als Zwischenspeicher für häufig angeforderte Informationen und Browser legen Daten von Informationen und Browser legen Daten von Webseiten direkt auf der Festplatte des Benutzers in Webseiten direkt auf der Festplatte des Benutzers in einem Cache ab.einem Cache ab.

Fordert ein Nutzer eine Webseite an, welche lokal Fordert ein Nutzer eine Webseite an, welche lokal vorliegt, wird diese Seite direkt an den Nutzer vorliegt, wird diese Seite direkt an den Nutzer weitergegeben, und der Server des Seitenanbieters weitergegeben, und der Server des Seitenanbieters erhält keine erneute Anforderung. erhält keine erneute Anforderung.

Cache-Mechanismen führen daher zu einem Cache-Mechanismen führen daher zu einem verringerten Ausweis von Seitenaufrufen. Durch die verringerten Ausweis von Seitenaufrufen. Durch die Möglichkeit, eine regelmäßige Aktualisierung der Möglichkeit, eine regelmäßige Aktualisierung der Seiten zu erzwingen, kann der Einfluss von Cache-Seiten zu erzwingen, kann der Einfluss von Cache-Mechanismen jedoch begrenzt werden.Mechanismen jedoch begrenzt werden.

Page 12: Web Mining Kundenpotentiale nutzen… Marko Lepage

Datenbereinigung: Identifikation Datenbereinigung: Identifikation von Benutzernvon Benutzern

Grundsätzlich erfolgt die Identifikation einzelner Grundsätzlich erfolgt die Identifikation einzelner Besucher anhand der gespeicherten IP-Besucher anhand der gespeicherten IP-Adresse. IP-Adressen sind jedoch nicht immer Adresse. IP-Adressen sind jedoch nicht immer eindeutig.eindeutig.

Internet-Service-Provider müssen in der Regel Internet-Service-Provider müssen in der Regel eine große Anzahl Teilnehmer mit einer eine große Anzahl Teilnehmer mit einer beschränkten Menge an IP-Adressen versorgen. beschränkten Menge an IP-Adressen versorgen.

daher weisen sie ihre Adressen dynamisch zu, daher weisen sie ihre Adressen dynamisch zu, so dass einem Nutzer zu verschiedenen so dass einem Nutzer zu verschiedenen Zeitpunkten verschiedene Adressen zugeordnet Zeitpunkten verschiedene Adressen zugeordnet werden.werden.

Page 13: Web Mining Kundenpotentiale nutzen… Marko Lepage

Ansätze zur Unterscheidung Ansätze zur Unterscheidung verschiedener Nutzer mit gleicher verschiedener Nutzer mit gleicher

IP – AdresseIP – Adresse Mögliche Ansätze zur Unterscheidung verschiedene Mögliche Ansätze zur Unterscheidung verschiedene

Nutzer mit gleicher IP – Adresse:Nutzer mit gleicher IP – Adresse: die Verknüpfung der IP Adresse mit dem verwendeten die Verknüpfung der IP Adresse mit dem verwendeten

Browser Browser Möglichkeit aus unterschiedlichen Browsern Möglichkeit aus unterschiedlichen Browsern unter der gleichen IP-Nummer auf verschiedene Nutzer unter der gleichen IP-Nummer auf verschiedene Nutzer zu schließen.zu schließen.

durch das Anzeigen des Browsers, ob eine Anfrage von durch das Anzeigen des Browsers, ob eine Anfrage von Robots oder Spidern stammt, können entsprechende Robots oder Spidern stammt, können entsprechende Logfile Einträge für die weitere Analyse ebenfalls Logfile Einträge für die weitere Analyse ebenfalls ausgeschlossen werden.ausgeschlossen werden.

Page 14: Web Mining Kundenpotentiale nutzen… Marko Lepage

CookiesCookies Eine Möglichkeit, um unabhängig von der IP – Adresse Eine Möglichkeit, um unabhängig von der IP – Adresse

festzustellen, ob sich hinter zwei verschiedenen festzustellen, ob sich hinter zwei verschiedenen Kontakten derselbe anonyme Nutzer verbirgt, besteht in Kontakten derselbe anonyme Nutzer verbirgt, besteht in der Verwendung von Cookies.der Verwendung von Cookies.

Cookies sind Textdateien, die auf den Rechner des Cookies sind Textdateien, die auf den Rechner des Besuchers einer Website geschrieben werden, um Besuchers einer Website geschrieben werden, um diesen bei nachfolgenden Transaktionen zu identifizieren. diesen bei nachfolgenden Transaktionen zu identifizieren.

In diesem Fall erhalten Logfiles ein zusätzlichesIn diesem Fall erhalten Logfiles ein zusätzliches Feld, in Feld, in dem der nutzerspezifische Cookie-Name festgehalten dem der nutzerspezifische Cookie-Name festgehalten wird.wird.

Jedoch: Selbst Cookies identifizieren lediglich einen Jedoch: Selbst Cookies identifizieren lediglich einen bestimmten Rechner.bestimmten Rechner.

Daher: Die Zuordnung von Zugriffen zu einzelnen Daher: Die Zuordnung von Zugriffen zu einzelnen Personen kann nur über eine Registrierung erreicht Personen kann nur über eine Registrierung erreicht werden.werden.

Page 15: Web Mining Kundenpotentiale nutzen… Marko Lepage

Verfälschende Elemente in Verfälschende Elemente in Logfile-DatensätzenLogfile-Datensätzen

Page 16: Web Mining Kundenpotentiale nutzen… Marko Lepage

Identifikation von SitzungenIdentifikation von Sitzungen Besonders wertvolle Informationen lassen sich Besonders wertvolle Informationen lassen sich

gewinnen, wenn aus den erfassten Seitenaufrufen die gewinnen, wenn aus den erfassten Seitenaufrufen die vollständigen Bewegungspfade der Nutzer vollständigen Bewegungspfade der Nutzer rekonstruiert werden. Voraussetzung dafür ist die rekonstruiert werden. Voraussetzung dafür ist die verlässliche Nutzeridentifizierung, da die einzelnen verlässliche Nutzeridentifizierung, da die einzelnen Seitenaufrufe eines Besuchers in den Logfiles Seitenaufrufe eines Besuchers in den Logfiles zunächst als unabhängige Vorgänge festgehalten zunächst als unabhängige Vorgänge festgehalten werden.werden.

Die entstehende Einheit verschiedener Seitenaufrufe Die entstehende Einheit verschiedener Seitenaufrufe eines Individuums wird als Sitzung oder Session eines Individuums wird als Sitzung oder Session bezeichnet.bezeichnet.

Erst wenn die Daten zu Sessions gebündelt vorliegen, Erst wenn die Daten zu Sessions gebündelt vorliegen, können beispielsweise die Verweildauer auf einer können beispielsweise die Verweildauer auf einer Seite, die Anzahl der betrachteten Seiten pro Sitzung Seite, die Anzahl der betrachteten Seiten pro Sitzung sowie die häufigsten Ausstiegsseiten ermittelt sowie die häufigsten Ausstiegsseiten ermittelt werdenwerden..

Page 17: Web Mining Kundenpotentiale nutzen… Marko Lepage

Datenintegration – zusätzliche Datenintegration – zusätzliche DatenquellenDatenquellen

Benutzerdaten zu persönlichen Eigenschaften Benutzerdaten zu persönlichen Eigenschaften und Präferenzen werden bei Anmelde- und und Präferenzen werden bei Anmelde- und Registrierungsvorgängen über Formulare Registrierungsvorgängen über Formulare erhoben. Mit Hilfe von Cookies lassen sich die erhoben. Mit Hilfe von Cookies lassen sich die gewonnenen Informationen mit den Logfile-gewonnenen Informationen mit den Logfile-Daten zusammenführen. Daten zusammenführen.

Dieses Vorgehen ist in Deutschland aufgrund Dieses Vorgehen ist in Deutschland aufgrund strenger Datenschutzbestimmungen jedoch strenger Datenschutzbestimmungen jedoch nicht unproblematisch und sollte daher immer nicht unproblematisch und sollte daher immer die Einwilligung des Nutzers zur Erhebung und die Einwilligung des Nutzers zur Erhebung und Nutzung seiner Daten voraussetzen.Nutzung seiner Daten voraussetzen.

Page 18: Web Mining Kundenpotentiale nutzen… Marko Lepage

DatenschutzDatenschutz Da im Rahmen des Web Log Mining potenziell Da im Rahmen des Web Log Mining potenziell

personenbezogene Daten genutzt werden, sind die personenbezogene Daten genutzt werden, sind die entsprechenden Gesetze des Datenschutzes zu berücksichtigen. entsprechenden Gesetze des Datenschutzes zu berücksichtigen. Grundsätzlich unterliegt die Verarbeitung personenbezogener Grundsätzlich unterliegt die Verarbeitung personenbezogener Daten in Deutschland dem Bundesdatenschutzgesetz (BDSG) [1, Daten in Deutschland dem Bundesdatenschutzgesetz (BDSG) [1, S. 431]. In Bezug auf das Internet ist zusätzlich das S. 431]. In Bezug auf das Internet ist zusätzlich das Teledienstedatenschutzgesetz (TDDSG) zu beachten. Demnach Teledienstedatenschutzgesetz (TDDSG) zu beachten. Demnach ist für die Erhebung personalisierter Daten zu ist für die Erhebung personalisierter Daten zu Marktforschungszwecken die Einwilligung des Nutzers Marktforschungszwecken die Einwilligung des Nutzers erforderlich.erforderlich.

Die Verwendung anonymer Nutzungsprofile ist zulässig; diese Die Verwendung anonymer Nutzungsprofile ist zulässig; diese dürfen jedoch nicht ohne Einwilligung mit eventuell vorhandenen dürfen jedoch nicht ohne Einwilligung mit eventuell vorhandenen personenbezogenen Daten zusammengeführt werden [12].personenbezogenen Daten zusammengeführt werden [12]. So ist So ist es aus rechtlichen, aber auch aus ethischen Gründen unbedingt es aus rechtlichen, aber auch aus ethischen Gründen unbedingt notwendig, Besucher im Internet über die Erhebung ihrer Daten notwendig, Besucher im Internet über die Erhebung ihrer Daten zu informieren und gegebenenfalls das Einverständnis zur zu informieren und gegebenenfalls das Einverständnis zur Nutzung der Daten einzuholen.Nutzung der Daten einzuholen.

Page 19: Web Mining Kundenpotentiale nutzen… Marko Lepage

Mögliche Datenquellen des Web Usage Mining

Die Berücksichtigung der Transaktionsdaten ermöglicht die Suche Die Berücksichtigung der Transaktionsdaten ermöglicht die Suche nach Kriterien, anhand derer Erfolg versprechende Besucher nach Kriterien, anhand derer Erfolg versprechende Besucher (z. B. Käufer) identifiziert werden können. Daneben können (z. B. Käufer) identifiziert werden können. Daneben können

Kundenstammdaten oder soziodemographische Daten Kundenstammdaten oder soziodemographische Daten herangezogen werden.herangezogen werden.

Page 20: Web Mining Kundenpotentiale nutzen… Marko Lepage

Data Mining VerfahrenData Mining Verfahren Nachdem die Datenbasis entsprechend Nachdem die Datenbasis entsprechend

aufbereitet wurde, können die klassischen aufbereitet wurde, können die klassischen Verfahren des Data Mining eingesetzt Verfahren des Data Mining eingesetzt werden. Für das Spezialgebiet des Web werden. Für das Spezialgebiet des Web Usage Mining bieten sich insbesondere Usage Mining bieten sich insbesondere die folgenden Verfahren an…die folgenden Verfahren an…

Page 21: Web Mining Kundenpotentiale nutzen… Marko Lepage

ClusteranalyseClusteranalyse Clusteranalytische Verfahren ermöglichen eine Clusteranalytische Verfahren ermöglichen eine

Segmentierung der Internetbesucher.Segmentierung der Internetbesucher. Mögliche Dimension der Segmentierung sind die Mögliche Dimension der Segmentierung sind die

Herkunft des Nutzers, eingegebene Suchbegriffe oder Herkunft des Nutzers, eingegebene Suchbegriffe oder angeforderte Seiten. Anhand dieser Dimensionen kann angeforderte Seiten. Anhand dieser Dimensionen kann versucht werden, zum Beispiel auf Berufstätigkeit versucht werden, zum Beispiel auf Berufstätigkeit (Zugriff von beispielsweise Firmen bzw. (Zugriff von beispielsweise Firmen bzw. Universitätsrechnern, Uhrzeit des Zugriffs), oder die Universitätsrechnern, Uhrzeit des Zugriffs), oder die Informationsbedürfnisse (eingegebene Suchbegriffe, Informationsbedürfnisse (eingegebene Suchbegriffe, angeforderte Seiten) der identifizierten Nutzergruppen zu angeforderte Seiten) der identifizierten Nutzergruppen zu schließen. schließen.

Ziel ist die Schaffung personalisierter oder Ziel ist die Schaffung personalisierter oder zielgruppenspezifischer Informationsangebote.zielgruppenspezifischer Informationsangebote.

Page 22: Web Mining Kundenpotentiale nutzen… Marko Lepage

AssoziationsanalyseAssoziationsanalyse Die Assoziationsanalyse eignet sich im Die Assoziationsanalyse eignet sich im

Web Mining insbesondere dazu, Seiten zu Web Mining insbesondere dazu, Seiten zu identifizieren, die häufig gemeinsam identifizieren, die häufig gemeinsam innerhalb einer Sitzung aufgerufen innerhalb einer Sitzung aufgerufen werden. Eine Verknüpfung dieser werden. Eine Verknüpfung dieser Seitenkombinationen durch Seitenkombinationen durch entsprechende Links kann dazu beitragen, entsprechende Links kann dazu beitragen, die Benutzerfreundlichkeit der Site zu die Benutzerfreundlichkeit der Site zu verbessern.verbessern.

Page 23: Web Mining Kundenpotentiale nutzen… Marko Lepage

SequenzanalyseSequenzanalyse Mit Hilfe der Sequenzanalyse lassen sich typische Mit Hilfe der Sequenzanalyse lassen sich typische

Bewegungspfade der Besucher im Netz, das Bewegungspfade der Besucher im Netz, das sogenannte Clickstreambehavior, analysieren. sogenannte Clickstreambehavior, analysieren.

Gesucht werden Pfade, auf denen Besucher sich häufig Gesucht werden Pfade, auf denen Besucher sich häufig bewegen. Unter der Voraussetzung einer bewegen. Unter der Voraussetzung einer Transaktionsübergreifenden Nutzeridentifikation kann Transaktionsübergreifenden Nutzeridentifikation kann auch die Abfolge verschiedener Besuche eines Nutzers auch die Abfolge verschiedener Besuche eines Nutzers analysiert werden. In diesem Fall können zusätzlich analysiert werden. In diesem Fall können zusätzlich Aussagen über die zeitliche Entwicklung des Aussagen über die zeitliche Entwicklung des Konsumentenverhaltens getroffen werden. Konsumentenverhaltens getroffen werden.

es lässt sich ermitteln, nach welcher Anzahl von es lässt sich ermitteln, nach welcher Anzahl von Besuchen durchschnittlich eine Bestellung erfolgt oder in Besuchen durchschnittlich eine Bestellung erfolgt oder in welchem zeitlichen Abstand Wiederholungskäufe welchem zeitlichen Abstand Wiederholungskäufe getätigt werden.getätigt werden.

Page 24: Web Mining Kundenpotentiale nutzen… Marko Lepage

KlassifikationsverfahrenKlassifikationsverfahren Klassifikationsverfahren wie Entscheidungsbäume oder Klassifikationsverfahren wie Entscheidungsbäume oder

Künstliche Neuronale Netze ermöglichen eine Künstliche Neuronale Netze ermöglichen eine Einordnung der Internet-Besucher in vorgegebene Einordnung der Internet-Besucher in vorgegebene Klassen. Oftmals ist es von Interesse, Besucher zu Klassen. Oftmals ist es von Interesse, Besucher zu identifizieren, die ein konkretes Ziel einer Website (z.B. identifizieren, die ein konkretes Ziel einer Website (z.B. Produktkauf) unterstützen. Zu diesem Zweck suchen Produktkauf) unterstützen. Zu diesem Zweck suchen Klassifikationsverfahren bestimmte Seitenaufrufe, Klassifikationsverfahren bestimmte Seitenaufrufe, Seitenfolgen oder Nutzermerkmale, anhand derer Seitenfolgen oder Nutzermerkmale, anhand derer Besucher beispielsweise in die Klassen »Käufer« und Besucher beispielsweise in die Klassen »Käufer« und »Nicht-Käufer« eingeordnet werden können. »Nicht-Käufer« eingeordnet werden können.

Jeder Klasse wird ein spezifisches Nutzerprofil Jeder Klasse wird ein spezifisches Nutzerprofil zugeordnet. zugeordnet.

einem neuen Besucher kann in Abhängigkeit von seinem einem neuen Besucher kann in Abhängigkeit von seinem Profil bestimmte Inhalte dargeboten werden.Profil bestimmte Inhalte dargeboten werden.

Page 25: Web Mining Kundenpotentiale nutzen… Marko Lepage

Potenzial zur Potenzial zur EntscheidungsunterstützungEntscheidungsunterstützung

Mit Hilfe von Web Usage Mining lässt sich das Verhalten Mit Hilfe von Web Usage Mining lässt sich das Verhalten der Online-Besucher detailliert dokumentieren und der Online-Besucher detailliert dokumentieren und analysieren. analysieren.

Kunden können segmentiert, klassifiziert und nach ihrer Kunden können segmentiert, klassifiziert und nach ihrer Kaufwahrscheinlichkeit bewertet werden.Kaufwahrscheinlichkeit bewertet werden.

die Seitenstruktur sollte an häufigen Bewegungspfaden die Seitenstruktur sollte an häufigen Bewegungspfaden ausgerichtet sein, um die Navigation zu erleichtern. ausgerichtet sein, um die Navigation zu erleichtern.

es bietet sich an Werbung auf diesen Pfaden zu es bietet sich an Werbung auf diesen Pfaden zu platzieren.platzieren.

zielgruppenspezifische Marketingkampagnen undzielgruppenspezifische Marketingkampagnen und personalisierte Seiteninhalte sind möglich.personalisierte Seiteninhalte sind möglich.

Page 26: Web Mining Kundenpotentiale nutzen… Marko Lepage

Einsatzmöglichkeiten des Web Mining

Page 27: Web Mining Kundenpotentiale nutzen… Marko Lepage

Schätzung des Kundenwertes Schätzung des Kundenwertes bei bestehenden Kundenbei bestehenden Kunden

Eine der wichtigsten Aufgaben des CRM ist die Eine der wichtigsten Aufgaben des CRM ist die Analyse des Wertes bzw. der Profitabilität eines Analyse des Wertes bzw. der Profitabilität eines Kunden, um nutzenstiftende Beziehungen Kunden, um nutzenstiftende Beziehungen fortzuführen und unvorteilhafte Beziehungen zu fortzuführen und unvorteilhafte Beziehungen zu beenden.beenden.

Erster Schritt zur Bestimmung der Erster Schritt zur Bestimmung der Charakteristika profitabler Kunden ist die Charakteristika profitabler Kunden ist die Bestimmung eines Profitabilitätsmaßes. Dieses Bestimmung eines Profitabilitätsmaßes. Dieses kann sinnvollerweise in Form des CLTV kann sinnvollerweise in Form des CLTV aufgestellt werden.aufgestellt werden.

Page 28: Web Mining Kundenpotentiale nutzen… Marko Lepage

Beispiel des CLTV einer GaststätteBeispiel des CLTV einer Gaststätte

Page 29: Web Mining Kundenpotentiale nutzen… Marko Lepage

Customer Livetime ValueCustomer Livetime Value Die Menge der Kunden mit errechnetem CLTV dient als Die Menge der Kunden mit errechnetem CLTV dient als

Trainingsmenge für ein Modell zur Schätzung des CLTV Trainingsmenge für ein Modell zur Schätzung des CLTV der anderen Kunden.der anderen Kunden.

Zunächst kann eine Analyse der zur Schätzung des Zunächst kann eine Analyse der zur Schätzung des CLTV relevanten Kundenattribute erfolgen. Dies CLTV relevanten Kundenattribute erfolgen. Dies geschieht am besten mit Hilfe eines geschieht am besten mit Hilfe eines Entscheidungsbaumes, da dieser sehr viele Variablen Entscheidungsbaumes, da dieser sehr viele Variablen effizient verarbeiten kann. Als abhängige Variable dient effizient verarbeiten kann. Als abhängige Variable dient der CLTV, als unabhängige Variablen können alle der CLTV, als unabhängige Variablen können alle soziodemographischen in das Modell aufgenommen soziodemographischen in das Modell aufgenommen werden, von denen erwartet wird, dass sie einen werden, von denen erwartet wird, dass sie einen Einfluss auf den CLTV haben könnten, z. B. Alter, Einfluss auf den CLTV haben könnten, z. B. Alter, Ausbildung, Einkommen, Lifestyle, Interessen. Durch Ausbildung, Einkommen, Lifestyle, Interessen. Durch die Entscheidungsbauminduktion können aus den die Entscheidungsbauminduktion können aus den unabhängigen Variablen diejenigen bestimmt werden, unabhängigen Variablen diejenigen bestimmt werden, die einen entscheidenden Beitrag dazu leisten, den die einen entscheidenden Beitrag dazu leisten, den CLTV zu schätzen.CLTV zu schätzen.

Page 30: Web Mining Kundenpotentiale nutzen… Marko Lepage

Entscheidungsbaum zur Bestimmung Entscheidungsbaum zur Bestimmung relevanter Kundenmerkmale zurrelevanter Kundenmerkmale zur

Schätzung des Customer Lifetime ValueSchätzung des Customer Lifetime Value

Page 31: Web Mining Kundenpotentiale nutzen… Marko Lepage

EntscheidungsbaumEntscheidungsbaum

Der Entscheidungsbaum verdeutlicht den hohen Der Entscheidungsbaum verdeutlicht den hohen differenzierenden Anteil der Kundenmerkmale differenzierenden Anteil der Kundenmerkmale Alter und Einkommen auf die Klasse des CLTV, Alter und Einkommen auf die Klasse des CLTV, da diese im Entscheidungsbaum nahe an der da diese im Entscheidungsbaum nahe an der Wurzel stehen. Wurzel stehen.

Im nächsten Schritt können die bestimmten Im nächsten Schritt können die bestimmten relevantesten Merkmale als unabhängige relevantesten Merkmale als unabhängige Variablen für ein Backpropagation-Netz Variablen für ein Backpropagation-Netz eingesetzt werden, mit Hilfe dessen der CLTV eingesetzt werden, mit Hilfe dessen der CLTV geschätzt werden kann.geschätzt werden kann.

Page 32: Web Mining Kundenpotentiale nutzen… Marko Lepage

Backpropagation-Netz zur Backpropagation-Netz zur Schätzung des Customer Lifetime Schätzung des Customer Lifetime

ValueValue

Page 33: Web Mining Kundenpotentiale nutzen… Marko Lepage

Neuronales Netz zur Vorhersage Neuronales Netz zur Vorhersage des CLTVdes CLTV

Als unabhängige Variablen und damit Als unabhängige Variablen und damit bestimmende Merkmale für den CLTV wurden bestimmende Merkmale für den CLTV wurden die Kundenmerkmale Alter, Einkommen, die Kundenmerkmale Alter, Einkommen, Lifestyle und Ausbildung identifiziert. Die Menge Lifestyle und Ausbildung identifiziert. Die Menge der Kunden mit errechnetem CLTV dient als der Kunden mit errechnetem CLTV dient als Trainingsmenge für das KNN.Trainingsmenge für das KNN.

Das trainierte Netz kann zur Vorhersage des Das trainierte Netz kann zur Vorhersage des CLTV eines bestehenden Kunden verwendet CLTV eines bestehenden Kunden verwendet werden, bei dem die unabhängigen Variablen werden, bei dem die unabhängigen Variablen bekannt sind.bekannt sind.

Page 34: Web Mining Kundenpotentiale nutzen… Marko Lepage

MarktkorbanalyseMarktkorbanalyse Bei der Marktkorbanalyse werden Assoziationen Bei der Marktkorbanalyse werden Assoziationen

zwischen Produkten gesucht, die die Kunden zwischen Produkten gesucht, die die Kunden gleichzeitig erwerben. Die gefundenen gleichzeitig erwerben. Die gefundenen Assoziationen beziehen sich jedoch nicht auf Assoziationen beziehen sich jedoch nicht auf das Verhalten einzelner Kunden, sondern sind das Verhalten einzelner Kunden, sondern sind häufig beobachtete Muster in den Transaktionen häufig beobachtete Muster in den Transaktionen aller betrachteten Kunden. Ein Beispiel für eine aller betrachteten Kunden. Ein Beispiel für eine durch die Warenkorbanalyse gefundene durch die Warenkorbanalyse gefundene Assoziationsregel ist:Assoziationsregel ist:

Wurst ? Senf ? Kohle ? Streichhölzer;Wurst ? Senf ? Kohle ? Streichhölzer;

Page 35: Web Mining Kundenpotentiale nutzen… Marko Lepage

MarktkorbanalyseMarktkorbanalyse Eine ähnliche Anwendung ist die Suche nach Eine ähnliche Anwendung ist die Suche nach

Assoziationen zwischen Webseiten, die in einer Assoziationen zwischen Webseiten, die in einer Sitzung zusammen besucht werden. Sitzung zusammen besucht werden.

Ein Beispiel für eine durch eine solche Analyse Ein Beispiel für eine durch eine solche Analyse gefundene Assoziationsregel ist A.html ? gefundene Assoziationsregel ist A.html ? B.html ? C.html 0,9;0,2, die besagt, dass in 90% B.html ? C.html 0,9;0,2, die besagt, dass in 90% der Sitzungen, in denen die Dokumente A.html der Sitzungen, in denen die Dokumente A.html und B.html von einem Benutzer abgerufen und B.html von einem Benutzer abgerufen werden, auch das Dokument C.html abgerufen werden, auch das Dokument C.html abgerufen wird. Diese Regeln trifft bei 20% der wird. Diese Regeln trifft bei 20% der untersuchten Sitzungen zu.untersuchten Sitzungen zu.

Page 36: Web Mining Kundenpotentiale nutzen… Marko Lepage

MarktkorbanalyseMarktkorbanalyse Eine solche Regeln kann erst ökonomisch Eine solche Regeln kann erst ökonomisch

sinnvoll interpretiert werden, wenn ein Bezug sinnvoll interpretiert werden, wenn ein Bezug zum Inhalt der Webseiten hergestellt werden zum Inhalt der Webseiten hergestellt werden kann. Dies kann durch eine Analyse der kann. Dies kann durch eine Analyse der Metadaten der entsprechenden HTML-Metadaten der entsprechenden HTML-Dokumente erreicht werden.Dokumente erreicht werden.

Handelt es sich beispielsweise um Seiten, die Handelt es sich beispielsweise um Seiten, die bestimmte Produkte beschreiben, so könnte die bestimmte Produkte beschreiben, so könnte die um den inhaltlichen Aspekt angereicherte Regel um den inhaltlichen Aspekt angereicherte Regel die Folgende sein: Produkt1 ? Produkt2? die Folgende sein: Produkt1 ? Produkt2? Produkt3 0,9;0,2 .Produkt3 0,9;0,2 .

Page 37: Web Mining Kundenpotentiale nutzen… Marko Lepage

Vorhersage des Kundenverhaltens Vorhersage des Kundenverhaltens durch Sequenzanalysendurch Sequenzanalysen

Sie wird hauptsächlich dazu verwendet, häufige Sie wird hauptsächlich dazu verwendet, häufige Navigationspfade und Gruppen von Webseiten, die Navigationspfade und Gruppen von Webseiten, die häufig zusammen besucht werden, zu identifizieren.häufig zusammen besucht werden, zu identifizieren.

Page 38: Web Mining Kundenpotentiale nutzen… Marko Lepage

SequenzanalyseSequenzanalyse

Das Web-Log enthält nur diejenigen Web-Seiten und Das Web-Log enthält nur diejenigen Web-Seiten und vorher aufgerufene Seiten (Referrer), die explizit vom vorher aufgerufene Seiten (Referrer), die explizit vom Browser angefordert wurden. Browser angefordert wurden.

Drückt der Benutzer den ‚Back’- Knopf seines Browsers, Drückt der Benutzer den ‚Back’- Knopf seines Browsers, um die vorher aufgerufene Web-Seite zu betrachten, so um die vorher aufgerufene Web-Seite zu betrachten, so wird die Seite nicht noch einmal beim Web-Server wird die Seite nicht noch einmal beim Web-Server angefordert, sondern aus dem Zwischenspeicher des angefordert, sondern aus dem Zwischenspeicher des Browsers dargestellt. Browsers dargestellt.

Erster Schritt der Pfadanalyse ist es also, aus dem Web-Erster Schritt der Pfadanalyse ist es also, aus dem Web-Log den tatsächlichen Navigationspfad des Benutzers zu Log den tatsächlichen Navigationspfad des Benutzers zu rekonstruieren, falls dies nicht schon vorher im Rahmen rekonstruieren, falls dies nicht schon vorher im Rahmen der Data preparation Phase erfolgt ist. der Data preparation Phase erfolgt ist.

Page 39: Web Mining Kundenpotentiale nutzen… Marko Lepage

SequenzanalyseSequenzanalyse

Darauf folgend werden Navigationspfade ermittelt, die Darauf folgend werden Navigationspfade ermittelt, die einen signifikanten Support aufweisen. Durch die einen signifikanten Support aufweisen. Durch die Zuordnung von Inhalten zu den einzelnen Web-Seiten Zuordnung von Inhalten zu den einzelnen Web-Seiten wie bei der Induktion von Assoziationsregeln können die wie bei der Induktion von Assoziationsregeln können die Navigationspfade dann ökonomisch interpretiert werden. Navigationspfade dann ökonomisch interpretiert werden. Die Pfadanalyse ist eine für das Web Mining spezifische Die Pfadanalyse ist eine für das Web Mining spezifische Methode, da sie explizit Gebrauch von der Hyperlink-Methode, da sie explizit Gebrauch von der Hyperlink-Struktur einer Web-Site macht.Struktur einer Web-Site macht.

Zur Analyse individuellen Benutzerverhaltens ist sie Zur Analyse individuellen Benutzerverhaltens ist sie jedoch nur bedingt tauglich, da meist die Gesamtheit der jedoch nur bedingt tauglich, da meist die Gesamtheit der Benutzer als Analyseobjekt dient, ohne zwischen Benutzer als Analyseobjekt dient, ohne zwischen einzelnen Benutzern zu differenzieren.einzelnen Benutzern zu differenzieren.

Page 40: Web Mining Kundenpotentiale nutzen… Marko Lepage

SequenzanalyseSequenzanalyse

Unter der Vorraussetzung, dass alle bei der Interaktion Unter der Vorraussetzung, dass alle bei der Interaktion mit den Kunden angefallenen Daten integriert wurden, mit den Kunden angefallenen Daten integriert wurden, liegen umfangreiche Verhaltensdaten für jeden Kunden liegen umfangreiche Verhaltensdaten für jeden Kunden vor. vor.

Dazu zählen sowohl die Navigationspfade einzelner Dazu zählen sowohl die Navigationspfade einzelner www-Sitzungen, die einem konkreten Kunden www-Sitzungen, die einem konkreten Kunden zugeordnet werden können, als auch getätigte Käufe, E-zugeordnet werden können, als auch getätigte Käufe, E-Mail-Anfragen etc. Da diese Interaktionen ohne Mail-Anfragen etc. Da diese Interaktionen ohne Schwierigkeiten in eine geordnete zeitliche Reihenfolge Schwierigkeiten in eine geordnete zeitliche Reihenfolge gebracht werden können, können einfache Techniken gebracht werden können, können einfache Techniken der Sequenzanalyse angewendet werden, um zeitliche der Sequenzanalyse angewendet werden, um zeitliche Muster zu identifizieren.Muster zu identifizieren.

Page 41: Web Mining Kundenpotentiale nutzen… Marko Lepage

SequenzanalyseSequenzanalyse

Page 42: Web Mining Kundenpotentiale nutzen… Marko Lepage

SequenzanalyseSequenzanalyse

Ein Beispiel eines durch die Sequenzanalyse Ein Beispiel eines durch die Sequenzanalyse identifizierten häufigen sequenziellen Musters. Die identifizierten häufigen sequenziellen Musters. Die Benutzer betrachten zunächst die Web-Seite a, deren Benutzer betrachten zunächst die Web-Seite a, deren Inhalt mit dem Produkt A in Verbindung stehe. Darauf Inhalt mit dem Produkt A in Verbindung stehe. Darauf folgend werden die Web-Seiten b und c in beliebiger folgend werden die Web-Seiten b und c in beliebiger Reihenfolge betrachtet, dann wieder die Seite a. Reihenfolge betrachtet, dann wieder die Seite a. Anschließend erfolgt der Kauf des Produktes A. Anschließend erfolgt der Kauf des Produktes A. Abschließend betrachten die Benutzer die Seite b, die in Abschließend betrachten die Benutzer die Seite b, die in Verbindung mit dem Produkt B stehe und es erfolgt der Verbindung mit dem Produkt B stehe und es erfolgt der Kauf des Produktes B. Dabei können zwischen den Kauf des Produktes B. Dabei können zwischen den einzelnen Elementen des Musters beliebige andere einzelnen Elementen des Musters beliebige andere Interaktionen stattgefunden haben.Interaktionen stattgefunden haben.

Page 43: Web Mining Kundenpotentiale nutzen… Marko Lepage

Ergebnis – SequenzanalyseErgebnis – Sequenzanalyse

Defizite der Web-Site können aufgedeckt werdenDefizite der Web-Site können aufgedeckt werden Weiterhin kann ein Muster zur Vorhersage des Weiterhin kann ein Muster zur Vorhersage des

Benutzerverhaltens festgehalten werden. Benutzerverhaltens festgehalten werden. Ist z. B. die erste Hälfte des Musters durch die Ist z. B. die erste Hälfte des Musters durch die

Interaktion mit einem Kunden ‚eingetreten’, so kann mit Interaktion mit einem Kunden ‚eingetreten’, so kann mit einer bestimmten Wahrscheinlichkeit davon einer bestimmten Wahrscheinlichkeit davon ausgegangen werden, dass die zweite Hälfte innerhalb ausgegangen werden, dass die zweite Hälfte innerhalb einer bestimmten Zeit auch noch eintritt.einer bestimmten Zeit auch noch eintritt.

Darauf aufbauend können z. B. Maßnahmen zur Darauf aufbauend können z. B. Maßnahmen zur Erhöhung dieser Wahrscheinlichkeit getroffen werden, Erhöhung dieser Wahrscheinlichkeit getroffen werden, indem dynamisch Web-Seiten erzeugt werden, die die indem dynamisch Web-Seiten erzeugt werden, die die vorhergesagte Interaktion vereinfachen.vorhergesagte Interaktion vereinfachen.

Page 44: Web Mining Kundenpotentiale nutzen… Marko Lepage

Customer Touch Points – Kosten Customer Touch Points – Kosten beachten !beachten !

Anschließend sollte der Blick der Anschließend sollte der Blick der Marketingverantwortlichen auf die Kosten Marketingverantwortlichen auf die Kosten für Neukundenaquise, Kundenbindung und für Neukundenaquise, Kundenbindung und –rückgewinnung gelenkt werden. –rückgewinnung gelenkt werden.

Es gilt von den unterschiedlichen Es gilt von den unterschiedlichen Ansprache- und Betreuungswegen Ansprache- und Betreuungswegen (Customer Touch Points) denjenigen zu (Customer Touch Points) denjenigen zu wählen der in der jeweiligen Situation die wählen der in der jeweiligen Situation die beste Kunden/Nutzen Relation aufweist.beste Kunden/Nutzen Relation aufweist.

Page 45: Web Mining Kundenpotentiale nutzen… Marko Lepage

Customer-Touch-Points im (E-)CRM

Page 46: Web Mining Kundenpotentiale nutzen… Marko Lepage

MarketingmaßnahmenMarketingmaßnahmen Es kommt hierbei entscheidend darauf an, den Es kommt hierbei entscheidend darauf an, den

potenziellen Besucher einer Website vor der potenziellen Besucher einer Website vor der Registrierung vom persönlichen Nutzen einer derartigen Registrierung vom persönlichen Nutzen einer derartigen Registrierung zu überzeugen, anderenfalls wird eine Registrierung zu überzeugen, anderenfalls wird eine Registrierung unterbleiben oder verfälscht. Registrierung unterbleiben oder verfälscht.

Online wäre hierbei z.B. an die kostenlose Online wäre hierbei z.B. an die kostenlose Zurverfügungstellung individualisierter Informationen Zurverfügungstellung individualisierter Informationen mittels E- Mail-Newsletter, die Teilnahme an einem mittels E- Mail-Newsletter, die Teilnahme an einem Online-Gewinnspiel, der verbilligte Direktbezug von Online-Gewinnspiel, der verbilligte Direktbezug von Software-Upgrades, das kostenlose Versenden von Software-Upgrades, das kostenlose Versenden von SMS oder auch an das Herunterladen von Klingeltönen SMS oder auch an das Herunterladen von Klingeltönen zu denken.zu denken.

Page 47: Web Mining Kundenpotentiale nutzen… Marko Lepage

Registrierung onlineRegistrierung online

Page 48: Web Mining Kundenpotentiale nutzen… Marko Lepage

Web Mining und Data MiningWeb Mining und Data Mining

Das größte Potential liegt für Das größte Potential liegt für Unternehmen in der Zusammenführung Unternehmen in der Zusammenführung von Data Mining und Web Mining, da sich von Data Mining und Web Mining, da sich hieraus die aussichtsreichsten hieraus die aussichtsreichsten Ansatzpunkte für eine nutzensteigernde Ansatzpunkte für eine nutzensteigernde Individualisierung aller Marketing-Mix-Individualisierung aller Marketing-Mix-Instrumente ergeben.Instrumente ergeben.

Page 49: Web Mining Kundenpotentiale nutzen… Marko Lepage

Web Mining und Data MiningWeb Mining und Data Mining Web Mining und Data-Mining-Analysen auf Grundlage Web Mining und Data-Mining-Analysen auf Grundlage

anderer Datenquellen (z.B. Kundendatenbank, anderer Datenquellen (z.B. Kundendatenbank, Interessentendatenbank, Zufriedenheitsanalysen etc.) Interessentendatenbank, Zufriedenheitsanalysen etc.) ergänzen sich und erhöhen die gesamte Aussagekraft ergänzen sich und erhöhen die gesamte Aussagekraft der durchgeführten Analysen deutlich.der durchgeführten Analysen deutlich.

Idealerweise gibt der Website-Besucher sich zu Idealerweise gibt der Website-Besucher sich zu erkennen (z.B. mittels Registrierung). Dann entfaltet sich erkennen (z.B. mittels Registrierung). Dann entfaltet sich das Potenzial des Web Minings in hervorragender das Potenzial des Web Minings in hervorragender Weise, weil so eine personenindividuelle Weise, weil so eine personenindividuelle Nutzungsanalyse des Customer-Touch-Points unter Nutzungsanalyse des Customer-Touch-Points unter Berücksichtigung einschlägiger Datenschutz-Berücksichtigung einschlägiger Datenschutz-bestimmungen (insbesondere Teledienstdatenschutz-bestimmungen (insbesondere Teledienstdatenschutz-Gesetz TDDSG) quasi mühelos mitzuleisten ist.Gesetz TDDSG) quasi mühelos mitzuleisten ist.

Page 50: Web Mining Kundenpotentiale nutzen… Marko Lepage

Web Mining und Data MiningWeb Mining und Data Mining