1
HMD 268 3 Editorial Der Data Miner arbeitet für gewöhnlich un- scheinbar unter Tage, taucht aber zuverlässig immer dann in den Büroetagen auf, wenn Fi- nanzkennzahlen analysiert, Kundenakquisiti- ons- und Kundenbindungsprogramme entwi- ckelt oder Markttrends nachgespürt werden müssen. Mit dieser Charakterisierung hat Mar- kus Grolik den Wettbewerb für die Wahl eines neuen Cartoonisten gewonnen. Die visuelle Umsetzung seiner Idee finden Sie als Cartoon in diesem Heft. Wir begrüßen Markus Grolik und freuen uns auf weitere grafische Würfe für un- sere künftigen Schwerpunktthemen. An dieser Stelle möchten wir uns bei Nor- man Zey herzlich bedanken, der uns seit Jahren als Cartoonist unterstützt. Sein erster Cartoon erschien im HMD-Heft 223 über elektronische Marktplätze im Februar 2002. Norman Zey hat uns mit seinem Talent bei 45 HMD-Heften be- gleitet! Seine Cartoons finden Sie auf der Web- site der HMD-Zeitschrift zum Download unter http://hmd.dpunkt.de/archiv/cartoons.html. Wie können die stark wachsenden Daten- sammlungen in Firmen und Organisationen oder der wild wuchernde Datendschungel im World Wide Web mit Werkzeugen erforscht werden? Leiden wir nicht alle unter dem Infor- mation Overload und gibt es hier Abhilfe? Diese oder ähnliche Fragen haben Sie, liebe HMD-Le- serinnen und -Leser, sicher schon öfter gestellt. Die HMD-Herausgeber haben sich deshalb ent- schlossen, dem Themengebiet Web und Data Mining ein eigenes Schwerpunktheft zu wid- men. Bei diesem Heft hat uns Prof. Dr. Matthias Knoll von der Hochschule Darmstadt als Gastherausgeber tatkräftig unterstützt. Was ist nun der Unterschied zwischen Web Mining und Data Mining? Wenn Sie den Grund- lagenbeitrag von Kilian Stoffel studieren, kön- nen Sie der einfachen Formel Web + Data Mi- ning = Web Mining folgen. Tatsächlich ist die Suche nach Mustern in Datenbeständen in der Informatik schon immer ein wichtiges Thema gewesen. Begonnen mit dem Information Re- trieval, d.h. der Suche nach relevanter Informati- on, haben sich die Algorithmen rasch verbreitet. Interessant ist, dass beim Web Mining einer- seits bekannte Verfahren des Information Re- trieval angewendet werden – Google lebt uns dies täglich vor –, dass aber andererseits auch innovative Methoden speziell fürs Web Mining entwickelt worden sind. Sie haben nun, liebe HMD-Leserinnen und -Leser, ein Schwerpunktheft über Web und Data Mining in den Händen. Dabei geben wir zu, Sie in einigen Beiträgen herauszufordern. So lernen Sie neben neueren Ansätzen wie Random Forest oder Fuzzy-Klassifikation auch Methoden und Techniken für das Opinion bzw. Stream Mining kennen. Wenn wir Sie an der einen oder ande- ren Stelle etwas stark mit methodischem und mathematischem Background strapazieren, so war das durchaus Absicht der Herausgeber. An- spruchsvolle Algorithmen des Web und Data Mining verlangen, die darunterliegende Theorie zu verstehen und nachvollziehen zu können. Wir wünschen Ihnen, liebe Suchende nach Mustern in großen Datenbeständen, viel Spaß und viel Erkenntnis mit unserem Schwerpunkt- heft. Wie immer sind wir offen für Anregungen, Kritik oder Kommentare zu den einzelnen Bei- trägen. Matthias Knoll Andreas Meier

Editorial

Embed Size (px)

Citation preview

Page 1: Editorial

HMD 268 3

Editorial

Der Data Miner arbeitet für gewöhnlich un-scheinbar unter Tage, taucht aber zuverlässigimmer dann in den Büroetagen auf, wenn Fi-nanzkennzahlen analysiert, Kundenakquisiti-ons- und Kundenbindungsprogramme entwi-ckelt oder Markttrends nachgespürt werdenmüssen. Mit dieser Charakterisierung hat Mar-kus Grolik den Wettbewerb für die Wahl einesneuen Cartoonisten gewonnen. Die visuelleUmsetzung seiner Idee finden Sie als Cartoon indiesem Heft. Wir begrüßen Markus Grolik undfreuen uns auf weitere grafische Würfe für un-sere künftigen Schwerpunktthemen.

An dieser Stelle möchten wir uns bei Nor-man Zey herzlich bedanken, der uns seit Jahrenals Cartoonist unterstützt. Sein erster Cartoonerschien im HMD-Heft 223 über elektronischeMarktplätze im Februar 2002. Norman Zey hatuns mit seinem Talent bei 45 HMD-Heften be-gleitet! Seine Cartoons finden Sie auf der Web-site der HMD-Zeitschrift zum Download unterhttp://hmd.dpunkt.de/archiv/cartoons.html.

Wie können die stark wachsenden Daten-sammlungen in Firmen und Organisationenoder der wild wuchernde Datendschungel imWorld Wide Web mit Werkzeugen erforschtwerden? Leiden wir nicht alle unter dem Infor-mation Overload und gibt es hier Abhilfe? Dieseoder ähnliche Fragen haben Sie, liebe HMD-Le-serinnen und -Leser, sicher schon öfter gestellt.Die HMD-Herausgeber haben sich deshalb ent-schlossen, dem Themengebiet Web und DataMining ein eigenes Schwerpunktheft zu wid-men. Bei diesem Heft hat uns Prof. Dr. MatthiasKnoll von der Hochschule Darmstadt alsGastherausgeber tatkräftig unterstützt.

Was ist nun der Unterschied zwischen WebMining und Data Mining? Wenn Sie den Grund-lagenbeitrag von Kilian Stoffel studieren, kön-

nen Sie der einfachen Formel Web + Data Mi-ning = Web Mining folgen. Tatsächlich ist dieSuche nach Mustern in Datenbeständen in derInformatik schon immer ein wichtiges Themagewesen. Begonnen mit dem Information Re-trieval, d.h. der Suche nach relevanter Informati-on, haben sich die Algorithmen rasch verbreitet.Interessant ist, dass beim Web Mining einer-seits bekannte Verfahren des Information Re-trieval angewendet werden – Google lebt unsdies täglich vor –, dass aber andererseits auchinnovative Methoden speziell fürs Web Miningentwickelt worden sind.

Sie haben nun, liebe HMD-Leserinnen und-Leser, ein Schwerpunktheft über Web und DataMining in den Händen. Dabei geben wir zu, Siein einigen Beiträgen herauszufordern. So lernenSie neben neueren Ansätzen wie Random Forestoder Fuzzy-Klassifikation auch Methoden undTechniken für das Opinion bzw. Stream Miningkennen. Wenn wir Sie an der einen oder ande-ren Stelle etwas stark mit methodischem undmathematischem Background strapazieren, sowar das durchaus Absicht der Herausgeber. An-spruchsvolle Algorithmen des Web und DataMining verlangen, die darunterliegende Theoriezu verstehen und nachvollziehen zu können.

Wir wünschen Ihnen, liebe Suchende nachMustern in großen Datenbeständen, viel Spaßund viel Erkenntnis mit unserem Schwerpunkt-heft. Wie immer sind wir offen für Anregungen,Kritik oder Kommentare zu den einzelnen Bei-trägen.

Matthias Knoll Andreas Meier