21
Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen. Rutger Lörch I Sales Manager I IntraFind Software AG I 12. März 2014

Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Embed Size (px)

DESCRIPTION

Ein Vortrag von intrafind AG auf dem ECM-Forum zur CeBIT 2014 Referent: Franz Kögel, intrafind AG

Citation preview

Page 1: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen.

Rutger Lörch I Sales Manager I IntraFind Software AG I 12. März 2014

Page 2: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Über IntraFind

IntraFind ist Ihr Spezialist für die Informationsgewinnung aus unstrukturierten und strukturierten Unternehmensdaten.

Enterprise Search – Textanalyse – Metadatenmanagement – Textklassifikation

Kundenbasis in Deutschland, Österreich und Schweiz

Kunden: > 850

Mitarbeiter: 30

Gründung: Jahr 2000

Wir bieten unseren Kunden Softwareprodukte, Lösungen und Beratung rund um die Themen Enterprise Search, Information Access & Text Mining und verfügen über mehr als 13 Jahre Erfahrung in der Planung und Umsetzung von Such- und Textanalyse-Projekten.

© IntraFind Software AG, 2014

Page 3: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

IntraFind Software AG – unsere Kunden

© IntraFind Software AG, 2014

Page 4: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Eigenschaften von BIG DATA Quelle : BITKOM

© IntraFind Software AG, 2014

Page 5: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Handling von BIG DATA

automatisierte Verfahren der Textanalyse und Textklassifikation einsetzen => neue und bestehende Inhalte intelligent miteinander zu verknüpfen

standort- oder abteilungsbezogene Informationssilos aufbrechen => Unternehmensinformationen effizient zugänglich machen

Die richtigen Recherchefunktionalitäten bereitstellen => das Potenzial von Informationen aus unstrukturierten Daten optimal nutzen und schnell Zusammenhänge sichtbar machen

© IntraFind Software AG, 2014

Page 6: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

BIG DATA aus Sicht der IT: Wichtige Aspekte im Umgang mit großen Datenmengen

© IntraFind Software AG, 2014

Big Data

Skalier-barkeit

Ausfall- sicherheit

Verteilte Szenarien

Aktualität

Qualität

Benutzer-rechte

Kosten

Admini-strier-barkeit

Page 7: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Single Point of Information Access

File Shares (Win, Unix)

E-Mail DMS & Archive

Applikation ERP/CRM

+ weitere Quellen…

Collabo-ration Intranet / Internet

Wikis

© IntraFind PSO 2014 - Manuel Brunner - zur vertraulichen Verwendung 7

Konnektoren

"Don’t underestimate the cost

or complexity of connectivity.

Search engines rely on

connectors to hook into

databases and applications.“

The Forrester Wave™

Enterprise Search

Page 8: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Eigennamen erkennen

Automatische Extraktion von Kern-informationen aus unstrukturierten Daten

Eigennamen von Personen

Eigennamen von Firmen

Marken aus Produktlisten

Technische Kennzahlen aus Technischen Daten

(Raw Materials, Produkttypen, Bestellnummern,

Prozessnummern, eClass Kategorien)

Straßen- Ortsbezeichnungen

Währungs- und Buchhaltungswerte

Datumsangaben

Telefonnummern, E-Mail-Daten, Hyperlinks

8 IntraFind PSO 2014 - Manuel Brunner

Page 9: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Topic Learner Classifier

Rules (Parameters)

Definition of

Topics 1……N

Topic Classifier

Topic Association

Learning Phase

Classification Phase

New Document

Example Documents

Themen erkennen – mit Textklassifikation

IntraFind PSO 2014 - Manuel Brunner 9

Page 10: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Themen erkennen – mit Textklassifikation

© IntraFind Software AG, 2014

Topic 1

Topic 1.1

Topic 1.2

Topic 1.2.1

Topic 1.2.2

Topic 2

Topic 3

Neues Dokument

Step 1: Topic Analysis

Step 2: Topic Matching

Hohe Genauigkeit

Hoch skalierbar

Hoch verteilbar

Bis zu 5.000 parallele

Prozesse möglich

Taxonomy

Topic 1.2.2

Page 11: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

BIG DATA aus Sicht des Anwenders: JEDER SUCHT ANDERS…

1. Zielgerichtete Suche 2. Suche mit vagen Informationen

3. Stöbern

4. Nicht suchen – informiert bleiben

WER SUCHET DER FINDET. ABER WIE?

© IntraFind Software AG, 2014

Page 12: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Funktionsbausteine einer modernen unternehmensweiten Suche

© IntraFind Software AG, 2014

Basistechnologie (z.B. iFinder Enterprise Search)

Erweiterte Suche

Dubletten-erkennung

Thumbnails &

Preview

Sortierung

Gespeicherte Suchen & Alerts

Gruppierung Best Bets

Favorisierte Dokumente

People Search

Phonetische Suche

Semantisch-Assoziative

Suche

Verwandte Begriffe

Wissens- landkarte

Entitäten- extraktion

Ähnlichkeits-

suche

Auto-complete

„Meinten Sie…?“

Facetten

Linguistik Serendipität Zufallsfunde

Distanz-suche

GeoSearch

Themen-

erkennung

Unscharfe Suche

Page 13: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Integration von SERVICES & PLUGINS am Beispiel von Elasticsearch

© 2014 - IntraFind Software AG

IntraFind

Converter Service

IntraFind

Tagging Service

IntraFind

Index Service

Text-

extraktion

Anreicherung

mit Metadaten

Elasticsearch IntraFind

Linguistik Plugin

INDIZIERUNG SUCHE

IntraFind

Thesaurus Service

Automobil

Kfz

Fahrzeug

TREFFERLISTE

IntraFind

Search Service

Neue

angereicherte

Query Linguistisch

aufbereitete und

vollständige

Trefferliste

Auto

IntraFind

Linguistik Plugin

IntraFind

Autocomplete Service

13

Page 14: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Erfolgreiche Suchprojekte zeichnet aus…

Gute Planung im Vorfeld

Genug Zeit in die Requirements Spezifikationen stecken

Die richtige Technologie für eine mittel- und langfristige Planung (Dateiformate, Anzahl Konnektoren, SSO, Skalierbarkeit)

Bitte beachten Sie: Ich will eine Google für mein Intranet heiß NICHT: Sie brauchen Google

Security – Organisatorisch klären

Suche deckt auf: Lange Laufzeiten durch lange QA Zeiten im Projekt einplanen

Groß denken, klein starten

Starten mit den „low hanging fruits“ – Den wichtigsten Datenträger – Den wichtigsten „Stakeholdern“

Start mit dediziertem Bereich - Nur mit interner Unterstützung/Marketing wird Suche zum Erfolg

„Tue Gutes und sprich darüber“

14 © 2014 - IntraFind Software AG

Page 15: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Danke für Ihre

Aufmerksamkeit!

Besuchen Sie uns in

Halle 3, Stand F36

© IntraFind Software AG, 2014

Page 16: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

BACKUP FOLIEN

© IntraFind Software AG, 2014

Page 17: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Beispiel: iFinder Enterprise Search

© IntraFind Software AG, 2014

Page 18: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Benutzerfreundlichkeit am Beispiel PDM

Navigation zur Erweiterten Suche, Wissenslandkarte, Hilfe, Favorisierten

Dokumenten, Gespeicherten Suchen und zum Benutzerhandbuch

Auswahl Suchbereich

Angemeldeter Benutzer

Sucheingabefeld

Eigene Symbole für Suchoptionen

ConteXtoren (Facetten)

zur Filterung von

Metadaten

Trefferliste mit

Dokumentenvorschau

und Hit-Highlighting

Suchanfrage

komplett löschen

Suchbereiche können an-und abgewählt werden

Starterm Treffer –

Synonyme besonders

hervorgehoben

Page 19: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Benutzerfreundlichkeit am Beispiel PDM

(c) 2014 I IntraFind Software AG 19

Page 20: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Beispiel: Voith-Suche auf SharePoint UI

© IntraFind Software AG, 2014

Page 21: Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen | ECM-Forum auf der CeBIT 2014

Enterprise Search auf Basis von Lucene Derivaten Flexibel – Skalierbar – Performant – Günstig

Lucene / Solr „Best in class“-Technologie

Bekannte Lucene / Solr-Installationen im Web:

Apple iTunes

LinkedIn

MySpace (~ 6 Mrd. Dokumente)

Twitter

1.000 TPS (tweets/sec)

12.000 QPS (queries/sec)

mehr als 1 Milliarde Suchanfragen pro Tag (!)

Beispielhafte iFinder-Installationen

Robert Bosch GmbH: 42 Mio. Dokumente und ClearCase

Voith GmbH: 40 Mio. Dokumente, PDM und SharePoint auf 6 Servern

Krauss-Maffei Wegmann: 23 Mio. Dokumente und E-Mails (live und archiviert)

Automotive-Kunde (aktuelles Projekt): 500 Mio. Dokumente im Dateisystem

© IntraFind Software AG, 2014

Hohe Flexibilität – geringe

Kosten