View
338
Download
1
Embed Size (px)
DESCRIPTION
Ein Vortrag von intrafind AG auf dem ECM-Forum zur CeBIT 2014 Referent: Franz Kögel, intrafind AG
Citation preview
Keine Angst vor Big Data. Praxistipps für den richtigen Umgang mit Unternehmensinformationen.
Rutger Lörch I Sales Manager I IntraFind Software AG I 12. März 2014
Über IntraFind
IntraFind ist Ihr Spezialist für die Informationsgewinnung aus unstrukturierten und strukturierten Unternehmensdaten.
Enterprise Search – Textanalyse – Metadatenmanagement – Textklassifikation
Kundenbasis in Deutschland, Österreich und Schweiz
Kunden: > 850
Mitarbeiter: 30
Gründung: Jahr 2000
Wir bieten unseren Kunden Softwareprodukte, Lösungen und Beratung rund um die Themen Enterprise Search, Information Access & Text Mining und verfügen über mehr als 13 Jahre Erfahrung in der Planung und Umsetzung von Such- und Textanalyse-Projekten.
© IntraFind Software AG, 2014
IntraFind Software AG – unsere Kunden
© IntraFind Software AG, 2014
Eigenschaften von BIG DATA Quelle : BITKOM
© IntraFind Software AG, 2014
Handling von BIG DATA
automatisierte Verfahren der Textanalyse und Textklassifikation einsetzen => neue und bestehende Inhalte intelligent miteinander zu verknüpfen
standort- oder abteilungsbezogene Informationssilos aufbrechen => Unternehmensinformationen effizient zugänglich machen
Die richtigen Recherchefunktionalitäten bereitstellen => das Potenzial von Informationen aus unstrukturierten Daten optimal nutzen und schnell Zusammenhänge sichtbar machen
© IntraFind Software AG, 2014
BIG DATA aus Sicht der IT: Wichtige Aspekte im Umgang mit großen Datenmengen
© IntraFind Software AG, 2014
Big Data
Skalier-barkeit
Ausfall- sicherheit
Verteilte Szenarien
Aktualität
Qualität
Benutzer-rechte
Kosten
Admini-strier-barkeit
Single Point of Information Access
File Shares (Win, Unix)
E-Mail DMS & Archive
Applikation ERP/CRM
+ weitere Quellen…
Collabo-ration Intranet / Internet
Wikis
© IntraFind PSO 2014 - Manuel Brunner - zur vertraulichen Verwendung 7
Konnektoren
"Don’t underestimate the cost
or complexity of connectivity.
Search engines rely on
connectors to hook into
databases and applications.“
The Forrester Wave™
Enterprise Search
Eigennamen erkennen
Automatische Extraktion von Kern-informationen aus unstrukturierten Daten
Eigennamen von Personen
Eigennamen von Firmen
Marken aus Produktlisten
Technische Kennzahlen aus Technischen Daten
(Raw Materials, Produkttypen, Bestellnummern,
Prozessnummern, eClass Kategorien)
Straßen- Ortsbezeichnungen
Währungs- und Buchhaltungswerte
Datumsangaben
Telefonnummern, E-Mail-Daten, Hyperlinks
8 IntraFind PSO 2014 - Manuel Brunner
Topic Learner Classifier
Rules (Parameters)
Definition of
Topics 1……N
Topic Classifier
Topic Association
Learning Phase
Classification Phase
New Document
Example Documents
Themen erkennen – mit Textklassifikation
IntraFind PSO 2014 - Manuel Brunner 9
Themen erkennen – mit Textklassifikation
© IntraFind Software AG, 2014
Topic 1
Topic 1.1
Topic 1.2
Topic 1.2.1
Topic 1.2.2
Topic 2
Topic 3
Neues Dokument
Step 1: Topic Analysis
Step 2: Topic Matching
Hohe Genauigkeit
Hoch skalierbar
Hoch verteilbar
Bis zu 5.000 parallele
Prozesse möglich
Taxonomy
Topic 1.2.2
BIG DATA aus Sicht des Anwenders: JEDER SUCHT ANDERS…
1. Zielgerichtete Suche 2. Suche mit vagen Informationen
3. Stöbern
4. Nicht suchen – informiert bleiben
WER SUCHET DER FINDET. ABER WIE?
© IntraFind Software AG, 2014
Funktionsbausteine einer modernen unternehmensweiten Suche
© IntraFind Software AG, 2014
Basistechnologie (z.B. iFinder Enterprise Search)
Erweiterte Suche
Dubletten-erkennung
Thumbnails &
Preview
Sortierung
Gespeicherte Suchen & Alerts
Gruppierung Best Bets
Favorisierte Dokumente
People Search
Phonetische Suche
Semantisch-Assoziative
Suche
Verwandte Begriffe
Wissens- landkarte
Entitäten- extraktion
Ähnlichkeits-
suche
Auto-complete
„Meinten Sie…?“
Facetten
Linguistik Serendipität Zufallsfunde
Distanz-suche
GeoSearch
Themen-
erkennung
Unscharfe Suche
Integration von SERVICES & PLUGINS am Beispiel von Elasticsearch
© 2014 - IntraFind Software AG
IntraFind
Converter Service
IntraFind
Tagging Service
IntraFind
Index Service
Text-
extraktion
Anreicherung
mit Metadaten
Elasticsearch IntraFind
Linguistik Plugin
INDIZIERUNG SUCHE
IntraFind
Thesaurus Service
Automobil
Kfz
Fahrzeug
TREFFERLISTE
IntraFind
Search Service
Neue
angereicherte
Query Linguistisch
aufbereitete und
vollständige
Trefferliste
Auto
IntraFind
Linguistik Plugin
IntraFind
Autocomplete Service
13
Erfolgreiche Suchprojekte zeichnet aus…
Gute Planung im Vorfeld
Genug Zeit in die Requirements Spezifikationen stecken
Die richtige Technologie für eine mittel- und langfristige Planung (Dateiformate, Anzahl Konnektoren, SSO, Skalierbarkeit)
Bitte beachten Sie: Ich will eine Google für mein Intranet heiß NICHT: Sie brauchen Google
Security – Organisatorisch klären
Suche deckt auf: Lange Laufzeiten durch lange QA Zeiten im Projekt einplanen
Groß denken, klein starten
Starten mit den „low hanging fruits“ – Den wichtigsten Datenträger – Den wichtigsten „Stakeholdern“
Start mit dediziertem Bereich - Nur mit interner Unterstützung/Marketing wird Suche zum Erfolg
„Tue Gutes und sprich darüber“
14 © 2014 - IntraFind Software AG
Danke für Ihre
Aufmerksamkeit!
Besuchen Sie uns in
Halle 3, Stand F36
© IntraFind Software AG, 2014
BACKUP FOLIEN
© IntraFind Software AG, 2014
Beispiel: iFinder Enterprise Search
© IntraFind Software AG, 2014
Benutzerfreundlichkeit am Beispiel PDM
Navigation zur Erweiterten Suche, Wissenslandkarte, Hilfe, Favorisierten
Dokumenten, Gespeicherten Suchen und zum Benutzerhandbuch
Auswahl Suchbereich
Angemeldeter Benutzer
Sucheingabefeld
Eigene Symbole für Suchoptionen
ConteXtoren (Facetten)
zur Filterung von
Metadaten
Trefferliste mit
Dokumentenvorschau
und Hit-Highlighting
Suchanfrage
komplett löschen
Suchbereiche können an-und abgewählt werden
Starterm Treffer –
Synonyme besonders
hervorgehoben
Benutzerfreundlichkeit am Beispiel PDM
(c) 2014 I IntraFind Software AG 19
Beispiel: Voith-Suche auf SharePoint UI
© IntraFind Software AG, 2014
Enterprise Search auf Basis von Lucene Derivaten Flexibel – Skalierbar – Performant – Günstig
Lucene / Solr „Best in class“-Technologie
Bekannte Lucene / Solr-Installationen im Web:
Apple iTunes
MySpace (~ 6 Mrd. Dokumente)
1.000 TPS (tweets/sec)
12.000 QPS (queries/sec)
mehr als 1 Milliarde Suchanfragen pro Tag (!)
Beispielhafte iFinder-Installationen
Robert Bosch GmbH: 42 Mio. Dokumente und ClearCase
Voith GmbH: 40 Mio. Dokumente, PDM und SharePoint auf 6 Servern
Krauss-Maffei Wegmann: 23 Mio. Dokumente und E-Mails (live und archiviert)
Automotive-Kunde (aktuelles Projekt): 500 Mio. Dokumente im Dateisystem
© IntraFind Software AG, 2014
Hohe Flexibilität – geringe
Kosten