Überblick über die Suchplattform LucidWorks Search 2.1

Preview:

DESCRIPTION

www.shi-gmbh.com In der Präsentation wird die auf Apache Solr basierende Suchplattform LucidWorks Search vorgestellt. Es wird darüber hinaus auf das ergänzende Produkt Smartlogic Semaphore für die Realisierung intelligenter Suche mittels Taxonomien, Ontologien und automatischer Content Klassifikation eingegangen.

Citation preview

Überblick über die Suchplattform

LucidWorks Search 2.1

Augsburg, 13. November 2012

Seite 2

Kurzvorstellung SHI

Seit 1994

Softwaredienstleister mit Schwerpunkt auf Search- und

dokumentenzentrischen Anwendungen

25 Mitarbeiter

Homogenes Portfolio: Open Source, Web Applikationen, Suchtechnologie &

Content Management

Komplettes Dienstleistungsprogramm: Beratung, Schulung, Entwicklung &

Support

Starke Partner

Seite 3

+ PLATTFORM

Search

LucidWorks Search (LWS) – Was ist das?

Schnell (sub second)

Skalierbar: Clustering, Sharding, …

Fehlertolerante Suche: Wildcard, Fuzzy,

Synonyme, Stemming, Autosuggest, ….

Konfigurierbares Ranking

Placements

Navigationshilfen: Facetten, more like this, did

you mean, …

….

Connectoren für zahlreiche

Datenquellen & -formate

LDAP / AD

Admin Oberfläche

Rapid Prototyping

Log Auswertung

Click Scoring Engine

Alerting Service

Business Rules Engine

Erweitertes API

Schnellere Entwicklung

Migration Tools

7x24 SLA Support

SERVER LIBRARY

Seite 4

Auf den folgenden Folien erfolgt die Vorstellung der Suchplattform

LucidWorks Search 2.1 aus der Sicht der Businessanwender.

Seite 5

LWS: Main Dashboard

Das „Main Dashboard“ zeigt alle relevanten Informationen zu dem Suchservice an: Speicherbedarf,

Performance der Suchanfragen, Performance der Indexierung, indexierte Datenquellen u.s.w.

Performance Anzeige Zeigt die Anzahl der Suchanfrage pro

Sekunde (QPS) an.

Speicherbedarf Zeigt den Speicherbedarf für den Suchindex an.

Angelegte Collectionen In der tabellarischen Ansicht sind alle

derzeit konfigurierten Collectionen

dargestellt. Eine Collection kann aus

einer oder mehreren Datenquellen (z.

B. Webseiten, Dateisystemen, etc.)

bestehen. In der Darstellung sind

darüber hinaus Informationen wie z. B.

Anzahl Dokumente in der jeweiligen

Collection, letzte Akualisierung, u.s.w.

angegeben.

Anlage neuer Datencollectionen Das nicht-technische Personal kann

sehr bequem neue Datenquellen (z. B.

Webseiten) zum Indexieren anlegen.

Der Umweg über die IT-Abteilung bleibt

somit erpart.

Seite 6

LWS: Collectionen

In dieser Ansicht erhält man den Überblick über eine bestimmte Collection. Darüber hinaus können

hier Datenquellen (Data Sources) der jeweiligen Collection verwaltet werden.

Verwaltung Das Verwaltungsmenü enthält

unterschiedliche Operationen zur

Steuerung der Collection.

Datails Der Bereich mit den Details der

Collections enhält neben dem

Speicherverbrauch auch weitere

wertvolle Informationen wie z. B. die

Aktualität des Index.

Die populärsten Suchanfragen Stellt den Trend der Suchanfragen dar.

Übersicht der Datenquellen In der tabellarischen Übersicht sind alle

konfigurierten Datenquellen samt ihrer

jeweiligen Aktualität dargestellt.

Darüber hinaus kann man hier den

Crawl-Vorgang manuell starten.

Seite 7

LWS: Datenquellen

In dieser Darstellung erhält man detaillierte Informationen zu einer bestimmten Datenquelle. Darüber

hinaus können hier Einstellungen geändert und Operationen (wie z. B. Start des Crawln-Vorgangs)

durchgeführt werden.

Verwaltung der Datenquelle Hier können Einstellung der jeweiligen

Datenquelle bequem vorgenommen

werden.

Einstellungen Die derzeit gültigen Einstellungen kann

man auf einen Blick sehen.

Historie In der tabellarischen Darstellung kann

man die Historie der Indexierung für die

jeweilige Datenquelle nachvollziehen.

Seite 8

LWS: Datenquelle anlegen

LWS unterstützt eine Vielzahl unterschiedlicher Datenquellen, die indexiert werden können. So z. B.

auch Webseiten, Dateisysteme, Document Management Systeme (Alfresco, OpenText,

Documentum, …) u. v. m.

Datenquellen Aus der Liste können bequem

Datenquellen ausgewählt und für die

Suche konfiguriert werden. Hierzu ist in

den meisten Fällen keine speziellen

technischen Kenntnisse notwendig.

Übersicht der Datenquellen In der tabellarischen Ansicht sieht man

alle angelegten Datenquellen der

jeweiligen Collection.

Seite 9

LWS: Webseite als Datenquelle

LWS ist mit einem leistungsstarken Crawler für Webseiten ausgestattet. Die Anlage einer Webseiten-

Datenquelle ist sehr einfach und kann durch nicht-technisches Personal durchgeführt werden.

Seite 10

LWS: Stopwortlisten

Stopwörter werden nicht indexiert. LWS bietet eine sehr bequeme Möglichkeit, die Stopwortlisten zu

verwalten. Die Bereitstellung der Stopwörter kann automatisiert z. B. auch aus Fremdsystemen

erfolgen.

Seite 11

LWS: Synonyme

Synonyme sorgen dafür, dass Benutzer auch mit Alternativbegriffen das richtige Ergebnis finden. In

dieser Ansicht können Fachbereiche Synonyme bequem verwalten. Die Bereitstellung der

Synonyme können automatisiert z. B. auch aus Fremdsystemen erfolgen.

Seite 12

LWS: Suchfeatures

Ob Facetten, Auto-suggest (Type-ahead), Nutzung der Synonyme u. v. m. verwendet werden sollen,

kann in der folgenden Übersicht eingestellt werden.

Seite 13

LWS: Suche

Den indexierten Datenbestand kann man sofort testen. Je nach Konfiugration können hier neben der

Qualität der Suchergebnisse solche Funktionen wie z. B. Auto-suggest, Facetten, Meinten Sie…?,

ähnliche Dokumente, u. s. w. sofort getestet werden.

Auto-suggest Beim Tippen werden vorhandene

Begriffe angezeigt.

Ergebnisliste Mit Alert-Funktion, Facetten, ähnliche

Dokument, etc.

Seite 14

LWS: Berechtigungen

In LWS können Rechte für das Finden und Lesen von Dokumenten pro Collection bequem verwaltet

werden. Die Rechteverwaltung kann sowohl Gruppen-basiert wie auch ACL-basiert (Access Control

List wie sie z. B. bei Freigabeverzeichnissen vorhanden sind) geschehen.

Seite 15

LWS: Zeitplan für das Indexieren

In LWS können Zeitpläne für das Indexieren pro Collection bequem verwaltet werden. Die Einstellung

eines Zeitplans ist immer dann sinnvoll, wenn Datenquellen periodisch und automatisch indexiert

werden sollen.

Seite 16

Kombiniert mit der semantischen Technologieplattform Smartlogic Semaphore

können dank automatischer Klassifikation insbesondere von unstrukturierten Inhalten

intelligente Suchlösungen realisiert werden, die Mitarbeiter beim Suchen entlasten!

Seite 17

Semaphore: Intelligente Suche dank Klassifikation

Dank extrahierter /Metadaten können Suchen

mit intelligentem Auto-Suggest, Topics und

Facetten realisiert werden.

Vorteil: Mitarbeiter finden relevante

Informationen – anders als bei Google - im

Bruchteil einer Sekunde!

Curt-Frenzel-Str. 12

D-86167 Augsburg

info@shi-gmbh.com

www.shi-gmbh.com

LucidWorks Search 2.1 Augsburg, 13. November 2012

Recommended