Wanted

Einsatz von Suchmaschinen in Unternehmen

Armin Singer

Mit herkömmlichen IT-Mitteln lässt sich der steigende Informationshunger bei gleichzeitig wachsender Informationsmenge in Unternehmen immer weniger befriedigen. Selbstbedienung bei der Informationsbeschaffung wird gefordert – das Internet macht es uns vor. Nichts liegt also näher, als das erfolgreiche Konzept der Internetsuchmaschinen auch zur Suche und Recherche innerhalb eines Unternehmens anzuwenden. Dieser Artikel zeigt auf, worin sich Internetsuchmaschinen wie Google grundlegend von unternhmensweiten Suchmaschinen unterscheiden und wie die Firma Semantec Anforderungen an eine solche Lösung mit ihrer Suchmaschine DirectInfo umgesetzt hat.

Die elektronisch gespeicherte Informationsmenge in Unternehmen wächst rapide, nicht zuletzt durch die vom Gesetzgeber vorgeschriebene Aufbewahrungspflicht elektronischer Dokumente (wie z.B. GDPdU) und damit auch die Anzahl informationsspeichernder Anwendungen (DMS, CRM, CMS, ERP, MIS, E-Mail-Server, Portale etc.). Ineffiziente und nicht vereinheitlichte Systeme machen den Zugriff auf die gespeicherten Informationen kompliziert, langsam und teuer. Anspruchsvolle Zugriffsroutinen auf Informationsquellen erfordern immer noch ausgiebiges Training, welches dann aber oft genug ausfällt. Fusionen, Allianzen und die zunehmende Einbindung in Partnerschaftsnetze lassen Unternehmen sich immer häufiger die Frage stellen: „Können wir es uns überhaupt noch leisten, alle unsere Partner mit allen unseren Systemen vertraut zu machen?“

Hoher Zeitaufwand für Anwendungsschulungen, Mehrfachspeicherung identischer Information und Unkenntnis über das Vorhandensein wichtiger Daten sind die Folgen. Akkurat vorliegende Informationen werden dann oft durch Annahmen ersetzt, was später zu erheblichen Fehlern oder Fehlentscheidungen führen kann. Business-Analysten schätzen den Zeitaufwand, den moderne, so genannte Knowledge-Unternehmen für die Informationsbeschaffung aufwenden, bereits auf bis zu 50 Prozent der gesamten Arbeitszeit, Tendenz steigend. Eine Selbstbedienung bei der Informationsbeschaffung scheint nicht mehr möglich. Erfreulicherweise stellen heute moderne Lösungen Informationen einfach, effizient und genau zum richtigen Zeitpunkt zur Verfügung. Aktuelle Suchmaschinentechnologien machen dies möglich.

Suchmaschine in Unternehmen

Der breite Einsatz und die Akzeptanz von unternehmensweit eingesetzten Webservern in Kombination mit moderner Suchmaschinentechnologie zeigen, dass der Prozess der Informationsbeschaffung besser organisiert werden kann. Die Suchmaschine Google ist wahrscheinlich der bekannteste Einsatz von Suchmaschinentechnologie zur Informationsbeschaffung.

Funktionalität zur Suche von Informationen sollte zu einem wesentlichen und herausragenden Merkmal Ihres Informationssystems werden und nicht nur ein Anhängsel der IT-Anwendungen. Ein allgemeines, vereinheitlichtes Suchportal sollte den Zugriff auf sämtliche Informationen erlauben, unabhängig von deren Speicherort und Speicherformat.
Das Diagramm in Abbildung 1 zeigt schematisch, wie Semantecs Suchmaschine DirectInfo als ein vereinheitlichtes Suchportal Informationen unabhängig vom Speicherort, Speicherformat und über Anwendungen hinweg zur Verfügung stellt. DirectInfo unterstützt hierbei über 300 Dateiformate, der Volltextindex wird in einer Oracle-Datenbank gespeichert, die gleichzeitig als Laufzeitumgebung der Anwendung dient. Semantecs Lösung ist somit eine vollständig serverbasierte Anwendung, die clientseitig lediglich einen HTML-fähigen Browser benötigt.

Der Einsatz von Suchmaschinen auf Informationsquellen innerhalb eines Unternehmens unterscheidet sich teilweise grundlegend von Internetsuchmaschinen. Deshalb sind erfolgreiche Konzepte zur Suche im Internet nicht zwangsläufig auch für unternehmensweite Suchmaschinen erfolgreich. Nachfolgend werden nun die entscheidenden Unterschiede zwischen einer offenen Suche im Internet und einer geschlossenen Suche in unternehmenseigenen „Suchräumen“ dargestellt.

Abb. 1: Schematische Funktionsweise der Semantec-Suchmaschine DirectInfo
Bekannte Suchräume

Am Anfang der Informationsbeschaffung steht der Wunsch, Fragen durch Informationen zu beantworten. „Gibt es die dazu notwendige Information überhaupt?“ Mit dieser Grundfrage beginnt die Suche. Und sie ist erst dann beendet, wenn alle Fragen beantwortet sind.
Um herauszufinden, ob benötigte Informationen überhaupt vorliegen, muss der Suchende in der Lage sein, dem System mitteilen zu können, an welcher Information er interessiert ist. Unternehmenseigene Informationen stellen anders als im Internet bekannte Suchräume dar. Schon alleine aus diesem Grund liegt oft mehr Wissen über die gesuchte Information vor als lediglich ein oder zwei Suchbegriffe. So sind möglicherweise der Autor, das Dateiformat, das Alter der Information oder das Speichermedium (z.B. E-Mail) bekannt oder weitere so genannte Metadaten wie Stichworte, zugehöriges Projekt, Thema, Kommentare, usw. Eine unternehmensweite Suchmaschine muss es folglich dem Suchenden ermöglichen, all sein eigenes Wissen über die gesuchte Information mitteilen zu können (Abb. 2).

Abb. 2: Eingabeformular für Dateioptionen

Beispiel: Sie suchen nach den Preislisten Ihres Unternehmens, die als Excel-Dateien vorliegen, nicht älter als zwei Monate sind und von der Abteilung Vertrieb stammen. Jede Information, die Sie der Suchmaschine über Ihre Erwartungshaltung mitteilen, erhöht die Wahrscheinlichkeit, die richtigen (relevanten) Treffer zu erhalten und die Trefferliste zu reduzieren. Internetsuchmaschinen haben genau hier das größte Problem, nämlich unüberschaubare Ergebnislisten mit Tausenden oder Millionen von Treffern zu liefern, weil sie außer Suchbegriffen meist keine weiteren Kriterien zulassen.

Relevanzbetrachtung

Aufgrund der unbekannten Suchräume bieten Internetsuchmaschinen meist nur die Relevanzbetrachtung auf Basis statistischer Mittel, und selbst dieser Algorithmus wird nicht offen gelegt, sodass der Suchende keine Anhaltspunkte darüber hat, wie die Relevanz zustande kommt bzw. wie diese zu interpretieren ist. Nun kann aber z.B. der 489. Treffer in der Ergebnisliste genau die gesuchte Information enthalten. Um sicherzustellen, dass dieser Treffer weit vorne in der Trefferliste erscheint, muss eine unternehmensweite Suchmaschine folglich auch andere Sortierungen als ausschließlich nach statistischen Algorithmen, die lediglich eine Relevanz vorgaukeln, ermöglichen. DirectInfo erlaubt eine individuelle Sortierung nach allen Metadaten, aufsteigend oder absteigend. Auch kann das Ergebnis in Tabellenform angezeigt werden, wobei die Metadaten Tabellenspalten entsprechen und nach jeder Spalte sortiert werden kann (Abb. 3).

Abb. 3: Sortierung
Wiederauffinden/Recherche

Grundsätzlich lassen sich Suchanfragen in zwei Kategorien einteilen: dem „Wiederauffinden“ von (bekannten) Informationen, z.B. „Wo ist die PowerPoint-Präsentation, die ich letzte Woche für den Kunden XY erstellt habe?“ und einer offenen „Recherche“, also der Suche nach Informationen in beliebig vielen (unbekannten) Informationsquellen, z.B. „Welches Feedback gab uns der Kunde XY in den letzen 12 Monaten zu unseren Produkten A und B?“.

Beide Kategorien von Suchanfragen müssen durch Suchmaschinen unterstützt werden. Wie bereits geschildert ist es beim Wiederauffinden wichtig, der Suchmaschine möglichst viele bekannte Eigenschaften des Gesuchten mitzuteilen, um eine wirklich relevante und kleine Trefferliste zu erhalten. Die offene Recherche dagegen ist ein interaktiver Prozess, bei dem der Suchende in Zwischenschritten durch Suchresultate inspiriert wird und neue Erkenntnisse erhält, die wiederum im nächsten Prozessschritt als Input an die Suchmaschine zurückfließen. DirectInfo unterstützt diesen Prozess durch das so genannte „result set inspection“, also durch Informationen über eine Trefferliste, die als Zwischenergebnis vorliegt.

Beispiel: Sie recherchieren zum Thema „Fischer und Kohl“ und erhalten 500 Treffer (Zwischenergebnis). DirectInfo teilt Ihnen mit, dass 150 Treffer aus dem Suchraum „Kochrezepte“ stammen (result set inspection). Falls Sie an den beiden Politikern interessiert sind, können Sie den Suchraum „Kochrezepte“ im nächsten Schritt ausklammern (feedback) und haben damit die Trefferliste verkleinert und deutlich relevanter gemacht.
Selbstverständlich muss eine Suchmaschine für eine erfolgreiche Recherche auch themenbezogene und unscharfe Suche unterstützen sowie Suche nach Wortstämmen und phonetischen Ähnlichkeiten (z.B. Meyer, Mayer, Maier, Meier).

Geschrieben von
Armin Singer
Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.