Intelligente Such-Technologie versteht Dokumenteninhalte Detail - Computerwelt

Computerwelt: Aktuelle IT-News Österreich


09.11.2009 pi/Rudolf Felser

Intelligente Such-Technologie versteht Dokumenteninhalte

Die Suche im Internet oder in digitalen Archiven lässt Nutzer oft verzweifeln. Gefragt sind intelligente Lösungen, die Dokumente verstehen können.

Die Produktion elektronischer Dokumente nimmt weltweit rasant zu, sowohl innerhalb von Organisationen als auch im Internet. Allein bei Google sind über acht Milliarden Internet-Seiten indexiert. Rund 80 Prozent der Informationen, über die Unternehmen verfügen, liegen heute in unstrukturierter Form digital als Word-Texte, XML-Dateien, PDFs, Emails, Präsentationen oder Web-Seiten vor. Sie sind oft an verschiedenen Orten gespeichert. Viele dieser elektronischen Dokumente enthalten geschäftskritische Informationen, die über Märkte, Wettbewerber, Produkte oder Forschungsvorhaben Auskunft geben können. Informationen stellen somit ein Unternehmenskapital dar, das über den Geschäftserfolg wesentlich mitentscheidet.

Dieses Wissenspotential gilt es zu erschließen und wertschöpfend zu nutzen. Jedoch treibt die Informationssuche im Internet oder in elektronischen Dokumentenarchiven die Rechercheure nicht selten zur Verzweiflung. Die eingesetzten Systeme suchen schlicht nach Zeichenfolgen, ohne deren inhaltliche Bedeutung zu verstehen. So bleibt es den Anwendern überlassen, mühsam die Spreu vom Weizen zu trennen und innerhalb endloser Trefferlisten die wichtigen Informationen zwischen irrelevanten Dokumenten zu identifizieren.

Andererseits: Wer mit den falschen Stichworten sucht, wundert sich häufig über die magere Ausbeute. Moderne Such-Technologien sollen Organisationen nun dabei helfen, in der Masse der Dokumente schnell, einfach und kostengünstig die relevanten Informationen aufzuspüren. Gartner prognostiziert, dass der Markt für "Enterprise Search"-Technologien weltweit bis 2012 von 860 Mio. Dollar im Jahr 2007 auf 1,5 Mrd. Dollar wachsen wird.

Vielen Unternehmen fehlt heute der Überblick über ihr Wissenspotential. Elektronische Archive und Dokumenten-Management-Systeme (DMS) helfen zwar bei der Verwaltung digitaler Dokumente, führen aber bei der Erschließung von Wissen nicht wesentlich weiter. Denn "Wissen" entsteht häufig erst durch das Zusammensetzen vieler einzelner Informationsbausteine zu einem "Gesamtbild". Das kostet Zeit und Geld, denn schon heute benötigen Wissensarbeiter 1,5 Arbeitstage pro Woche allein für die Suche nach Informationen. Dabei können sie nicht einmal sicher sein, jeweils alle relevanten Dokumente auch tatsächlich gefunden zu haben.

TECHNOLOGIE VERSTEHT DOKUMENTE Systeme, die zur Dokumentenverwaltung konzipiert sind, setzen bei der thematischen Kategorisierung digitaler Inhalte meist manuelle Vorarbeiten voraus, wie zum Beispiel die Zuordnung bestimmter Schlagworte oder die Verlinkung von Dateien. In Organisationen mit hohem Dokumentenaufkommen erweisen sich solche manuellen Verfahren meist als "Flaschenhals", der die rasche Bereitstellung geschäftskritischer Informationen beeinträchtigt. Gefragt sind daher intelligente Lösungen, die den Prozess der Informationsgewinnung weitgehend automatisieren und aus riesigen unstrukturierten Datenbeständen die jeweils relevanten Informationen selbstständig herausfiltern und zusammentragen können. Genau an dieser Stelle setzen Such- und Wissensmanagement-Technologie wie jene des Schweizer Unternehmens Infocodex an, die auf der Grundlage modernster semantischer und informationstheoretischer Methoden entwickelt wurde.

"Dreh- und Angelpunkt unserer Technologie ist die Fähigkeit, den Inhalt unstrukturierter Dokumente aller Art selbstständig zu verstehen", erläutert Paul Wälti, Geschäftsführer von Infocodex und - gemeinsam mit Carlo A. Trugenberger - Gründer des Unternehmens. "Enthält ein Dokument zum Beispiel den Begriff 'Blatt', erkennt das Infocodex-System, ob es sich um ein Blatt Papier oder das Blatt einer Pflanze handelt. Im Unterschied zu anderen Systemen benötigt unsere Lösung hierfür auch kein aufwändiges Training und ist sofort produktiv nutzbar", verspricht Wälti. Nach rascher Installation durchforstet das System unermüdlich unternehmensweite Netzwerke, Archive, Mailboxen oder auch das Internet, liest und analysiert unstrukturierte Dokumente einschließlich Email-Anhängen, und kategorisiert die Dokumente automatisch nach sachlogischen Kriterien. Inhaltlich zusammenhängende Dokumente werden wie in einem neuronalen Netz zueinander in Beziehung gesetzt, Informationen aus unterschiedlichsten Quellen zusammengetragen und konsolidiert. Dabei zeigt sich die Suchtechnologie als echtes Sprachtalent, denn Suchen und Kategorisierungen erfolgen sprachübergreifend: Neben Deutsch werden Englisch, Französisch, Italienisch, Spanisch und demnächst auch Holländisch unterstützt, eine Leistung, die sich sehen lassen kann und die laut Angaben des Herstellers "derzeit kein anderes System am Markt bieten kann". Dank der multi-lingualen Fähigkeiten erkennt die Infocodex-Lösung auch, dass die englische Übersetzung eines deutschen Dokuments den gleichen Inhalt hat wie das Original.

UNSCHARFE SUCHEN Eminent wichtig ist die Möglichkeit, sogenannte unscharfe Suchen durchzuführen, etwa, wenn sich die Anwender über die genauen Suchbegriffe nicht schlüssig sind. Wer mit dem Infocodex-System zum Beispiel nach dem Begriff "Schiffsverkehr" sucht, erhält als Resultat auch inhaltlich relevante Dokumente zum Thema "Seetransporte", "Schifffahrtsrouten" oder "Frachtaufkommen". Eine große Erleichterung bei der Auswertung der Suchergebnisse ist die automatische Generierung von Abstracts mit den Kernaussagen der einzelnen gefundenen Dokumente. So können sich die Anwender schnell einen Überblick über die jeweiligen Inhalte verschaffen. Dokumente mit sehr ähnlichen Inhalten gruppiert das System in entsprechende Dokumentenfamilien und verkürzt dadurch die Trefferlisten, da beispielsweise zehnfach vorliegende Dokumente zu einer einzigen Position zusammengefasst werden. Generell hat Infocodex großen Wert auf eine benutzerfreundliche Präsentation von Informationen gelegt. Mit Hilfe einer elektronischen Informations-Landkarte (Cluster Map) erhalten Unternehmen nach Sachgebieten geordnet auch eine Gesamtübersicht über die Topographie des firmeneigenen Wissens.

Dass sich für ein leicht bedienbares System, welches sich auf die selbstständige inhaltliche Analyse digitaler Dokumente versteht, vielfältige Verwendungszwecke bei Wissensmanagement und Monitoring ergeben, liegt auf der Hand. So können Unternehmen mit der Infocodex-Lösung zum Beispiel alte mit neuen Forschungsvorhaben, Produktentwicklungen mit Marktbedürfnissen, frühere mit heutigen Verträgen, Angebote mit Kundenprofilen oder Aufgabenstellungen mit Personalqualifikationen abgleichen (Content Matching). Das automatische Erkennen von Veränderungen und neuen Fakten prädestiniere das System laut dem Hersteller auch für den Einsatz zur Markt- und Wettbewerbsbeobachtung sowie für nachrichtendienstliche Aufgaben.

Dass sein Infocodex-System auch die Neugierde potentieller Wettbewerber wecken könnte, betrachtet Paul Wälti gelassen, denn: "Nach den vielen Jahren intensiver Forschungs- und Entwicklungsarbeit haben wir unsere Technologie in Europa und den USA patentieren lassen". (pi/rnf)

Diesen Artikel

Bewertung:

Übermittlung Ihrer Stimme...
Noch nicht bewertet. Seien Sie der Erste, der diesen Artikel bewertet!
Klicken Sie auf den Bewertungsbalken, um diesen Artikel zu bewerten.
  Sponsored Links:

IT-News täglich per Newsletter

E-Mail:
Weitere CW-Newsletter

CW Premium Zugang

Whitepaper und Printausgabe lesen.  

kostenlos registrieren

Aktuelle Praxisreports

(c) FotoliaHunderte Berichte über IKT Projekte aus Österreich. Suchen Sie nach Unternehmen oder Lösungen.

Service

Acceptance Testing: Trotz knapper Ressourcen

Zum Thema

  • NAVAX Unternehmensgruppe

    NAVAX Unternehmensgruppe Wasser- und Energieversorgung, Vereine und Verbände, Öffentliche Verwaltung, Medizin und Gesundheitswesen, Maschinen- und Anlagenbau, Konsumgüterindustrie, Immobilien,... mehr
  • Dimension Data Austria GmbH

    Dimension Data Austria GmbH Call Center, IKT-Consulting, Migrations-Management, Outsourcing, Systemintegration und Systemmanagement, Systempflege- und Wartung mehr
  • adesso Austria GmbH

    adesso Austria GmbH Öffentliche Verwaltung, Grundstoffindustrie, Großhandel, Finanzdienstleistungen, Fertigung, Produktion und Konstruktion, Druck- und Verlagswesen, Qualitätssicherung,... mehr
  • MIC – managing international customs & trade compliance

    MIC – managing international customs & trade compliance Supply Chain Management, Kaufmännische Software (ERP), Expertensysteme, E-Procurement und Supply Chain Management, B2B Dienste und Lösungen mehr

Hosted by:    Security Monitoring by: