Vernetzung statt Datengau im Zeitalter von "Big Data" Detail - Computerwelt

Computerwelt: Aktuelle IT-News Österreich


09.05.2011 Marion Fugléwicz-Bren*

Vernetzung statt Datengau im Zeitalter von "Big Data"

Abhilfe im Informationschaos versprechen semantische Technologien.

Kennen Sie das? Dateninseln, unterschiedliche Metadaten-Schemata oder Vokabulare im professionellen Informationsmanagement. Babylonische Sprachverwirrung? Hoher Zeitaufwand? Frustration nach fehlgeschlagenen Suchvorgängen? Kein Wunder. Abhilfe versprechen hier semantische Technologien. "Wer ein Thema recherchiert oder Informationen zu verschiedenen detaillierten Sachverhalten aus einer Firma braucht, merkt rasch – sei es im Unternehmen oder im Internet – die unangenehme Nebenwirkung: Informationsbestände liegen unterschiedlich strukturiert (XML, Datenbanken) oder auch unstrukturiert (als Word, PDF etc.) vor, und können daher nicht einfach integriert oder mit Hilfe eines Volltext-Index durchsuchbar gemacht werden. Aus Zeitgründen suchen Mitarbeiter daher oft nur oberflächlich, erzielen aber nur selten das bestmögliche Ergebnis", erzählt Andreas Blumauer, Geschäftsführer der Semantic Web Company in Wien aus Erfahrung. So stellte er sich gemeinsam mit Kollegen und Geschäftspartnern der punkt.netServices, einem Spezialisten für Semantic Web Anwendungen und Suchmaschinen, vor einigen Jahren die Frage: Wie wäre es, zu finden, was man sucht? Gemeinsam machte man sich an die Entwicklung einer plattformunabhängigen Lösung: "Wir nannten sie die PoolParty Produktfamilie." Dabei geht es darum, unterschiedlichste Datenbestände intelligent zu strukturieren, zu verknüpfen und durchsuchbar zu machen. "Die Daten werden zudem semantisch angereichert, was die Suche vereinfacht und dem Suchergebnis mehr Kontextinformation verschafft". Heute zählen renommierte Konzerne wie Roche, Credit Suisse oder die Telekom Austria zu den Kunden des Software-Produkts.

WO LIEGT DER NUTZEN? Klassische relationale Datenbanksysteme sowie Statistik und Visualisierungstools sind oft nicht in der Lage, die riesigen Datenmengen – in der Fachsprache "Big Data" genannt, für eine sinnvolle Weiterverarbeitung aufzubereiten. In Zusammenhang mit dem Begriff "Open Data" – einer Philosophie und Praxis, die auf der Grundidee beruht, dass vorteilhafte Entwicklungen eingeleitet werden, wenn Daten für jedermann frei zugänglich gemacht werden – bedeutet "Big Data" zunächst einfach "more Data" – und dieses "Mehr" an Daten ist ad hoc eine erschreckende Vorstellung. Dass das "Mehr" als Steigerung von "viel" aber auch mit Vielfalt zu tun hat, ist die andere Seite der Medaille. Und von dieser Vielfalt profitieren Bürger wie auch Unternehmen in vielerlei Hinsicht, sofern sie diese nützen: Die Abermillionen irrelevanter Daten werden ausgeblendet, wenn das System die Anfrage des Anwenders versteht. Die Zeiten des Konvertierens, Umformens und Anpassens sind vorbei, denn es gibt ein standardisiertes Datenformat, auf das Entwickler zugreifen können. Diese Standards – etwa RDF und RDFa - wurden vom renommierten W3C entwickelt, dem internationalen Konsortium zur Standardisierung von World Wide Web-Techniken. Auch Google wendet diese Standards an, etwa bei der Kochrezept-Suche Recipe Search.

"Die Daten, die von Maschinen gelesen werden und daher einfach und problemlos weiterverarbeitet werden können, lassen sich in Folge auch miteinander verknüpfen und werden somit zu Linked Data", so Andreas Blumauer, wodurch auch klarer wird, wohin die Reise mit der vielzitierten semantischen Suche geht. "Beim Einsatz unserer Suchsysteme profitieren Anwender von Eingabehilfen wie Auto-Complete, der so genannten 'facettierten Suche' oder von Vorschlägen für ähnliche verfügbare Informationen. Die Möglichkeit, über eine einzige Suchanwendung auf unterschiedliche und kontextualisierte Informationsquellen zugreifen zu können, führt Unternehmen in ein semantisches Zeitalter des Informationsmanagements. PoolParty ist dabei europaweit ein Vorreiter – und wurde in Österreich entwickelt."

POOLPARTY IN KÜRZE Mit dem PoolParty Thesaurus Manager werden kontrollierte Vokabulare und Thesauri auf Basis von W3C Standards aufgebaut. Der heterogene Sprachgebrauch (Synonyme, Mehrdeutigkeiten, Mehrsprachigkeit, etc.) im Unternehmen wird so harmonisiert und die vielfältigen Beziehungen zwischen Themen und Geschäftsobjekten (Produkte, Projekte, Standorte, etc.) können als Hintergrundwissen in Suchszenarien einbezogen werden. Der PoolParty Extraktor dient zur Datenintegration und "mappt" unterschiedliche XML-Schemata sowie Metadaten-Werte auf einen zentralen Unternehmens-Thesaurus. Damit können auch unstrukturierte Datenbestände (Word, PDF, etc.) hinsichtlich signifikanter Themen und Geschäftsobjekten automatisiert analysiert werden (Text Mining) und so wird der Datenbestand um weitere Bedeutungsebenen angereichert. Der PoolParty Semantic Indexer & Search Server erlaubt die strukturierte Abfrage mittels einer zentralen Suchlösung über zuvor nicht oder nur lose verbundene Datenquellen. Mehr Infos unter poolparty.punkt.at – mit Videobeispielen.

KOSTENLOSES WEBINAR: SEMANTISCHE SUCHE Ein kostenloses Webinar zum Thema "Semantische Suche" findet am 1. Juni um 16:00 statt – 45 Minuten lang beantworten die Experten die Anfragen von Interessenten – hier geht's zur Registrierung.

* Marion Fugléwicz-Bren ist freie Autorin in Wien.

Diesen Artikel

Bewertung:

Übermittlung Ihrer Stimme...
Noch nicht bewertet. Seien Sie der Erste, der diesen Artikel bewertet!
Klicken Sie auf den Bewertungsbalken, um diesen Artikel zu bewerten.
  Sponsored Links:

IT-News täglich per Newsletter

E-Mail:
Weitere CW-Newsletter

CW Premium Zugang

Whitepaper und Printausgabe lesen.  

kostenlos registrieren

Aktuelle Praxisreports

(c) FotoliaHunderte Berichte über IKT Projekte aus Österreich. Suchen Sie nach Unternehmen oder Lösungen.

Zum Thema

  • eyepin GmbH

    eyepin GmbH Application Service Providing, Auftragsentwicklung für Software, Individual-Softwareentwicklung, Programmierung, Übernahme von Softwareprojekten mehr
  • Anexia

    Anexia Application Service Providing, Auftragsentwicklung für Software, Individual-Softwareentwicklung, RZ-Dienstleistungen, Übernahme von Softwareprojekten, User Helpdesk-Systeme und Hotlines mehr
  • VOQUZ Technologies GmbH

    VOQUZ Technologies GmbH Öffentliche Verwaltung, Maschinen- und Anlagenbau, Finanzdienstleistungen, Qualitätssicherung, Product Lifecycle Management (PLM), Mobile Lösungen und Applikationen, Management Informationssysteme (MIS),... mehr
  • Arrow ECS Internet Security AG

    Arrow ECS Internet Security AG WLAN-Systeme, VPN, Netzwerk-Systeme (LAN, MAN, WAN), Netzwerk-Management, Netzwerk-Diagnose-Systeme, Netzwerk-Betriebssysteme, Office Software,... mehr

Hosted by:    Security Monitoring by: