Automatisierte Analyse unstruktierter Daten Detail - Computerwelt

Computerwelt: Aktuelle IT-News Österreich


27.02.2009 Rudolf Felser

Automatisierte Analyse unstruktierter Daten

Mit einer neuen Softwarelösung will SAS un- oder teilstrukturierte Daten in strategische Unternehmenssoftware einbinden.

Mit einer neuen Softwarelösung will der Business-Analytics-Anbieter SAS un- oder teilstrukturierte Daten in strategische Unternehmenssoftware einbinden. SAS Content Categorization kann dem hersteller zufolge Texte aus Anwendungen, Aufzeichnungen, Geschäftsprozessen, Blogs oder Wikis automatisiert entschlüsseln, kategorisieren und mit Metadaten versehen. Die neue Lösung wurde von der SAS Tochter Teragram entwickelt, die sich mit Technologien für die Verarbeitung natürlicher Sprache beschäftigt.

Anwender sollen mittels einer intuitiv bedienbaren grafischen Oberfläche ein nach Kategorien und Konzepten gegliedertes Informationssystem aufbauen (Taxonomie) können. Benutzerdefinierte Regeln sorgen dafür, dass die einzelnen Dokumente entsprechend zugeordnet werden können. SAS Content Categorization erlaubt dabei auch die Zusammenarbeit mehrerer Experten an einem Projekt.

Die SAS-Lösung sei in der Lage, große Mengen an Textinformationen zu analysieren und dabei redundante Informationen zu erkennen und zu eliminieren, verspricht das Unternehmen. Sie "versteht" 30 verschiedene Sprachen, sodass Unternehmen auch mehrsprachige Inhalte verarbeiten können und nutzt komplexe linguistische Verfahren, um eindeutig identifizierbare Begriffe zu finden, Klassifizierungsregeln aufzustellen und Dokumente zuzuordnen. Auf diese Weise könnten Unternehmen Zeitaufwand und Kosten für die Kategorisierung von Textinformationen deutlich reduzieren.

Der B2B-Informationsdienstleister Reed Business beispielsweise verarbeitet mit einem Taxonomiesystem Milliarden von Dokumenten - darunter Informationen zu 14 Millionen Unternehmen, vielen Millionen Menschen und Tausenden von Produktkategorien und Themen. Das Unternehmen verbessert damit die Suchergebnisse auf seiner Website.

"Renommierte Unternehmen wie AP, CNN, eBay, forbes.com, NYTimes Digital, Sony, die Weltbank oder Yahoo beziehen auch unstrukturierte Daten in ihre Analysen mit ein - Informationen zu Kunden, Marktchancen, ihr operatives Geschäft, ihre Lieferketten. Wir sorgen dafür, dass ihnen schnell und zuverlässig die Informationen zur Verfügung stehen, die sie für ihre Entscheidungen benötigen", erklärt Yves Schabes, President und Mitgründer von Teragram. "Unsere leistungsstarken Verfahren für die Kategorisierung von Content sind das Herzstück der neuen SAS-Lösung. Mit ihnen können Unternehmen auch ihre unstrukturierten Daten optimal nutzen." (rnf)

Diesen Artikel

Bewertung:

Übermittlung Ihrer Stimme...
Noch nicht bewertet. Seien Sie der Erste, der diesen Artikel bewertet!
Klicken Sie auf den Bewertungsbalken, um diesen Artikel zu bewerten.
  Sponsored Links:

IT-News täglich per Newsletter

E-Mail:
Weitere CW-Newsletter

CW Premium Zugang

Whitepaper und Printausgabe lesen.  

kostenlos registrieren

Aktuelle Praxisreports

(c) FotoliaHunderte Berichte über IKT Projekte aus Österreich. Suchen Sie nach Unternehmen oder Lösungen.

Zum Thema

  • ELO Digital Office AT GmbH

    ELO Digital Office AT GmbH Mobile Lösungen und Applikationen, Dokumentenmanagement und ECM, Übernahme von Softwareprojekten, Systemintegration und Systemmanagement, Programmierung, Individual-Softwareentwicklung, IKT-Consulting,... mehr
  • selectyco Media Solutions GmbH

    selectyco Media Solutions GmbH B2C Dienste und Lösungen, B2B Dienste und Lösungen mehr
  • Dicom Computer VertriebsgesmbH

    Dicom Computer VertriebsgesmbH WLAN-Systeme, VPN, Netzwerk-Systeme (LAN, MAN, WAN), Netzwerk-Management, Netzwerk-Diagnose-Systeme, Netzkomponenten, Mobile Lösungen und Applikationen,... mehr
  • free-com solutions gmbh

    free-com solutions gmbh Werbewirtschaft, Wasser- und Energieversorgung, Vereine und Verbände, Umweltschutz, Touristik, Personenverkehr, Öffentliche Verwaltung,... mehr

Hosted by:    Security Monitoring by: