Nationalbibliothek archiviert das österreichische Internet Detail - Computerwelt

Computerwelt: Aktuelle IT-News Österreich


13.03.2009 apa/Oliver Weiss

Nationalbibliothek archiviert das österreichische Internet

Die Österreichische Nationalbibliothek archiviert ab heuer das österreichische World Wide Web. Dazu gehören alle Websites mit einer .at-Endung.

Wer in ein paar Jahrzehnten die Urlaubs-Schnappschüsse seiner Großeltern sucht, könnte diese an einem unerwarteten Ort finden: in der Österreichischen Nationalbibliothek (ÖNB). Denn dort wird ab heuer das "österreichische" World Wide Web archiviert. Dazu gehören alle Websites mit einer ".at"-Endung - also neben Nachrichtenportalen, offiziellen Websites und Firmen-Homepages u.a. auch private Blogs und Online-Fotoalben. "Wir können nicht wissen, was unsere Nachfolger einmal interessieren wird", sagte die Leiterin der Hauptabteilung "Digitale Bibliothek" in der Nationalbibliothek, Bettina Kann.

Die Nationalbibliothek wird nach einer diesbezüglichen Novelle im Mediengesetz, die am 1. März in Kraft getreten ist, künftig ein- bis zweimal im Jahr alle österreichischen Webseiten automatisch aufrufen, die dort veröffentlichten Daten auslesen und auf eigenen Speichermedien archivieren. Rund 800.000 Webseiten mit der Endung ".at" werden erfasst, dazu kommen noch Adressen mit anderen Endungen wie ".eu", ".org" oder ".net", die einen eindeutigen Österreich-Bezug haben. Nachrichtenseiten und andere Websites von größerem Interesse sollen täglich ausgelesen werden.

80 TERABYTE IN FÜNF JAHREN Im Herbst soll der erste vollständige "Crawl" stattfinden, also das erste automatisierte Sammeln der Daten des österreichischen Webs. Wie groß diese Datenmenge sein wird, kann trotz zweimaliger Probeläufe (2008 bei der Fußball-Europameisterschaft und bei der Nationalratswahl) nicht genau gesagt werden, so Kann. Man schätzt, dass das Archiv nach fünf Jahren rund 80 Terabyte an Daten umfasst. Die Daten werden nicht in der Nationalbibliothek, sondern im Bundesrechenzentrum gespeichert und gepflegt.

Einen nicht geringen Anteil daran dürften persönliche Homepages ausmachen. Ob Privates wie etwa Urlaubsfotos aus den norditalienischen Touristen-Hochburgen wissenschaftlichen Wert hat, ist für Kann nicht die entscheidende Frage. So habe man auch bisher "so viel wie möglich" an publizistischem Schaffen gesammelt. "Vielleicht gibt es tatsächlich jemanden, der einmal genau danach recherchieren will: Wie war das Bild von Bibione im Jahr 2009, was war der touristische Eindruck."

WEB-SCHNAPPSCHÜSSE BEI BEDEUTENDEN EREIGNISSEN Das Archiv wird sich den großen und kleinen Dingen widmen: Gemeinsam mit anderen europäischen Nationalbibliotheken wird die kommende EU-Wahl am 7. Juni als sogenanntes "Event-Harvesting" dokumentiert: Einen derartigen Web-"Schnappschuss" soll es künftig immer wieder über die regelmäßige Archivierung hinaus bei bedeutenden Ereignissen geben.

Dass man bei automatischer Erfassung unweigerlich auch viel Datenmüll mitsammelt, wird in Kauf genommen: "Wir wollen einen Eindruck davon geben, wie das Web im Jahr 2009 in Österreich tatsächlich ausgesehen hat." Eine lückenlose Dokumentation sei jedoch nicht zu schaffen. Insbesondere die immer häufiger verwendeten Multimediadateien - Filme auf Videoplattformen, Flash-Animationen, Musikstücke - stellen nicht nur wegen der Datenmenge eine Herausforderung für die Sammler da. Wie Video- oder Animations-Formate für künftige Generationen zugänglich gehalten werden sollen, wenn die dazugehörige Abspielsoftware nicht mehr erhältlich ist, sei eine offene Frage. "Uns geht es dezidiert um Wort und Bild", schränkt Kann ein.

Diese Daten regelmäßig in aktuelle Formate zu migrieren, um die Abspielbarkeit zu erhalten, oder als Alternative auch die Abspielsoftware mitzuarchivieren, sei auch eine Kostenfrage. "Die Kosten fallen nicht nur bei der Erstspeicherung an. Das geht über Jahre hinweg." Wie groß diese Kosten insgesamt werden, darüber "fehlen noch die Langzeit-Erfahrungswerte". Man müsse "klar sagen: Es wird nicht gelingen, alles lesbar zu halten." Ein großes Ressourcen-Problem seien auch die Indexes, die die gespeicherten Daten durchsuchbar machen, schildert Kann. Auch dadurch fallen große Datenmengen an.

Diesen Artikel

Bewertung:

Übermittlung Ihrer Stimme...
Noch nicht bewertet. Seien Sie der Erste, der diesen Artikel bewertet!
Klicken Sie auf den Bewertungsbalken, um diesen Artikel zu bewerten.
  Sponsored Links:

IT-News täglich per Newsletter

E-Mail:
Weitere CW-Newsletter

CW Premium Zugang

Whitepaper und Printausgabe lesen.  

kostenlos registrieren

Aktuelle Praxisreports

(c) FotoliaHunderte Berichte über IKT Projekte aus Österreich. Suchen Sie nach Unternehmen oder Lösungen.

Zum Thema

  • T-Systems Austria GesmbH

    T-Systems Austria GesmbH WLAN-Systeme, VPN, Voice Mail Dienste, Videokonferenz-Systeme, Unified Messaging Dienste, Netzwerk-Systeme (LAN, MAN, WAN), Netzwerk-Management,... mehr
  • Dimension Data Austria GmbH

    Dimension Data Austria GmbH Call Center, IKT-Consulting, Migrations-Management, Outsourcing, Systemintegration und Systemmanagement, Systempflege- und Wartung mehr
  • KORAM Softwareentwicklungsgesellschaft m.b.H:

    KORAM Softwareentwicklungsgesellschaft m.b.H: Betriebsdaten- und Zeiterfassung, Kaufmännische Software (ERP), Management Informationssysteme (MIS), Bauwesen, Einzelhandel, Fertigung, Produktion und Konstruktion, Freie Berufe,... mehr
  • SEQIS GmbH

    SEQIS GmbH Qualitätssicherung, Expertensysteme, Tools, Security Audits, E-Commerce-Software, B2B Dienste und Lösungen, Übernahme von Softwareprojekten,... mehr

Hosted by:    Security Monitoring by: