Landesbibliothek Teßmann baut an europaweitem digitalem Zeitungsarchiv mit

02.10.2012 | e-Business

Um den Zugang zu historischen Zeitungen zu vereinfachen und zugleich das von der Zersetzung bedrohte Papiermaterial zu schonen, haben zahlreiche Bibliotheken und andere Einrichtungen in den letzten Jahren damit begonnen, große Zeitungsbestände einzuscannen und ihren Benutzern und Benutzerinnen in digitaler Form zur Verfügung zu stellen.

Die Landesbibliothek Teßmann hat zwischen 2006 und 2011 etwa eineinhalb Millionen Zeitungsseiten digitalisiert, die sie seit 2010 über das eigene Portal “DZA – Digitales Zeitungsarchiv” bereitstellt. Die Technik von Alpin stellt nicht nur die Benutzeroberfläche für Navigation und Visualisierung bereit, sondern erbringt auch die Dienste für die langfristige Archivierung der Digitalisate und die automatische Aufbereitung der Daten in unterschiedlichen Auflösungen für eine Internet und Intranet-Publikation. Über 40 Zeitungen und Zeitschriften aus dem Raum des historischen Tirols werden über dieses Portal vorgestellt und können über eine Titelliste oder über die Kalendernavigation angesteuert werden.

Seit Kurzem freigeschaltet ist auch der Bereich „Grafiken“ und „Bücher“, mit der einmalige historische Werke einer breiten Öffentlichkeit zugänglich gemacht werden. Für Forscher interessant: sämtliche Werke lassen sich nicht in einer angepassten Webauflösung betrachten, können dann aber – mit Mengenbegrenzung – auch in einer hochauflösenden Variante heruntergeladen werden. Die innovative Technik von Alpin rechnet die Originaldaten dabei in Echtzeit in günstigen PDF Formaten um.

Die Landesbibliothek Teßmann beteiligt sich mit weiteren 16 Partnereinrichtungen am EU-Projekt “Europeana Newspapers – A Gateway To Newspapers Online”; dieses hat sich die Optimierung und Vereinfachung der Recherche in digitalisierten historischen Zeitungsseiten zum Ziel gesetzt.

Dazu werden die digitalisierten Seiten unter anderem mit einer Software für automatisierte Texterkennung (OCR – Optical Character Recognition) und für Artikelsegmentierung (OLR – Optical Layout Recognition) bearbeitet, wodurch die digitalisierten Zeitungen einerseits volltextdurchsuchbar werden und andererseits auch die gewünschte Position eines Stichworts im Text angegeben werden kann, indem man etwa nur jene Treffer anzeigen lässt, in denen sich das gesuchte Wort in der Schlagzeile oder im Vorspann eines Zeitungsartikels befindet.

Zum Abschluss des EU-Projekts werden die beteiligten Bibliotheken über 18 Millionen digitalisierte, für die Recherche verfeinerte Zeitungsseiten zur freien Nutzung über das europäische Online-Kulturportal Europeana bereitstellen.

Die Landesbibliothek Teßmann wird dann ihrerseits die technisch für eine optimierte Recherche aufbereiteten Zeitungsseiten in das landesbibliothekseigene Portal “Digitales Zeitungsarchiv” einspielen und damit die gezielte Suche im digitalisierten Zeitungsbestand ermöglichen.

Am EU-Projekt sind neben der Landesbibliothek “Friedrich Teßmann” auch die Staatsbibliothek zu Berlin, die National Library of the Netherlands, die National Library of Estonia, die Österreichische Nationalbibliothek, die Universität Innsbruck, die University of Helsinki, die National Library of Finland, die Staats- und Universitätsbibliothek Hamburg, die Bibliothèque Nationale de France, die National Library of Poland, die CCS Content Conversion Specialists GmbH, die LIBER Foundation, die National Library of Latvia, die National Library of Turkey, die University of Beograd, The British Library, die University of Salford und The European Library beteiligt.

Weitere News: Enterprise Content Management - e-Business - Software Entwicklung