Mikroverfilmung und elektronische Archivierung
Thomas Parschik: Durchführung von
Digitalisierungsprojekten in Bibliotheken
Bibliotheksdienst. Organ der Bundesvereinigung deutscher Bibliotheksverbände
(BDB), 40 (2006), Heft 12 (Dezember), S. 1421 - 1443
Rezensent Peter Toebak
Der Artikel basiert auf einer Diplomarbeit und behandelt
kursorisch alle relevanten Aspekte eines
Digitalisierungsprojekts. Die Projektplanung, die Wirtschaftlichkeit, das
konkrete Vorgehen, die Formatvorgaben, die (parallele) Sicherheitsverfilmung,
die Auflösung und Farbtiefe, die Qualität und Technik des Scanners, die Aufbewahrung, die
formale und inhaltliche Erschliessung, die Indexierung, das OCR-Verfahren, die
strukturierte Ablage, der Schutz der Objekte und das Urheberrecht kommen alle
zur Sprache. Vieles ist natürlich nicht neu, als Einstiegs- und auch als
Wiederholungsliteratur in die Materie ist der Artikel dennoch wertvoll.
Einige Elemente, die auffällen:
- Die notwendige Auflösung und die Farbtiefe
hängen von der Qualität der Vorlagen und dem Digitalisierungsziel ab. Sie
bestimmen die Dateigrösse, die Übertragungsdauer sowie den Speicherplatz
und damit die Kosten der Aufbewahrung. Im Durchschnitt handelt es sich um
eine Resolution von 300 bis 600 dpi. Graustufen werden z.B. bevorzugt,
sobald Text mit Bild versehen ist oder der Kontrast zwischen Schrift und
Hintergrund nicht ausreicht
- Transparente Verzeichnisstrukturen und Dateinamen sind
notwendig für die Imagefolgen, die sich auf die analogen Objekte und deren
Strukturen oder Tektoniken beziehen (allenfalls mittels Konkordanz)
- "Die Digitalisierung von Beständen ist nur
sinnvoll, wenn die Digitalisate auch angemessen erschlossen werden"
(1424) bzw. sind. Auch "sollten digitale Dokumentenbestände so
angelegt werden, dass man sie einheitlich in Stapelbetrieb ändern [migrieren,
konvertieren] kann"
- Parallele Verfilmung und Digitalisierung ist ein
sicheres, fast wasserdichtes Verfahren, wobei man nur noch über die
Reihenfolge streiten kann. Diese Sichtweise aus 1996 kann mittlerweile
relativiert werden
- Jede Vorlage soll bei der Digitalisierung mehrfach
erfasst werden, damit aufwändige Korrekturen nach der Qualitäts- und
Vollständigkeitskontrolle vermieden werden können
- Es muss zwischen einem Masterimage (Archivexemplar) und
einem Arbeitsimage (Darstellungsexemplar) unterschieden werden. Die Formate
GIF (verlustbehaftet), JFIF/JPEG (verlustbehaftet), PNG (nicht verbreitet)
gelten als Bereitstellungsformate, TIFF (frei benutzbar, strukturiert
aufgebaut, Header mit Tags für Metainformationen, plattformunabhängig, in
Schwarz-Weiss-Form verlustfrei komprimierbar) und PDF/A (weit verbreitet,
plattformunabhängig, layoutbeständig, tauglich für Volltextsuche,
schutzfähig) jedoch als Archivformate
- Die Auflösung, die Farb- oder Bittiefe und der
Schwellenwert beeinflussen das Ergebnis eines OCR-Durchgangs.
Schrifterkennungsprogramme haben weniger Mühe mit Schreibmaschinenschrift
als mit PC-Schriften [und Druckschriften], weil der Abstand der Schriftzeichen im ersten Fall
einheitlich ist und im zweiten Fall nicht
- Schutz der im Internet präsentierten Digitalisate vor
Kopierung durch sperren von "Speichern unter" reicht nicht
(PC-Cachefunktion kopiert jede Webseite); digitales Wasserzeichen,
Schutzmöglichkeiten bei PDF, geringe Bildqualität helfen mehr
Der Artikel gibt indirekt einen relevanten Hinweis für das
Records Management. So kostet die manuelle Indexierung eines Dokuments (wobei
ein inhaltliches Verständnis des Informationsobjekts vorausgesetzt wird) 15
Minuten. Natürlich ist die detaillierte bibliographische Autopsie mit formalen und
inhaltlichen Angaben gemeint. Doch wird ersichtlich, wie wichtig es ist,
mit einem gut durchdachten logischen Gerüst im Hintergrund die Metadatenerfassung
der Unterlagen-Records soweit möglich zu automatisieren.