Die Bibliothek des Max-Planck-Instituts für europäische Rechtsgeschichte in Frankfurt am Main befasst sich ausführlich mit der Digitalisierung ihrer Sammlungen. Aufwand und Kosten bei der Aufbereitung, Erfassung, Pflege und späteren Migration der Daten auf andere elektronische Datenträger werden wohl immer ein selektives Vorgehen auflegen, aber die vorgestellten Projekte sind doch bemerkenswert.
Das 1. Projekt umfasst 4.000 deutschsprachige Titel aus dem 19. Jahrhundert mit über einer Million Buchseiten. Zuerst werden die Bände verfilmt (dauerhaftes Speichermedium) und dann mit einer Auflösung von 400 dpi bitonal gescannt, wobei die einzelnen Seiten als Abbilder (Images) im komprimierten TIFF-Format auf CD-ROM gespeichert werden.
Der Zugriff auf die Seiten, Paragrafen, Abschnitte und Kapitel geschieht über Verknüpfungen (Hyperlinks) von den relevanten Inhaltsverzeichnissen aus. Die Verzeichnisse werden dazu im Volltext (SGML-basiert) manuell erfasst oder sogar nachträglich erstellt. Das OCR-Verfahren hat für altertümliche Schriftarten leider immer nur noch begrenzte Bedeutung.
Das 2. Projekt hat nicht eine Volltexterfassung zum Ziel, es beschränkt sich auf einen verbesserten bibliografischen Nachweis. Immerhin werden in diesem Fall die Titelaufnahmen mit den Abbildern der Titelseiten verknüpft. Es geht dabei um 60.000 (meist lateinische) Dissertationen, Disputationen und Gelegenheitsschriften des 16.-18. Jahrhunderts.
Der Zugriff kann mittels einer vorstrukturierten Suche über Metadaten stattfinden: Titel, Autor, Beiträger, Widmungsempfänger, Sachtitel, Erscheinungsort, Drucker, Verleger, Erscheinungsjahr, ggf. Promotionsdatum, Seitenumfang und Format. Die gescannten Titelseiten lassen als Primärdokumente ausserdem weitere Informationen zu, nämlich Bildungsgang des Autors, Titel und Position des Doktorvaters usw.