Digilib: Wissenschaftliches Bildmaterial studieren und kommentieren im Internet
Forschungsbericht (importiert) 2005 - Bibliotheca Hertziana – Max-Planck-Institut für Kunstgeschichte
Wissenschaftliche Bilder im Netz
Der Zugang zu Texten über das Internet wird immer besser und schneller. Google und ähnliche textbasierte Dienste eröffnen einen sofortigen Zugang zu Informationen, die noch vor wenigen Jahren nur mit großen Mühen zu beschaffen gewesen wären. Auch für die Wissenschaft ist der Mehrwert offensichtlich: Forscher nutzen Fachdatenbanken in der ganzen Welt, seltene historische Werke stehen ihnen als elektronische Faksimiles und digitale Transkriptionen zur Verfügung. Ihre Ergebnisse können sie zeitnah online publizieren.
Dagegen sind die Möglichkeiten, Bilder wissenschaftlich zu erschließen, gering entwickelt. Das hat verschiedene Gründe. Zum einen erfordern Bilddateien im Vergleich zu Texten in der Regel ein Vielfaches an Speicherplatz. Ein großer Teil der in der Wissenschaft anfallenden bildlichen Daten sind digitale Fotografien, Scans oder Filme. Ihr hoher Speicherbedarf ergibt sich aus der digitalen Pixel-Struktur: Ein Bild in Druckqualität kann auf einem Quadratzentimeter 14.000 Bildpunkte enthalten. Helligkeit, Farbton, Sättigung und Transparenz müssen für jeden Bildpunkt einzeln gespeichert werden. Kompressionsmethoden können zwar den Speicherbedarf reduzieren, im Allgemeinen bringen sie aber einen Verlust von Bildqualität mit sich. Der hohe Speicherbedarf wirkt sich negativ auf die Archivierungskosten, die Ladezeiten im Internet und die erforderliche Bandbreite aus.
Zum anderen kommen Probleme bei der inhaltlichen Erschließung hinzu. Denn maschinell lassen sich aus Pixel- oder Vektordaten kaum nennenswerte inhaltliche Informationen erheben. Alles Wissenswerte über ein Bild muss als „Metadaten“ mitgeliefert werden. Das betrifft den Bildinhalt, also das, was dargestellt ist, ebenso wie die technischen Daten und die Umstände der Aufnahme.
Die mittlerweile zahlreich im Internet vorhandenen Bilddatenbanken können den höheren Ansprüchen der Forscher nicht gerecht werden. Diese Problemlage war Ausgangspunkt bei der Konzeption von Digilib.
Von Forschern für Forscher: Die Entwicklung von Digilib
Um wissenschaftliches Material besser organisieren und studieren zu können, haben sich Forscher zu allen Zeiten ihre Werkzeuge selber geschaffen. Das gilt auch für das digitale Zeitalter. Zwei Probleme stellten sich von Anfang an bei der Nutzung wissenschaftlicher Bilder im Internet. Das eine ist die lange Übertragungsdauer hoch aufgelöster digitaler Pixelgrafiken. Ein bildschirmfüllendes Bild von 1024 mal 768 Bildpunkten in hoher Farbqualität, wie es dem Standard heutiger Monitore entspricht, enthält unkomprimiert bereits 2,2 Megabyte an Daten und braucht oft einige Sekunden, um vollständig übertragen zu werden. Das kann für den Wissenschaftler, der viele Bilder durchsehen muss, zu einer zeitraubenden Angelegenheit werden. Außerdem ist die Darstellung eines ganzen Bildes in Monitorauflösung in vielen Fällen nicht ausreichend genau, sie enthält weniger Bildinformationen als ein scharfer Fotoabzug von 7-mal 10 cm Größe. Mehr Bilddetails können nur durch größere Bilddateien (bei entsprechend verlängerter Wartezeit) oder höher aufgelöste Ausschnitte erfasst werden.
Hier stellt sich das zweite Problem: Die Arbeit an einem virtuellen Bildausschnitt erfordert es, dessen Abmessungen und Maßstab zu fixieren, um den Ausschnitt später, etwa um eine wissenschaftliche Aussage zu belegen, reproduzieren zu können. Um auf relevante Einzelheiten hinzuweisen, ist es sinnvoll, Markierungen, Pfeile oder andere erläuternden Elemente anbringen zu können. Das ist mit digitalen Bildern nicht möglich, ohne das Original selbst zu verändern oder zumindest den Übertragungsvorgang auf dem Bildserver zu manipulieren.
Digitale Bilder stellen also zwei Herausforderungen an die Wissenschaft: Zum einen sollen sie in allen Einzelheiten erforscht werden, zum anderen sollen Forschungsergebnisse dokumentiert werden, indem Aussagen überprüfbar mit anschaulichen Details belegt, erläutert und mit Hilfe fester Referenzen zitiert werden. Diese Vorgehensweise sollte außerdem nicht nur dem Eigentümer der Bilder möglich sein, sondern allen Wissenschaftlern, die mit Bildern arbeiten, die im Internet zugänglich sind.
Diesen beiden Anforderungen begegnet die Software Digilib, die seit 1996 am Max-Planck-Institut für Wissenschaftsgeschichte in Berlin und am Lehrstuhl für Wissenschaftstheorie und -geschichte der Uni Bern verwirklicht wird [1].
Wie funktioniert Digilib?
Die Grundidee ist einfach: Bilder werden auf einem zentralen Server, einem Rechner im Netz, der anderen Computern Dienste anbietet, gespeichert, wo ein Programm Ausschnitte und Ansichten der Bilder berechnet und über das Internet ausliefert. Damit alle Funktionen interaktiv nutzbar werden, besteht das System aus zwei Software-Komponenten: Eine anfragende Komponente, der so genannte Client, stellt im Internetbrowser des Benutzers komfortable Bedienungsmöglichkeiten zur Verfügung, der Server überträgt das angeforderte Bild.
Für den Client stehen verschiedene Oberflächen zur Bildbetrachtung und Bildverwaltung zur Verfügung. Sie sind im Prinzip wie gewöhnliche Webseiten gestaltet, enthalten jedoch dynamische Elemente, die eine interaktive Bedienung ermöglichen. So wird etwa der gewünschte Bildausschnitt festgelegt, indem ein beweglicher Rahmen mit der Maus aufgezogen wird.
Die Größe des Bildausschnitts, die gewünschte Bildgröße und weitere Befehle zur Manipulation des übertragenen Bildes sind ebenso wie Koordinaten von Markierungen und Erläuterungen in dem URL (Uniform Resource Locator: eindeutige Bezeichnung eines Internet-Servers, eines darauf gespeicherten Dokumentes oder einer anderen Ressource des Internet) enthalten, mit der die aktuelle Ansicht aufgerufen wird. Er enthält somit alle Informationen, um den kompletten Darstellungskontext zu reproduzieren und kann als Referenz zitiert und weitergegeben werden.
Sendet der Client eine solche Anfrage, so erzeugt das Server-Programm dynamisch (on the fly) aus der Originalgrafik den gewünschten Ausschnitt mit den passenden Abmessungen und sendet diesen in einem für alle Internetbrowser lesbaren Bildformat zurück.
An der Universität Bern entwickelte browserspezifische Zusatzmodule erweitern die Kernfunktionalität des Grafikservers um spezielle Anwendungsbereiche. Diese neuen Bestandteile sind unter dem Arbeitstitel „Alcatraz“ zusammengefasst. Sie nutzen die Fähigkeit des Browsers Mozilla Firefox, so genannte Extensions zu integrieren. Diese Erweiterungen können vom Benutzer je nach Bedürfnis installiert werden und ermöglichen es ihm, die Funktionalität von Digilib unabhängig von der Präsentation der Seite einzusetzen, auf der das Bild gefunden wurde.
Unabhängige Webseiten oder eigenständige Programme können den Digilib-Server auch direkt ansprechen, um eigene Darstellungen und neue Funktionen zu entwickeln.
Das ECHO-Projekt: Neue Anwendungen für Digilib
Am Max-Planck-Institut für Wissenschaftsgeschichte in Berlin wurde Digilib zunächst zur Präsentation von Digitalisierungen und Transkriptionen historischer naturwissenschaftlicher Druckwerke aus der frühen Neuzeit im Rahmen des Archimedes-Projekts eingesetzt. An der Universität Bern wurden astronomische Diagramme aus mittelalterlichen Handschriften, Abbildungen aus historischen Werken der Botanik sowie Laborbücher aus der Naturwissenschaft des 20. Jahrhunderts mit Digilib zugänglich gemacht.
Das von der Europäischen Kommission im 5. Rahmenprogramm geförderte Projekt ECHO (European Cultural Heritage Online), an dem mehrere Max-Planck-Institute beteiligt waren, brachte von 2002 an einen starken Entwicklungsschub für Digilib. Seither gehört auch die Bibliotheca Hertziana (Max-Planck-Institut für Kunstgeschichte) in Rom zum Kreis der Digilib-Benutzer und -Entwickler. Ziel von ECHO ist es, Quellen und Material zur gesamten europäischen Kulturgeschichte über das Internet öffentlich verfügbar zu machen. Die Vernetzung der Informationen soll die kulturelle Vielschichtigkeit Europas abbilden und einen interdisziplinären Zugang zum europäischen Kulturerbe bieten.
Durch diese Erweiterung des wissenschaftlichen Horizonts kamen auch andere Anwendungen in das Blickfeld. Der Beitrag der Bibliotheca Hertziana zu ECHO ist das Projekt „Lineamenta“. Lineamenta hat sich zum Ziel gesetzt, historische Architekturpläne – der Schwerpunkt liegt zunächst auf dem 18. Jahrhundert – in hoch aufgelösten Digitalfotografien beziehungsweise Scans der Forschung zur Verfügung zu stellen und parallel dazu die Zeichnungen wissenschaftlich zu katalogisieren und durch ein Datenbanksystem zu erschließen.
Die barocken Zeichnungen von bis zu 150 cm Seitenlänge werden mit aufwändiger Kameratechnik in der Bibliotheca Hertziana gescannt und mithilfe von Digilib konsultierbar gemacht. In einer zweiten Datenbank namens CIPRO (Catalogo delle Piante di Roma Online), die historische Stadtpläne und Ansichten der Stadt Rom enthält, kommen noch größere Formate vor. Die einzelnen Dateien haben in der Regel eine Größe von 700 Megabyte und erreichen mitunter 1,5 Gigabyte.
Da die Abbildungen nicht nur betrachtet, sondern auch im Rahmen von Forschungsfragen untersucht werden sollten, wurde Digilib um Funktionen erweitert, die es erlauben, einen Bildausschnitt in Originalgröße anzuzeigen, Helligkeit und Kontrast zu verstellen und Ausschnitte zu drehen und zu spiegeln.
Seither hat Digilib als Instrument zur Betrachtung und wissenschaftlichen Analyse grafischer Kunstwerke an Bedeutung gewonnen. Für diese Materialgattung bietet sich die Software besonders an, da die Werke häufig aus konservatorischen Gründen unter Verschluss gehalten werden müssen und nur an einem Ort, nicht selten unter starken Einschränkungen, zugänglich sind. Durch Digilib wird dieses ganze Materialcorpus nun erstmals zugänglich.
Auch andere Sammlungen setzen Digilib zur Präsentation von Architekturzeichnungen ein. Die Kasseler Museen veröffentlichen im Rahmen eines von der Deutschen Forschungsgemeinschaft (DFG) geförderten Projekts die Architekturzeichnungen der Staatlichen Graphischen Sammlung [3]. Das Museo di Castelvecchio in Verona verwendet Digilib zur internen Konsultation der Zeichnungen von Carlo Scarpa.
Bei „ArsRoma“, einem weiteren Projekt der Bibliotheca Hertziana, dient Digilib zur detaillierten Veranschaulichung römischer Gemälde um 1600. Das Archiv des Kunsthistorikers Friedrich Noack zu den in Rom tätigen ausländischen Künstlern wird ebenfalls mithilfe von Digilib erschlossen. Die aus über 18.000 Notizzetteln in Kurzschrift bestehenden „Schede Noack“ wurden 2005 digitalisiert.
Daneben spielt Digilib eine wichtige Rolle in wissenschaftlichen Fototheken, die ihre Bestände an dokumentarischen Fotografien online stellen möchten. Die Max-Planck-Institute für Kunstgeschichte in Rom und Florenz machen sowohl digitale Originalfotos als auch gescannte Negative mit Digilib über das Internet zugänglich.
Zukunftsperspektiven
Die Nutzungsmöglichkeiten von Digilib für die Wissenschaft sind mit den bisher realisierten Programmen und Modulen bei weitem nicht erschöpft. Es gibt eine Fülle von Ideen für die Weiterentwicklung. Digilib ist ein Forschungsinstrument mit Zukunft, speziell in den Bildwissenschaften. Die Herausforderungen des Internets im Hinblick auf die wissenschaftliche Bildverarbeitung zeichnen sich jetzt erst ab. Dabei spielen jedoch nicht allein technische Fragen eine Rolle. Auch mit Problemen, die beispielsweise ein verschärftes Urheberrecht für die Forschung mit sich bringen wird, ist zu rechnen [4].
Die Förderung des Open-Access-Prinzips, des weltweiten, freien Zugangs zum kulturellen Erbe Europas, zu Forschungsergebnissen, die aus öffentlichen Mitteln finanziert wurden, und der notwendigen Software ist ein Hauptziel des ECHO-Projekts. Digilib trägt dazu bei, diese Ideen, die auch von der Max-Planck-Gesellschaft in der Berliner Erklärung vom 22. Oktober 2003 unterzeichnet wurden, zu verwirklichen. Die Weiterverbreitung des Programms für solche Zwecke ist ausdrücklich erwünscht.