Digitalisierung

 

In einer einführenden Präsentation ist Anna Michel während der Spring School auf die allgemeinen Aspekte bezüglich der Digitalisierung eingegangen. Mit der Hilfe von Malte Rehbein wird nun im Rahmen dieses Blogs eine Reflexion meiner Erfahrungen mit dem Vorgang des Digitalisierens vorgestellt.

Durch meine Arbeit im Universitätsarchiv bin ich zum Teil auch schon mit dem Digitalisieren, also dem Einpflegen von materiellen analogen Objekten auf dem Computer in Form eines Abbildes, an sich vertraut. Den Löwenanteil machte dabei bisher immer das Einscannen von Fotos aus. Dabei bergen Digitalisate mehrere Große Vorurteile: Wenn ein bestimmtes Foto beispielsweise benötigt wird, muss man nicht mehr extra zum Archiv hinfahren, um es zu untersuchen. Diese können stattdessen einem dann einfach auf dem Computer zugeschickt werden. Neben dem Aufwand spart man sich auch die Kosten einer möglichen Kopie, zumal häufig die Qualität durch die Vervielfältigung die Kopien leidet.

Um eine Digitalisierung vorzunehmen braucht man selbstverständlich die nötigen Apparaturen. Am häufigsten verwende ich dabei den Flachbettscanner, da dieser sich freilich am besten für jegliche Dokumente und Fotos eignet. Auch zu Hause verwende ich dieses Gerät gerne, da ich so wichtige Unterlagen zu anderen Stellen (Rechtsanwalt, Arzt, Sportverein) schnell und bequem senden kann, wenn ich diese zuvor eingescannt habe. Beim Scannvorgang wird das Foto oder Dokument mit der bedruckten Seite nach unten auf die Glasplatte des Scanners gelegt. Das Objekt wird mit Licht angestrahlt und auf einen festen Spiegel gespiegelt. Der Spiegel wirft das Licht im Anschluss auf einen Bildsensor. Dieser wandelt die Lichtsignale Schritt für Schritt durch Pixel in ein Digitalsignal um. Neben dem Flachbettscanner gibt es aber auch Scanner die speziell für Bücher verwendet werden. Im Anschluss lässt sich mit Hilfe von Programmen das digitale Bild weiter bearbeiten. So lassen sich Ränder entfernen oder das Abbild in eine bestimmte Art von Datei umwandeln.

Häufige Nutzung finden neben Flachscannern auch Buchscanner in der Bibliothek, da Studenten häufig ausliegendes Material nicht mitnehmen dürfen, aufgrund der Tatsache, dass es sich um Präsenzbestände handelt. Buchscanner haben dabei den Vorteil, dass sie den Buchrücken schonen. Wenn man beispielsweise versucht Seiten aus einem Buch mit dem Flachbettscanner zu bearbeiten kann der Buchrücken beschädigt werden, da die obere Klappe auf diesem lastet. Zudem fällt es schwer die inneren Seiten korrekt einzuscannen. Hierbei schafft die Buchwippe des Buchscanners Abhilfe, die das Buch mechanisch fixiert. Die Technik die dabei verwendet wird ist die gleiche wie bei der Digitalkamera.

Die Digitalkamera ist sicherlich ein Gegenstand, den man so ziemlich in jedem Haushalt vorfindet. Sie eignet sich prima um Schnappschüsse im Urlaub zu machen oder persönlich wichtige Momente in Form eines Bildes festzuhalten. Im Gegensatz zu analogen Kameras wird hierfür kein empfindlicher Film innerhalb der Kamera benötigt. An dessen Stelle ist ein elektronischer Bildsensor getreten. Der Vorteil hierbei ist, dass man nun nicht mehr die Filme entwickeln lassen muss, um sich die Bilder anzusehen, da man die Digitalkamera problemlos mit dem Computer verbinden kann und sich diese dort anzeigen lassen. Neben dem privaten Gebrauch finden Digitalkameras aber auch Verwendung in den Archiven. Häufig werden diese dort genutzt um beispielsweise die Entwicklung von Neubauten zu verfolgen. Obschon die Digitalkamera sicherlich die praktischere Variante darstellt, erlebt aber dennoch die auch die Analogkamera ein kleines Revival. Gerade die Einwegkameras haben auch ihre praktischen Vorzüge, da man diese Kindern ohne schlechtes Gewissen aushändigen kann. Im Gegensatz zu teuren Digitalkameras kosten diese nicht viel und sind äußerst robust. Zudem haben sie den amüsanten Nebeneffekt, dass man die Bilder nicht direkt auf der Kamera wieder löschen kann wie auf der Digitalkamera. Das bedeutet, dass man nie weiß was letztlich auf der Kamera zu sehen ist. Erst wenn die Filme entwickelt sind lüftet sich das Geheimnis mit oftmals erheiternden Überraschungen.

Wenn man digitale Bilder auf dem Computer hierbei digital darstellen möchte, gibt es dabei zwei unterschiedliche Möglichkeiten: die Rastergrafik und die Vektorgrafik.

Rastergrafiken werden dabei von der Bildgröße sowie der Farbtiefe bestimmt. Die Bildgröße wiederum zeichnet sich durch die Anzahl der einzelnen Pixel aus. Je mehr Pixel ein Bild enthält, desto größer ist dieses. Die Farbtiefe zeigt an wie viele Helligkeits- und Farbwerte ein einzelnes Pixel beschreiben. Wenn man nun tief in ein Foto hineinzoomt, fällt auf, dass das Bild mit der Rastergrafik ungenauer wird und man infolgedessen jedes einzelne Pixel sehen kann. Ein weiteres Kennzeichen von Rastergrafiken ist, dass dieses Format viel Speicherkapazitäten benötigt. Aus diesem Grund werden häufig Bildkompressionen verwendet, die die Größe der Dateien verkleinern. Dabei kann man auf verlustbehaftete Kompressionen zurückgreifen oder auf verlustfreie. Bei verlustbehafteten Kompressionen werden überflüssige Informationen aus den Daten entfernt. Als Beispiel lässt sich hier die Musikdatei anfügen, in der es Töne gibt, die für das menschliche Ohr nicht zu hören sind und daher entfernt werden können. Bei Bildern verhält es sich dementsprechend ähnlich: Details die das menschliche Auge nicht erfassen kann, werden einfach entfernt. Allerdings muss hier angemerkt werden, dass es hierfür keine allgemeine Definition gibt, was erkennbar ist und was nicht. Wie der Name schon suggeriert geht bei der verlustfreien Kompression keine Informationen verloren. Es ändert sich nur die Art der Speicherung. Der Kompressionsalgorithmus ist demnach so ausgelegt, dass er, statt jedes Pixel einzeln zu speichern, die Information über regelmäßig wiederkehrende Pixel und Gestalt und Position dieser speichert. Verlustbehaftete Formate sind zum Beispiel jpeg verlustfreie sind tiff Formate.

Die Vektorgrafik beschreibt Bilder nicht anhand von einzelnen Pixeln sondern sogenannter grafischer Primitive, wie zum Beispiel Punkte, Linien, Polygone, Kreise und Ellipsen. Außerdem zählen dazu noch Information über Farbe, Strichform, Füllung und Behandlungen wie Spiegelungen. Als Grundordnung dient hierbei ein Koordinatensystem. Der Vorteil bei Vektorgrafiken ist dabei, dass diese beim Hineinzoomen keinen Qualitätsverlust verzeichnen. Zudem unterscheiden sich die beiden Formate dahingehend, dass der Speicherbedarf einer Rastergrafik abhängig ist aus dem Produkt von Bildgröße und Farbtiefe wohingegen die Vektorgrafik abhängig ist von der Komplexität eines Bildes. Zudem ist der Aufwand für die Wiedergabe einer Vektorgrafik aufwendiger als bei der Rastergrafik, da der Computer zunächst das Bild aus grafischen Primitiven zusammenrechnen muss. Die Umwandlung einer Rastergrafik in eine Vektorgrafik ist sehr aufwendig wohingegen die Umwandlung von Vektorgrafiken in Rastergrafiken sehr viel einfacher ist.

Ein Computer kann aber lediglich die einzelnen Pixel erkennen. Ähnlich würde es sich bei der Digitalisierung von Texten verhalten. Die einzelnen Pixel können gelesen werden, jedoch erkennt der Computer keine Sinnzusammenhänge. Früher hat man diese Texte bearbeitet indem man sie transkribierte. Auch heute ist das noch nötig, gerade wenn es um handschriftliche Quellen aus dem Mittelalter geht. Zumeist wählt man zwei Personen aus, die unabhängig voneinander die Texte abtippen und dann vergleichen, damit etwaige Flüchtigkeitsfehler oder Lesefehler vermieden werden. Allerdings ist man heute schon so weit, dass auch Computerprogramme in der Lage sind Texte zu erkennen mit der automatischen Texterfassung, dem Optical Character Recognition. Hierbei startet das Programm damit, die Vorlage zu optimieren, zum Beispiel werden eventuelle Verzerrungen ausgeglichen. Ebenfalls kommt es in der Vorverarbeitung dazu, dass die Pixel entweder dem Text oder dem Hintergrund zugeordnet werden. Nach der eigentlichen Zeichenerkennung folgt die Nachbearbeitung, in der versucht wird, das Textbild qualitativ aufzuwerten. Wichtig für dieses Verfahren ist die Erkennungsgenauigkeit von Buchstaben und Wörtern, also wie korrekt die Wiedergabe dieser im Verhältnis zur Vorlage ist. Bei modernen Buchdruck- und Computerschriftarten ergeben sich keine großen Probleme. Auch Dokumente aus Schreibmaschinen können gut erkannt werden durch den Computer. Allerdings wird es spätestens bei der Erkennung von handschriftlich verfassten Dokumenten schwierig für ein Computerprogramm.

Schreibe einen Kommentar