{"id":90,"date":"2017-06-09T01:26:03","date_gmt":"2017-06-08T23:26:03","guid":{"rendered":"https:\/\/blogs.uni-paderborn.de\/dfriedl\/?p=90"},"modified":"2017-08-15T15:32:57","modified_gmt":"2017-08-15T13:32:57","slug":"rehbein-digitalisierung","status":"publish","type":"post","link":"https:\/\/blogs.uni-paderborn.de\/dfriedl\/2017\/06\/09\/rehbein-digitalisierung\/","title":{"rendered":"Rehbein: Digitalisierung"},"content":{"rendered":"<div class=\"twoclick_social_bookmarks_post_90 social_share_privacy clearfix 1.6.4 locale-de_DE sprite-de_DE\"><\/div><div class=\"twoclick-js\"><script type=\"text\/javascript\">\/* <![CDATA[ *\/\njQuery(document).ready(function($){if($('.twoclick_social_bookmarks_post_90')){$('.twoclick_social_bookmarks_post_90').socialSharePrivacy({\"txt_help\":\"Wenn Sie diese Felder durch einen Klick aktivieren, werden Informationen an Facebook, Twitter, Flattr, Xing, t3n, LinkedIn, Pinterest oder Google eventuell ins Ausland \\u00fcbertragen und unter Umst\\u00e4nden auch dort gespeichert. N\\u00e4heres erfahren Sie durch einen Klick auf das <em>i<\\\/em>.\",\"settings_perma\":\"Dauerhaft aktivieren und Daten\\u00fcber-tragung zustimmen:\",\"info_link\":\"http:\\\/\\\/www.heise.de\\\/ct\\\/artikel\\\/2-Klicks-fuer-mehr-Datenschutz-1333879.html\",\"uri\":\"https:\\\/\\\/blogs.uni-paderborn.de\\\/dfriedl\\\/2017\\\/06\\\/09\\\/rehbein-digitalisierung\\\/\",\"post_id\":90,\"post_title_referrer_track\":\"Rehbein%3A+Digitalisierung\",\"display_infobox\":\"on\"});}});\n\/* ]]> *\/<\/script><\/div><p>Bei dem folgenden Text handelt es sich um eine <strong>Zusammenfassung<\/strong> der wichtigsten Informationen aus <em>Rehbein, Malte: Digitalisierung. In: Fotis Jannidis, Hubertus Kohle und Malte Rehbein (Hgg.): Digital Humanities. Eine Einf\u00fchrung. Stuttgart 2017, S. 179-198<\/em>. Der Aufsatz bietet einen ersten \u00dcberblick \u00fcber verschiedene Verfahren und Fachbegriffe der Bilddigitalisierung.<\/p>\n<p>Der von Rehbein verfasste Text handelt von der Digitalisierung analoger Originale, insbesondere der Bilddigitalisierung. Hierbei werden zun\u00e4chst die <strong>Vorteile<\/strong> der neuen Bilddigitalisierung vorgestellt. Die fr\u00fcheren Abbildungen hatten etwa noch den Nachteil, dass sie durch ihre physische Form in ihrer Zug\u00e4nglichkeit eingeschr\u00e4nkt waren und weitere Kopien Kosten und gegebenenfalls Informationsverlust zur Folge hat. Dies ist bei der Bilddigitalisierung nicht der Fall, denn besonders die computergest\u00fctzte Vernetzung bietet, im Vergleich mit der Arbeit am Original, neue Zugangsm\u00f6glichkeiten. Auch ist die Anfertigung weiterer Kopien kosteng\u00fcnstiger und verlustfrei m\u00f6glich. Im Weiteren werden die Begriffe &#8222;Aufl\u00f6sung&#8220; und &#8222;Abtastrate&#8220; im Rahmen der Analog-Digital-Wandler, welche mittels Sensoren ein Objekt messen und die Messdaten speichern, eingef\u00fchrt. Darauf aufbauend werden in ausf\u00fchrlicher Form zwei M\u00f6glichkeiten unterschieden, unsere Bilder in digitaler Form zu repr\u00e4sentieren: die Raster- und die Vektorgrafik. Dieser Abschnitt ist m.E. von hoher Bedeutung, denn die beiden M\u00f6glichkeiten haben f\u00fcr uns als Historiker jeweils entscheidende Vor- und Nachteile. Bei einer <strong>Rastergrafik<\/strong> wird das Bild in ein zweidimensionales Koordinatensystem eingeteilt, wobei jeder Punkt in diesem Koordinatensystem mit einem Wert versehen wird, welcher den jeweiligen Farbwert angibt. Rastergrafiken k\u00f6nnen anhand ihrer Bildgr\u00f6\u00dfe und ihrer Farbtiefe unterschieden werden. Die <strong>Bildgr\u00f6\u00dfe<\/strong> wird durch die Anzahl der Punkte im Koordinatensystem bestimmt, wobei dieser Wert entweder in einer Spalten-mal-Zeilen-Form oder in einer Multiplikation dieser dargestellt werden kann. Die <strong>Farbtiefe<\/strong> beschreibt, wie viele verschiedene Helligkeits- und Farbwerte von einem Bildpunkt im Koordinatensystem, also von einem Pixel, angenommen werden k\u00f6nnen. Ein Bild mit einer Farbtiefe von 1 kann nur die Werte schwarz und wei\u00df annehmen. Auch bei Schwarz-wei\u00df-Bildern gibt es jedoch die M\u00f6glichkeit, das Bild weiter in <strong>Graustufen<\/strong> auszudifferenzieren; ein Bild mit einer Farbtiefe von 8 Bit h\u00e4tte z.B. 256 verschiedene Graustufen, trotzdem h\u00e4tte es nur einen <strong>Farbkanal<\/strong>. Moderne ist jedoch die Digitalisierung in Farbe, wobei das <strong>RGB-Farbmodell<\/strong> vorgestellt wird. Hierbei wird jeder Bildpunkt mit drei Werten versehen, die jeweils f\u00fcr die Grundfarben Rot, Gr\u00fcn und Blau stehen. Der Bildpunkt nimmt nun neue Farben an, indem die Grundfarben in verschiedenen Abstufungen miteinander vermischt werden. Dadurch, dass es sich um drei Farbkan\u00e4le handelt, sind bei einer Farbtiefe von 8 Bit pro Kanal bereits 16.277.216 verschiedene Farbwerte m\u00f6glich. Der Anstieg der Bildgr\u00f6\u00dfe und Farbtiefe ist jedoch auch mit einem Anstieg der Datenmengen und einem daraus resultierenden Kostenanstieg verbunden, weswegen in das Thema der <strong>Bildkompression<\/strong> eingef\u00fchrt wird. Hierbei wird zwischen verlustfreier und verlustbehafteter Kompression unterschieden. Bei der <strong>verlustbehafteten <\/strong>Kompression wird auf Informationen verzichtet, die als \u00fcberfl\u00fcssig betrachtet wird, dies h\u00e4ngt jedoch ganz vom Verwendungszweck ab. Ein Beispiel f\u00fcr ein verlustbehaftetes Bildformat w\u00e4re JPG. Die <strong>verlustfreie<\/strong> Kompression hingegen speichert hingegen Informationen \u00fcber die Muster und Fl\u00e4chen eines Bildes, anstatt jeden einzelnen Pixel. Durch einen Algorithmus ist dies verlustfrei m\u00f6glich, jedoch sollte dieser offengelegt werden. Ein Beispiel f\u00fcr ein verlustfreies Bildformat w\u00e4re TIFF. Eine weitere M\u00f6glichkeit, neben der Rastergrafik, Bilder in digitaler Form zu pr\u00e4sentieren, ist die <strong>Vektorgrafik<\/strong>. Die Vektorgrafik beschreibt nicht jeden Bildpunkt einzeln, sondern versucht das Bild in seinem Aufbau zu erfassen und diesem sogenannte grafische Primitive (Punkte, Linien, Formen, Farbe etc.) zuzuordnen. Vektor- und Rastergrafik unterscheiden sich voneinander stark, was zu jeweiligen Vor- und Nachteilen f\u00fchrt. Ein wesentlicher Unterschied liegt in den M\u00f6glichkeiten der Skalierung. Ist eine Skalierung bei einer Rastergrafik nur mit einer Ver\u00e4nderung der Bildpunktanzahl m\u00f6glich, was zu Qualit\u00e4tsverlust f\u00fchren kann, so werden die grafischen Primitiven einer Vektorgrafik lediglich verlustfrei und umkehrbar an die neue Gr\u00f6\u00dfe angepasst. Der Speicherbedarf ist bei einer Rastergrafik abh\u00e4ngig von Bildgr\u00f6\u00dfe und Farbtiefe, der einer Vektorgrafik von ihrer jeweiligen Komplexit\u00e4t. Der Speicherbedarf einer Rastergrafik ist also kalkulierbarer. Hinzu kommt, dass f\u00fcr die Darstellung einer Vektorgrafik auf dem Bildschirm ein gewisser Rechenaufwand erforderlich ist. Weitere Vorteile einer Vektorgrafik liegen vor allem in der einfachen Umwandlung in eine Rastergrafik, dies ist anders herum schwieriger, und in der Bildbearbeitung.<\/p>\n<p>Bei der <strong>Bilddigitalisierung<\/strong>, also der Messung von Licht, welches von einem Objekt reflektiert wird, werden zwei Instrumente unterschieden: Digitalkameras und Scanner. Als analoge Alternative besitzen die <strong>Mikroformen<\/strong> eine hohe Relevanz. Mikroformen sind stark verkleinerte Abbildungen auf Polyester-basiertem Filmmaterial, welche aufgrund ihrer Haltbarkeit von 500 Jahren, besonders gut f\u00fcr die Langzeitarchivierung geeignet sind. Auch ist technologische Unabh\u00e4ngigkeit gegeben, was die Langzeitverf\u00fcgbarkeit sicherstellt. Bei der <strong>Digitalkamera<\/strong> halte ich es f\u00fcr nicht sehr relevant, zu beschreiben, wie diese genau funktioniert. Erw\u00e4hnt seien jedoch die Begriffe Fokussierung, also die Anpassung der Optik an die Entfernung, Verschlusszeit, welche die Dauer der Belichtung beeinflusst, und die Gr\u00f6\u00dfe der Blenden\u00f6ffnung, welche die Sch\u00e4rfentiefe beeinflusst, denn diese k\u00f6nnen sowohl automatisch als auch durch den Benutzer eingestellt werden. Das andere Instrument der Bilddigitalisierung ist der <strong>Scanner<\/strong>. Scanner sind im Allgemeinen Ger\u00e4te, die ein Objekt systematisch erfassen und in ein digitales Signal umwandeln. F\u00fcr Historiker ist besonders der Bildscanner relevant. Beim Bildscanner k\u00f6nnen der Flachbettscanner und der Buchscanner unterschieden werden. Beim Flachbettscanner wird das Objekt mit der zu scannenden Seite nach unten auf eine Glasplatte gelegt, unter welcher verschiedene Spiegel das Licht zu einem Bildsensor f\u00fchren. Ein Problem ist hierbei, dass, aufgrund der mangelnden Sch\u00e4rfentiefe, das Objekt fest auf der Glasplatte liegen muss, was z.B. bei Buchbindungen eine Schwierigkeit darstellt. Der Buchscanner hingegen ist speziell f\u00fcr das Scannen von B\u00fcchern spezialisiert. Hierbei wird das zu scannende Buch aufgeschlagen auf einer Buchwippe platziert und anschlie\u00dfend von einer Digitalkamera, welche vorher an die Lichtverh\u00e4ltnisse und Buchgr\u00f6\u00dfe angepasst werden muss, abgelichtet. Auch hier kann es zu Problemen mit dem Buchr\u00fccken kommen, denn das Buch muss bis zum einem Winkel von 180 Grad ge\u00f6ffnet werden. Hilfe kann hierbei der Wolfenb\u00fctteler Buchspiegel gew\u00e4hren, er erm\u00f6glicht einen \u00d6ffnungswinkel von lediglich 45 Grad. Das Umbl\u00e4ttern der einzelnen Seiten kann entweder langsam per Hand oder effektiver durch Scan-Roboter geschehen, welche die Seiten ansaugen und automatisch umbl\u00e4ttern. Unabh\u00e4ngig davon, f\u00fcr welche Form der Bilddigitalisierung ich mich entscheide, ist es von hoher Wichtigkeit, dem Digitalisat die n\u00f6tigen <strong>Parameter<\/strong> anzuh\u00e4ngen, um m\u00f6gliche Fehlinterpretationen zu verhindern. Diese Parameter k\u00f6nnen sowohl Aussagen etwa dar\u00fcber geben, ob die Quelle noch eine Beschriftung der R\u00fcckseite besitzt, als auch technische Parameter der Digitalisierung sein. Technische Parameter beinhalten unter anderem Informationen \u00fcber die Aufl\u00f6sung eines Scans, also der Dichte an Bildpunkten pro Streckeneinheit. In der Regel wird die Aufl\u00f6sung in pixel per inch (ppi) angegeben, wobei ein h\u00f6herer Wert auch eine h\u00f6here Sch\u00e4rfe bedeutet. Welche Aufl\u00f6sung f\u00fcr welches Objekt verwendet wird, h\u00e4ngt ganz vom Verwendungszweck des Digitalisats ab. Um die Betrachtung mit dem blo\u00dfen Auge zu simulieren ist etwa eine Aufl\u00f6sung von 300ppi ausreichend, f\u00fcr genauere Analysen des Objekts werden jedoch h\u00f6here Aufl\u00f6sungen ben\u00f6tigt.<\/p>\n<p>Um etwa die Auffindbarkeit eines Digitalisats zu gew\u00e4hrleisten, m\u00fcssen sogenannte <strong>Metadaten<\/strong> erzeugt werden. Hierbei k\u00f6nnen deskriptive, welche zum Auffinden eines Objektes herangezogen werden, strukturelle, welche verwendet werden, um das Objekt in seinem Aufbau zu erfassen, technische, welche verwendet werden, um die Qualit\u00e4t des Objekts zu beurteilen und administrative Metadaten, welche verwendet werden, um etwa Nutzungsrechte zu dokumentieren, unterschieden werden. Diese Trennung ist allerdings nicht strikt. Im Rahmen dieser Metadaten gibt es verschiedene internationale Standards, wie Dublin Core, METS, MODS, TEI, EAD und SAFT. Ich halte es an dieser Stelle nicht f\u00fcr n\u00f6tig, alle Standards vorstellen, werde jedoch TEI kurz zusammenfassen, denn mit diesem Standard haben wir uns in der Spring School besch\u00e4ftigt. TEI steht f\u00fcr Text Encoding Initiative und bietet haupts\u00e4chlich Richtlinien und XML-Schemata f\u00fcr das Kodieren elektronischer Texte. Auch skriptive und strukturelle Metadaten k\u00f6nnen etwa im Header angegeben werden.<\/p>\n<p>Bei der Digitalisierung eines Textes st\u00f6\u00dft man schnell auf das Problem, dass beim Abbilden in einer zweidimensionalen Tabelle zwar die einzelnen Pixel, jedoch nicht ihr Bedeutungszusammenhang erfasst wird. Um dies zu gew\u00e4hrleisten, ist eine <strong>Transkription<\/strong> n\u00f6tig, wobei zwischen manueller und automatischer Transkription unterschieden werden kann. Bei der <strong>manuellen<\/strong> Transkription wird der Text per Hand abgetippt. Um dadurch auftretende Fehler zu vermeiden, k\u00f6nnen etwa zwei Transkriptionen unabh\u00e4ngig voneinander angefertigt werden, welche anschlie\u00dfend verglichen werden. F\u00fcr die <strong>automatische<\/strong> Transkription kommt das OCR-Verfahren (Optical Character Recognition) zur Anwendung. Das Verfahrend gliedert sich in mehrere Phasen: Die Vorverarbeitung, in welcher versucht wird die Rastergrafik f\u00fcr die OCR zu optimieren, die Binarisierung, in welcher das Bild in Hinter- und Vordergrund gegliedert wird, die Analyse des Layouts und die Segmentierung der Vorlage, in welcher erkannt werden soll, welche Stellen Text erhalten und in welcher das Objekt logisch strukturiert wird, die Zeichenerkennung, in welcher die Buchstaben etwa in eine Matrix eingesetzt werden, um sie mit bekannten Buchstaben zu vergleichen, und schlie\u00dflich die Nachbereitung, in welcher mithilfe von z.B. W\u00f6rterb\u00fcchern versucht wird die Texterkennung zu korrigieren. Ein Qualit\u00e4tskriterium f\u00fcr die Transkription ist die <strong>Erkennungsgenauigkeit<\/strong>, \u00fcber welche man sich als Historiker im Vorfeld stets erkundigen sollte. Die Erkennungsgenauigkeit wird in Prozent angegeben, wobei eine Transkription als \u201ewissenschaftlich zuverl\u00e4ssig\u201c gilt, wenn sie eine Genauigkeit von 99,95 Prozent aufweist. Je \u00e4lter eine Quelle allerdings ist, desto niedriger ist h\u00e4ufig auch die Erkennungsgenauigkeit. Gerade bei Handschriften sollte auf die manuelle Transkription zur\u00fcckgegriffen werden, auch wenn diese durch computerbasierte pal\u00e4ographische Hilfsmittel unterst\u00fctzt werden kann.<\/p>\n<p>Abschlie\u00dfend sollen noch drei weitere Digitalisierungsverfahren kurz vorgestellt werden. Zum einen ist die <strong>Objektdigitalisierung<\/strong> zu nennen. Im Gegensatz zu den bisher vorgestellten Digitalisierungsverfahren wird hierbei kein zwei- sondern ein dreidimensionaler Raum abgebildet. Dadurch wird z.B. die Tiefe der Pr\u00e4gung einer M\u00fcnze f\u00fcr den Betrachter ersichtlich. Ein weiteres Verfahren ist die <strong>Multispektralfotografie<\/strong>. Dabei wird das Lichtspektrum nicht in die drei Bereich Rot, Gr\u00fcn, Blau, sondern in sogenannte Spektralb\u00e4nder unterteilt, was es erlaubt, auch f\u00fcr das menschliche Auge nicht sichtbares Licht zu erfassen. Man damit z.B. R\u00fcckschl\u00fcsse auf die chemische Zusammensetzung des Objekts ziehen. Die Audiodigitalisierung besch\u00e4ftigt sich im Gegensatz dazu, mit der Digitalisierung von vorliegenden analogen Tonaufzeichnungen. Auch eine Transkription dieser Tonaufzeichnungen ist etwa bei gesprochener Sprache m\u00f6glich.<\/p>\n<p style=\"text-align: center\">\n<p style=\"text-align: center\"><strong>Sekund\u00e4rliteratur<\/strong><\/p>\n<p><em>Rehbein, Malte: Digitalisierung. In: Fotis Jannidis, Hubertus Kohle und Malte Rehbein (Hgg.): Digital Humanities. Eine Einf\u00fchrung. Stuttgart 2017, S. 179-198<\/em>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Bei dem folgenden Text handelt es sich um eine Zusammenfassung der wichtigsten Informationen aus Rehbein, Malte: Digitalisierung. In: Fotis Jannidis, Hubertus Kohle und Malte Rehbein (Hgg.): Digital Humanities. Eine Einf\u00fchrung. Stuttgart 2017, S. 179-198. Der Aufsatz bietet einen ersten \u00dcberblick &hellip; <a href=\"https:\/\/blogs.uni-paderborn.de\/dfriedl\/2017\/06\/09\/rehbein-digitalisierung\/\">Weiterlesen <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":7864,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[],"class_list":["post-90","post","type-post","status-publish","format-standard","hentry","category-springschool"],"_links":{"self":[{"href":"https:\/\/blogs.uni-paderborn.de\/dfriedl\/wp-json\/wp\/v2\/posts\/90","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogs.uni-paderborn.de\/dfriedl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogs.uni-paderborn.de\/dfriedl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.uni-paderborn.de\/dfriedl\/wp-json\/wp\/v2\/users\/7864"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.uni-paderborn.de\/dfriedl\/wp-json\/wp\/v2\/comments?post=90"}],"version-history":[{"count":3,"href":"https:\/\/blogs.uni-paderborn.de\/dfriedl\/wp-json\/wp\/v2\/posts\/90\/revisions"}],"predecessor-version":[{"id":256,"href":"https:\/\/blogs.uni-paderborn.de\/dfriedl\/wp-json\/wp\/v2\/posts\/90\/revisions\/256"}],"wp:attachment":[{"href":"https:\/\/blogs.uni-paderborn.de\/dfriedl\/wp-json\/wp\/v2\/media?parent=90"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogs.uni-paderborn.de\/dfriedl\/wp-json\/wp\/v2\/categories?post=90"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogs.uni-paderborn.de\/dfriedl\/wp-json\/wp\/v2\/tags?post=90"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}