{"id":18,"date":"2017-05-01T21:10:47","date_gmt":"2017-05-01T19:10:47","guid":{"rendered":"https:\/\/blogs.uni-paderborn.de\/marfrom\/?p=18"},"modified":"2017-06-11T19:18:14","modified_gmt":"2017-06-11T17:18:14","slug":"digitalisation","status":"publish","type":"post","link":"https:\/\/blogs.uni-paderborn.de\/marfrom\/2017\/05\/01\/digitalisation\/","title":{"rendered":"Digitalisation"},"content":{"rendered":"<div class=\"twoclick_social_bookmarks_post_18 social_share_privacy clearfix 1.6.4 locale-de_DE sprite-de_DE\"><\/div><div class=\"twoclick-js\"><script type=\"text\/javascript\">\/* <![CDATA[ *\/\njQuery(document).ready(function($){if($('.twoclick_social_bookmarks_post_18')){$('.twoclick_social_bookmarks_post_18').socialSharePrivacy({\"txt_help\":\"Wenn Sie diese Felder durch einen Klick aktivieren, werden Informationen an Facebook, Twitter, Flattr, Xing, t3n, LinkedIn, Pinterest oder Google eventuell ins Ausland \\u00fcbertragen und unter Umst\\u00e4nden auch dort gespeichert. N\\u00e4heres erfahren Sie durch einen Klick auf das <em>i<\\\/em>.\",\"settings_perma\":\"Dauerhaft aktivieren und Daten\\u00fcber-tragung zustimmen:\",\"info_link\":\"http:\\\/\\\/www.heise.de\\\/ct\\\/artikel\\\/2-Klicks-fuer-mehr-Datenschutz-1333879.html\",\"uri\":\"https:\\\/\\\/blogs.uni-paderborn.de\\\/marfrom\\\/2017\\\/05\\\/01\\\/digitalisation\\\/\",\"post_id\":18,\"post_title_referrer_track\":\"Digitalisation\",\"display_infobox\":\"on\"});}});\n\/* ]]> *\/<\/script><\/div><p>Um uns mit den technischen Voraussetzunge der Digitalisierung vertraut zu machen, sollten wir den Aufsatz \u201eDigitalisierung\u201c von Malte Rehbein lesen. Rehbein besch\u00e4ftigt sich hier mit der kultur- und geisteswissenschaftlichen Nutzbarmachung von Digitalisaten. Zugleich werden auch die Anforderungen an die digitalen Kopien thematisiert.<\/p>\n<p>Rastergrafik<\/p>\n<p>Der Autor konzentriert sich dabei vor allem auf die digitale Abbildung von optischen Informationstr\u00e4gern, also Bild- und Textquellen. Die Erfassung gelingt dabei durch Sensoren, die das reflektierte Licht registrieren und in digitale Daten umwandeln. Es entsteht eine Rastergrafik als digitale Kopie.<\/p>\n<p>Dabei werden innerhalb eins Koordinatensystems alle Bildpunkte (Pixel) mit ihrer jeweiligen Farbtiefe erfasst. Die Farbtiefe ergibt sich aus dem Bitcode. Je mehr Bits zur Beschreibung eines Pixels vorhanden sind, desto gr\u00f6\u00dfer ist die Farbauswahl. Die Farbtiefe der einzelnen Bildpunkte und die Zahl der Pixel bilden die Werte einer Rastergrafik und machen daher auch den Speicherbedarf aus. So k\u00f6nnen gro\u00dfe Bilder mit einer Vielzahl an Farben viel Speicherplatz und eine hohe Rechenleistung erfordern. Mittels Kompressionsverfahren l\u00e4sst sich die Dateigr\u00f6\u00dfe jedoch vermindern. Viele standardm\u00e4\u00dfig genutzte Kompressionsformate sind jedoch verlustbehaftet: Um Speicherplatz zu sparen, werden vom menschlichen Auge nicht wahrnehmbare Differenzierungen und Eindr\u00fccke aus dem Bild herausgefiltert. Bei einer zu hohen Kompression ist jedoch eine visuelle Verschlechterung des Bildes zu erkennen. Daneben gibt es auch verlustfreie Kompressionsverfahren. Dabei werden Redundanzen vermieden, indem zusammenh\u00e4ngende Bildpunkte mit derselben Farbtiefe nur einmal als Pixel gespeichert werden. Gleichzeitig werden die Informationen \u00fcber die genauen Koordinaten der Bildpunkte durch einen Algorithmus gespeichert. Dieses Verfahren bedeutet zwar einen geringeren Speicherverbrauch, verlangt jedoch eine h\u00f6here Rechenleistung, da das Bild bei jeder Darstellung entsprechend gerastert werden muss.<\/p>\n<p>Vektorgrafik<\/p>\n<p>Neben den Rastergrafiken finden vor allem Vektorgrafiken Verwendung. Hier werden nicht die einzelnen Bildpunkte gespeichert, sondern Informationen zu den geometrischen, farblichen und weiteren gestalterischen Eigenschaften. Bei der Ausgabe der Grafik wird das Bild anhand dieser Informationen mit einem Algorithmus berechnet. Der gro\u00dfe Vorteil besteht darin, dass sich Vektorgrafiken ohne Qualit\u00e4tsverlust skalieren lassen. In der Regel ist der Speicherbedarf auch geringer, da nur die Parameter gespeichert werden. Im Gegenzug ben\u00f6tigt man f\u00fcr das Aufrufen einer Vektorgrafik jedoch mehr Rechenleistung, da das Bild erst gerendert werden muss. Der Speicherplatz einer Vektorgrafik richtet sich daher auch nicht nach der Gr\u00f6\u00dfe des Bildes oder der Farbtiefe, sondern nur nach der Komplexit\u00e4t der Darstellung. Aufgrund der technischen Komplexit\u00e4t werden Bilder und Texte jedoch meist als Rastergrafiken digitalisiert.<\/p>\n<p>Parameter<\/p>\n<p>Die technischen Parameter bestimmen die Qualit\u00e4t des Digitalisats und damit auch die wissenschaftliche Aussagekraft. Es gibt hier keine allgemeing\u00fcltigen Vorgaben. Vielmehr muss bei der Einstellung der technischen Parameter die sp\u00e4tere Nutzung und der Forschungszweck mitbedacht werden. Aus diesem Grund ist es wichtig, die technischen Parameter der jeweiligen Digitalisierung zu kennen. Nur so kann man feststellen, ob sich die digitalen Abbilder \u00fcberhaupt f\u00fcr den jeweiligen Forschungszweck eignen.<\/p>\n<p>Trotzdem gibt es einige allgemeine Richtlinien, die vor allem die Aufl\u00f6sung des Digitalisats betreffen. Diese sollte mindestens 300 dpi (dots per inch) betragen. Ein inch sind 25,4 mm, sodass mindestens 300 Pixel auf einer 25,4 mm langen Strecke abgetastet werden sollten. Bei detaillierten Untersuchungen einzelner Bildteile oder des Materials sind noch h\u00f6here Aufl\u00f6sungen notwendig.<\/p>\n<p>Ger\u00e4te zur Digitalisierung und Archivierung<\/p>\n<p>Die Standardger\u00e4te zur Digitalisierung sind dabei Scanner und Digitalkameras. Beide arbeiten mit elektronischen Bildsensoren, die das reflektierte Licht auffangen und in ein Abbild umwandeln. Verwendet man eine Digitalkamera, so kann man durch die Fokussierung, die Gr\u00f6\u00dfe der Blenden\u00f6ffnung, die Verschlusszeit sowie die Brennweite des Objektivs die Qualit\u00e4t des Digitalisats beeinflussen oder bestimmte Bereiche der Vorlage besonders in den Blick nehmen.<\/p>\n<p>Scanner sind Datenerfassungsger\u00e4te, die die Vorlage mittels Licht nach bestimmten Rastern abtasten und digitalisieren. Dabei wird zwischen Flachbettscannern und Buchscannern unterschieden. Erstere sind vor allem f\u00fcr die Digitalisierung von einzelnen zweidimensionalen Objekten geeignet. B\u00fccher k\u00f6nnen aufgrund der Buchbindung schlecht auf Flachbettscannern digitalisiert werden, da die Objekte dort mit der zu scannenden Seite flach auf der Glasplatte aufliegen m\u00fcssen. Zudem kann so die Bindung zerst\u00f6rt werden. Daher verwendet man hier spezielle Buchscanner. Das Buch wird dabei aufgeschlagen auf die sogenannte Buchwippe gelegt und von oben abfotografiert. Glasplatten und andere Befestigungsmethoden sorgen daf\u00fcr, dass die Seiten fixiert sind und sich nicht umbl\u00e4ttern. Um bei wertvollen und empfindlichen B\u00fcchern die Bindung nicht zu zerst\u00f6ren, finden mittlerweile auch Scanner Verwendung, die eine Abtastung bei einem \u00d6ffnungswinkel von 45 Grad erlauben. M\u00fcssen ganze B\u00fccher digitalisiert werden, k\u00fcmmern sich Scan-Roboter um das automatische Umbl\u00e4ttern und die Fixierung der Seiten.<\/p>\n<p>Eine immer noch verwendete analoge Abbildungsm\u00f6glichkeit sind Mikroformen, wie Mikrofiche oder Mikrofilm. Hier wird eine Vorlage stark verkleinert auf Filmmaterial abgebildet. Mittels eines Leseger\u00e4tes kann diese Kopie vergr\u00f6\u00dfert betrachtet werden. Die lange Haltbarkeit der Mikrofilme, die auf bis zu 500 Jahre gesch\u00e4tzt wird, macht sie zum idealen Speichermedium f\u00fcr Bibliotheken und Archive. Die Mikroformen k\u00f6nnen durch spezielle Ger\u00e4te zudem digitalisiert werden, sodass man hier nicht das Original als Vorlage ben\u00f6tigt.<\/p>\n<p>Die Metadaten<\/p>\n<p>Zur Erschlie\u00dfung eines Digitalisats sind Metadaten von gro\u00dfer Wichtigkeit. Rehbein unterscheidet vier Typen von Metadaten. Deskriptive Metadaten beschreiben den Inhalt und sind vor allem zum Auffinden eines Digitalisats wichtig. Der Aufbau des Bildes oder Textes wird in den strukturellen Metadaten festgehalten, w\u00e4hrend die technischen Metadaten die Qualit\u00e4t des Objektes beurteilen. Die administrativen Metadaten geben Auskunft \u00fcber die Nutzungsrechte. Insgesamt hat sich hier kein allgemeing\u00fcltiger Standard durchsetzen k\u00f6nnen, sodass es eine gro\u00dfe Zahl an Spezifikationen gibt, die auf die jeweiligen Fachgebiete zugeschnitten sind.<\/p>\n<p>Digitale Texterfassung<\/p>\n<p>Bei der Digitalisierung eines Textes m\u00fcssen noch weitere Vorgaben beachtet werden. So muss hier nicht einfach nur das Druckbild digital erfasst werden, sondern auch der Text erkannt werden. Man bedient sich daf\u00fcr zwei Methoden: Bei der manuellen Zeichenerfassung wird der Text per Hand abgetippt. Um Fl\u00fcchtigkeitsfehler zu verhindern, wird ein Text dabei von mehreren Personen abgetippt und anschlie\u00dfend verglichen.<\/p>\n<p>Beim zweiten Verfahren erfolgt wie bei der Bilddigitalisierung eine automatische digitale Abtastung der Vorlage als Rastergrafik, die als Optical Character Recognition bezeichnet wird. M\u00f6gliche Verzerrungen oder andere Bildst\u00f6rungen, die die sp\u00e4tere Texterkennung st\u00f6ren k\u00f6nnten, sollten danach bei einer Vorverarbeitung behoben werden. Danach wird die Grafik binarisiert, d. h. jeder Bildpunkt wird entweder dem Hintergrund oder dem Text zugeordnet. Eine Analyse und Segmentierung der Vorlage filtert alle nicht zum Text geh\u00f6renden Bereiche wie Bilder aus der Texterkennung heraus. Die Textbereiche werden in Zeilen und Wortbl\u00f6cke geordnet. Bei der anschlie\u00dfenden Zeichenerkennung werden die einzelnen Glyphen mit einem Modellzeichensatz verglichen und dementsprechend zugeordnet. In der Nachbearbeitung wird der Text mit W\u00f6rterb\u00fcchern verglichen, um m\u00f6gliche Zeichen- und daraus resultierende Wortfehler zu beheben.<\/p>\n<p>Damit ein solch digitalisierter Text f\u00fcr die wissenschaftliche Auswertung brauchbar ist, empfiehlt die DFG eine Textgenauigkeit von 99,95 %. Die Qualit\u00e4t einer Textdigitalisierung h\u00e4ngt dabei vom Zustand und der Textart der Vorlage ab. So ist das Erkennen von Handschriften wesentlich schwieriger als von Schreibmaschinen-, Computer- oder Buchdrucktexten.<\/p>\n<p>Weitere Digitalisierungsformen<\/p>\n<p>Dank moderner Techniken gibt es heute weitere Digitalisierungsformen. So erm\u00f6glichen 3D-Digitalisierungsverfahren eine gegenst\u00e4ndliche Erfassung einer Vorlage. So k\u00f6nnen Informationen, die bei der zweidimensionalen Digitalisierung nur mittelbar als Metadaten erfasst werden k\u00f6nnen, direkt dargestellt werden. Daneben gibt es nat\u00fcrlich auch Digitalisierungen im nichtvisuellen Bereich. So werden z. B. akustische Analogvorlagen in digitale Formen umgewandelt.<\/p>\n<p>Meine Erfahrungen mit Digitalisierungen und Digitalisaten<\/p>\n<p>Als Student habe ich mit der Digitalisierung von Texten bereits Erfahrung gesammelt. Hierbei handelt es sich jedoch haupts\u00e4chlich um Sekund\u00e4rliteratur, die ich f\u00fcr meine Forschungsarbeiten ben\u00f6tigt habe. Hier nutze ich sowohl Flachbett- als auch Buchscanner. Bilddigitalisierungen habe ich im Rahmen meiner Arbeit im Universit\u00e4tsarchiv durchgef\u00fchrt. Aufgrund des jungen Alters der Universit\u00e4t handelt es sich hierbei meist um Analogfotos oder Plakate. Als Digitalisierungswerkzeuge werden im Archiv sowohl ein Flachbettscanner als auch eine Digitalkamera genutzt.<\/p>\n<p>Zur dauerhaften Nutzung halte ich Digitalisierungen f\u00fcr sehr wichtig, da sie die wissenschaftliche Arbeit stark erleichtern. So kann Quellmaterial geschont werden, da man f\u00fcr eine Untersuchung auf das digitale Abbild zur\u00fcckgreifen kann. Gleichzeitig erleichtert eine Digitalisierung die Zug\u00e4nglichkeit. So k\u00f6nnen Digitalisate ohne gro\u00dfen technischen oder finanziellen Aufwand vervielf\u00e4ltigt oder online bereitgestellt werden. F\u00fcr mich liegt der Nachteil eines Digitalisats vor allem in den technischen Voraussetzungen, die erf\u00fcllt sein m\u00fcssen, um auf das Abbild zuzugreifen. Ohne die entsprechende Hardware und Software ist eine Betrachtung und Auswertung des Dokuments nicht m\u00f6glich. Zugleich m\u00fcssen die digitalen Abbilder stets in die aktuellen Formate \u00fcbertragen werden, um eine dauerhafte Nutzung zu gew\u00e4hrleisten. Ein gro\u00dfer Vorteil der Digitalisierung liegt vor allem auch in der Platzersparnis gegen\u00fcber Zettelkopien oder B\u00fcchern.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Um uns mit den technischen Voraussetzunge der Digitalisierung vertraut zu machen, sollten wir den Aufsatz \u201eDigitalisierung\u201c von Malte Rehbein lesen. Rehbein besch\u00e4ftigt sich hier mit der kultur- und geisteswissenschaftlichen Nutzbarmachung von Digitalisaten. Zugleich werden auch die Anforderungen an die digitalen &hellip; <a href=\"https:\/\/blogs.uni-paderborn.de\/marfrom\/2017\/05\/01\/digitalisation\/\">Weiterlesen <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":7904,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-18","post","type-post","status-publish","format-standard","hentry","category-allgemein"],"_links":{"self":[{"href":"https:\/\/blogs.uni-paderborn.de\/marfrom\/wp-json\/wp\/v2\/posts\/18","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogs.uni-paderborn.de\/marfrom\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogs.uni-paderborn.de\/marfrom\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.uni-paderborn.de\/marfrom\/wp-json\/wp\/v2\/users\/7904"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.uni-paderborn.de\/marfrom\/wp-json\/wp\/v2\/comments?post=18"}],"version-history":[{"count":3,"href":"https:\/\/blogs.uni-paderborn.de\/marfrom\/wp-json\/wp\/v2\/posts\/18\/revisions"}],"predecessor-version":[{"id":124,"href":"https:\/\/blogs.uni-paderborn.de\/marfrom\/wp-json\/wp\/v2\/posts\/18\/revisions\/124"}],"wp:attachment":[{"href":"https:\/\/blogs.uni-paderborn.de\/marfrom\/wp-json\/wp\/v2\/media?parent=18"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogs.uni-paderborn.de\/marfrom\/wp-json\/wp\/v2\/categories?post=18"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogs.uni-paderborn.de\/marfrom\/wp-json\/wp\/v2\/tags?post=18"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}