{"id":280,"date":"2018-05-01T12:05:47","date_gmt":"2018-05-01T10:05:47","guid":{"rendered":"https:\/\/blogs.uni-paderborn.de\/mwille\/?page_id=280"},"modified":"2018-06-19T13:11:26","modified_gmt":"2018-06-19T11:11:26","slug":"transkribus-2","status":"publish","type":"page","link":"https:\/\/blogs.uni-paderborn.de\/lingutools\/transkribus-2\/","title":{"rendered":"Transkribus"},"content":{"rendered":"<div class=\"twoclick_social_bookmarks_post_280 social_share_privacy clearfix 1.6.4 locale-de_DE sprite-de_DE\"><\/div><div class=\"twoclick-js\"><script type=\"text\/javascript\">\/* <![CDATA[ *\/\njQuery(document).ready(function($){if($('.twoclick_social_bookmarks_post_280')){$('.twoclick_social_bookmarks_post_280').socialSharePrivacy({\"txt_help\":\"Wenn Sie diese Felder durch einen Klick aktivieren, werden Informationen an Facebook, Twitter, Flattr, Xing, t3n, LinkedIn, Pinterest oder Google eventuell ins Ausland \\u00fcbertragen und unter Umst\\u00e4nden auch dort gespeichert. N\\u00e4heres erfahren Sie durch einen Klick auf das <em>i<\\\/em>.\",\"settings_perma\":\"Dauerhaft aktivieren und Daten\\u00fcber-tragung zustimmen:\",\"info_link\":\"http:\\\/\\\/www.heise.de\\\/ct\\\/artikel\\\/2-Klicks-fuer-mehr-Datenschutz-1333879.html\",\"uri\":\"https:\\\/\\\/blogs.uni-paderborn.de\\\/lingutools\\\/transkribus-2\\\/\",\"post_id\":280,\"post_title_referrer_track\":\"Transkribus\",\"display_infobox\":\"on\"});}});\n\/* ]]> *\/<\/script><\/div><p><strong>Was ist Transkribus?<\/strong><\/p>\n<p>Transkribus ist eine Plattform f\u00fcr die automatische Erkennung von Handschriften, Druckschriften, Bildern und Layoutstrukturen. Sie eignet sich besonders, um Dokumente in ihrer vielf\u00e4ltigen typographischen, graphischen und strukturellen Darstellung maschinell zu erschlie\u00dfen und f\u00fcr linguistische Forschungsfragen weiterzunutzen. Transkribus segmentiert hierzu jedes Dokument automatisch in Textbl\u00f6cke (<em>text regions<\/em>), Grundlinien (<em>baselines<\/em>) und Zeilen (<em>line regions<\/em>). Eingebaute OCR-Tools erm\u00f6glichen dar\u00fcber hinaus eine automatische Texterkennung, die besonders bei hochwertigen Scanvorlagen gute Ergebnisse liefern.<\/p>\n<p><strong>Vorteile:<\/strong><\/p>\n<ul>\n<li>Auswahl aus einem gro\u00dfen Fundus an Funktionen und Werkzeugen zur Texterschlie\u00dfung<\/li>\n<li>nach Registrierung frei nutzbar<\/li>\n<li>zuverl\u00e4ssige Strukturerkennungsfunktionen, die auch manuelle Korrekturen erlauben<\/li>\n<li>vielf\u00e4ltige M\u00f6glichkeiten des Datei-Imports (PDF, jpg, docx&#8230;) und -Exports (PDF, docx, xml&#8230;)<\/li>\n<li>intuitiv zug\u00e4ngliche Benutzeroberfl\u00e4che mit Bildbereich, Texteditor und Men\u00fcleiste (gilt f\u00fcr die Grundfunktionen der Plattform)<\/li>\n<li>Automatische Bild- und Texterkennung spezifischer Dokumente sind trainierbar<\/li>\n<li>individuelle Korpuserstellung f\u00fcr gr\u00f6\u00dfere Datenmengen<\/li>\n<\/ul>\n<p><strong>Nachteile:<\/strong><\/p>\n<ul>\n<li>Gro\u00dfer Funktionsumfang erfordert Einarbeitungszeit<\/li>\n<li>Umgang mit den Annotationswerkzeugen manchmal umst\u00e4ndlich<\/li>\n<\/ul>\n<hr \/>\n<p><strong>\u201eGetting started\u201c<\/strong> \u2013 <strong>Schritt-f\u00fcr-Schritt-Anleitung<\/strong><\/p>\n<p>Laden Sie sich die letzte Release-Version von Transkribus unter <a href=\"https:\/\/transkribus.eu\/Transkribus\/\">https:\/\/transkribus.eu\/Transkribus\/<\/a> f\u00fcr Ihr Betriebssystem herunter. Um die Plattform nutzen zu k\u00f6nnen, ist eine Registrierung notwendig (Verkn\u00fcpfung via Google-Konto ist m\u00f6glich). Folgen Sie den Installationsschritten und \u00f6ffnen Sie Transkribus auf ihrem lokalen System.<\/p>\n<p>Loggen Sie sich mit ihren Zugangsdaten auf den Servern des Programms ein, um Zugriff auf einige Beispieldokumente sowie die Funktionen von Transkribus zu erhalten.<\/p>\n<figure id=\"attachment_324\" aria-describedby=\"caption-attachment-324\" style=\"width: 1915px\" class=\"wp-caption alignleft\"><a href=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/transkribus-2\/transkribus-step-by-step-4\/\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-324 size-full\" src=\"https:\/\/blogs.uni-paderborn.de\/mwille\/files\/2018\/05\/transkribus-step-by-step-4.jpg\" width=\"1915\" height=\"994\" srcset=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-4.jpg 1915w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-4-300x156.jpg 300w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-4-768x399.jpg 768w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-4-1024x532.jpg 1024w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-4-500x260.jpg 500w\" sizes=\"auto, (max-width: 1915px) 100vw, 1915px\" \/><\/a><figcaption id=\"caption-attachment-324\" class=\"wp-caption-text\">Ansicht der Benutzeroberfl\u00e4che in &#8222;Transkribus&#8220;<\/figcaption><\/figure>\n<p><strong>Automatische Layout-Analyse<\/strong><\/p>\n<p>Sie haben nun die M\u00f6glichkeit, eine automatische Layout-Analyse Ihres Dokumentes durchzuf\u00fchren. Klicken Sie hierzu in der Funktionsleiste oben links auf <strong>Tools <\/strong>und w\u00e4hlen Sie nach Bedarf, ob Transkribus die ausgew\u00e4hlte Seite oder das gesamte Transkript analysieren soll. Die Funktionen <strong>Find Text Regions <\/strong>und <strong>Find Lines in Text Regions <\/strong>sind automatisch aktiviert, klicken Sie unter dem Punkt <strong>Layout Analysis <\/strong>auf <strong>Run <\/strong>und die automatische Analyse startet (auch hier kann die Bearbeitung je nach struktureller Komplexit\u00e4t einige Zeit in Anspruch nehmen).<\/p>\n<p>Transkribus pr\u00e4sentiert das analysierte Dokument anschlie\u00dfend in Bildform mit segmentierten Textbl\u00f6cken und Zeilenerkennungen, die Sie als Grundlage f\u00fcr eine eigene\u00a0 Transkription nutzen k\u00f6nnen. Der Texteditor unterhalb der Bildansicht stellt die Zeilen des Flie\u00dftextes dar, in die Sie die Transkription eintragen k\u00f6nnen. Texttranskription und die bildliche Originalvorlage sind Zeile f\u00fcr Zeile miteinander verkn\u00fcpft:<\/p>\n<figure id=\"attachment_326\" aria-describedby=\"caption-attachment-326\" style=\"width: 1693px\" class=\"wp-caption alignleft\"><a href=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/transkribus-2\/transkribus-step-by-step-5\/\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-326 size-full\" src=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-5.jpg\" width=\"1693\" height=\"996\" srcset=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-5.jpg 1693w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-5-300x176.jpg 300w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-5-768x452.jpg 768w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-5-1024x602.jpg 1024w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-5-500x294.jpg 500w\" sizes=\"auto, (max-width: 1693px) 100vw, 1693px\" \/><\/a><figcaption id=\"caption-attachment-326\" class=\"wp-caption-text\">Manuelles Annotieren im Texteditor<\/figcaption><\/figure>\n<p>Wenn Sie die automatische Layouterkennung Ihren eigenen Bed\u00fcrfnissen anpassen bzw. Erkennungsfehler korrigieren m\u00f6chten, k\u00f6nnen Sie die Werkzeuge der vertikalen Funktionsleiste links neben der Bildansicht nutzen. Hier k\u00f6nnen Sie Ihrem Dokument auch weitere Textregionen, Linien oder andere Annotationselemente hinzuf\u00fcgen.<\/p>\n<p>Die weitere Bearbeitung des Dokuments in Transkribus richtet sich nach Ihren Forschungsfragen und Erkenntnisinteressen, die Methode des Ausprobierens und Erkundens eignet sich f\u00fcr Transkribus aufgrund der vielf\u00e4ltigen Funktionen sehr gut. Exemplarisch sei auf die M\u00f6glichkeit hingewiesen, Ihren transkribierten Text mit zus\u00e4tzlichen Informationen zu &#8222;taggen&#8220; (mit Auszeichnungen anzureichern). Unter dem Reiter <strong>Metadata <\/strong>finden Sie eine F\u00fclle von vorgegebenen &#8222;Tags&#8220; (aufgeteilt in strukturelle Tags und textuelle Tags), mit der Sie Ihr Dokument annotieren k\u00f6nnen. Neben prototypischen Annotationen f\u00fcr Textauszeichnungen (\u00dcberschriften, Signaturzeilen, Paragraphen, Bildern etc.) k\u00f6nnen Sie auch eigene Annotationen erstellen und das Dokument individuell auszeichnen. Folgender Screenshot zeigt diese Weiterverarbeitung exemplarisch:<\/p>\n<figure id=\"attachment_328\" aria-describedby=\"caption-attachment-328\" style=\"width: 1848px\" class=\"wp-caption alignleft\"><a href=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/transkribus-2\/transkribus-step-by-step-7\/\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-328 size-full\" src=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-7.jpg\" width=\"1848\" height=\"986\" srcset=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-7.jpg 1848w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-7-300x160.jpg 300w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-7-768x410.jpg 768w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-7-1024x546.jpg 1024w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-7-500x267.jpg 500w\" sizes=\"auto, (max-width: 1848px) 100vw, 1848px\" \/><\/a><figcaption id=\"caption-attachment-328\" class=\"wp-caption-text\">Automatische und semi-automatische Texterkennung und Annotation von Textbausteinen<\/figcaption><\/figure>\n<p><strong>Automatische Texterkennung (OCR)<\/strong><\/p>\n<p>Ein weiteres, \u00fcberaus n\u00fctzliches Tool in Transkribus ist die automatische Texterkennung mittels OCR (&#8222;Optical Character Recognition&#8220;). Klicken Sie hierzu erneut auf den Reiter <strong>Tools. <\/strong>Unter dem Unterpunkt <strong>Text Recognition <\/strong>k\u00f6nnen Sie nun eine Methode der automatischen Texterkennung ausw\u00e4hlen, deren Erkennungsgenauigkeit ganz erheblich von der Dokumentenvorlage abh\u00e4ngt. Im vorliegenden Beispieldokument handelt es sich um einen gedruckten Text in der noch heute g\u00e4ngigen Schriftart Antiqua, was die Erfolgsrate der automatischen Texterkennung immens steigert. Da Transkribus auch auf die Erkennung von Handschriftenvorlagen programmiert ist, k\u00f6nnen Sie unter <strong>Models&#8230; <\/strong>ein Erkennungsmodell ausw\u00e4hlen, das auf authentischen handschriftlichen Vorlagen trainiert wurde und die OCR-Erfolgsrate Ihres Dokumentes erh\u00f6hen k\u00f6nnte. Die OCR-Erkennung des Beispieltranskriptes zeigt folgender Screenshot ausschnitthaft:<\/p>\n<figure id=\"attachment_330\" aria-describedby=\"caption-attachment-330\" style=\"width: 1728px\" class=\"wp-caption alignleft\"><a href=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/transkribus-2\/transkribus-step-by-step-8\/\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-330 size-full\" src=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-8.jpg\" width=\"1728\" height=\"995\" srcset=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-8.jpg 1728w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-8-300x173.jpg 300w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-8-768x442.jpg 768w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-8-1024x590.jpg 1024w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-8-500x288.jpg 500w\" sizes=\"auto, (max-width: 1728px) 100vw, 1728px\" \/><\/a><figcaption id=\"caption-attachment-330\" class=\"wp-caption-text\">Exemplarisches Ergebnis einer automatischen Textannotation<\/figcaption><\/figure>\n<p>Wenn Sie Ihre annotierten Dokumente weiterverarbeiten wollen, bietet Ihnen Transkribus eine ganze Reihe an Exportoptionen. Klicken Sie hierzu auf das Symbol mit dem Befehl <strong>Export document <\/strong>in der horizontalen oberen Men\u00fcleiste. Die Software bietet unter anderem den Export des Materials als PDF-Dokument, als simple TXT-Datei, als Word-Dokument, als Excel-Tabelle oder als TEI-XML-Dokument an. Zus\u00e4tzlich k\u00f6nnen Sie genau ausw\u00e4hlen, welche Informationen (Annotationen, Textregionen, Zeilenumbr\u00fcche, Seiten etc.) exportiert werden sollen.<\/p>\n<figure id=\"attachment_332\" aria-describedby=\"caption-attachment-332\" style=\"width: 1561px\" class=\"wp-caption alignleft\"><a href=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/transkribus-2\/transkribus-step-by-step-9\/\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-332 size-full\" src=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-9.jpg\" width=\"1561\" height=\"989\" srcset=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-9.jpg 1561w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-9-300x190.jpg 300w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-9-768x487.jpg 768w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-9-1024x649.jpg 1024w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-9-474x300.jpg 474w\" sizes=\"auto, (max-width: 1561px) 100vw, 1561px\" \/><\/a><figcaption id=\"caption-attachment-332\" class=\"wp-caption-text\">Exportoptionen zur Weiterverarbeitung der Annotationen<\/figcaption><\/figure>\n<p>Folgender Screenshot zeigt einen PDF-Export der in der Anleitung analysierten Beispielseite:<\/p>\n<figure id=\"attachment_334\" aria-describedby=\"caption-attachment-334\" style=\"width: 1478px\" class=\"wp-caption alignleft\"><a href=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/transkribus-2\/transkribus-step-by-step-10\/\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-334 size-full\" src=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-10.jpg\" width=\"1478\" height=\"786\" srcset=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-10.jpg 1478w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-10-300x160.jpg 300w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-10-768x408.jpg 768w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-10-1024x545.jpg 1024w, https:\/\/blogs.uni-paderborn.de\/lingutools\/files\/2018\/05\/transkribus-step-by-step-10-500x266.jpg 500w\" sizes=\"auto, (max-width: 1478px) 100vw, 1478px\" \/><\/a><figcaption id=\"caption-attachment-334\" class=\"wp-caption-text\">Aus &#8222;Transkribus&#8220; exportiertes PDF-Dokument (Beispiel)<\/figcaption><\/figure>\n<hr \/>\n<p><strong>Weiterf\u00fchrende Links:<\/strong><\/p>\n<p><a href=\"https:\/\/transkribus.eu\/Transkribus\/\">https:\/\/transkribus.eu\/Transkribus\/<\/a><\/p>\n<p><a href=\"https:\/\/transkribus.eu\/wikiDe\/index.php\/Hauptseite\">Transkribus Wiki<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Was ist Transkribus? Transkribus ist eine Plattform f\u00fcr die automatische Erkennung von Handschriften, Druckschriften, Bildern und Layoutstrukturen. Sie eignet sich besonders, um Dokumente in ihrer vielf\u00e4ltigen typographischen, graphischen und strukturellen Darstellung maschinell zu erschlie\u00dfen und f\u00fcr linguistische Forschungsfragen weiterzunutzen. Transkribus segmentiert hierzu jedes Dokument automatisch in Textbl\u00f6cke (text regions), Grundlinien (baselines) und Zeilen (line regions). &hellip; <a href=\"https:\/\/blogs.uni-paderborn.de\/lingutools\/transkribus-2\/\" class=\"more-link\"><span class=\"screen-reader-text\">Transkribus<\/span> weiterlesen<\/a><\/p>\n","protected":false},"author":7825,"featured_media":346,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-280","page","type-page","status-publish","has-post-thumbnail","hentry"],"_links":{"self":[{"href":"https:\/\/blogs.uni-paderborn.de\/lingutools\/wp-json\/wp\/v2\/pages\/280","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogs.uni-paderborn.de\/lingutools\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/blogs.uni-paderborn.de\/lingutools\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.uni-paderborn.de\/lingutools\/wp-json\/wp\/v2\/users\/7825"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.uni-paderborn.de\/lingutools\/wp-json\/wp\/v2\/comments?post=280"}],"version-history":[{"count":12,"href":"https:\/\/blogs.uni-paderborn.de\/lingutools\/wp-json\/wp\/v2\/pages\/280\/revisions"}],"predecessor-version":[{"id":606,"href":"https:\/\/blogs.uni-paderborn.de\/lingutools\/wp-json\/wp\/v2\/pages\/280\/revisions\/606"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blogs.uni-paderborn.de\/lingutools\/wp-json\/wp\/v2\/media\/346"}],"wp:attachment":[{"href":"https:\/\/blogs.uni-paderborn.de\/lingutools\/wp-json\/wp\/v2\/media?parent=280"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}