Mein Workflow

Techniktipps zum Promovieren

Die Datenbank hatte sich zuvor längst angebiedert, sich allmählich in meine Lektüregewohnheiten eingeschlichen, hatte meinen Blick getriggert, ihn formatiert. Hatte meinem Lesen einen Sinn gegeben. (Friedrichs 2021)

Der Beitrag von Werner Friedrichs hat mich vor einer Weile dazu inspiriert, darüber nachzudenken, wie das Zusammenspiel mit der Technik mein Arbeiten prägt. Dabei habe ich gemerkt: Mir macht schließlich nicht nur das akademische Arbeiten an sich Spaß, sondern auch, am wie des Arbeitens zu feilen und technische Lösungen für dabei entstehende Probleme zu finden. Es fühlt sich doch irgendwie erfüllender an, eine halbe Stunde in die Automatisierung einer nervigen Aufgabe zu investieren, als sie in 20 Minuten von Hand zu erledigen. Dafür nutze ich gerne freie und Open-Source-Software. Mir gefällt die darin oft aufscheinende Idee des Teilens und der Community. Ganz in diesem Sinne dachte ich, ich teile auch mal, wie ich aktuell arbeite - vielleicht kann ja jemand etwas damit anfangen.

Literatur finden

Neben der „Schneeballmethode“, also dem Literaturfinden durch das Lesen von anderen Texten verwende ich häufig Suchmaschinen wie Google Scholar oder den Katalog der Universitätsbibliothek. Um das zu beschleunigen, habe ich beide als eigene Suchmaschinen zu Firefox hinzugefügt. Dafür ruft man die entsprechende Website, also z.B. https://katalog.ub.uni-heidelberg.de/cgi-bin/search.cgi auf und führt dort eine Suche durch. Im Anschluss Rechtsklick in der Adressleiste und auf „Heidi hinzufügen“ o.ä. klicken. Im Anschluss kann man unter EinstellungenSucheSuchmaschinen-Schlüsselwörter noch ein eigenes Schlüsselwort, z.B. „heidi“ hinzufügen. Jetzt kann man einfach in die URL-Leiste heidi Condorcet eingeben und wird direkt auf die Ergebnisseite weitergeleitet. Adresszeile, in der „heidi Das Lehramt als politischer Beruf“ steht

Downloaden und Zusammenfügen von PDFs

Im Optimalfall lade ich Bücher oder Aufsätze aus dem Internet runter. Manche eLibraries, z.B. Nomos oder DeGruyter erlauben nicht den Download ganzer Bücher sondern nur den Download aller einzelnen Kapitel (mit Hilfe eines Download-Managers wie DownThemAll lässt sich dieser Schritt wohl etwas automatisieren - die richtige Lösung wäre natürlich, dass die Verlage auf solche unnötigen und unsinnigen Hürden verzichten). Die dadurch erhaltenen einzelnen PDF-Dateien lassen sich mit Hilfe von Tools wie PDF Chain oder pdftk wieder zusammensetzen.

Scannen

Bücher die ich nicht digital vorliegen habe, scanne ich in der Regel mit den Aufsichtsscannern der Bibliothek. Kürzere Texte scanne ich zuhause mit dem Handy und der kostenlosen App vFlat. Und wenn ich mal Zeit habe, baue ich mir meinen eigenen Buchscanner

Texterkennung im PDF

Insbesondere selbstgescannte Texte lassen sich häufig weder durchsuchen noch markieren, weil es keine Textebene gibt. Zur automatischen Texterkennung nutze ich deshalb das Open-Source-Tool ocrmypdf, für das es eine ausführliche Anleitung im Netz gibt. Für den Scan eines deutschsprachigen Buchs erreicht man in der Regel gute Ergebnisse mit dem Befehl ocrmypdf -l deu Scan.pdf Scan_OCR.pdf. Tipp: Zum Scannen von Frakturschrift gibt es ein eigenes Sprachpaket, das sich unter Ubuntu oder Debian mit apt install tesseract-ocr-script-frakt installieren lässt. ocrmypdf kann außerdem auch noch eine Reihe von Optimierungen am PDF vornehmen, um z.B. die Dateigröße zu verringern. Für Zotero gibt es auch ein Plug-In der UB Mannheim namens zotero-ocr, das unter der Haube die gleiche Software wie ocrmypdf nutzt - ich nutze aus Gewohnheit weiter ocrmypdf.

Seitenzahlen (page labels) zu PDF-Dateien hinzufügen

Beim Scannen von Büchern aber auch bei heruntergeladenen Aufsätzen kommt es vor, dass die Seitenzahlen des PDFs nicht mehr zu den Seitenzahlen des Buchs passen, etwa weil man das Cover mitgescannt hat und das jetzt als Seite 1 gezählt wird. Insbesondere, wenn man die Funktionen Zoteros (z.B. das Verlinken auf PDF-Seiten in Notizen) voll ausnutzen möchte, ist das nervig. Zum Glück gibt es auch dafür Abhilfe, indem man auf die PDF-Funktion page labels zurückgreift (bei vielen PDFs aus dem Internet haben die Verlage das schon gemacht): Zum Anpassen der Seitenzahlen erstellt man im gleichen Verzeichnis wie die PDF-Dateie eine Textdatei meta.txt. Diese sieht so aus:

PageLabelBegin
PageLabelNewIndex: 1
PageLabelStart: 1
PageLabelNumStyle: NoNumber
PageLabelBegin
PageLabelNewIndex: 7
PageLabelStart: 7
PageLabelNumStyle: UppercaseRomanNumerals
PageLabelBegin
PageLabelNewIndex: 10
PageLabelStart: 1
PageLabelNumStyle: DecimalArabicNumerals

Dieser Code würde also bedeuten: Die Seiten 1 bis 6 werden nicht nummeriert. 7 bis 9 werden als VII - IX nummeriert, ab Seite 10 beginnen dann die Seitennummern in arabischen Ziffern mit der 1. Auf die PDF-Datei angewandt wird diese neue Struktur mit dem Befehl pdftk Scan_OCR.pdf update_info meta.txt output Scan_Pages.pdf

Literatur verwalten & lesen

Allen Freund*innen, Bekannten und Studierenden empfehle ich dringend die Nutzung einer Literaturverwaltungssoftware. Meistens sind dafür über die Universität Lizenzen verfügbar - die man aber gar nicht braucht, wenn man, wie ich, die freie Software Zotero nutzt.

Literatur verwalten und sortieren

Alle PDFs, Bücher und Aufsätze, die ich verwende, landen dort, meistens schon direkt in Unterordnern (Sammlungen), die nach Projekt (z.B. Aufsatz 2021) und Thema sortiert sind. Um die Übersicht zu behalten, habe ich Tags angelegt, mit denen ich die Bücher nach dem Lesen nach Relevanz in drei Kategorien (Eher Irrelevant, Mittelmäßig Relevant, Sehr relevant) sortiere. Den Tags habe ich jeweils eine Farbe zugeordnet, die in der Übersicht neben dem Titel des Werks angezeigt wird. Beim Zuweisen der Farbe kann man auch direkt eine Zahl auswählen, die man tippen kann, um den Einträgen schnell Tags zuzuweisen - ich brauche also nur 1 tippen, um den ausgewählten Eintrag als „Sehr Wichtig“ zu markieren. Ich vergebe außerdem einige inhaltliche Tags, das passiert aber eher unsystematisch.

Literatur lesen und annotieren

Weil ich die Zotero-Beta nutze, kann ich den in Zotero integrierten PDF-Reader nutzen. Wie das funktioniert, habe ich hier versucht zu zeigen.

Schreiben

Das Schreiben mache ich am Ende in LibreOffice-Writer - alle Lösungen, die z.B. auf Markdown oder Latex setzten, waren mir letztlich zu kompliziert, insbesondere weil man dann auf einige nützliche Zotero-Funktionen verzichten muss. Um den Arbeitsaufwand aber trotzdem gering zu halten, nutze ich natürlich Formatvorlagen.

Nextcloud

Für Backups, das einfache Teilen von Dateien und für meinen persönlichen Kalender, meine Notizen und meine Kontakte (jeweils mit dem Handy und dem PC synchronisiert) nutze ich Nextcloud. Sprechstundentermine vergebe ich mit Hilfe der dafür verfügbaren App Appointments - das hat z.B. den Vorteil, dass gebuchte Sprechstundentermine automatisch in meinem Kalender auf dem Handy auftauchen. Ein Formular für die Buchung einer Sprechstunde

Matthias Heil
Matthias Heil
Wissenschaftlicher Mitarbeiter

Ich interessiere mich für politische Bildung, Politische Theorie und dafür, wie beides zusammenhängt.