Hey und willkommen zur 58. Ausgabe des Online-Recherche Newsletters!
Viele Medien schreiben von "Dokumenten, die uns vorliegen", veröffentlichen sie aber nicht – selbst wenn der Quellenschutz es erlauben würde. Ein Grund dafür könnte die Sorge sein, dass sich in einer Datei noch verräterische Spuren verstecken. Drei Werkzeuge geben Euch mehr Sicherheit.
Im Werkstatt-Interview geht es um gar nicht lange zurückliegende Verbrechen, deren Aufarbeitung in den aktuellen Nachrichten kaum Raum findet. Willkürliche Verhaftungen, Folter, Tötungen: Das Regime des ehemaligen syrischen Machthabers Baschar al-Assad hat die eigenen Taten minutiös dokumentiert. Als Assad floh, gelangten Dokumente in die Hände von Journalist*innen – darunter mein Interviewgast Antonius Kempmann.
Einmal abstauben: Exiftool und qpdf für harmlose Dokumente
🔑 Wofür braucht man das? PDF-Dokumente haben Meta-Daten – etwa den Namen der Person, die das Dokument erstellt hat, oder wann es zuletzt geändert wurde. Wie ein eingenähtes Zettelchen im Pullover beachten viele solche Meta-Daten kaum. Dennoch können sie Details über vertrauliche Quellen preisgeben, wenn eine Redaktion so ein Dokument veröffentlicht. Mit Exiftool (Si apre in una nuova finestra) und qpdf (Si apre in una nuova finestra) lassen sich Meta-Daten entfernen.
⚙️ Wie funktioniert das? Die Werkzeuge sind quelloffen und für Windows, MacOS und Linux verfügbar. Exiftool ersetzt Meta-Daten durch einen leeren Eintrag. Bei PDF-Dokumenten sind solche Veränderungen aber inkrementell – das heißt, die älteren Meta-Daten sind immer noch versteckt vorhanden. Deshalb braucht es noch das Tool qpdf. Es erstellt eine neue Datei ohne Spuren der älteren Meta-Daten.
📌 Was muss man beachten? Beide Tools haben keine schicke Oberfläche. Sie müssen über die Konsole bedient werden. Nach der Installation lautet der erste Befehl: [exiftool -all:all input.pdf -o output.pdf]; und der zweite: [qpdf --linearize output.pdf output_final.pdf]. Wer so etwas verwirrend findet, kann sich von einem großen Sprachmodell wie ChatGPT Schritt für Schritt durchführen lassen.
🐿️ Noch nicht abonniert? Lass dir regelmäßig eine Dosis Recherche-Skills schicken und trage dich jetzt hier ein (Si apre in una nuova finestra).
Gründlich reinigen: Dangerzone für kritische Dokumente
🔑 Wofür braucht man das? Meta-Daten sind nicht die einzigen potenziell verräterischen Spuren in einem PDF. In solchen Dokumenten können sich auch unscheinbare Dinge verstecken, etwa Programmcode, Kommentare, Schriftarten. Dangerzone (Si apre in una nuova finestra) eliminiert all das wie ein scharfes Desinfektonsmittel.
⚙️ Wie funktioniert das? Dangerzone ist ein quelloffenes Werkzeug der gemeinnützigen "Freedom of the Press Foundation". Es wurde entwickelt, damit Redaktionen von Fremden zugespielte Dokumente sicher öffnen können, selbst wenn sie eventuell mit Schadsoftware verseucht sind. Das Programm öffnet die Datei in einer sicheren Umgebung, schnappt sich nur die optisch sichtbaren Pixel und baut daraus eine neue Datei – etwa so, als würde man das Dokument abfotografieren. Entfernt werden dabei nicht nur Computerviren, sondern auch unerwünschte Spuren.
📌 Was muss man beachten? Mit 1,7 Gigabyte nimmt Dangerzone einiges an Speicherplatz ein. Auch die Dateien, die es ausspuckt, sind oft deutlich größer als das Original, weil das Programm ein PDF wie ein Bild behandelt.
Ballast abwerfen: Reinen Text extrahieren mit OCRmyPDF
🔑 Wofür braucht man das? Wer sensible Dokumente mit der Öffentlichkeit teilen will, muss sich nicht mit PDF-Dokumenten herumschlagen. Alternativ lässt sich auch der Inhalt extrahieren und als reiner Text veröffentlichen. Dann stellt sich auch nicht mehr die Frage nach verstecktem Programmcode oder zu großen Dateien.
⚙️ Wie funktioniert das? Bei machen PDFs ist der Text bereits maschinenlesbar und lässt sich einfach markieren und herauskopieren. Falls das nicht klappt, kann das quelloffene Werkzeug OCRmyPDF (Si apre in una nuova finestra) die Zeichen in PDFs lesbar machen. Auch dieses Tool wird per Konsole bedient. Nach der Installation lautet der Befehl: [ocrmypdf input.pdf output.pdf]. Falls es hakt, kann ein Sprachmodell weiterhelfen.
📌 Was muss man beachten? Einen aus einem PDF kopierten Text muss man nochmal händisch nachbessern. Zum Beispiel, weil OCRmyPDF Umlaute falsch erkennt oder unerwünschte Silbentrennungen übernimmt. Ein Tool für Fortgeschrittene, das zumindest einen Teil dieser Fleißarbeit automatisiert, ist das quelloffene p3df (Si apre in una nuova finestra) vom deutschen Entwickler Johannes Filter (pd3f.com (Si apre in una nuova finestra)).
Interview: Eine Festplatte mit 70.000 geheimen Fotos

Im Damascus Dossier (Si apre in una nuova finestra) geht es um die Aufarbeitung eines der größten Menschenrechtsverbrechen der Gegenwart. Mehrere Monate lang hat sich NDR-Journalist Antonius Kempmann durch Zehntausende Unterlagen und Fotos des Assad-Regimes gewühlt, Social-Media-Posts gesichtet und Aussagen geprüft. Beteiligt waren NDR, WDR, Süddeutsche Zeitung und das International Consortium of Investigative Journalists. Wie destilliert man Geschichten aus so viel Material – und schützt dabei die eigene Psyche?
ORN: Antonius Kempann, das Damascus Dossier basiert auf geheimen Unterlagen aus dem Assad-Regime. Wovon sprechen wir genau?
Antonius: Es geht um zehntausende Dokumente aus verschiedenen Bereichen syrischer Geheimdienste. Zum Beispiel Verhaftungsberichte, Totenscheine und Listen von verhafteten Menschen. Außerdem geht es um über 70.000 Fotos. Viele davon zeigen tote Menschen, die meisten davon wohl Häftlinge – oft gezeichnet von schwerer Folter und Unterernährung. Angehörige der syrischen Militärpolizei haben die Toten dokumentiert, größtenteils zwischen 2015 und 2024.
ORN: Wie ist das Material beim NDR gelandet?
Antonius: Der Sturz des Assad-Regimes im Dezember 2024 war eine historische Ausnahmesituation. Streng geheime Unterlagen wurden plötzlich zugänglich. Aber solche Leaks und Dokumente fallen nicht vom Himmel. Innerhalb unseres Ressorts haben sich Kolleginnen und Kollegen viele Jahre lang mit Syrien beschäftigt, viele Reisen unternommen und Kontakte vor Ort aufgebaut. Die Festplatte mit den Fotos hat der dafür zuständige Militärpolizist selbst aus seiner Dienststelle geschafft. Über Mittelsmänner kam sie zu uns.
ORN: Die Fotos der Leichen können traumatisieren. Wie seid ihr damit umgegangen?
Antonius: Vor der Sichtung haben wir einen Workshop gemacht. Es gibt Tricks, damit die Betrachtung weniger schwerfällt. Zum Beispiel kann man sich ein Foto nur in Graustufen anzeigen lassen und nicht bildschirmfüllend betrachten. Für die detaillierte Auswertung der Bilder haben wir zudem eine statistisch relevante Stichprobe gezogen: 540 Bilder, verteilt über mehrere Kolleginnen und Kollegen. Auf dieser Grundlage haben wir Aussagen für die Recherche abgeleitet, etwa über Gewalteinwirkungen oder den Zustand der Leichen.
„Möglichst viel Zeit mit Datensatz verbringen“
ORN: Und wie habt ihr die Masse an Dokumenten bewältigt?
Antonius: Die Unterlagen waren auf Arabisch. Dafür ist es natürlich essentiell, Muttersprachlerinnen und -sprachler im Team zu haben. Zudem haben wir mehrere Übersetzungswerkzeuge getestet, bis wir mit den Ergebnissen zufrieden waren. Am besten funktioniert hat am Ende eine hausinterne Lösung von der IT des NDR.
Dann haben das Team und ich uns mehrere Monate mit den Dokumenten beschäftigt, oft auch jenseits der festen Arbeitszeiten. Ich finde, man muss möglichst viel Zeit mit einem Datensatz verbringen und ihn auch händisch erschließen. Nur so kann man ein Gefühl für die Daten bekommen, auch für Details wie handschriftliche Notizen. Das sind Dinge, die sich auch mit der heutigen Technologie nicht automatisieren lassen. Es braucht letztlich Fleiß, Fleiß, Fleiß.
ORN: Wie habt ihr die Recherche intern dokumentiert?
Antonius: Bei so großen Projekten mit vielen Beteiligten braucht es die Disziplin, alle wichtigen Funde gemeinsam festzuhalten. Wir nutzen dafür eine selbst gehostete Plattform von ARD und ZDF, die auf Nextcloud basiert. Bei Zusammenarbeit zwischen verschiedenen ARD-Anstalten habe ich damit sehr positive Erfahrungen gemacht. Gerade bei sensiblen Recherchen bevorzugen wir hauseigene Lösungen gegenüber Anwendungen großer US-Tech-Konzerne.
ORN: In der TV-Doku erzählt ihr von Muhannad Khalifa. Das Regime hat ihn verhaftet und getötet. Wieso habt ihr seinen Fall herausgepickt?
Antonius: In den uns zugespielten Unterlagen stehen eine Menge Namen, die man im Netz suchen kann. In vielen Fällen konnten wir die dazu gehörigen Familien aufspüren. Denn nach dem Sturz des Assad-Regimes haben Tausende Menschen Aufrufe veröffentlicht, um ihre vermissten Angehörigen zu finden, zum Beispiel auf Facebook. Wir hatten Kontakt zu mehreren von ihnen. Einige wollten mit uns sprechen, wollten aber nicht gefilmt werden. Das haben wir respektiert.
Die Familie von Khalifa war damit einverstanden, dass wir sie filmen. Das war zugleich eine schwierige Situation. Unseren Unterlagen zufolge war Khalifa bereits tot. Die Familie hatte aber selbst, als das Assad-Regime fiel, also 13 Jahre nach seiner Verhaftung, noch Hoffnung.
ORN: Ihr habt mir der Kamera den Moment festgehalten, als die Familie realisiert: Khalifa kommt nicht zurück. Wie habt ihr euch psychologisch darauf vorbereitet?
Antonius: Wir haben uns in einem Workshop mit Trainerin Juliana Ruhfus gezielt schulen lassen, sowohl für den Selbstschutz in der Situation als auch für den Umgang mit möglicherweise schwer traumatisierten Familien. Wichtig ist, sich bei jedem Schritt im Interview rückzuversichern, ob immer noch das Einverständnis aller Anwesender vorliegt.
„Ärzte haben schwere Folter bestätigt“
ORN: Ihr konntet auch mit Ärzten sprechen, die im Militärkrankenhaus Harasta tätig waren. Also dem Ort, wo die Fotos der gefolterten Häftlinge entstanden sein sollen. Manche dieser Ärzte praktizieren heute sogar in Deutschland. Wie habt ihr sie gefunden?
Antonius: Anscheinend mussten Ärzte die Totenscheine des Regimes unterschreiben. Bei Recherchen vor Ort fanden wir zudem Dienstpläne mit weiteren Namen der syrischer Ärzte. Die Namen konnten wir im Netz suchen. Manche fanden wir in Deutschland. Die Offenheit der Ärzte, die hier arbeiten, hat mich überrascht. Mehrere haben uns die schwere Folter durch Sicherheitskräfte des Regimes bestätigt. Die Ärzte selbst waren nach eigener Aussage aber daran nicht beteiligt.
ORN: Hatte die Recherche auch Sackgassen?
Antonius: Am Anfang hatten wir noch nicht genug Belege dafür, dass Menschen im Krankenhaus Harasta gefoltert wurden. Die Angaben von Überlebenden waren anfangs bruchstückhaft. Vielen wurden die Augen verbunden. Um ihre Aussagen prüfen zu können, hatte ich zusammen mit meinen Kollegen eine 3D-Rekonstruktion bestimmter Teile des Krankenhauses erstellt, basierend auf eigenen Messungen, Satellitenbildern und auch zuletzt mit Apps wie Polycam. Damit konnten wir Details von Überlebenden einordnen, etwa: Da war eine Säule. So konnten wir verfizieren, dass Menschen tatsächlich dort gewesen waren. Im Lauf der Recherche wurde das 3D-Modell aber immer unwichtiger. Wir hatten genug direkte Aussagen zum Krankenhaus und zur Folter im siebten Stock, auch von Seiten des Personals.
“Assad hat Repressions-Industrie aufgebaut”
ORN: Der Doku zufolge habt ihr auf Grundlage des Leaks eine Liste mit Namen von etwa 1.500 verschwundenen Menschen erstellt und mit NGOs geteilt. Wie kam es dazu?
Antonius: Das war ein besonderer Fall. Sonst folgen wir dem Grundsatz: Wir teilen keine Datensätze. Was wir nicht veröffentlichen, bleibt bei uns. Durch unsere Besuche in Syrien wussten wir aber, wie verzweifelt die Familien dort ihre Angehörigen suchen. Die Namen aus den Dokumenten können für sie sehr wertvoll sein. Deshalb war uns relativ schnell klar: Wir müssen Hilfsorganisationen eine solche Liste geben.
ORN: Warum hat das Regime die eigenen Straftaten so minutiös dokumentiert?
Antonius: Das wäre eine Recherche für sich. Das Assad-Regime hat jedenfalls eine ganze Repressions-Industrie aufgebaut und administriert. Die Todesursache in den Totenscheinen lautet standardmäßig "Herzstillstand". Die Fotos der toten Häftlinge sind mit Kennziffern versehen. Menschen, die in Haft gestorben sind, wurden nachträglich von einem Militärgericht zu Tode verurteilt.
ORN: Welche Resonanz hatte die Recherche?
Antonius: Einige große Medien haben sie aufgegriffen. Gerade in Syrien gab es sehr viel Aufmerksamkeit. Es gibt wohl keine syrische Familie, die von der Gewalt der letzten 15 Jahre unberührt geblieben ist. Mein Eindruck ist aber, viele Menschen in Deutschland und Europa sind gerade mit nationalen Themen beschäftigt. Sie lassen sich nur schwer mit solchen Recherchen erreichen.
Das war’s für diese Ausgabe. Wenn du mir auf Mastodon (Si apre in una nuova finestra) oder Bluesky (Si apre in una nuova finestra) folgst, liest du regelmäßig Neuigkeiten rund um Netzpolitik, Alterskontrollen, Databroker und digitale Gewalt.
Vor der Online-Veröffentlichung erscheint dieser Newsletter zuerst und teils gekürzt im Medium Magazin (Si apre in una nuova finestra). Für deinen Recherche-Alltag habe ich ein verschlagwortetes Online-Archiv aller Beiträge (Si apre in una nuova finestra) zusammengestellt und eine Linkliste mit noch mehr Tools (Si apre in una nuova finestra).
Danke fürs Lesen, viel Erfolg bei der Recherche und bis zum nächsten Mal!
Sebastian