ORN #55 Tippfehler finden wie ein Boss

0 High-Fives

Hey, willkommen zur 55. Ausgabe des Online-Recherche Newsletters! Und zur ersten, die über Steady verschickt wird. Ciao, Substack (Öffnet in neuem Fenster).

Ich hoffe, dieser Newsletter hat keine Tippfehler, denn dieses Mal geht es ums Fehlersuchen. Zuerst stelle ich drei simple Werkzeuge vor, die Patzer auf ein Minimum reduzieren.

Im Werkstatt-Interview geht es dann um eine Recherche der Frankfurter Allgemeinen Sonntagszeitung. Die Kolleg*innen haben (inhaltliche) Fehler in der Wikipedia gesucht – mit einer innovativen Methode.

Keine Umwege: Rechtschreibprüfung direkt im Browser

🔑 Wofür braucht man das? Eine Weile lang habe ich meine Texte hin und her kopiert: Rechtschreibprüfung in LibreOffice; Veröffentlichung via WordPress im Browser. Das war nicht nur unnötig – gerade bei Änderungen in letzter Minute haben sich oftmals noch Tippfehler eingeschlichen. Dabei lässt sich die Rechtschreibprüfung auch direkt im Browser machen.

⚙️ Wie funktioniert das? Die Funktion muss man händisch aktivieren. Bei Firefox geht das unter Menüleiste > Burger-Symbol > Einstellungen > Allgemein > Sprache > "Rechtschreibung während der Eingabe überprüfen". Danach muss man einmalig ein Wörterbuch für die gewünschte Sprache hinzufügen: Rechtsklick auf ein beliebiges Textfeld einer Website > Sprachen > Wörterbuch hinzufügen. Bei Chrome geht es etwas schneller: Menüleiste > Drei-Punkte-Symbol > Einstellungen > Sprachen > "Bei der Eingabe von Text auf Webseiten nach Tippfehlern suchen".

📌 Was muss man beachten? Häufig markieren die Programme Namen und Fachbegriffe als Fehler. Sie lassen sich per Rechtsklick dem eigenen Wörterbuch hinzufügen. Google bietet im Einstellungsmenü auch eine erweiterte Rechtschreibprüfung an; dabei werden die Texte allerdings an Google-Server geschickt.

Kann auch Kommas: Premium-Prüfung mit dem Duden-Mentor

🔑 Wofür braucht man das? Unter der Marke Duden vertreibt der Cornelsen-Verlag nicht nur das bekannte Wörterbuch, sondern auch eine Rechtschreibprüfung (Öffnet in neuem Fenster). Besonders bei Kommasetzung hebt sich der "Duden-Mentor" von anderen Programmen ab. Seit ich den Mentor nutze, merke ich, wie ich gerade bei Schachtelsätzen wie diesem hier, jahrelang Komma-Fehler gemacht habe.

⚙️ Wie funktioniert das? Die Duden-Mentor läuft direkt im Browser. Die Gratis-Version ist aber auf 500 Zeichen begrenzt. Das bringt nur dann etwas, wenn man bei einem schwierigen Satz gezielt Rat sucht. Um bequem ganze Texte zu prüfen, braucht es die Premium-Version ab 7,95 Euro im Monat.

📌 Was muss man beachten? Auf Wunsch kann der Duden-Mentor auch zu lange Sätze und Wortwiederholungen ankreiden. Ein paar Funktionen des Programms überzeugen mich allerdings weniger. So kann der Mentor per Browser-Erweiterung auch Texte direkt im Browser prüfen, verlangt dafür aber Zugriff auf alle Website-Inhalte – das ist mir zu invasiv. Mit einem optionalen "KI-Assistenten" greift der Mentor selbst in den Text ein und bietet Formulierungshilfen; das geht mir zu weit.

🐿️ Noch nicht abonniert? Lass dir regelmäßig eine Dosis Recherche-Skills schicken und trage dich jetzt hier ein (Öffnet in neuem Fenster).

Wörter verstehen: Kontext-Recherche mit DWDS-Account

🔑 Wofür braucht man das? Manchmal hängt es nicht an der Schreibweise, sondern an der Wortwahl. Gerade bei Begriffen, die sehr neu- oder sehr altmodisch sind. In welchem Kontext sagt man noch mal "Bärendienst" – oder "Rizz"? Hier hilft das "Digitale Wörterbuch der deutschen Sprache" (DWDS (Öffnet in neuem Fenster)) mit seinen Textkorpora. Alte, neue oder einfach nur seltene Begriffe lassen sich damit direkt im Kontext studieren.

⚙️ Wie funktioniert das? Hinter dem DWDS steckt die von Bund und Ländern geförderte Berlin-Brandenburgische Akademie der Wissenschaften. Mit dem Projekt wollen die Forschenden den deutschen Wortschatz online zugänglich machen. Dafür erfassen und katalogisieren sie systematisch Texte – von historischem Schriften aus dem 16. Jahrhundert bis hin zur Jugendsprache aus Online-Magazinen.

📌 Was muss man beachten? Einige Inhalte des DWDS lassen sich erst nach einem Log-in nutzen; der Account ist jedoch kostenlos. Gerade für neumodische Wörter ist der Korpus "Webmonitor" nützlich. Das Portal eignet sich auch für Recherchen zur Geschichte von Begriffen.

Interview: Auf Fehlersuche in der Wikipedia

Porträt von Patrick Bernau — Patrick Bernau | Credit: Christina Gruber

Sprachmodelle wie ChatGPT sind für sogenannte Halluzinationen bekannt. Immer wieder generieren sie Texte mit falschen Behauptungen. Trotzdem können sie bei der Suche nach Auffälligkeiten in großen Textmengen helfen, wie die Recherche von Patrick Bernau zeigt. Er leitet das FAS.-Ressort Wirtschaft und Wert und berichtet im Interview, wie er für seine Fehlersuche in der Wikipedia (Öffnet in neuem Fenster) die Fähigkeiten von Mensch und Maschine kombiniert hat.

ORN: Patrick Bernau, wie viel Quatsch steht in der Wikipedia?

Patrick: Mindestens jeder dritte Artikel in der deutschsprachigen Wikipedia hat ein Problem. Das Wort "mindestens" ist wichtig, weil wir für die Recherche nur ein Mindestmaß ermittelt haben. Genauer gesagt hatten bei unserer Stichprobe mindestens 20 Prozent der Wikipedia-Artikel veraltete Informationen und mindestens 20 Prozent Informationen, die nie gestimmt haben.

ORN: Fehlersuche in der Wikipedia ist ein zeitloses Thema. Wieso habt ihr das jetzt gemacht?

Patrick: Weil wir dafür jetzt erstmals Sprachmodelle einsetzen konnten. Ohne KI würde für eine solche Recherche eine ganze Universität aus Fachleuten nicht ausreichen. Du bräuchtest zum Beispiel Menschen, die sich mit Primzahlen auskennen, mit estnischen Fußballspielern und mit Gemeindegebietsreformen in China. Mit Sprachmodellen konnten wir eine große Stichprobe an Artikeln nach Auffälligkeiten untersuchen.

ORN: Wie bist du auf die Methode gekommen?

Patrick: Das Projekt begann als reine Prokrastination. Im Winter 2024 habe ich eigentlich abends ein Buch geschrieben. Wenn ich mal nicht weiterkam, habe ich mit KI experimentiert. Mich interessiert es schon länger, ob uns Sprachmodelle bei der Fehlersuche in der Redaktion helfen können. Die meisten Fehler passieren ja nicht im Zentrum einer Recherche, wenn man ohnehin am aufmerksamsten ist, sondern bei Nebensächlichkeiten.

Wie korrekt die Wikipedia ist, wollte ich schon länger messen. Also habe ich einfach mal Artikel in ChatGPT kopiert und die KI gefragt, ob sie Fehler findet. Das hat erstaunlich gut funktioniert. Gerade mit den damals neuen Reasoning-Modellen, die ihre Antworten länger berechnen.

ORN: Wie wurde daraus eine FAS-Recherche?

Patrick: Als ich gemerkt habe, dass die Methode halbwegs funktioniert, habe ich in der Redaktion und im Verlag darüber gesprochen. Es haben sich drei Kollegen aus dem Archiv gefunden, die mir geholfen haben, die vom Sprachmodell entdeckten Auffälligkeiten zu prüfen. Sonst wäre es nicht möglich gewesen, 1.000 Wikipedia-Artikel zu untersuchen.

„Sprachmodelle bemängeln sogar korrekte Dinge“

ORN: Hast du alle Artikel händisch in ChatGPT kopiert?

Patrick: Nein, dafür habe ich nach den ersten Testläufen die Programmierschnittstelle (API) von ChatGPT genutzt. Man braucht dafür ein kleines Python-Skript, aber das kann ChatGPT für einen schreiben. Du musst dafür nicht selbst programmieren können. Es genügt ein Grundverständnis für Code. Das Skript hat sich zuerst über die API von Wikipedia einen zufälligen, deutschsprachigen Artikel besorgt und ihn dann zur Prüfung an die Sprachmodelle geschickt.

ORN: Welchen Prompt hast du genutzt?

Patrick: Der Prompt war sinngemäß: Du bist ein gewissenhafter Lektor, bitte prüfe den Text Satz für Satz auf der Suche nach Fehlern. Ein weiterer Teil des Prompts war zu prüfen, ob noch wichtige Informationen ergänzt werden müssen. Alle Auffälligkeiten sollte das Sprachmodell in einer maschinenlesbaren JSON-Datei auflisten. Die genaue Formulierung des Prompts war aber nicht so wichtig. Bei der Suche nach Auffälligkeiten sind Sprachmodelle zu selbstsicher. Das heißt, sie finden eher zu viel und bemängeln sogar korrekte Dinge. Die Sprachmodelle haben zum Beispiel Menschen in Wikipedia-Artikeln für tot erklärt, obwohl sie noch leben. Beim Prompten habe ich nicht zu sehr dagegen gekämpft, weil die KI sowieso nur Recherche-Anregungen liefern sollte.

ORN: Eignen sich Sprachmodelle nicht denkbar schlecht für solche Faktenchecks? Gerade die Wikipedia war ja selbst Trainingsmaterial, inklusive Fehler.

Patrick: Der KI-Chef unseres Verlags hat mich auch zuerst überrascht angeschaut. Gerade weil wir für die Recherche mit dem sogenannten Modellwissen gearbeitet haben. Das heißt, wir haben die KI nicht gebeten, in Online-Quellen zu suchen; das hätte viel zu lange gedauert. Die KI sollte allein auf Basis ihres Trainings antworten, auch wenn sie dann fehleranfälliger ist. Funktioniert hat das trotzdem, weil der eigentliche Faktencheck von Menschen kam. Die KI sollte nur Auffälligkeiten finden. Unser Ziel war es auch nicht, alle Fehler zu entdecken, sondern ein Mindestmaß. Wir haben unsere Methodik der Wikimedia vorgelegt; es gab keine größeren Einwände.

ORN: Wie lief die menschliche Prüfung ab?

Patrick: Es gab etwa 5.000 Auffälligkeiten in rund 1.000 Wikipedia-Artikeln. Die haben wir in einer Tabelle abgearbeitet, das hat insgesamt etwa drei Wochen lang gedauert. Für jede Auffälligkeit galt das Vier-Augen-Prinzip. Erst wenn sich zwei Prüfer einig waren, wurde etwas als Fehler eingestuft.

Wie soll die Wikipedia langfristig aktuell und korrekt bleiben?

ORN: Waren das eher langweilige Fehler oder auch alarmierende Desinformation?

Patrick: Große Desinformation haben wir nicht gefunden, eher menschliche Fehler. Zum Beispiel gab es im Artikel über Prairie County in Arkansas zwei unterschiedliche Angaben zum Verwaltungssitz. In unserer zufälligen Stichprobe gab es nicht mal politisch brisante Artikel. Die bekanntesten handelten etwa von der Saar oder einer Harry-Potter-Verfilmung. Wir haben dann einige besonders häufig gelesene Artikel extra angeguckt. Zur Recherchezeit war zum Beispiel die iranische Atomanlage Fordo bombardiert worden. Auch im dazu gehörigen Wikipedia-Artikel gab es Fehler, aber das sah nicht nach einem Masterplan aus. Das Problem ist eher quantitativ.

ORN: Was meinst du damit?

Patrick: Die Wikipedia ist für viele die wichtigste Anlaufstelle, um etwas nachzuschlagen. Noch im Jahr 2005 hatte eine Studie von Natur (Öffnet in neuem Fenster)e gezeigt, dass die Wikipedia nicht mehr Fehler hatte als die renommierte Encyclopaedia Britannica. Aber das war vor 20 Jahren. Es kommen immer mehr Wikipedia-Artikel hinzu, andere veralten. Das Projekt kämpft mit Autorenmangel. Gedruckte Enzyklopädien wurden verdrängt. Wie soll die Wikipedia langfristig aktuell und korrekt bleiben? Ich halte das für ein strukturelles Problem.

ORN: Was ist deine Schlussfolgerung?

Patrick: Die Wikipedia setzt allein auf Ehrenamtliche. Aber meiner Meinung nach braucht das Projekt langfristig bezahlte Autorinnen und Autoren. Gerade für Aufgaben, die weniger intrinsische Motivation wecken. Ich glaube, für viele Freiwillige ist es ein großer Anreiz, einen neuen Artikel über ein Thema schreiben. Das macht einfach Spaß. Andere teilen gerne ihr Wissen und schlagen Bearbeitungen vor. Aber teils muss man viele Wochen warten, bis das jemand prüft. Dann werden Ergänzungen wieder abgelehnt, der Tonfall ist oft rau. Das kann Leute abschrecken. Ich glaube, man würde schon dann viel erreichen, wenn bezahlte Autoren einfach nur ungesichtete Bearbeitungen prüfen und Feedback geben.

ORN: Wie hat die Wikipedia-Community auf eure Recherche reagiert?

Patrick: Wir haben eine bereinigte Version unserer Funde veröffentlicht. Die war wenige Stunden später auch auf der Wikipedia selbst zu finden. Dann haben die Wikipedia-Autoren zügig angefangen, die Liste abzuarbeiten. Es gibt auch eine Stelle, an der sie eine Quelle nachgeliefert und uns damit überzeugt haben. Wir hatten den Verlauf einer Straße in Schottland falsch eingeschätzt.

ORN: Wäre das nicht ein Anlass, mal Auffälligkeiten in 1.000 FAZ-Artikeln zu suchen?

Patrick: Der Vorschlag kam natürlich gleich von manchem Wikipedia-Autor. Aber wahr ist: Wir haben als zuverlässigen Fehler-Detektor schon unsere Hunderttausenden Leser. Die sagen sehr schnell Bescheid, wenn mal etwas nicht korrekt ist. Aber das kommt zum Glück selten vor.

Das war’s für diese Ausgabe. 💫 Wenn du mir auf Mastodon (Öffnet in neuem Fenster) oder Bluesky (Öffnet in neuem Fenster) folgst, liest du regelmäßig Neuigkeiten rund um Netzpolitik, Databroker und digitale Gewalt.

Vor der Online-Veröffentlichung erscheint dieser Newsletter zuerst gedruckt und teils gekürzt im Medium Magazin (Öffnet in neuem Fenster). Für deinen Recherche-Alltag habe ich ein verschlagwortetes Online-Archiv aller Beiträge (Öffnet in neuem Fenster) zusammengestellt und eine Linkliste mit noch mehr Tools (Öffnet in neuem Fenster).

Danke fürs Lesen, viel Erfolg bei der Recherche und bis zum nächsten Mal 💛

Sebastian

Datum 25.10.2025

0 High-Fives