Newsletter #6 Was ist „KI“ – und ist sie intelligent?

0 High-Fives

00 Kommentare

Abstrakte Abbildung einer Frau, die halb Mensch, halb Maschine ist. — Illustration erstellt mit Midjourney

Heute geht es weniger um einen konkreten KI-Anwendungsfall als um eine Frage, die sich überraschend schlecht „nebenbei“ beantworten lässt: Was meinen wir eigentlich, wenn wir „Künstliche Intelligenz“ sagen – und was meinen wir, wenn wir „intelligent“ sagen? Denn genau an dieser Nahtstelle entstehen viele Missverständnisse, Ängste und falsche Versprechen.

Hier geht es zum aktuellen Videocast (Öffnet in neuem Fenster).

KI ist kein Ding, sondern eine Methode

Im Alltag steht „KI“ oft synonym für Chatbots und große Sprachmodelle (LLMs). Das ist verständlich, und auch wir haben in unserem Podcast uns hauptsächlich damit beschäftigt. Aber diese sind nur ein Ausschnitt. „KI“ ist eher ein Sammelbegriff für eine Familie von Methoden und Systemen, die u. a. eingesetzt werden für Bilderkennung, Spracherkennung, Empfehlungssysteme, Prognosen, Anomalie-Erkennung, Optimierung oder Robotik.

Hilfreich ist hier eine funktionale, absichtlich breite Definition, wie sie heute in Politik, Standardisierung und Risikomanagement genutzt wird: Die OECD beschreibt (Öffnet in neuem Fenster)ein KI-System als ein maschinenbasiertes System, das aus Eingaben ableitet (infers), wie es Outputs wie Vorhersagen, Inhalte, Empfehlungen oder Entscheidungen erzeugt, die physische oder virtuelle Umgebungen beeinflussen können.

Wichtig daran: Diese Perspektive umfasst auch Systeme, die nicht „wie ChatGPT reden“. Und sie erinnert an etwas, das gern vergessen wird: Viele „KI-artige“ Systeme sind gar nicht neu. Gerade regelbasierte Systeme – klassische Expertensysteme (Öffnet in neuem Fenster) mit Wenn-Dann-Regeln – galten in den 1970ern/80ern als eine der ersten großen Erfolgsgeschichten der KI.

KI ist nicht erst seit Chatbots da, sie ist nur viel sichtbarer geworden.

Genese: Ein Begriff als Forschungsversprechen (nicht als Befund)

Der Begriff „Artificial Intelligence“ wurde 1956 im Umfeld der Dartmouth-Sommerforschung geprägt (Öffnet in neuem Fenster) – in einer interdisziplinären Gruppe (u. a. John McCarthy, Marvin Minsky, Claude Shannon, Nathaniel Rochester). Sie verwendeten den Begriff nicht, weil Maschinen damals intelligent waren, sondern weil die Forscher glaubten, dass man menschliches Denken formal beschreiben und maschinenhaft reproduzieren könne. Der Name war also ein Forschungsversprechen und ein Programm, kein Befund.

Genau hier beginnt bis heute die sprachliche Schieflage: „Intelligenz“ klingt nach Verstehen, Urteil, Verantwortung, vielleicht sogar nach einem inneren Erleben. Viele KI-Systeme sind aber hochentwickelte Statistik, Mustererkennung und Optimierung. Das kann enorm wirksam sein. Aber es ist nicht automatisch „ein intelligentes Wesen“.

Was ist Intelligenz – und warum wirkt die Technik-Definition so verführerisch?

Eine einheitliche Definition von Intelligenz gibt es nicht. In der Informatik wird deshalb häufig pragmatisch definiert: Ein System gilt als intelligent, wenn es Aufgaben löst, die wir normalerweise menschlicher Intelligenz zuschreiben. Diese Idee schimmert in sehr vielen Standardwerken durch – etwa in der „rational agent“-Perspektive (Öffnet in neuem Fenster) (AI als Design von Agenten, die wahrnehmen und handeln).

Alan Turing hat diese Verschiebung 1950 auf den Punkt gebracht: Weg von der metaphysischen Frage „Können Maschinen denken?“, hin zu einer beobachtbaren Frage nach Verhalten im „Imitation Game“ (später „Turing Test“ (Öffnet in neuem Fenster)). Seine Versuchsanordnung: eine Testperson kommuniziert am Bildschirm mit zwei Akteuren, einem Menschen und einer Maschine. Wenn das Verhalten zwischen beiden nicht mehr unterscheidbar ist, d.h. wenn der Mensch nicht sagen kann, welches seiner Gegenüber ein Mensch und welches eine Maschine ist, ist es „intelligent“.

Das ist eine radikal praktische Definition – und sie hat einen Sog:

Sie fragt nicht, wie ein Ergebnis zustande kommt.
Sie verlangt kein Bewusstsein, keine Absicht, kein Selbst.
Sie reicht aus, um Technik zu bauen, zu messen, zu verbessern.

Und ja: In diesem Sinne wirken heutige LLMs „intelligent“, weil sie Sprache generieren, kombinieren, Aufgaben lösen, sich an Kontexte anpassen, ohne dass sie im menschlichen Sinn verstehen oder wollen. Genau wie Taschenrechner „rechnen“, ohne Mathematik zu begreifen.

Diskussion: Was blendet diese Definition aus?

Reduktionismus und die „Ursünde“: Geist als Computer

Wenn Intelligenz primär als Output-Kompetenz verstanden wird, liegt der Schluss nahe: Mit genug Daten und Training bauen wir etwas Menschenähnliches. Historisch wurde das oft explizit so gedacht. Marvin Minsky provozierte berühmt mit der Idee, wir seien letztlich „meat machines (Öffnet in neuem Fenster)“, also biologische Maschinen, deren Funktionen prinzipiell reproduzierbar seien.

Dem widersprach früh Joseph Weizenbaum (ELIZA-Schöpfer). Nicht, weil er Technik verachtete, sondern weil er die Verwechslung von Berechnung und Urteil für gefährlich hielt. In der späteren KI-Debatte wurde seine Kritik als Warnung vor einer „perverse grand fantasy“ zitiert: der Fantasie, man könne eine Maschine bauen, die „wie ein Kind“ lernt und damit das Menschliche im Kern kopiert (Öffnet in neuem Fenster).

Verkörperung: Intelligenz ohne Körper?

Ein zweiter blinder Fleck: Menschen sind nicht nur Informationsverarbeiter*innen. Kognition ist verkörpert, situativ, durch Handlung und Umwelt mitgeformt. Genau das betonen große Stränge der Kognitionsforschung. Wenn Intelligenz wesentlich mit Körper, Wahrnehmung, Fühlen, sozialer Eingebundenheit, Intuition etc. zusammenhängt, dann ist die Vorstellung von "entkörperter Intelligenz" eine aktive Entscheidung darüber, welche Apsekte der Realität für uns relevant sind und welche wir vernachlässigen.

Intelligenz als Plural, relational, verteilt, verkörpert

Der britische Künstler und Technologie-Autor James Bridle (Öffnet in neuem Fenster) setzt in Ways of Being (2022) genau hier an: Intelligenz ist für ihn nicht etwas, das ist, sondern etwas, das geschieht – in Beziehungen. Sie ist relational und verkörpert, nicht isoliert im Kopf (oder im Modell) eingeschlossen.

Bridle hilft, den Reflex zu stoppen, Maschinen immer nur auf einer Skala „weniger–mehr wie wir“ zu bewerten. Stattdessen lenkt er unseren Blick auf viele verschiedene Intelligenzen (Öffnet in neuem Fenster), viele Arten von Welt-Kontakt.

Seine Beispiele umfassen:

Schleimpilze (Öffnet in neuem Fenster) (Physarum) können in Experimenten kürzeste Wege in Labyrinthen finden und Netzwerke erzeugen, die Effizienz, Kosten und Robustheit realer Infrastrukturen erstaunlich nahekommen (u. a. Tokyo-Rail-Vergleich). Das ist „Netzwerk-Intelligenz“ ohne Gehirn, ein Hinweis darauf, dass Problemlösen nicht zwingend ein menschliches Innenleben voraussetzt.
Mykorrhiza-Netzwerke: Über unterirdische Pilz-Wurzel-Verbindungen werden Nährstoffe transferiert (Öffnet in neuem Fenster).
Aktuell ist auch die populäre Erzählung vom „Wood Wide Web“ (Bäume „reden“, „füttern“ gezielt ihre Nachkommen) weit verbreitet, allerdings auch wissenschaftlich umstritten: Eine einflussreiche Debatte dreht sich darum, dass positive Befunde überzitiert und Effekte überinterpretiert (Öffnet in neuem Fenster)werden.
Für Bridle sind auch Maschinen intelligente Akteure. Nicht weil sie wie Menschen sind, sondern weil sie neue Formen des Sehens, Sortierens und Entscheidens hervorbringen.

Uns spricht diese Perspektive, Intelligenz als unterschiedliche Beziehungen zur Welt und als wirksame Problemlösung zu verstehen, und nicht als Kopie menschlicher Rationalität, sehr an. Damit geht auch eine neue Ethik: Wenn wir anerkennen, dass Intelligenz in vielen Formen existiert, müssen wir auch anders mit Tieren, Ökosystemen und Technologien umgehen.

Wie funktioniert KI – und warum fühlt sich das manchmal „wie Denken“ an?

Moderne KI wird tatsächlich nicht mehr „gebaut“ wie klassische Software, Zeile für Zeile. Sondern sie entsteht durch Training: Ein Modell startet als riesige Sammlung aus Zahlen (den Gewichten/Parametern) und wird dann durch viele Durchläufe über Daten so angepasst, dass es eine Aufgabe immer besser erfüllt. Dieses Grundprinzip - Fehler messen, Gewichte korrigieren, wiederholen - ist der Motor fast aller heutigen Deep-Learning-Systeme.

Am Anfang sind die Gewichte typischerweise zufällig. Der folgende Prozess sieht so aus (und zwar in gigantischem Maßstab):

Das Modell bekommt eine Eingabe (Text, Bild, Audio …) und produziert eine Ausgabe.
Eine Loss-/Kostenfunktion misst, wie falsch oder wie „unpassend“ diese Ausgabe im Vergleich zu den Trainingsdaten ist.
Mit Backpropagation wird berechnet, wie jede Verbindung im Netz minimal verändert werden müsste, damit der Fehler kleiner wird.
Ein Optimierungsverfahren setzt diese mini-kleinen Korrekturen um, und das millionen- bis milliardenfach.

Wenn ihr euch dafür interessiert, wie das unter Experten beschrieben wird, könnt ihr ja mal einen Blick in dieses Buch zu Deep Learning (Öffnet in neuem Fenster) werfen:-)

Entwickler schreiben nicht die Regeln hinein, wie ein System denken soll. Sie geben ihm eine Zielfunktion (weniger Fehler) und viel Erfahrung (Daten), und es findet intern eine Strategie. Während wir diesen Trainingsmechanismus gut verstehen, wissen selbst Experten oft nicht, welche inneren Repräsentationen das Modell ausbildet und warum es im Einzelfall zu genau dieser Antwort kommt. Der Wired Artikel Ai is a black box (Öffnet in neuem Fenster) beschreibt diese Situation anschaulich am Beispiel von Anthropic.

Bei großen Sprachmodellen lernt das Modell, welche Token (Wortteile) in einem Kontext wahrscheinlich als Nächstes kommen. Die Basismaschine macht Vorhersagen und berechnet Wahrscheinlichkeiten und heraus kommt etwas, das wir als Nutzer als „Reasoning“, „Planung“ oder „Verstehen“ erleben.

Ein paralleler, sehr weit verbreiteter, ebenfalls generativer Ansatz, sind sogenannte VAEs, Variational Autoencoders, die lernen, Daten zu komprimieren und daraus neue, ähnliche Samples zu erzeugen.

Stell dir vor, du hast tausend Katzenfotos. Ein VAE lernt daraus so etwas wie eine Landkarte der Katzen-Variationen: runde Ohren hier, Fellmuster dort, Blickwinkel da. Dann kann es entweder ein Foto rekonstruieren, oder eine neue Katze generieren, die es so nie gesehen hat, aber die plausibel ist. ‘Intelligenz’ heißt hier: eine Struktur in Daten entdecken. Und zu lernen "Welche Variationen kommen vor, was gehört zusammen, wie sieht ein ‘typisches’ Beispiel aus" und auf der Basis dessen neue Varianten zu generieren.

Die Website This Person Does Not Exist (Öffnet in neuem Fenster) generiert mit jedem neuen Klick ein Foto eines fiktiven Menschen. Hier eines von Millionen KI-generierter Bilder:

Parallelen zwischen Maschine und Gehirn - das Gehirn als Vorhersagesystem

In der Neurowissenschaft und Kognitionswissenschaft gibt es einflussreiche Stränge (Predictive Processing / Predictive Coding), die das Gehirn als System beschreiben, das fortlaufend Hypothesen über sensorische Eingänge bildet und Vorhersagefehler minimiert. Der britische Neurowissenschaftler Andy Clark fasst das prägnant als Prediction Machine (2024) (Öffnet in neuem Fenster) zusammen. Demnach ist das Gehirn ist kein passiver Empfänger, sondern ein Vorhersagesystem, das permanent Hypothesen über die Welt generiert und korrigiert. Wahrnehmung ist in diesem Sinne, etwas überspitzt formuliert, „kontrollierte Halluzination“. Wir sehen oft Sachen, die es gar nicht gibt, die aber unser Gehirn ergänzt, weil es denkt, es müsste dort sein.

Das beste Beispiel dafür ist unser blinder Fleck (Öffnet in neuem Fenster). Jede Netzhaut hat eine Stelle, wo der Sehnerv austritt – dort gibt es keine Photorezeptoren. Trotzdem sehen wir kein Loch im Sichtfeld. Unser Gehirn ergänzt einfach, was ‘dort sein müsste’, weil es aus der Umgebung vorhersagt, wie es weitergeht.

Das bedeutet natürlich nicht, dass LLMs Gehirne sind, aber dass es Gemeinsamkeiten gibt, da bei beiden “Wahrnehmung” auf einem Abgleich zwischen Modell und Daten basiert.

Wo stehen wir heute? Claims für Intelligenz sind ambivalent

Viele KI-Anwendungen sind sehr beeindruckend. Sie können Mustert in riesigen Datenräumen finden, generalisieren, variieren und kombinieren. Wenn wir unter Intelligenz diese Output-Qualität verstehen (und nicht Verstehen, Urteil, Verantwortung, Beziehung), dann gibt es einerseits viele überzeugende Beispiele für funktionale Intelligenz. Anderseits erleben wir immer wieder, dass LLMs bei vielen Arbeitsaufgaben grandios scheitern.

Einerseits ersetzen heutige Modelle in klar umrissenen, gut messbaren Domänen bereits Teile menschlicher Expertise – schnell, billig, oft verblüffend kompetent. OpenAI zeigt das an GPT-5.2 Thinking: In der Eval GDPval (Knowledge-Work-Aufgaben über 44 Berufe) schlägt oder erreicht das Modell menschliche Expert*innen in 70,9 % der Vergleiche und produziert die Ergebnisse dabei über 11× schneller und zu unter 1 % der Kosten, die mit menschlichen Expert:innen anfallen.

Ebenso faszinierend ist der Blick auf DeepMind, z.B. in der sehenswerten Dokumentation The Thinking Game (Öffnet in neuem Fenster) (auf YouTube verfügbar), die deren Forschungsgeschichte aus der Innensicht erzählt. DeepMind wurde 2010 vom britischen KI-Forscher und Schach-Prodigy Demis Hassabis (mitgegründet). Die Firma wurde berühmt, weil seine Systeme 2016 im Go die Weltspitze schlugen und später mit AlphaZero Schach auf übermenschliches Niveau hoben. DeepMind steht auch hinter einem der größten KI-befeuerten Durchbrüche in der angewandten Wissenschaft: AlphaFold (Öffnet in neuem Fenster). Das Modell hat die Proteinstrukturvorhersage so weit verschoben, dass heute für „praktisch alle“ der rund 200 Millionen bekannten Proteine Strukturmodelle berechnet werden können und diesse offen für alle zur Verfügung gestellt wurden. 2024 wurde diese Arbeit mit dem Nobelpreis für Chemie ausgezeichnet.

Andererseits sind viele KI Ergebnisse in Alltagssituationen weiterhin fragil. Wir kennen Halluzinationen, frei erfundene Quellen, „glattgebügelte“ Zusammenfassungen, die aus Unsicherheiten Gewissheiten machen oder Ursache und Wirkung vertauschen. Und selbst wenn die Outputs beeindruckend aussehen, scheitern Systeme oft an echten Arbeitsaufgaben im Projektmodus: Sie produzieren Fehler, bleiben unvollständig, missverstehen Anforderungen oder verlieren unterwegs den Faden – wie z.B. diese aktuelle Studie (Öffnet in neuem Fenster) beschreibt.

Super-Intelligence als Ziel

Fehler, Halluzinationen und all die heutigen Unzulänglichkeiten wirken für viele in der Branche nur wie Kinderkrankheiten. Ein Zwischenstadium auf dem Weg zu etwas Größerem. Denn eine der meistdiskutierten Fragen im Feld „Intelligenz & KI“ ist längst nicht mehr, ob Modelle nützlich sind, sondern ob (und wie bald) sie in Richtung AGI und darüber hinaus in Richtung Superintelligenz kippen.

Dabei wird oft zwischen zwei Zielbegriffen unterschieden: AGI (Artificial General Intelligence) meint grob eine KI, die über viele Domänen hinweg lernen, Wissen transferieren und neuartige Probleme lösen kann, ungefähr auf menschlichem Niveau. Superintelligenz wäre dann ein System, das die besten Menschen in praktisch allen relevanten kognitiven Bereichen deutlich übertrifft. Je nach Definition ist Superintelligenz die nächste Stufe nach AGI, oder AGI wird gleich als „übermenschlich“ verstanden.

Mir (Joana) begegnete diese Idee zum ersten Mal 2014 auf einer Konferenz, auf der Nick Bostrom sein gerade erschienenes Buch Superintelligence: Paths, Dangers, Strategies (2014) vorstellte, welches seitdem die Debatte mitgeprägt hat, Bostrom versteht unter Superintelligenz einen Intellekt, der in praktisch allen Bereichen, von wissenschaftlicher Kreativität über allgemeine Weisheit bis sozialen Kompetenzen weitaus leistungsfähiger ist als die besten menschlichen Gehirne.

Heute ist diese Vorstellung Mainstream in vielen Tech-Zirkeln: In Podcasts, Investor-Decks und Konferenzen wird AGI oft als bevorstehend gesetzt; Szenarien wie AI 2027 (Öffnet in neuem Fenster) malen eine Intelligenzexplosion durch selbstverbessernde Systeme, die ab 2027 Fabriken bauen, Policies entwerfen und die materielle Umwelt neu organisieren – mit Menschen höchstens noch am Rand. Auch Deep Minds Demis Hassabis formuliert den „Arrival of AGI“ als einen der wichtigsten Momente, denen wir je gegenüberstanden.

Gleichzeitig gibt es deutlich nüchternere Stimmen.

Datum 19.03.2026

0 High-Fives

00 Kommentare