Früher wies ich meine Philosophiestudierenden an, Wikipedia-Einträge über Philosophie zu meiden. Aber die Dinge ändern sich. Wikipedia hat sich immens verbessert und wird stetig noch besser. Mittlerweile sage ich Studierenden, dass Wikipedia für gewöhnlich eine zuverlässige Quelle ist, doch sie müssten aufpassen, nicht Teile daraus "unabsichtlich" in ihre Aufsätze zu übernehmen. Wikipedia ist heute eine der vielen wundervollen, oft kostenfreien und großteils sorgfältig editierten Onlinequellen, die Studierenden zur Verfügung stehen.

Wesentliche Unterschiede

Der Siegeszug der generativen KI lenkt uns nun jedoch in eine andere Richtung. Chatbots wie ChatGPT und Claude werden nicht nur zur Texterstellung verwendet, sondern auch um das Internet zu durchforsten, Fragen beantworten zu lassen und Informationen oder Fakten zu finden. Googles Gemini zählt zu den beliebtesten KI-Chatbots und wird künftig fix als KI-Assistent in die Google-Umgebung integriert sein. Eine bedeutungsvolle neue Entwicklung besteht darin, dass jede Google-Suche per Standardeinstellung nun auch eine "Übersicht mit KI" liefert.

Eine stilisierte Illustration zeigt eine menschliche Hand und eine Roboterhand, die sich einander nähern, um Daten auszutauschen. Die Szene ist in lebhaften Farben gestaltet, mit geometrischen Formen, Pixeln, Zitaten und digitalen Symbolen, die den Austausch betonen.
Der Nobelpreisträger und Gründer von Google DeepMind, Sir Demis Hassabis, sagte kürzlich in einem Interview, dass Large Language Models (LLMs, die Sprachmodelle hinter den heute verbreiteten KI-Chatbots) unter anderem deshalb so erfolgreich seien, weil "ihr Ausgangspunkt die Gesamtheit menschlichen Wissens, all das, was wir ins Internet stellen" sei. Diese Behauptung ist schlichtweg falsch, findet Tim Crane.

Dies erscheint zunächst unproblematisch – nutzen wir nicht schließlich alle Google und Wikipedia, als wären sie ein und dasselbe, und verlassen uns ohne Weiteres auf die Ergebnisse? Macht es einen Unterschied, ob man etwas auf Wikipedia oder in Googles KI-Übersicht nachliest? Ist das nicht im Prinzip dasselbe?

Meiner Ansicht nach besteht allerdings ein wesentlicher Unterschied, der sich aus der grundlegenden Natur des Wissens ergibt. Wikipedia kann zu Recht als Wissensspeicher bezeichnet werden, KI-Chatbots nicht. Lassen Sie mich dies näher ausführen.

Der Nobelpreisträger und Gründer von Google DeepMind, Sir Demis Hassabis, sagte kürzlich in einem Interview, dass Large Language Models (LLMs, die Sprachmodelle hinter den heute verbreiteten KI-Chatbots) unter anderem deshalb so erfolgreich seien, weil "ihr Ausgangspunkt die Gesamtheit menschlichen Wissens, all das, was wir ins Internet stellen" sei. Diese Behauptung spricht Bände. Oberflächlich betrachtet scheint sie plausibel, wenn auch etwas übertrieben. Sie ist jedoch schlichtweg falsch.

Dinge, die nicht stimmen

Beginnen wir mit einem weit verbreiteten Phänomen: Fehlern. Es ist allgemein bekannt, dass Chatbots Fehler machen. Genau genommen behaupten sie Dinge, die nicht stimmen. Das haben wir wohl alle schon einmal beobachtet, und auch die modernsten Modelle haben dieses Problem bislang nicht in den Griff bekommen (so schreibt Google standardmäßig unter die KI-Übersicht: „KI-Antworten können Fehler enthalten.“). KI-Forscher:innen bezeichnen diese Fehler als Halluzinationen. Dazu zählen das Erfinden von wissenschaftlichen Artikeln, Rechtstexten oder Geschichten über real existierende Personen wie auch Rechen- und Logikfehler.

Viele KI-Forscher:innen tun diese Halluzinationen als Kinderkrankheiten ab; sie seien nichts weiter als kleine Funktionsstörungen, die mit fortschreitender Entwicklung und anhaltendem Training der Modelle verschwinden würden. Aus dem Blickwinkel der KI selbst jedoch, das heißt in Hinblick auf ihr Entwicklungsziel, sind Halluzinationen keine Funktionsstörung. Chatbots wurden mit dem Ziel entwickelt, in grammatikalisch korrekten Sätzen auf einen Prompt zu reagieren und dabei Inhalte, die zu diesem Prompt passen, zu produzieren. Halluzinationen sind daher keine Funktionsstörung, weil die Maschine genau das tut, wofür sie geschaffen wurde.

Die suggestive Bezeichnung "Halluzination" ist daher zutiefst irreführend. Eine visuelle Halluzination liegt vor, wenn das optische System Erfahrungen erzeugt, die die Realität völlig verzerrt darstellen: Als Beispiele ließen sich hier drogeninduzierte Trips während eines LSD-Rauschs oder, in tragischeren Fällen, Halluzinationen von Menschen, die am Charles-Bonnet-Syndrom oder an Alkoholismus leiden, anführen. Halluzinationen sind ein Versagen beziehungsweise eine Funktionsstörung des optischen Systems. Es erfüllt seinen evolutionären Zweck, die Welt visuell akkurat darzustellen, nicht. Die "Halluzinationen" von großen Sprachmodellen haben damit nichts zu tun.

Wahres Wissen

Dass LLMs nicht darauf ausgerichtet sind, Sachverhalte korrekt wiederzugeben, erklärt zudem, warum es aus ihrer Sicht belanglos ist, dass nicht alle ihre Trainingsdaten der Wahrheit entsprechen. Manches davon ist missverständlich, unvollständig oder sogar bewusst irreführend. Für eine Maschine, die auf die Ausgabe grammatikalisch korrekter Sätze ausgerichtet ist, spielt das keine Rolle. Wenn LLMs jedoch Wissen generieren sollen, ist es durchaus von Bedeutung.

Hassabis Behauptung, dass LLMs basierend auf der "Gesamtheit menschlichen Wissens" trainiert werden, ist nicht nur deshalb problematisch, weil das im Internet verfügbare Wissen unvollständig ist und daher nicht die Gesamtheit des Wissens darstellt; noch gravierender kommt zum Tragen, dass vieles von dem, was sich im Internet findet, gar nicht als Wissen bezeichnet werden kann. Wissen muss naturgemäß (man könnte auch sagen, definitionsgemäß) wahr sein. Wer behauptet zu wissen, die Sonne drehe sich um die Erde, hat damit unrecht und kann dies daher nicht wissen. Die Person mag annehmen, es zu wissen, aber sie weiß es nicht. Und wer behauptet, die MMR-Impfung verursache Autismus, hat unrecht und kann dies daher nicht wissen, egal wie überzeugt die Person davon ist.

Manche mögen nun einwenden, es gebe unterschiedliches "Wissen" und man solle sich nicht gegen alternative Sichtweisen stellen. Das ist aber ein Missverständnis. Es steht außer Frage, dass Menschen unterschiedliche und oft inkompatible Perspektiven haben, und wie wir mit diesen umgehen, ist eine wichtige ethische und politische Frage. Doch wenn diese Sichtweisen nicht korrekt sind, stellen sie kein Wissen dar. Wissen gibt die Realität ausnahmslos wahrheitsgemäß und korrekt wieder.

Zwei Cover der Time-Magazine-Ausgabe
Drehen am Rad der Wissensgeschichte: Die zwei Cover der 2025er-Person of the Year-Ausgabe des "Time Magazine", die Jensen Huang, Präsident und CEO von Nvidia; Elon Musk, xAI; Dario Amodei, CEO von Anthropic; Lisa Su, CEO von AMD; Mark Zuckerberg, CEO von Meta; Demis Hassabis, CEO von DeepMind Technologies; Fei-Fei Li, Co-Director des Stanford University Human-Centered AI Instituts und CEO von World Labs; sowie Sam Altman, CEO von Open AI, zeigen.

Man kann gar nicht genug betonen, wie wichtig dieser Punkt ist. Das Konzept von Wissen ist in allen menschlichen Kulturen zentral: Während einige Sprachen keine eigenen Wörter für essen und trinken oder er und sie kennen, gibt es in allen menschlichen Sprachen ein Wort für Wissen, das mit dem Begriff "Wahrheit" im Zusammenhang steht. Wissen – wie auch immer es in einer Sprache bezeichnet werden mag – bedeutet eine bestimmte korrekte und wahrheitsgetreue Darstellung. Wenn etwas nicht wahr ist, kann es nicht Wissen sein. Es gibt kein falsches Wissen.

LLMs können diesen Unterschied zwischen Wahrheit und Unwahrheit nicht erkennen. Sie fabrizieren Sätze, indem sie mit Milliarden von Texten im Internet interagieren. Es ist jedoch weder ihre Aufgabe noch die Aufgabe von unterbezahlten Klickarbeiter:innen, die KI-Outputs klassifizieren, zwischen wahrheitsgemäßen Texten und solchen, die Unwahres enthalten, zu unterscheiden. Jeder Text ist gut genug, wenn er nur zum Prompt passt.

Echte Modelle der Welt

Und das ist auch der Schlüssel zum Verständnis des Unterschieds zwischen Wikipedia und LLMs. Wikipedia ist bestrebt, Sachverhalte korrekt darzustellen, und verfolgt dieses Ziel mithilfe einer immensen Anzahl an Freiwilligen, die ihre Einträge im Einklang mit den relativ strengen Wikipedia-Regeln fortlaufend aktualisieren und die Interventionen anderer korrigieren. Ihr Ziel ist eine korrekte Darstellung, wovon Wahrheit eine bestimmte Version ist. Manchmal machen Autor:innen Fehler, die dann von anderen korrigiert werden. Einige Fehler werden dabei ohne Zweifel unentdeckt bleiben. Doch im Gegensatz zu einem LLM verfolgt Wikipedia die Absicht, von den Meinungen zur echten Welt, die die Freiwilligen beisteuern, zu lernen, um so das übergeordnete Ziel zu erreichen, die Welt wahrheitsgetreu darzustellen.

Dies ist auch der Grund, warum einige führende Wissenschaftler:innen, die LLMs kritisch gegenüberstehen – darunter Gary Marcus und Yann LeCun –, ins Treffen führen, dass KI-Anwendungen zusätzlich zu ihren Textproduktionsprogrammen echte "Modelle der Welt" benötigen. Ob dieser Vorschlag Gehör finden wird, zählt derzeit zu den interessantesten Fragen in der KI-Welt.

Vielleicht denkt jetzt jemand, dass die meisten LLMs sich ja ohnehin Wikipedia einverleibt haben und es deshalb keinen nennenswerten Unterschied zwischen den beiden Systemen mehr gebe.

Natürlich ist es sinnvoll, dass LLMs sich auf Wikipedia stützen, anstatt sich ausschließlich aus Webseiten voller Verschwörungstheorien zu speisen. Der Unterschied besteht aber dennoch in den Zielen der Systeme, nicht nur in ihren Trainingsgrundlagen. Auch wenn Wikipedia falsche Informationen enthält, so ist es doch ihr dezidiertes Ziel, wahrheitsgetreue und korrekte Informationen anzubieten. Ein Fehler in einem Wikipedia-Eintrag ist ein Makel, eine Halluzination eines Chatbots ist jedoch, wie wir gesehen haben, angesichts seiner Aufgabe kein Makel. Wikipedia-Autor:innen verfolgen das Ziel, die Einträge so korrekt wie möglich zu gestalten; für Klickarbeiter:innen, die die Daten in LLMs klassifizieren, ist das bedeutungslos.

Ernstzunehmende Probleme

Wikipedia liefert keine Garantie dafür, dass alle Informationen stimmen – eine solche existiert grundsätzlich nicht. Was Wikipedia allerdings bietet, ist eine verlässliche Methode, etwas über die Welt herauszufinden. LLMs bieten eine verlässliche Methode, binnen Sekunden kohärente Texte zu produzieren. Aber sie stellen keine verlässliche Methode zur Verfügung, etwas über die Welt zu lernen. Aus diesem Grund kann Wikipedia eine Wissensquelle sein, während LLMs dies nicht sind, denn Verlässlichkeit ist ein grundlegendes Element der Wissensgenerierung. Wissen braucht Wahrheit, aber Wahrheit allein ist nicht genug – man kann ja auch aus Zufall auf die Wahrheit stoßen (zum Beispiel, indem man mit Glück etwas richtig errät). Um Wissen zu erwerben, braucht man verlässliche Methoden der Wahrheitsfindung – beispielsweise etwas mit eigenen Augen zu sehen, sich an etablierte, vertrauenswürdige Autoritäten zu wenden oder durch wissenschaftliche Experimente Theorien zu bestätigen. Das Konzept einer verlässlichen Methode zur Wahrheitsfindung bildet daher den Kern von Wissen.

Eine Person in einem schwarzen Anzug und Krawatte hält ein Mikrofon während einer Pressekonferenz. Im Hintergrund befinden sich unscharf abgebildete Personen vor einer blauen Wand mit einem Schriftzug. Die Gesichter sind unkenntlich gemacht.
Tim Crane, geb. 1962, ist ein britischer Philosoph und einer der führenden Vertreter der Philosophie des Geistes. Er ist ist Director of Research des FWF- Exzellenzclusters "Knowledge in Crisis" und Professor für Philosophie sowie Pro-Rektor der Central European University in Wien. Er hat das Institute of Philosophy der University of London gegründet und war Knightbridge-Professor an der University of Cambridge. Der Essay erschien kürzlich im Jahresbericht des Wissenschaftsfonds FWF: www.fwf.ac.at

Im FWF-Exzellenzcluster "Knowledge in Crisis" wenden wir diese grundlegenden Ideen der Erkenntnistheorie (Epistemologie) auf alle heutigen Wissenskrisen an – und die KI-Krise ist nur eine davon. Wir veranstalten Workshops und öffentliche Diskussionsrunden, in denen wir uns mit der Relevanz philosophischer Theorien zu Wissen und Erkenntnisgewinn für die derzeitigen Krisen befassen, und die Wissenschaftler:innen dieses Clusters publizieren Artikel und Bücher zu diesem Thema. Zusammen mit Forscher:innen anderer Disziplinen – wie etwa Wissenschaftskommunikation, Sozialwissenschaften, Psychologie und Wirtschaftswissenschaften – befassen wir uns auch mit Fragen, die für uns alle wesentlich sind. Dieses Jahr werden wir gemeinsam mit dem FWF-Exzellenzcluster "Bilateral Artificial Intelligence" öffentliche Veranstaltungen organisieren, um die Bedeutung von KI in der heutigen Zeit zu diskutieren.

Es ist bemerkenswert, wie tief diese Krisen philosophisch verwurzelt sind. Manchmal werden diese Wissenskrisen ausschließlich in Hinblick auf Wissenschaftsfeindlichkeit (etwa in Bezug auf die Ablehnung von Impfungen) oder Probleme, die durch die Verbreitung von Falschinformation und Desinformation ausgelöst werden, diskutiert, beispielsweise wenn Nutzer:innen auf sozialen Medien absichtlich zu politischen Themen in die Irre geführt werden. Das sind sehr ernstzunehmende Probleme, mit denen wir uns im Rahmen unseres Exzellenzclusters intensiv beschäftigen. Die Epistemologie von KI – insbesondere von LLMs – ist jedoch noch viel subtiler und tiefgreifender: Sie bedroht die Grundfesten unserer Methoden der Wissensproduktion. Wenn wir nicht lernen zu verstehen, wie die Maschinen mit Fakten über Wahrheit und Wissen umgehen, werden wir uns immer weiter in dem Netz aus Nichtwissen und Chaos, das die KI-Unternehmen über uns ausspannen, verwickeln. Darum gehört es zu den Zielen des Teams von "Knowledge in Crisis", dieses Verständnis zu fördern und allen zur Verfügung zu stellen.

 

Nota. - 1° Die Welt ist keine Gegend, die man ausmessen und sichtbar, hörbar oder definierbar - wiedergeben kann; sondern eine Horizont, in den man alle Informa-tionen, denen man in reellen Gegenden begegnet, einpassen kann. Ob alles passt - "stimmt" -, kommt nicht bloß auf den Horizont, sondern ebensosehr auf die Infor-mationen an. Gegebenfalls muss man jenen oder diese oder alle neu justieren, um sie passgerecht zu machen. Ob es gelingt, kann nur der Versuch erweisen

Daraus folgt 2°, dass Wahrheit keine Gegebenheit, sondern eine Aufgabe - gr. pro-blêma - ist. Kein terminus a quo, sondern ein terminus ad quem.

Werden die Anforderungen an Wissen und Wahrheit dadurch lockerer oder strenger? 

Strenger, weil sie sowohl gedanklich als auch phänomenal stets die engst-mögliche Bestimmung verlangen - die aber nur pragmatisch gesucht, nicht aber dogmatisch berechnet werden können.
JE