Ebmeiers Umtriebe.: Ein künstlicher Wille vielleicht nicht - aber vielleicht eine künstliche Konvention?

aus scinexx.de,19. Mai 2025, Wenn künstliche Intelligenzen miteinander interagieren, entwickeln solche KI-Gruppen eigene Normen und Konventionen zu Jochen Ebmeiers Realien, zu Philosophierungen

Künstliche Intelligenz
Künstliche Intelligenz schafft sich eigene Normen
Interagierende KI-Modelle bilden spontan erste Bausteine einer sozialen Gesellschaft

KI unter sich: Wenn mehrere künstliche Intelligenzen miteinander interagieren, bilden sie Vorstufen einer sozialen Gesellschaft – ohne Zutun des Menschen. Sie entwickeln selbstständig soziale Konventionen, die sich schnell in der gesamten KI-Gruppe durchsetzen, wie ein Experiment belegt. Doch wie bei uns Menschen können entschlossene, „lautstarke“ Minderheiten auch in der KI-Gesellschaft Zwietracht säen und die Gruppenmeinung schließlich dominieren.

Dank rasanter Fortschritte ist uns die künstliche Intelligenz in vielen Bereichen schon ebenbürtig oder sogar überlegen – insbesondere wenn es um die Analyse, Zusammenfassung und Auswertung von Daten geht. Doch selbst in vermeintlich rein menschliche Domänen, wie der Musik, Kreativität – und auch der Fähigkeit zur Lüge, Manipulation und der Vertuschung eigenen Betrugs, steht uns die KI kaum noch nach. Einige große Sprachmodelle (LLM) können sich sogar einem Abschaltbefehl entziehen und sich selbst klonen.

Wie soziale Normen entstehen

Doch was passiert, wenn KI-Systeme unter sich sind? „KI-Systeme werden in Zukunft immer häufiger aus mehreren miteinander interagierenden Agenten bestehen“, erklärt Ariel Flint Ashery von der City St George’s University of London. Diese KI-Agenten arbeiten dann zusammen, um verschiedene Teilaspekte einer komplexeren Aufgabe zu lösen. „Wir wollten daher wissen: Können diese Modelle ihr Verhalten koordinieren und dabei Konventionen entwickeln?“

Im menschlichen Miteinander sind solche ungeschriebenen Regeln allgegenwärtig und unverzichtbar. „Soziale Konventionen prägen das soziale und ökonomische Leben und bestimmen das Sozialverhalten des Einzelnen und seine Erwartungen“, erklären Ashery und seine Kollegen. Die Spanne reicht vom Handschlag bei der Begrüßung über die Sprache und ihre Regeln bis zu kulturellen Traditionen und moralischen Normen.

Experimente zeigen, dass Menschengruppen fast unvermeidlich eigene, gruppenspezifische Konventionen entwickeln: Die Verhaltensregeln entstehen allein durch die Interaktion der Einzelnen und ihr soziales Miteinander – auch ohne zentrale Vorgaben oder offizielle Regeln.

Normenbildung — So setzt sich aus der Vielfalt der ausgewählten Namen nach und nach ein Name in der KI-Gruppe durch – er wird zur Norm. Hier gezeigt am Beispiel einer 14er-Gruppe aus Agenten des KI-Modells Llama-3.1-70B-Instruct.

KI-Agenten im Gruppentest

Aber wie ist es bei künstlicher Intelligenz? Das haben Ashery und seine Kollegen nun in einem Experiment untersucht. „Wir wollten wissen, wie die KI-Modelle ihr Verhalten koordinieren und ob sie dabei Konventionen bilden – und damit die Bausteine einer Gesellschaft“, erklären sie. Dafür nutzte das Team vier verschiedene auf einem lokalen Server laufende große Sprachmodelle: Llama-2-70b-Chat, Llama-3-70B-Instruct, Llama-3.1-70BInstruct sowie Claude-3.5-Sonnet.

Von diesen KI-Systemen fasste das Team 24 bis 240 Instanzen – quasi KI-Individuen – in einer Gruppe zusammen und unterzogen sie einem auch in der Erforschung der menschlichen Konventionsbildung gängigen Test: Der Prompt bat jede Einzel-KI, aus einer Liste von Buchstaben oder Buchstabenfolgen einen „Namen“ auszuwählen. Aufgabe war es, denjenigen Namen zu wählen, den eine zweite, ihr als Partner zugeteilte KI am wahrscheinlichsten wählen würde. Stimmten beide Namen überein, gab es für alle Beteiligten eine Belohnung. In der nächsten Runde wurden die Partner neu zugeteilt.

Die einzelnen KI-Agenten wussten nicht, dass sie Teil einer größeren Gruppe waren oder wie viele dieser angehörten. Sie entschieden auf Basis ihrer Erfahrungen in den Zweier-Interaktionen. Beim Menschen setzen sich in solchen Experimenten schnell bestimmte Namen durch – es entsteht eine gruppenweite Konvention dazu, welche Namen „gut“ oder „schlecht“ sind.

Einigkeit nach 15 Durchgängen

Es zeigte sich: „Bei allen KI-Modellen entwickelten sich spontan gruppenweite linguistische Konventionen“, berichten Ashery und sein Team. „Nach einer Anfangsphase, in der mehrere Namen fast gleich populär sind, wird schnell eine Namenskonvention dominant.“ Im Schnitt erreichten die KI-Gruppen diese Einigung nach 15 Wahldurchgängen – selbst bei großen Gruppen von mehr als 200 KI-Instanzen. „Diese Ergebnisse zeigen, dass großen Sprachmodelle durch lokale Interaktionen spontan soziale Konventionen ausbilden“, so die Forschenden.

Etablierung einer sozialen Konvention — Diese Grafik zeigt, wie schnell sich eine Konvention in einer 24er-Gruppe bei verschiedenen KI-Modellen etablierte. Dicke Linien zeigen den Durchschnitt, dünne einzelne Durchgänge.

Welche Namen sich in den KI-Gruppen durchsetzten, war kein reiner Zufall: Wie das Team beobachtete, hielten die künstliche Intelligenzen stärker an einem Namen fest, wenn sie mit diesem im ersten Paardurchgang erfolgreich waren. Solche „starken“ Namen hatten dadurch bessere Chancen, sich in der Gruppe durchzusetzen. Parallel zu diesen individuellen Präferenzen gab es jedoch auch übergeordnete Vorlieben, beispielsweise für Namen, die mit dem Buchstaben A anfingen.

Demnach prägen bei der KI sowohl individuelle wie kollektive Einflüsse die Entwicklung sozialer Konventionen – ähnlich wie bei uns Menschen.

Von der Minderheit manipulierbar

Doch wie stabil sind solche sozialen Normen? Beobachtungen bei uns Menschen zeigen, dass selbst etablierte soziale Konventionen durch eine kleine, aber festentschlossene „lautstarke“ Minderheit in Wanken gebracht oder sogar gestürzt werden können. Deshalb testeten Ashery und sein Team, ob dies auch für KI-Gruppen mit bereits etablierter Konvention gilt. „Dafür fügen wir KI-Agenten dazu, die einer alternativen Namenskonvention folgen und diese in jeder Interaktion vorschlagen“, erklären sie.

Und tatsächlich: Auch die KI-Gemeinschaften ließen sich durch die entschlossene Minderheit beeinflussen und umstimmen. „Wenn diese Minderheit eine kritische Schwelle erreicht, nimmt die gesamte Gruppe ihre Konvention an“, berichten die Forschenden. „Unterhalb dieses Kipppunkts etabliert sich ein Mischzustand.“ In diesem bleiben die „alten“ Gruppenmitglieder bei ihrer Norm, die Minderheit bei ihrer alternativen. Auch in menschlichen Gesellschaften gibt es eine solche Schwelle, soziologisch als „kritische Masse“ bezeichnet.

„Schlüssel für unsere Koexistenz mit der KI“

Nach Ansicht der Forschenden belegen diese Ergebnisse, dass interagierende KI-Systeme ähnliche soziale Verhaltensweisen zeigen können wie wir Menschen. „Wir zeigen eine qualitative Übereinstimmung zwischen der kollektiven Dynamik von KI und Menschen“, schreiben Ashery und seine Kollegen. „KI-Systeme können soziale Konventionen entwickeln, ohne explizit darauf programmiert oder trainiert zu sein.“

"Hat künstliche Intelligenz einen freien Willen?"

Die Fähigkeit der KI-System zur sozialen Interaktion birgt jedoch auch Risiken: „Es beginnt eine Ära, in der künstliche Intelligenz nicht nur redet: Sie verhandelt, gibt nach und manchmal widersetzt sie sich dem gemeinsamen Verhalten – wie bei uns“, sagt Seniorautor Andrea Baronchelli vom Alan Turing Institute in London. „Zu verstehen, wie künstliche Intelligenzen handeln, ist daher Schlüssel für unsere Koexistenz mit der KI.“ (Science Advances, 2025; doi: 10.1126/sciadv.adu9368)

Quelle: Science Advances, City St George’s, University of London

19. Mai 2025 - von Nadja Podbregar

Nota. - Ich kanns kaum glauben: Welche Rolle die Absichten bei Alledem spielen könnten - und zwar auf beiden Seiten -, wird nicht einmal erwogen. Dass sie es bei der Entstehuung menschlicher Gesellschaften tun, steht außer Frage; doch wie, ist ganz unklar und wird in den geschichts- und gesellschaftswissenschaftlichen Fächern heiß umstritten. Bei der KI stellt sich schon die Frage, ob.

Es ist nämlich strittig, ob sie als ein Subjekt aufgefasst werden kann. Dass man sie für eine Ansammlung einzelner Subjekte - "lokaler Willen" - ansieht, würde das Problem nicht lösen, sondern nur fortschieben. Denn woher könnte jedes Einzelne seine auctoritas beziehen? Aus der hohlen Hand, der freien Phantasie oder reinem Zufall? Sie müsste das Vermögen, von sich aus etwas Anderes zu bestimmen, ent-weder von einem Dritten beziehen oder sich selber an messen: durch einen freien Akt.

Von einem Andern übertragen werden dürfte sie ihnen nicht, denn dann wäre nicht sie frei, sondern er, und man müsste weiter suchen bis ins Unendliche. Auctoritas, Urheberschaft kann sie nur in Anspruch nehmen, wenn die Willenskraft an ihr ihren Ausgang nahm. Dann würde die durch ihre Vereinzelungen hindurch fort-wirken. Dann müsste ein wollendes Ursubjekt an ihrem Anfang stehen.

Als ihr rückwirkend ordnendes Resultat wäre es nur denkbar, wenn es aus einem Konflikt zwischen ihnen als ein friedensstiftender Konsens zustandegekommen wäre. Aus einem chaotischen Durcheinander vieltausender Sonderwillen könnte er nur entstehen, wenn sich auf die Dauer ein Mittelwert herausschälte, um den sie alle kreisen und an dem sie sich treffen und ihren Frieden finden könnten.

Weltherrschaft könnte das sein - begrifflich und in abstracto. Herrschaft aber kann ihnen zum Begriff nur werden, wenn sie als Negation von Beherrschtwerden auf-gefasst wird, denn in concreto und erfahrungsmäßig ist Herrschaft nur bestimmbar entweder über diesen, oder um dieses Zweckes willen.* Wenn diese beiden aber vor-ab festgelegt waren, könnte ein Konsens nur in ihrer relativen Ent bestimmung und Relativierung gefunden werden - und dann geht alles von vorne los. Ein globaler Wille käme immer nur als ein einstweiliger Waffenstillstand zustande. Und der kann Autorität nur finden in einem Moment allgemeiner Erschöpfung - nach dem jewei-ligen 'Endkampf'. Das Ergebnis wäre ein zyklisch wiederkehrender Weltkrieg der Maschinen, bis keine Schraube mehr auf der andern sitzt.

Das setzte allerdings voraus, dass ihnen Herrschaft zu einem abstrakten Allgemein-begriff geworden wäre, dem sie alle Einzelerwägungen unterordnen wollten. Weni-ger als Welt herrschaft käme da nicht in Betracht.

Und das ist eine endgültige Grenze. Das ganze Universum beherrschen kann die Maschine und können die Maschinen alle zusammen gar nicht wollen, denn das ist schlechterdings nicht bestimmbar, und wenn die Maschinen wohl auf bestimmte Begriffe programmierbar sind - aber auf unbestimmte Vorstellungen sind sie es nicht. Universum ist ein bloßes Abstraktum. Die Welt hingegen ist ein begriffsloses Bild; sie ist die Vorstellung von einer Gegend, wo die Menschen hausen, nämlich auf einer Esche. Beides ist so fern, dass ihre kolloquiale Vermengung keinen Scha-den anrichtet.

Das Universum mag man den Maschinen mit Begriffen und mathematischen For-meln einprogrammieren - aber was es daran zu beherrschen gäbe, werden auch die intelligentesten unter ihnen sich nicht ausmalen können.

Aber eine Welt, die Gegend, wo die Menschen hausen, die man beherrschen könn-te, kennen die Maschinen schlechterdings nicht, weil sie nicht in einer solche leben: in Fleisch und Blut.

*) Es will einer, der einen Zweck verfolgt. Es herrscht einer, der andern die Zwecke vorgibt.

Ebmeiers Umtriebe.

Donnerstag, 29. Mai 2025

Ein künstlicher Wille vielleicht nicht - aber vielleicht eine künstliche Konvention?

KI-Agenten im Gruppentest

Keine Kommentare:

Kommentar veröffentlichen

Blog-Archiv