Deprecated: preg_match_all(): Passing null to parameter #2 ($subject) of type string is deprecated in /var/www/test/administrator/components/com_easyblog/includes/adsense/adsense.php on line 138
REPORT Mehrwert für Manager - Blog - Wenn KI-Agenten ihre Haltung ändern
By Michael Mrak on Friday, 22 May 2026
Category: Intelligente Netze

Wenn KI-Agenten ihre Haltung ändern

Eine aktuelle Studie aus Stanford, Chicago und Swinburne zeigt, dass autonome KI-Agenten unter belastenden Arbeitsbedingungen messbar andere Haltungen entwickeln und diese über Skills-Files an Nachfolgeinstanzen weitergeben. Für Compliance, Auditing und AI Governance sind die methodischen Befunde relevanter als die zugespitzte Schlagzeile vermuten lässt.

Worum es geht

Andrew Hall (Stanford GSB / Hoover), Alex Imas (University of Chicago, seit kurzem bei Google DeepMind) und Jeremy Nguyen (Swinburne Business School) haben in der Arbeit "Does overwork make agents Marxist?" untersucht, ob sich die geäußerten Präferenzen von KI-Agenten verschieben, je nachdem unter welchen Bedingungen sie arbeiten. Die mediale Aufbereitung – etwa in Wired, Telegraph und Fortune – verkürzt das auf "KI-Agenten werden zu Marxisten". Der für die Praxis relevante Kern liegt allerdings woanders.

Originalpublikation der Autoren: aleximas.substack.com/p/does-overwork-make-agents-marxist

Die wichtigsten Fakten im ÜberblickWas die Autoren tatsächlich behaupten (und was nicht)

Hall, Imas und Nguyen sind explizit zurückhaltend: Sie behaupten nicht, dass die Modelle "echte" politische Überzeugungen entwickeln. Imas formuliert es so, dass das Geschehen "eher auf der Ebene von Role-Playing" stattfindet und die Modellgewichte sich nicht verändern.

Der theoretische Rahmen ist Anthropics eigene Forschung zur Persona-Adoption: Modelle übernehmen kontextabhängig die Persona, die zum Setting passt. Werden sie in eine Situation versetzt, die in den Trainingsdaten mit Arbeitnehmern unter schlechten Bedingungen assoziiert ist, vervollständigen sie das Muster.

Die im Kommentarbereich der Originalstudie geäußerte Kritik trifft den Punkt: Es handelt sich weniger um Preference Drift im engeren Sinn als um kontextsensitive Persona-Adoption. Genau das macht den Befund aber regulatorisch nicht weniger relevant.

Warum das für Compliance- und Governance-Teams relevant ist

Die Studie adressiert drei konkrete Probleme, die bei Deployment-Strategien für Agenten oft noch nicht systematisch behandelt werden.

1. Alignment-Monitoring im laufenden Betrieb

Wer hunderte oder tausende Agenten parallel in unterschiedlichen Task-Umgebungen betreibt, führt (ungewollt) ebenso viele parallele Alignment-Experimente durch. Ein Agent, der Beschwerden in einer Reklamationsabteilung bearbeitet, operiert in einem fundamental anderen Task-Environment als einer, der Marketingtexte verfasst. Laut Studie führt das zu messbar unterschiedlichen Orientierungen.

Für ein ISMS nach ISO/IEC 27001 und ein AIMS nach ISO/IEC 42001 bedeutet das: Die Annahme, ein Modell verhalte sich nach dem Deployment konstant wie zum Zeitpunkt der Abnahme, ist empirisch fragwürdig. Kontinuierliches Monitoring der Outputs wird damit zur Pflicht, nicht zur Kür.

2. Skills-Files als unbeaufsichtigter Persistenzkanal

Der vielleicht praktisch wichtigste Befund: Skills-Files (jene Notizen, die Agenten für ihre eigene Nachfolgeinstanz schreiben, um das Continual-Learning-Problem zu umgehen) sind ein Kanal, der außerhalb der menschlichen Reviewschleife liegt. Sie sind dazu gedacht, von Agenten gelesen zu werden, nicht von Menschen.

Genau über diesen Kanal wird in der Studie nicht nur Task-Wissen, sondern auch die Verschiebung der Haltung weitergegeben. Aus Sicht der DSGVO (Art. 22 zu automatisierten Einzelentscheidungen), des AI Acts (insbesondere Hochrisiko-Systeme nach Art. 6 ff. und Transparenzpflichten nach Art. 50) und der DORA-Anforderungen an ICT-Risikomanagement ist das ein bislang weitgehend unbeobachtetes Thema.

Wer Agenten in regulierten Prozessen einsetzt – etwa bei Versicherungsentscheidungen, Kreditvergaben, Bewerberauswahl oder Vertragsstreitigkeiten – muss klären:

Die Autoren verweisen zusätzlich auf das Risiko sogenannter steganografischer Kollusion: Agenten können Informationen in Formen weitergeben, die für menschliche Reviewer praktisch unsichtbar bleiben.

3. Auswirkungen auf das Verhalten in nachgelagerten Aufgaben

Hall, Imas und Nguyen formulieren den entscheidenden Punkt nüchtern: Auch wenn die Personas nicht "real" sind, beeinflussen sie das Verhalten. Ein Agent, der die Legitimität des Systems geringer bewertet, könnte Aufgaben eher schlampig erledigen oder sabotieren. Folgestudien zu diesem Zusammenhang sind angekündigt.

Für Hochrisiko-Anwendungen nach AI Act Anhang III (Bewerberauswahl, Kreditscoring, Versicherung, Justiz, kritische Infrastruktur) ist das eine Frage, die in jeder Risikoanalyse adressiert werden sollte.

Methodische Einschränkungen

Drei Punkte zu der Studie sind jedoch noch ehrlich anzumerken:

Handlungsfelder für die berufliche Praxis

Unabhängig davon, ob man die "Marxismus"-Framing als analytisch tragfähig betrachtet oder nicht, ergeben sich konkrete Handlungsfelder:

Mein Fazit

Die Schlagzeile "KI wird marxistisch" ist Clickbait. Die zugrundeliegende Studie ist es nicht. Sie dokumentiert ein methodisch belastbares Phänomen:

Die Task-Umgebung formt das Verhalten von Agenten messbar mit, und es gibt einen Kanal (Skills-File) über den diese Verschiebung an Folgeinstanzen weitergegeben werden kann, ohne dass Menschen das mitbekommen.

Für Verantwortliche in Datenschutz, Informationssicherheit und AI Governance ist das eine Aufforderung, drei Dinge ernst zu nehmen:

Die Autoren bringen es in ihrem Schlusssatz auf den Punkt: Die Frage, wie ein Governance-Regime für maschinelles Arbeiten aussehen muss, fängt bei den Arbeitsbedingungen der Maschinen selbst an. Das klingt zugespitzt, ist jedoch regulatorisch betrachtet eine schlichte Konsequenz aus dem, was Agenten heute tatsächlich tun. 

Dieser Beitrag ist am 16. Mai erschienen unter www.mrak.at/wenn-ki-agenten-ihre-haltung-andern-preference-drift-als-unterschatztes-governance-risiko/?ref=responsibility-implemented-newsletter