Wir zahlen jetzt die Rechnung.

Irgendwann musste das kommen. Die große Gratisphase der KI war kein Geschäftsmodell, sie war Wachstumsstrategie. Nutzer gewinnen, Daten sammeln, Abhängigkeiten schaffen. Und jetzt, wo die Abhängigkeiten da sind, dreht sich das Modell um.

Claude mit vollem Funktionsumfang: über hundert Euro im Monat. Coding-Tools noch mehr. ChatGPT war im April mehrmals ausgefallen und nicht weil niemand daran gearbeitet hätte, sondern weil schlicht zu viele Menschen gleichzeitig darauf zugreifen wollten. Rechenleistung ist physisch begrenzt. Und die neue Generation agentenbasierter Systeme, die nicht nur antworten sondern selbstständig handeln, verbraucht ein Vielfaches davon.

Was sich dabei verändert, ist eine Grundannahme, die sich in den letzten drei Jahren still eingeschliffen hat: mehr Prompt ist besser. Ausführlich erklären, Kontext geben, den Ton setzen. Das hatte seine Berechtigung und hat sie in komplexen Aufgaben noch. Aber an den Rändern des Systems, dort wo automatisierte Pipelines laufen und tausende Anfragen täglich abgearbeitet werden, entsteht gerade eine gegenteilige Praxis. Das Konzept der „Caveman LLMs" klingt skurril, ist aber symptomatisch: Schlagworte statt Sätze, Informationskern statt Fülltext, Token-Verbrauch um bis zu 75 Prozent reduziert. Für repetitive Abfragen funktioniert das, aber für alles, wo Nuancen zählen, nicht.

Was mich dabei beschäftigt, ist weniger die Technik als die Situation für Organisationen, die gerade erst anfangen, KI ernsthaft einzusetzen. Die werden nicht mit einer Phase kostenloser Experimente konfrontiert sondern sie stehen sofort vor Lizenzentscheidungen. Welches Werkzeug für welche Aufgabe? Welcher Preis ist gerechtfertigt? Brauchen wir wirklich das teuerste Modell für jeden Use Case?

Das sind eigentlich die richtigen Fragen. Nur hätten wir sie auch stellen können, als alles noch wenig gekostet hat.