Ein Smartphone zeigt die App-Store-Seite für „Claude by Anthropic“ vor einem Hintergrund mit dem Anthropic-Logo.
Bild anzeigen
Wählen Sie profil als bevorzugte Google-Quelle

Trump vs. Anthropic: Warum Fable und Mythos offline sind

Zwei Tage dauerte es, bis das stärkste KI-Modell von Anthropic, Fable 5, geknackt wurde. Die US-Regierung erließ daraufhin eine Sperre für Ausländer – Anthropic nahm das Modell weltweit offline. Fünf Fragen & Antworten.

Drucken

Schriftgröße

Hören Sie sich diesen Artikel an

Vergangene Woche veröffentlichte Anthropic mit „Fable 5“ eine abgespeckte Version seines angekündigten Spitzenmodells Mythos 5 für die KI-Software „Claude“. Das Modell war zunächst für die breite Öffentlichkeit zugänglich, wurde jedoch nach wenigen Tagen wieder offline genommen.

Auslöser war ein sogenannter Jailbreak. Der X-Nutzer „Pliney the Liberator“ erklärte rund 48 Stunden nach der Veröffentlichung, es sei ihm gelungen, die Sicherheitsvorkehrungen von Fable 5 zu umgehen. Dafür habe er das Modell mit einer Reihe kurzer, aufeinander aufbauender Prompts (Texteingaben) dazu gebracht, Teile des internen Sicherheitsprotokolls offenzulegen. Auf diesem Weg sollen auch Informationen zugänglich geworden sein, die Anthropic normalerweise einschränkt, etwa zu biologischen Waffen oder Viren.

1. Warum ist Claude Fable 5 nicht mehr verfügbar?

Drei Tage nach der Veröffentlichung ordnete die US-Regierung nach Sicherheitsbedenken ein vorläufiges „Exportverbot“ für Fable 5 beziehungsweise Mythos 5 an. Laut „Wall Street Journal“ soll Amazon-Chef Andy Jassy in Gesprächen mit dem Weißen Haus Bedenken geäußert haben, nachdem Sicherheitsforscher von Amazon auf mögliche Risiken bei Mythos 5 hingewiesen hatten.

In einer internen Studie soll es demnach gelungen sein, Fable 5 durch gezielte Manipulationen dazu gebracht zu haben, Informationen preiszugeben, die für Cyberangriffe genutzt werden könnten. Amazon hat sich dazu bis jetzt nicht öffentlich geäußert.

Pikant: Amazon ist nicht nur ein Investor von Anthropic, sondern auch ein strategischer Infrastrukturpartner. Anthropic nutzt die Rechenkapazitäten großer Tech-Konzerne, um seine KI-Modelle zu betreiben.

Nach dem vorläufigen Exportverbot darf Anthropic das neueste Modell nur US-Staatsangehörigen zur Verfügung stellen. Weil Anthropic offenbar nicht zuverlässig klassifizieren kann, welche Nutzerinnen und Nutzer US-Staatsbürger sind, entschloss sich das Unternehmen, die betroffenen Modelle vorerst für alle außer Dienst zu stellen.

Claude Mythos
Bild anzeigen

2. Welche Folgen hat das für Anthropic?

Kurzfristig befeuert das Verbot ein Narrativ, das Anthropic selbst seit Monaten pflegt: Das Unternehmen verfüge über das „mächtigste“ KI-Modell am Markt – möglicherweise sogar über ein Modell, das so stark ist, dass es regulatorisch eingeschränkt werden muss.

Gleichzeitig trifft die Sperre Anthropic an einer empfindlichen Stelle. Jede neue Version eines großen KI-Modells wird in der Branche genau beobachtet. Je besser ein Modell in Leistungstests abschneidet, desto stärker steigt in der Regel das Interesse von Investoren. Für Anthropic ist das besonders wichtig, weil das Unternehmen bislang von einer Finanzierungsrunde zur nächsten wächst. In der KI-Branche sind die operativen Einnahmen derzeit defizitär.

Ob sich Anthropic den Ausfall eines groß angekündigten Modells nach dem geplanten Börsengang mit sagenumwobenen PR-Narrativen ausreden kann, wird sich zeigen.

3. Welche Folgen hat das Exportverbot für Europa?

Das Exportverbot legt Europas Abhängigkeit von US-amerikanischen KI-Anbietern offen.

Zwar gibt es auch diesseits des Atlantiks eigene KI-Modelle. In den wichtigsten Benchmark-Tests liegen sie jedoch weiterhin deutlich hinter den leistungsstärksten Modellen aus den USA zurück. Die EU-Kommission hatte am Wochenende mitgeteilt, die Auswirkungen zu untersuchen. Die neuen Modelle böten erhebliche Vorteile, etwa für die Cyber-Abwehr, würden aber auch ernste Bedenken hinsichtlich der Cybersicherheit aufwerfen.

Das Exportverbot offenbart zudem ein geopolitisches Problem: Wer nicht im strategischen Interesse der US-Regierung liegt, könnte durch einen solchen oder ähnlichen Rechtsakt vom Zugang zu zentraler Technologie ausgeschlossen werden. Bereits seit Jahren beschränken die USA den Export ihrer Chiptechnologie und machen ihn zunehmend von sicherheitspolitischen Erwägungen abhängig. Eine vergleichbare Logik könnte nun künftig auch für Software-KI-Modelle kommen.

Gleichzeitig ist das Verhältnis zwischen Anthropic und Donald Trump angespannt. Das Unternehmen hatte sich in der Vergangenheit geweigert, dem US-Militär seine KI-Modelle für die Überwachung von Bürgerinnen und Bürgern und für autonome Waffensysteme zur Verfügung zu stellen. Was folgte: Anthropic wurde als Lieferketten-Risiko eingestuft.

4. Wie mächtig sind Fable und Mythos?

Fable 5 gilt als bislang stärkstes Modell in Anthropics KI Claude. In branchenüblichen Tests (Benchmarks) hat Fable 5 den bisherigen Spitzenreiter OpenAI (ChatGPT 5.5) überholt. Die beiden US-Unternehmen liefern sich im Silicon Valley seit Monaten ein Kopf-an-Kopf-Rennen um die leistungsfähigsten KI-Modelle.

Schon vor Monaten hatte Anthropic Mythos 5 angekündigt. Innerhalb der Branche sorgte das Modell für Spekulationen. Es soll in der Lage sein, in sehr kurzer Zeit Schwachstellen in Software zu finden. Für sensible Branchen wie Banken oder Versicherungen wäre das ein erhebliches Risiko.

Anthropic hielt die Veröffentlichung daher zunächst zurück und brachte betroffene Unternehmen in ein abgesichertes Testprogramm. Unter kontrollierten Bedingungen sollten sie prüfen, ob Mythos Schwachstellen in ihren Systemen entdeckt. Für Anthropic hatte das einen praktischen Nebeneffekt: Das Unternehmen konnte in kurzer Zeit zahlreiche Firmen an sich binden.

5. Kann Fable überhaupt „sicher“ gemacht werden?

Jailbreaks, also die absichtliche Umgehung von Sicherheitsmechanismen in Claude, werden nicht immer mit krimineller Absicht durchgeführt. In der KI-Szene gelten sie auch als eine Art Wettbewerb. Nutzerinnen und Nutzer versuchen, Sicherheitslücken aufzudecken, um auf Schwachstellen hinzuweisen oder sich Online-Reputation zu erarbeiten.

Bisher konnte sich kein KI-Modell vor einem Jailbreak schützen.

Anthropic verweist auf umfassende Tests vor der Veröffentlichung. „In über 1000 Teststunden ergab es keinen universellen Jailbreak“, schreibt das Unternehmen in seiner Erklärung zum neuen Modell. Gleichzeitig räumt Anthropic ein, dass absolute Sicherheit kaum erreichbar ist: „Es ist wahrscheinlich unmöglich, universelle Jailbreaks vollständig zu verhindern, aber unser Ziel ist es, auf diese Art, die verbleibenden langsam und kostspielig zu gestalten.“

Kevin Yang

Kevin Yang

seit 2024 Redakteur und Faktenchecker bei profil Digital. Schwerpunkte: Arbeitsmarkt, Wirtschaftsrecht und Wohnbau. Davor bei „Wiener Zeitung“ und ORF.