Claude Fable 5 wird veröffentlicht mit einer harten Obergrenze für seine Fähigkeiten

Claude Fable 5 wird veröffentlicht mit einer harten Obergrenze für seine Fähigkeiten

Anthropic hat am Dienstag Claude Fable 5 für Unternehmenskunden und zahlende Abonnenten verfügbar gemacht – aber die leistungsfähigste Version desselben zugrunde liegenden Modells, Claude Mythos 5, bleibt der breiten Öffentlichkeit unzugänglich. Die Trennung ist beabsichtigt: Fable 5 wird mit Sicherheitsvorkehrungen geliefert, die bestimmte Abfragen an ein älteres Modell umleiten, während Mythos 5 nur einer kleinen, überprüften Gruppe von Cyberschutzexperten und Infrastrukturanbietern zur Verfügung steht. Für die meisten Benutzer ist die Zugriffsobergrenze direkt in das Produkt integriert.

Was Claude Fable 5 tatsächlich kann — und wo es aufhört

Anthropic sagt, dass Fable 5 dasselbe zugrunde liegende Modell wie Mythos verwendet, aber Sicherheitsvorkehrungen hinzufügt, die Abfragen zu risikoreichen Themen — insbesondere Cybersicherheit und Biologie — abfangen und stattdessen an Claude Opus 4.8 weiterleiten. Laut Anthropic greifen diese Sicherheitsvorkehrungen in etwa 5 % der Sitzungen, was bedeutet, dass 95 % der Fable-Sitzungen überhaupt keinen Rückfall beinhalten. Das Unternehmen räumt ein, dass seine Klassifizierer auch bei harmlosen Anfragen ausgelöst werden können und dass kein Klassifizierersystem jeden Jailbreak verhindern kann.

Um diese Grenzen zu testen, führte Anthropic ein 1.000-Stunden-externes Bug-Bounty-Programm durch; es wurden keine universellen Jailbreaks gefunden. Externes Red-Teaming wurde auch vom britischen AISI durchgeführt. Das vollständige Bild dessen, was das Modell kann und nicht kann, ist im System-Karte und einem separaten Risikobericht dokumentiert.

Innerhalb des erlaubten Bereichs ist das Feedback der Early-Access-Nutzer durchweg positiv. Ein Kunde berichtete, dass das Modell “das State-of-the-Art-Modell auf CursorBench ist. Es hat eine Klasse von Langzeitproblemen geöffnet, die für frühere Modelle unerreichbar waren.” GitHub sagte, es “übernahm komplexe, langwierige Coding-Aufgaben mit einem Maß an Autonomie und Zuverlässigkeit, das frühere Benchmarks übertraf.”

Die visuellen Fähigkeiten von Fable 5 erstrecken sich auf Aufgaben wie das Navigieren von Pokémon FireRed von Anfang bis Ende unter Verwendung nur roher Spiel-Screenshots — eine Demonstration, die Anthropic verwendet, um zu zeigen, wie das Modell rein visuelle Eingaben ohne zusätzliche Kontextinformationen verarbeitet. Bei Tabellenkalkulationen fand ein Tester heraus, dass es “Opus 4.8 bei unserer alltäglichen Tabellenkalkulationssuite auf jeder Anstrengungsebene schlägt — und es schafft es mit weniger Durchläufen, die Durchläufe 25–30 % schneller beendet.”

Finanzteams sahen ähnliche Gewinne: Ein Early-User nannte es “das stärkste finanzorientierte Modell, das wir getestet haben, sowohl für allgemeine Finanz- als auch für Denkaufgaben”, und stellte fest, dass es “das erste ist, das 90 % auf unserem Kernanalyse-Benchmark für komplexe, langwierige Analyseaufgaben erreicht — ein Sprung von 10 Punkten gegenüber Opus.” Bei Rechtsarbeiten berichtete ein separates Team, dass das Modell “sich materiell anders anfühlt. In blinden Überprüfungen fanden unsere Anwälte, dass seine Rotstiftänderungen unser aktuelles Modell jedes Mal erreichten oder übertrafen.”

Für agentic Coding lieferte Fable 5 “leistungsfähigere Ingenieurskunst in weniger Durchläufen als frühere Modelle — die komplexen Multi-Agenten-Workflows, die unsere Mitarbeiter täglich in Claude Code ausführen, bewältigend”, wie ein Kunde berichtete. Bei Frontier-Physikforschung nannte ein anderer Tester es “das stärkste Modell, das wir getestet haben, während es ein Drittel der Denk-Token verwendet.” Bei ViBench wurde das Modell als “das leistungsstärkste Modell, das wir getestet haben — das unsere Basisanwendungsfälle nahezu sättigt und Apps in weniger Zeit mit weniger Token erstellt”, beschrieben.

Das Denkprofil erregte besondere Aufmerksamkeit. Ein Early-User schrieb: “Claude Fable 5s Denkvermögen ist ein klarer Schritt über Opus 4.8 hinaus. Es arbeitet auf dem Niveau eines leitenden Forschungswissenschaftlers — wählt Richtungen, teilt Ressourcen zu, eliminiert seine falschen Überzeugungen und produziert neuartige Erstprinzipien-Outputs.” Ein anderer fügte hinzu: “Bei höchster Anstrengung reflektiert und validiert Claude Fable 5 seine eigene Arbeit. Für uns ist das, was hochgradig autonome Operationen ermöglicht — das zusätzliche Denken zahlt sich aus.” Für Produktentwickler: “Claude Fable 5 versteht, was Entwickler meinen, nicht nur, was sie tippen. Apps, die vor einem Jahr noch hundert Prompts benötigten, werden jetzt in einem Durchgang erstellt.”

Konkrete Gewinne für Early Adopters — und echte Lücken für alle anderen

Stripe testete Fable 5 bei einer Codebase-weiten Migration einer 50-Millionen-Codezeilen umfassenden Ruby-Codebasis. Laut Stripe würde dieselbe Aufgabe einem ganzen Entwicklungsteam vier Tage — oder, je nach Umfang, zwei Monate manueller Arbeit — abverlangen; Fable 5 erledigte dies in einem Tag. Der Zugriff erfolgt über die Claude-API, bepreist bei 10 $ pro Million Eingabe-Token und 50 $ pro Million Ausgabe-Token.

Auf der wissenschaftlichen Seite führte Anthropic Medikamentendesign-Tests in Zusammenarbeit mit Dyno Therapeutics durch, die sich auf die Entwicklung adenoassoziierter Viren (AAVs) konzentrierten. Laut Anthropic beschleunigte Mythos 5 Aspekte des Medikamentendesignprozesses um den Faktor 10. Bei 14 Proteinzielen, die starke Kandidaten hervorbrachten, werden 9 derzeit aktiv untersucht.

In molekularbiologischen Bewertungen bevorzugten Wissenschaftler Mythos 5-Hypothesen 80 % der Zeit gegenüber konkurrierenden Ausgaben, so Anthropic. Das Unternehmen berichtet auch, dass Mythos 5 ein Modell trainierte, das 100-mal kleiner war als ein vergleichbares, das in der Zeitschrift Science veröffentlicht wurde. Eine der Hypothesen von Mythos 5 wurde unabhängig durch eine Studie eines Labors, das unabhängig an demselben Problem arbeitete, bestätigt.

Geschäftskunden, die Fable 5 und Mythos 5 verwenden, werden ihre Daten unter einer neuen Richtlinie, die auch für zukünftige Modelle gilt, 30 Tage lang speichern; Anthropic hat einen vollständigen Beitrag zur Datenaufbewahrungsrichtlinie veröffentlicht. Das Unternehmen hat separat in die Erkennung und Abwehr von groß angelegten Versuchen, Claude-Fähigkeiten zu extrahieren, investiert.

Die von Anthropic anerkannten Einschränkungen sind direkt: Ohne Sicherheitsvorkehrungen könnten die Fähigkeiten von Fable 5 in Bereichen wie der Cybersicherheit missbraucht werden, um ernsthaften Schaden anzurichten. Sicherheitsexperten und fortgeschrittene Biologieteams, die an der Grenze arbeiten, werden auf Fallback-Antworten stoßen, die ihre Mythos 5-Gegenstücke nicht erhalten. Die 5 %-Auslöserate, obwohl insgesamt niedrig, trifft professionelle Nutzer, deren Abfragen sich genau in den eingeschränkten Kategorien häufen, härter.

Zwei Ebenen, ein Modell — Was das Wettbewerbsbild aussagt

Die Leistungslücke zwischen Fable 5 und Mythos 5 ist am deutlichsten in Geschwindigkeitsbenchmarks sichtbar. Mythos 5 erreichte in 36 Stunden nahezu Parität mit GPT-5.5 bei Frontier-Physikforschung — eine Aufgabe, für die GPT-5.5 vier Tage benötigte, so Anthropic. Das Unternehmen behauptet, dass Mythos 5 die stärksten Cybersicherheitsfähigkeiten jedes öffentlich anerkannten Modells besitzt, obwohl diese Behauptung ein Produkt beschreibt, auf das die überwältigende Mehrheit der Fachleute derzeit keinen Zugriff hat.

Der Zugriff auf Mythos 5 erfolgt über Project Glasswing, ein Programm aus dem Jahr 2026, das in Zusammenarbeit mit der US-Regierung entwickelt wurde, um Mythos-Klassenmodelle an Cyberschützer und kritische Softwareinfrastrukturanbieter bereitzustellen. Partner in Glasswing haben bereits Cyberschützern geholfen, kritisch wichtige Software zu sichern, so Anthropic. Die etwa 150 Gruppen, die Mythos-Preview-Zugang hatten, werden auf Mythos 5 aufgerüstet.

Für den breiteren Markt ist Fable 5 identisch mit Mythos 5 bepreist — 10 $ pro Million Eingabe-Token, 50 $ pro Million Ausgabe-Token — was es zu einem Premiumangebot macht, unabhängig davon, auf welcher Ebene ein Kunde sich befindet. Anthropic sagt, dass es daran arbeiten wird, die Falsch-Positiv-Rate der Sicherheitsvorkehrungen zu reduzieren, wenn in den kommenden Monaten leistungsfähigere Modelle eintreffen, hat aber keinen bestimmten Zeitplan festgelegt.

Was bleibt unbeantwortet

Die zentrale Frage, die Anthropic nicht öffentlich geklärt hat, ist, wie schnell die Sicherheitslücken geschlossen werden. Die 5 %-Fallback-Rate mag für allgemeine Wissensarbeiter akzeptabel sein, aber professionelle Sicherheitsexperten und Biologen, die an sensiblen Projekten arbeiten, stehen einer anhaltenden Fähigkeitslücke im Vergleich zu den Teilnehmern von Glasswing gegenüber. Anthropic hat die Absicht signalisiert, den Zugang zu erweitern, hat aber nicht die Kriterien dafür definiert.

Das Glasswing-Modell selbst wirft eine Skalierungsfrage auf. Ungefähr 150 Organisationen haben derzeit über die Regierungspartnerschaft Zugang zu Mythos 5; unabhängige Forscher und kleinere Sicherheitsfirmen könnten sich dauerhaft in der Fable-Ebene wiederfinden, unabhängig von legitimen Bedürfnissen. Wie Anthropic den erweiterten Zugang regelt — und ob dieser Prozess transparent sein wird — bleibt abzuwarten.

Anthropic selbst räumt ein, dass Klassifizierer falsche Positive produzieren können und dass kein Bug-Bounty die Immunität gegen zukünftige Jailbreaks garantieren kann. Die Systemkarte und der Risikobericht bieten die vollständigste öffentliche Darstellung davon, wo die Grenzen des Modells derzeit liegen — und wo sie, nach eigener Aussage des Unternehmens, nicht liegen.

FAQ – Häufig gestellte Fragen

Wie wird Anthropic die Sicherheitsvorkehrungen in Claude Fable 5 überwachen und aktualisieren?

Anthropic plant, die Leistung von Claude Fable 5 kontinuierlich durch Benutzerfeedback und interne Tests zu überwachen und die Sicherheitsvorkehrungen bei Bedarf zu aktualisieren, um potenzielle Missbräuche zu verhindern. Das Unternehmen wird auch mit externen Experten zusammenarbeiten, um potenzielle Schwachstellen zu identifizieren. Updates werden voraussichtlich vierteljährlich ausgerollt.

Können Unternehmenskunden die Sicherheitsvorkehrungen in Claude Fable 5 für ihre spezifischen Anwendungsfälle anpassen?

Ja, Unternehmenskunden können mit Anthropic zusammenarbeiten, um die Sicherheitsvorkehrungen an ihre spezifischen Bedürfnisse anzupassen. Dies kann die Anpassung der Empfindlichkeit der Klassifizierer oder das Hinzufügen benutzerdefinierter Regeln zur Handhabung einzigartiger Anwendungsfälle beinhalten. Anthropic bietet Unternehmenskunden dedizierten Support, um ihnen bei der Optimierung der Modellleistung zu helfen.

Welche Art von Support bietet Anthropic für die Integration von Claude Fable 5 in bestehende Arbeitsabläufe?

Anthropic bietet umfassenden Support für die Integration von Claude Fable 5, einschließlich Dokumentation, API-Anleitungen und dedizierten Kundensupportteams. Das Unternehmen bietet auch Schulungs- und Onboarding-Programme an, um Kunden dabei zu helfen, das Beste aus dem Modell herauszuholen. Darüber hinaus verfügt Anthropic über ein Community-Forum, in dem Kunden Best Practices austauschen und voneinander lernen können.

Laszlo Szabo / NowadAIs

Laszlo Szabo is an AI technology analyst with 6+ years covering artificial intelligence developments. Specializing in large language models, ML benchmarking, and Artificial Intelligence industry analysis

Categories

Follow us on Facebook!

Amerikanische Rebellion gegen KI verschärft sich, während die öffentliche Wut wächst
Previous Story

Amerikanische Rebellion gegen KI verschärft sich, während die öffentliche Wut wächst

Latest from Blog

Malta ChatGPT-Plus-Rollout stellt Bildung vor Zugang

Malta ChatGPT-Plus-Rollout stellt Bildung vor Zugang

OpenAI und die Regierung von Malta haben ein Abkommen unterzeichnet, um allen maltesischen Einwohnern ein Jahr lang kostenloses ChatGPT Plus anzubieten – allerdings erst nach Abschluss eines strukturierten KI-Bildungskurses. Diese weltweit erste
Go toTop