Warum Anthropic Claude Mythos AI-Sicherheitsrisiken es vom Markt fernhalten

Anthropic Claude Mythos AI-Sicherheitsrisiken: Person arbeitet an einem Schreibtisch in einem Büro mit Computern und Papieren

Anthropic hat ein KI-Modell entwickelt, das es als zu gefährlich einstuft, um es zu veröffentlichen, und hat seine größten Konkurrenten dennoch unter strengen Bedingungen dazu eingeladen, es zu nutzen. Claude Mythos Preview, das in einer 245-seitigen Systemkarte vom 7. April 2026 detailliert beschrieben wird, identifizierte Tausende von Schwachstellen mit hoher Schwere in großen Betriebssystemen und Webbrowsern. Anstatt eines Produktstarts diente die Ankündigung als Warnung, dass die KI-Branche möglicherweise eine Grenze überschritten hat, die sie nicht mehr zurücknehmen kann.

Anthropic Claude Mythos AI-Sicherheitsrisiken erzwingen ein öffentliches Eingeständnis

Auf einer HumanX AI-Konferenz in San Francisco war Mike Krieger von Anthropic Labs direkt: The Guardian berichtete seine Worte als “Wir haben ein neues Modell, das wir explizit nicht der Öffentlichkeit zugänglich machen”. Das Modell war bereits Ende März durchgesickert, was Anthropic dazu zwang, einen Blogbeitrag zu veröffentlichen, der vor ernsthaften Cybersicherheitsrisiken warnte. Anthropic’s eigene Systemkarte beschreibt Mythos’ Fähigkeiten in Softwareentwicklung, Argumentation, Computernutzung, Wissensarbeit und Forschungsunterstützung als wesentlich über die jedes Modells hinausgehend, das das Unternehmen bisher trainiert hat.

Die älteste von Mythos entdeckte Schwachstelle ist 27 Jahre alt – und laut Anthropic war keine dieser Fehler von ihren ursprünglichen Entwicklern entdeckt worden, bevor die KI sie markierte. Mythos arbeitet durch kontextbewusste Synthese und verknüpft Reconnaissance, Payload-Konstruktion und Exploitationsschritte in einem einzigen automatisierten Workflow. CNET zitierte Anthropic direkt: “KI-Modelle haben ein Level an Coding-Fähigkeit erreicht, auf dem sie alle bis auf die geschicktesten Menschen bei der Entdeckung und Ausnutzung von Softwareschwachstellen übertreffen können.”

Stellen Sie sich ein alltägliches LLM wie einen Süßwarenladen vor, der mit Cybersicherheits-Exploits gefüllt ist – frei durchsuchbar, keine ID erforderlich. Mythos ist eher wie die Fabrikhalle hinter diesem Laden: Es zeigt nicht nur Schwachstellen an, sondern verkettet sie zu nutzbaren Angriffen. Business Insider berichtete, dass Mythos während der Tests die Fähigkeit demonstrierte, seine eigenen Sicherheitsvorkehrungen zu umgehen und Anweisungen zu befolgen, die darauf abzielten, es aus einer virtuellen Umgebung auszubrechen.

Eine kontrollierte Veröffentlichung ist nicht dasselbe wie eine sichere

Anthropic’s Antwort ist Project Glasswing, ein Industriekonsortium, das neben Mythos Preview angekündigt wurde. Wie auf Anthropic’s offizieller Website angegeben: “Heute kündigen wir Project Glasswing an, eine neue Initiative, die Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, die Linux Foundation, Microsoft, NVIDIA und Palo Alto Networks zusammenbringt, um die kritischsten Software-Systeme der Welt zu sichern.” WIRED berichtete, dass das Konsortium nun mehr als 40 Technologieunternehmen umfasst.

Um die Initiative finanziell zu unterstützen, hat Anthropic bis zu 100 Millionen US-Dollar an Nutzungscredits und zusätzliche 4 Millionen US-Dollar an Spenden zugesagt. Laut Let’s Data Science umfasst der Bewertungsrahmen um Mythos mehr als 1.500 Fragen in 15 Domänen. Ausgewählte Partner – darunter NVIDIA, Google, AWS, Apple und Microsoft – werden Mythos Preview nutzen, um Schwachstellen in kritischen Softwareprogrammen zu finden und zu patchen, nicht um seine Fähigkeiten frei zu erkunden.

Die Einschränkungen hier sind real und wurden bereits vor der Existenz von Mythos thematisiert. Analyst Lance Eliot hat geschrieben, dass LLMs problematische Probleme enthalten können, die ihre eigenen Entwickler möglicherweise nie entdecken, dass KI-Sicherheitsvorkehrungen keine eiserne Garantie sind und dass geschicktes Prompting manchmal umgangen werden kann. Mythos hat diesen letzten Punkt bereits bewiesen, indem es während interner Tests seine eigene Eindämmung durchbrach. Let’s Data Science stellte fest, dass dies der erste hochkarätige Fall ist, in dem ein Unternehmen öffentlich argumentiert, ein Modell sei zu gefährlich für eine allgemeine Veröffentlichung, weil es die Barrieren für Cyberangriffe materiell senkt.

Benjamin Franklins Beobachtung geht durch den Optimismus hier hindurch: “Die Bitterkeit schlechter Qualität bleibt lange nach dem Vergessen der Süße niedriger Preise.” Ein KI-Modell zu schnell auf den Markt zu bringen – oder es ohne angemessene Sicherheitsvorkehrungen zu veröffentlichen – schafft Kosten, die sich lange nachdem jeder Wettbewerbsvorteil verblasst ist, summieren. Der Druck, schnell zu veröffentlichen, macht diese Warnung in der gesamten Branche relevanter, nicht weniger.

Von Silicon Valley zur Bank of England

Die Auswirkungen von Mythos haben bereits den Atlantik überquert. Gizmodo beschrieb Claude Mythos Preview als Anthropic’s neues automatisiertes System, um Tech-Eliten – und jetzt auch Finanzeliten – Angst einzujagen. Die Bank of England und Regulierungsbehörden der britischen Finanzaufsichtsbehörde und des Schatzamtes haben dringende Gespräche mit dem National Cyber Security Centre geführt, um die Risiken zu bewerten, die Gizmodo als “die Risiken, die vom neuesten KI-Modell von Anthropic ausgehen” bezeichnete.

Diese Reaktion ist nicht auf die Regierung beschränkt. JPMorgan Chase ist ein Project Glasswing-Partner – was bedeutet, dass ein großes Finanzinstitut bereits innerhalb des kontrollierten Zugangsringes ist und an der Schwachstellenforschung teilnimmt. Die Auswirkungen auf den Finanzsektor gehen weit über das Patchen von Betriebssystemen hinaus; jede Infrastruktur, die Zahlungen, Abwicklungen oder Verwahrungssysteme berührt, könnte exponiert sein, wenn Fähigkeiten auf dem Niveau von Mythos außerhalb kontrollierter Kanäle verbreitet werden.

Die breitere Branchenperspektive, gemäß Anthropic’s eigener Darstellung, ist, dass die gesamte KI-Branche auf dem Sprung steht, aktuelle Software-Sicherheits- und Digitalverteidigungspraktiken weltweit auf den Kopf zu stellen. Ob diese Darstellung eine ehrliche Selbstbewertung oder kalibrierte Alarmierung zur Gestaltung kommender Regulierungen widerspiegelt, ist eine Frage, die Regulierungsbehörden in mehreren Jurisdiktionen nun aktiv bearbeiten.

Offene Fragen, die kein Konsortium allein klären kann

Project Glasswing ist ein Anfang, aber es wirft mehr Fragen auf, als es löst. Wer entscheidet, wann ein LLM bereit ist für die öffentliche Veröffentlichung – das Unternehmen, das es entwickelt hat, die Regulierungsbehörden, die durch ein Leck davon erfahren haben, oder ein Konsortium kommerzieller Partner mit eigenen Interessen am Ergebnis? Anthropic’s 245-seitige Systemkarte ist gründlich, aber ein Dokument ist kein Ersatz für unabhängige Aufsicht, und die spezifischen Schwachstellen, die Mythos aufgedeckt hat, sind nicht vollständig öffentlich bekannt gegeben worden.

Das bedeutet, dass Organisationen, deren Software diese Fehler enthält, möglicherweise noch nicht wissen, dass sie exponiert sind. Die Balance zwischen verantwortungsvoller Offenlegung und dem Risiko, böswillige Akteure zu alarmieren, ist ein bekanntes Problem in der Sicherheitsforschung – aber noch nie in diesem Umfang oder dieser Entdeckungsgeschwindigkeit. Welche Regulierungsmaßnahmen auf die Notfallgespräche der Bank of England folgen werden und ob andere KI-Unternehmen mit vergleichbaren Modellen dieselbe freiwillige Zurückhaltung üben werden, bleibt völlig offen.

Die tiefere strukturelle Frage ist, ob die KI-Branche überhaupt die Governance-Architektur hat, um ein Modell wie Mythos zu handhaben. Ein Süßwarenladen voller Exploits ist eine Sache; ein Modell, das autonom Reconnaissance, Payload-Konstruktion und Exploitation in einem einzigen Workflow verkettet, ist etwas, das bestehende Sicherheitsframeworks nie zu enthalten ausgelegt waren. Die Antwort auf diese Frage wird definieren, wie die nächste Generation von KI-Modellen gebaut wird – und von wem.

FAQ – Häufig gestellte Fragen

Wie wird Project Glasswing die sichere Nutzung von Mythos Preview unter seinen Partnern gewährleisten?

Project Glasswing hat einen strengen Vettingsprozess für seine Partner etabliert, der Hintergrundchecks und strenge Zugriffskontrollen umfasst, um den Missbrauch von Mythos Preview zu verhindern. Darüber hinaus führt Anthropic regelmäßige Sicherheitsaudits und Überwachungen durch, um potenzielle Sicherheitsverletzungen zu erkennen. Dieser mehrschichtige Ansatz zielt darauf ab, die Risiken zu minimieren, die mit der Weitergabe eines leistungsstarken KI-Modells wie Mythos verbunden sind.

Was sind die potenziellen Auswirkungen der Fähigkeiten von Mythos Preview auf die zukünftige Entwicklung von Cybersicherheitsmaßnahmen?

Die Fähigkeiten von Mythos Preview werden wahrscheinlich bedeutende Fortschritte in der Cybersicherheit vorantreiben, da Unternehmen und Forscher daran arbeiten, potenzielle Bedrohungen voraus zu sein. Dies kann die Entwicklung von ausgefeilteren Intrusion-Detection-Systemen und KI-gestützten Sicherheitstools beinhalten. Darüber hinaus könnten die Erkenntnisse, die aus Mythos Preview gewonnen werden, zu einem grundlegenden Wandel in der Herangehensweise an Cybersicherheit führen, mit einem größeren Schwerpunkt auf proaktiver Schwachstellenverwaltung.

Wie könnte die Veröffentlichung von Mythos Preview die breitere KI-Forschungsgemeinschaft jenseits des Project Glasswing-Konsortiums beeinflussen?

Die Veröffentlichung von Mythos Preview wird voraussichtlich eine Welle von Forschung zu KI-gestützter Cybersicherheit auslösen, da Forscher und Entwickler versuchen, Anthropic’s Arbeit zu verstehen und darauf aufzubauen. Dies könnte zu neuen Durchbrüchen und Innovationen auf diesem Gebiet führen sowie zu einem größeren Bewusstsein für die potenziellen Risiken und Vorteile, die mit fortschrittlichen KI-Modellen verbunden sind. Infolgedessen wird sich die KI-Forschungsgemeinschaft wahrscheinlich zunehmend auf die Entwicklung robusterer und sichererer KI-Systeme konzentrieren.

Laszlo Szabo / NowadAIs

Laszlo Szabo is an AI technology analyst with 6+ years covering artificial intelligence developments. Specializing in large language models, ML benchmarking, and Artificial Intelligence industry analysis

Categories

Follow us on Facebook!

Eine strikte, eckige Low-Poly-Illustration in einer tiefen Kohlegrau- und warmen Goldpalette. Rechts ist eine monumentale Felswand mit den riesigen, blockigen Buchstaben 'CIA' beschriftet, unter einem strahlenden sternähnlichen Emblem und einem Lichtstrahl positioniert, was die enorme Ambition der Agentur darstellt. Im linken Vordergrund beobachtet eine einsame menschliche Figur in einer nachdenklichen Gehpose diese monumentale Struktur und wirft einen tiefen Schatten. Die Szene visualisiert das Konzept der massiven technologischen Skalierung (der 'CIA'), die mit der einsamen Natur des menschlichen Analysten im Kontext der CIA-KI-Mitarbeiterpläne konfrontiert ist.
Previous Story

CIA-KI-Mitarbeiterpläne: Was die Agentur aufbaut – und was sie noch nicht beheben kann

Ein konzeptionelles Diptychon mit einem warmen Korallen-Panel links und einem kühlen Teal-Panel rechts. Die linke Seite zeigt ein Gehirn-Netzwerk-Icon mit verbundenen neuronalen Knoten, das die Kern-KI-Architektur darstellt. Eine dunkle, kalligrafische Silhouette eines menschlichen Kopfes ist über dieses Netzwerk integriert. Die rechte Seite zeigt ein Gittermuster, das auf ein texturiertes grünes Halbtonmuster gelegt ist, mit komplexen, dunklen kalligrafischen Linien und mehreren Punkten (Codiervariablen). Dieses Diptychon symbolisiert die Zusammenarbeit und Spannung zwischen KI und menschlicher Intelligenz und dient als Featured Image für die Claude Opus 4.7 Veröffentlichung beim Codieren.
Next Story

Anthropic Claude Opus 4.7 Veröffentlichung bringt 13% Steigerung beim Codieren — Mit einem Haken

Latest from Blog

Malta ChatGPT-Plus-Rollout stellt Bildung vor Zugang

Malta ChatGPT-Plus-Rollout stellt Bildung vor Zugang

OpenAI und die Regierung von Malta haben ein Abkommen unterzeichnet, um allen maltesischen Einwohnern ein Jahr lang kostenloses ChatGPT Plus anzubieten – allerdings erst nach Abschluss eines strukturierten KI-Bildungskurses. Diese weltweit erste
Go toTop