Claude Fable 5 nyilvánosságra kerül, képességeinek kemény korlátjaival

Claude Fable 5 nyilvánosságra kerül, képességeinek kemény korlátjaival

Az Anthropic kedden elérhetővé tette a Claude Fable 5-öt vállalati ügyfelek és fizetős előfizetők számára — de ugyanazon alapmodell legerősebb verziója, a Claude Mythos 5 továbbra is elérhetetlen a széles nyilvánosság számára. A különbség szándékos: a Fable 5 olyan biztonsági intézkedésekkel érkezik, amelyek bizonyos lekérdezéseket egy régebbi modellre irányítanak át, míg a Mythos 5 csak egy kis, ellenőrzött csoport számára érhető el, akik kiberbiztonsági védők és infrastruktúra-szolgáltatók. A legtöbb felhasználó számára a hozzáférési plafon magába a termékbe van beépítve.

Milyen képességeket tartalmaz valójában a Claude Fable 5 — és hol áll meg

Az Anthropic azt állítja, hogy a Fable 5 ugyanazt az alapmodellt használja, mint a Mythos, de hozzáadott biztonsági intézkedésekkel, amelyek elfogják a magas kockázatú témákra vonatkozó lekérdezéseket — különösen a kiberbiztonság és biológia területén — és ehelyett a Claude Opus 4.8-ra irányítják őket. Az Anthropic szerint ezek a biztonsági intézkedések az ülések nagyjából 5%-ában aktiválódnak, ami azt jelenti, hogy a Fable ülések 95%-ában egyáltalán nincs visszalépés. A vállalat elismeri, hogy osztályozó rendszerei ártalmatlan kérésekre is aktiválódhatnak, és hogy egyetlen osztályozó rendszer sem képes megakadályozni mindenféle kijátsszást.

A határok tesztelésére az Anthropic egy 1000 órás külső bug bounty programot futtatott; nem találtak univerzális kijátszást. Külső red-teaminget is végeztek a brit AISI segítségével. A modell képességeinek és korlátainak teljes képe dokumentálva van a rendszerkártyán és egy külön kockázati jelentésben.

A megengedett hatókörön belül az early-access visszajelzések következetesen erősek. Az egyik ügyfél arról számolt be, hogy a modell “a CursorBench-en az állami művészeti modell. Olyan hosszú távú problémákat nyitott meg, amelyek korábban elérhetetlenek voltak korábbi modellek számára.” A GitHub azt mondta, hogy “komplex, hosszú távú kódolási feladatokat vállalt magára olyan autonómiával és megbízhatósággal, amely meghaladta a korábbi benchmarkokat.”

A Fable 5 látási képességei olyan feladatokra terjednek ki, mint a Pokémon FireRed navigálása az elejétől a végéig, csak nyers játékképernyőképek segítségével — egy demonstráció, amelyet az Anthropic arra használ, hogy bemutassa, hogyan kezeli a modell a tisztán vizuális bemenetet kiegészítő kontextus nélkül. Táblázatokon az egyik tesztelő azt találta, hogy “megveri az Opus 4.8-at a mindennapi táblázatkezelő csomagunkon minden erőfeszítési szinten — és kevesebb lépéssel, 25–30%-kal gyorsabban befejezve a futásokat.”

A pénzügyi csapatok hasonló előnyöket tapasztaltak: az egyik korai felhasználó “a legerősebb pénzügy-orientált modellnek nevezte, amelyet teszteltünk, mind általános pénzügyekben, mind érvelésben,” és megjegyezte, hogy “ez az első, amely 90% fölé tört a komplex, hosszú futású analitikai feladatok mag-benchamarkján — 10 ponttal az Opus fölött.” Jogi munkán egy külön csapat arról számolt be, hogy a modell “lényegesen másnak tűnik. Vak áttekintésben ügyvédeink azt találták, hogy a modell szerkesztései minden alkalommal megegyeztek vagy meghaladták jelenlegi modellünket.”

Az agens kódolásban az egyik ügyfél arról számolt be, hogy a Fable 5 “képesebb mérnöki munkát végez kevesebb lépésben, mint a korábbi modellek — kezelve azokat a komplex multi-agens munkafolyamatokat, amelyeket alkalmazottaink napi szinten futtatnak a Claude Code-ban.” A határterületi fizikai kutatásokban egy másik tesztelő “a legerősebb modellnek nevezte, amelyet teszteltünk, miközben a következtetési tokeneknek csak egyharmadát használta.” A ViBench-en a modellt “a legmagasabb teljesítményű modellnek nevezték, amelyet teszteltünk — majdnem telítve alapvető használati eseteinket és kevesebb idő alatt, kevesebb tokennel építve alkalmazásokat.”

A következtetési profil különösen felkeltette a figyelmet. Az egyik korai felhasználó azt írta: “A Claude Fable 5 következtetése egyértelmű lépés az Opus 4.8-on túl. Szenior kutató tudósi szinten működik — irányokat választ, erőforrásokat oszt el, helytelen hiedelmeit megöli és újszerű első elvi kimeneteket produkál.” Egy másik hozzátette: “A legmagasabb erőfeszítésnél a Claude Fable 5 visszatekint és validálja saját munkáját. Számunkra ez teszi lehetővé a magasan autonóm műveleteket — a többlet gondolkodás megéri magának.” Termékfejlesztők számára: “A Claude Fable 5 megérti, mit jelentenek a fejlesztők, nem csak azt, amit beírnak. Azok az alkalmazások, amelyekhez egy évvel ezelőtt száz prompt kellett, most egy lépésben megoldhatók.”

Konkrét előnyök a korai adoptálók számára — és valódi hiányosságok mindenki más számára

A Stripe tesztelte a Fable 5-öt egy 50 millió soros Ruby kód bázisáttelepítésén. A Stripe szerint ugyanaz a feladat egy teljes mérnöki csapatnak négy napot venne igénybe — vagy a hatókör függvényében két hónap manuális munkát —; a Fable 5 egy nap alatt befejezte. A hozzáférés a Claude API-n keresztül történik, 10 dollárért millió input tokenenként és 50 dollárért millió output tokenenként.

A tudomány oldalán az Anthropic gyógyszertervezési teszteket végzett a Dyno Therapeutics-szel együttműködve, az adeno-asszociált vírusok (AAV) tervezésére összpontosítva. Az Anthropic szerint a Mythos 5 tízszeresére gyorsította a gyógyszertervezési folyamat egyes részeit. A 14 fehérje célpont közül, amelyek erős jelölteket eredményeztek, 9 jelenleg aktívan vizsgált.

A molekuláris biológia értékelésekben a tudósok 80%-ban a Mythos 5 hipotéziseit preferálták a versengő kimenetekkel szemben, az Anthropic szerint. A vállalat arról is beszámol, hogy a Mythos 5 egy 100-szor kisebb modellt tanított, mint egy hasonló, a Science folyóiratban megjelent modell. A Mythos 5 egyik hipotézisét egy független laboratóriumi tanulmány is megerősítette, amely ugyanazon a problémán dolgozott.

Az üzleti ügyfelek, akik Fable 5-öt és Mythos 5-öt használnak, adataikat 30 napig megőrzik egy új politika alapján, amely a jövőbeli modellekre is vonatkozik; az Anthropic közzétett egy teljes bejegyzést az adatmegőrzési politikáról. A vállalat külön beruházott a Claude képességeinek nagy léptékű kinyerésére tett kísérletek felderítésébe és megakadályozásába.

Az Anthropic által elismert korlátok közvetlenek: a biztonsági intézkedések nélkül a Fable 5 képességei olyan területeken, mint a kiberbiztonság, súlyos károkat okozhatnának. A biztonsági kutatók és a fejlett biológiai csapatok, akik a határterületen dolgoznak, olyan visszalépési válaszokat fognak tapasztalni, amelyeket Mythos 5-ös megfelelőik nem. Az 5%-os trigger arány, bár aggregált szinten alacsony, keményebben érinti azokat a professzionális felhasználókat, akiknek lekérdezései pontosan a korlátozott kategóriákba tartoznak.

Két szint, egy modell — Hogyan néz ki a versenyképes kép

A Fable 5 és a Mythos 5 közötti teljesítménykülönbség leginkább a sebesség benchmarkokban látható. A Mythos 5 közel paritást ért el a GPT-5.5-tel a határterületi fizikai kutatásokban 36 óra alatt — egy olyan feladat, amelyet a GPT-5.5 négy nap alatt teljesített, az Anthropic szerint. A vállalat azt állítja, hogy a Mythos 5 rendelkezik a legerősebb kiberbiztonsági képességekkel bármely nyilvánosan elismert modell közül, bár ez egy olyan terméket ír le, amelyhez a legtöbb szakember jelenleg nem fér hozzá.

A Mythos 5-höz való hozzáférés a Project Glasswing-en keresztül történik, egy 2026-os programon keresztül, amelyet az Egyesült Államok kormányával együttműködve építettek ki, hogy Mythos osztályú modelleket biztosítsanak kiber védők és kritikus szoftver infrastruktúra szolgáltatók számára. A Glasswing partnerei már segítették a kiber védőket kritikus fontosságú szoftverek biztosításában, az Anthropic szerint. A mintegy 150 csoport, amely Mythos Preview hozzáféréssel rendelkezett, frissül a Mythos 5-re.

A szélesebb piac számára a Fable 5 ára megegyezik a Mythos 5-tel — 10 dollár millió input tokenenként, 50 dollár millió output tokenenként —, prémium ajánlattá téve azt, függetlenül attól, hogy az ügyfél melyik szinten van. Az Anthropic azt állítja, hogy dolgozni fog a biztonsági intézkedések hamis pozitív eredményeinek csökkentésén, amint a jövő hónapokban nagyobb képességű modellek érkeznek, de nem kötelezte el magát egy konkrét idővonal mellett.

Mi marad válasz nélkül

A központi kérdés, amelyet az Anthropic nyilvánosan nem oldott meg, az, hogy milyen gyorsan zárulnak be a biztonsági intézkedések közötti rések. Az 5%-os visszalépési arány elfogadható lehet az általános tudásmunkások számára, de a szakmai biztonsági kutatók és biológusok, akik érzékeny projekteken dolgoznak, tartós képességbeli különbséget tapasztalnak a Glasswing résztvevőihez képest. Az Anthropic jelezte szándékát a hozzáférés bővítésére, de nem határozta meg ennek kritériumait.

Maga a Glasswing modell felvet egy skálázási kérdést. Körülbelül 150 szervezet jelenleg Mythos 5 hozzáféréssel rendelkezik a kormányzati partnerségen keresztül; független kutatók és kisebb biztonsági cégek véglegesen a Fable szinten maradhatnak, függetlenül attól, hogy jogosultak-e rá. Hogy az Anthropic hogyan dönti el a kibővített hozzáférést — és hogy ez a folyamat átlátható lesz-e —, még kiderül.

Az Anthropic saját elismerése, miszerint az osztályozók hamis pozitív eredményeket produkálhatnak, és hogy egyetlen bug bounty sem garantálhatja a jövőbeli kijátsszások elleni védelmet, nyitva tartja a biztonsági számításokat. A rendszerkártya és a kockázati jelentés kínálja a legteljesebb nyilvános számot arról, hogy hol vannak jelenleg a modell határai — és hol nem, a vállalat saját bevallása szerint.

GYIK – Gyakran Ismételt Kérdések

Hogyan fogja az Anthropic figyelemmel kísérni és frissíteni a Claude Fable 5 biztonsági intézkedéseit?

Az Anthropic azt tervezi, hogy folyamatosan figyelemmel kíséri a Claude Fable 5 teljesítményét a felhasználói visszajelzéseken és belső teszteken keresztül, frissítve a biztonsági intézkedéseket szükség szerint a potenciális visszaélések megelőzése érdekében. A vállalat külső szakértőkkel is együtt fog működni a potenciális sebezhetőségek azonosításában. A frissítéseket várhatóan negyedévente fogják kiadni.

Testreszabhatják-e a vállalati ügyfelek a Claude Fable 5 biztonsági intézkedéseit saját használati eseteikhez?

Igen, a vállalati ügyfelek együttműködhetnek az Anthropic-kal a biztonsági intézkedések testreszabásában saját igényeiknek megfelelően. Ez magában foglalhatja az osztályozók érzékenységének beállítását vagy egyedi szabályok hozzáadását egyedi használati esetek kezelésére. Az Anthropic dedikált támogatást nyújt a vállalati ügyfeleknek a modell teljesítményének optimalizálásában.

Milyen támogatást nyújt az Anthropic a Claude Fable 5 integrálásához a meglévő munkafolyamatokba?

Az Anthropic átfogó támogatást nyújt a Claude Fable 5 integrálásához, beleértve a dokumentációt, API útmutatókat és dedikált ügyfélszolgálati csapatokat. A vállalat képzési és bevezetési programokat is kínál, hogy segítse az ügyfeleket abban, hogy a legtöbbet hozzák ki a modellből. Ezenkívül az Anthropic-nak van egy közösségi fóruma, ahol az ügyfelek megoszthatják a legjobb gyakorlatokat és tanulhatnak más felhasználóktól.

Laszlo Szabo / NowadAIs

Laszlo Szabo is an AI technology analyst with 6+ years covering artificial intelligence developments. Specializing in large language models, ML benchmarking, and Artificial Intelligence industry analysis

Categories

Follow us on Facebook!

Az amerikai lázadás az MI ellen mélyül, ahogy nő a közvélemény haragja
Previous Story

Az amerikai lázadás az MI ellen mélyül, ahogy nő a közvélemény haragja

Latest from Blog

Go toTop