Claude Fable 5 podle Simona Willisona: velký, drahý a překvapivě schopný
Simon Willison popisuje první hodiny s Claude Fable 5: silný model s vysokou cenou, dlouhým kontextem a dobrým výkonem v agentních úlohách.
Simon Willison publikoval první dojmy z Claude Fable 5. A jeho text je zajímavý hlavně tím, že nejde o benchmarkovou tabulku, ale o několik hodin praktického používání na reálných úlohách.
Willison píše, že neměl early access a s modelem strávil zhruba 5,5 hodiny po vydání. Jeho první dojem: Fable 5 působí jako “velký” model. Nejen výkonem, ale i rychlostí, cenou a množstvím znalostí, které z něj podle něj vypadávají.
To je důležité číst opatrně. Anthropic podle zdroje neřekl nic konkrétního o velikosti modelu. Willison tedy nedělá technické měření parametrů. Spíš skládá indicie: rychlost, cenu, chování modelu a to, jak si model vede v úlohách vyžadujících znalost širšího světa.
Fable 5 vs. Mythos 5
Podle Simonova shrnutí Anthropic tvrdí, že Claude Fable 5 nabízí stejný výkon jako Claude Mythos 5, ale s mnohem přísnějšími guardrails.
Mythos 5 má podle zdroje sdílet schopnosti Fable 5 bez safety classifiers. Fable 5 tedy není prezentovaný jen jako “silnější Claude”, ale jako silný model s výraznější bezpečnostní vrstvou.
To se projevuje i v API. Willison zmiňuje nové mechanismy, které dají vědět, když model narazí na odmítnutí, a také novou možnost požádat o automatický fallback na jiný model, pokud se požadavek odmítne.
Z technických parametrů zdroj uvádí:
- kontextové okno 1 milion tokenů
- maximální výstup 128 000 tokenů
- knowledge cutoff leden 2026
- cenu 10 dolarů za milion input tokenů
- cenu 50 dolarů za milion output tokenů
- bez příplatku za delší kontext
To není levný model. Willison ho přímo popisuje jako pomalý a drahý. Zároveň ale dodává, že zatím ochotně zpracovával vše, co mu zadal.
Model, který působí “velký”
Jedna z věcí, která Willisona zaujala, byla znalost modelu.
Zadáním porovnal Fable 5 s Opus 4.8 na otázce, kde měl model vyjmenovat jeho open-source projekty. Oba modely běžely bez přístupu k vyhledávání. Opus 4.8 odpověděl opatrně a uvedl několik známých projektů. Fable 5 podle něj vypsal širší a podrobnější seznam, včetně novějších nástrojů jako files-to-prompt, datasette-extract, symbex, ttok, strip-tags nebo datasette-lite.
Willison sám připomíná, že dřív nekladl velký důraz na to, kolik toho model “ví”. Raději chce modely, které dobře manipulují s textem a kódem a umí si informace dohledat nástroji.
Tady ale dodává zajímavou poznámku: množství znalostí může být proxy pro velikost modelu. Ne nutně důkaz, ale signál.
Moje čtení: nejde o to, že “víc znalostí v modelu” je vždy lepší. Ale u coding modelu může hlubší znalost knihoven, patternů a projektů pomoci v dlouhých úlohách, kde model musí držet širší kontext.
Fable v praktické práci
Nejzajímavější část textu není porovnání znalostí, ale praktické úlohy.
Willison zkoušel Fable 5 v Claude.ai i v Claude Code. Jedna úloha se týkala jeho projektu micropython-wasm. Chtěl zjistit, jestli by šlo místo MicroPythonu rozběhnout plný Python ve WebAssembly sandboxu.
Fable podle něj našel vhodné buildy cpython-wasi-build, narazil na omezení prostředí při stahování, ale po dodání souborů pokračoval dál. Výsledkem byl funkční proof of concept a nakonec i wheel obsahující Python wrappers, WASM soubory a standard library.
Tohle je přesně typ úlohy, kde agentní modely začínají být zajímavé: nejde o jednu odpověď na prompt, ale o několik kroků výzkumu, iterace, řešení zádrhelů a zabalení výsledku do použitelného artefaktu.
Datasette Agent a LLM 0.32a3
Další úloha byla ještě praktičtější.
Willison chtěl přidat do Datasette Agent schopnost, aby tool calls mohly během běhu pauznout a vyžádat si schválení od uživatele. Fable podle něj nejen vyřešil tuto funkci, ale zároveň identifikoval a implementoval několik změn v knihovně LLM, které podporují pokročilejší pause-resume mechanismus u tool calls.
Výsledkem byl release LLM 0.32a3, který byl podle release note téměř celý napsaný Fable 5.
Mezi změnami jsou například:
- přístup k
llm.ToolCallobjektu uvnitř tool implementace - garantované unikátní
tool_call_id llm.PauseChainpro čisté pozastavení tool chainu- jasnější semantika při souběžném běhu tool calls
- možnost pokračovat z historie s nevyřešenými tool calls
- oprava chování async executorů při chybějícím toolu
Willison píše, že ho kvalita API designu, testů, kódu a dokumentace příjemně překvapila. Práce mu zabrala několik hodin, ale působila podle něj jako několik dní práce.
Tohle je podle mě silnější argument než obecné “model je chytrý”. Ukazuje to model v situaci, kde musí zasáhnout do existující knihovny, pochopit související projekt a navrhnout API změny, které dávají smysl.
Cena jako tvrdá realita
Willison také otevřeně ukazuje cenu.
Pomocí AgentsView sledoval lokální LLM usage napříč coding agenty. Za den používání Fable 5 mu vyšla spotřeba 110,42 dolaru v tokenech, z toho velká část na projektu kolem Datasette Agent.
To je důležitý detail.
Model může být silný, ale agentní práce ve větším měřítku rychle naráží na ekonomiku. U dlouhých úloh nejde jen o cenu jednoho promptu. Jde o celé sessions, opakované iterace, nástroje, testy a dlouhý kontext.
Moje takeaway: Fable 5 může být zajímavý právě pro těžké, dlouhé a hodnotné úlohy. Ale není to model, který by člověk chtěl bez přemýšlení pouštět na všechno.
Co si z toho vzít
Simonův text ukazuje dvě věci najednou.
Za prvé: Claude Fable 5 může být velmi schopný v agentních coding workflow, kde model nejen píše kód, ale řeší API design, testy, dokumentaci a navazující změny v knihovnách.
Za druhé: taková schopnost něco stojí. Nejen peníze, ale i čas čekání, kontrolu výstupů a dobrý úsudek, kdy takový model vůbec použít.
Praktický dopad pro vývojáře není “všechno teď dělejme přes největší model”.
Spíš: největší modely mohou dávat smysl tam, kde je úloha dost složitá a hodnotná na to, aby se jejich cena vrátila.
U agentní AI se tak čím dál víc vrací stejná otázka:
Nejen co model dokáže.
Ale kdy se jeho použití opravdu vyplatí.