Claude Fable 5 podle Simona Willisona: velký, drahý a překvapivě schopný

Simon Willison publikoval první dojmy z Claude Fable 5. A jeho text je zajímavý hlavně tím, že nejde o benchmarkovou tabulku, ale o několik hodin praktického používání na reálných úlohách.

Willison píše, že neměl early access a s modelem strávil zhruba 5,5 hodiny po vydání. Jeho první dojem: Fable 5 působí jako “velký” model. Nejen výkonem, ale i rychlostí, cenou a množstvím znalostí, které z něj podle něj vypadávají.

To je důležité číst opatrně. Anthropic podle zdroje neřekl nic konkrétního o velikosti modelu. Willison tedy nedělá technické měření parametrů. Spíš skládá indicie: rychlost, cenu, chování modelu a to, jak si model vede v úlohách vyžadujících znalost širšího světa.

Fable 5 vs. Mythos 5

Podle Simonova shrnutí Anthropic tvrdí, že Claude Fable 5 nabízí stejný výkon jako Claude Mythos 5, ale s mnohem přísnějšími guardrails.

Mythos 5 má podle zdroje sdílet schopnosti Fable 5 bez safety classifiers. Fable 5 tedy není prezentovaný jen jako “silnější Claude”, ale jako silný model s výraznější bezpečnostní vrstvou.

To se projevuje i v API. Willison zmiňuje nové mechanismy, které dají vědět, když model narazí na odmítnutí, a také novou možnost požádat o automatický fallback na jiný model, pokud se požadavek odmítne.

Z technických parametrů zdroj uvádí:

kontextové okno 1 milion tokenů
maximální výstup 128 000 tokenů
knowledge cutoff leden 2026
cenu 10 dolarů za milion input tokenů
cenu 50 dolarů za milion output tokenů
bez příplatku za delší kontext

To není levný model. Willison ho přímo popisuje jako pomalý a drahý. Zároveň ale dodává, že zatím ochotně zpracovával vše, co mu zadal.

Model, který působí “velký”

Jedna z věcí, která Willisona zaujala, byla znalost modelu.

Zadáním porovnal Fable 5 s Opus 4.8 na otázce, kde měl model vyjmenovat jeho open-source projekty. Oba modely běžely bez přístupu k vyhledávání. Opus 4.8 odpověděl opatrně a uvedl několik známých projektů. Fable 5 podle něj vypsal širší a podrobnější seznam, včetně novějších nástrojů jako files-to-prompt, datasette-extract, symbex, ttok, strip-tags nebo datasette-lite.

Willison sám připomíná, že dřív nekladl velký důraz na to, kolik toho model “ví”. Raději chce modely, které dobře manipulují s textem a kódem a umí si informace dohledat nástroji.

Tady ale dodává zajímavou poznámku: množství znalostí může být proxy pro velikost modelu. Ne nutně důkaz, ale signál.

Moje čtení: nejde o to, že “víc znalostí v modelu” je vždy lepší. Ale u coding modelu může hlubší znalost knihoven, patternů a projektů pomoci v dlouhých úlohách, kde model musí držet širší kontext.

Fable v praktické práci

Nejzajímavější část textu není porovnání znalostí, ale praktické úlohy.

Willison zkoušel Fable 5 v Claude.ai i v Claude Code. Jedna úloha se týkala jeho projektu micropython-wasm. Chtěl zjistit, jestli by šlo místo MicroPythonu rozběhnout plný Python ve WebAssembly sandboxu.

Fable podle něj našel vhodné buildy cpython-wasi-build, narazil na omezení prostředí při stahování, ale po dodání souborů pokračoval dál. Výsledkem byl funkční proof of concept a nakonec i wheel obsahující Python wrappers, WASM soubory a standard library.

Tohle je přesně typ úlohy, kde agentní modely začínají být zajímavé: nejde o jednu odpověď na prompt, ale o několik kroků výzkumu, iterace, řešení zádrhelů a zabalení výsledku do použitelného artefaktu.

Datasette Agent a LLM 0.32a3

Další úloha byla ještě praktičtější.

Willison chtěl přidat do Datasette Agent schopnost, aby tool calls mohly během běhu pauznout a vyžádat si schválení od uživatele. Fable podle něj nejen vyřešil tuto funkci, ale zároveň identifikoval a implementoval několik změn v knihovně LLM, které podporují pokročilejší pause-resume mechanismus u tool calls.

Výsledkem byl release LLM 0.32a3, který byl podle release note téměř celý napsaný Fable 5.

Mezi změnami jsou například:

přístup k llm.ToolCall objektu uvnitř tool implementace
garantované unikátní tool_call_id
llm.PauseChain pro čisté pozastavení tool chainu
jasnější semantika při souběžném běhu tool calls
možnost pokračovat z historie s nevyřešenými tool calls
oprava chování async executorů při chybějícím toolu

Willison píše, že ho kvalita API designu, testů, kódu a dokumentace příjemně překvapila. Práce mu zabrala několik hodin, ale působila podle něj jako několik dní práce.

Tohle je podle mě silnější argument než obecné “model je chytrý”. Ukazuje to model v situaci, kde musí zasáhnout do existující knihovny, pochopit související projekt a navrhnout API změny, které dávají smysl.

Cena jako tvrdá realita

Willison také otevřeně ukazuje cenu.

Pomocí AgentsView sledoval lokální LLM usage napříč coding agenty. Za den používání Fable 5 mu vyšla spotřeba 110,42 dolaru v tokenech, z toho velká část na projektu kolem Datasette Agent.

To je důležitý detail.

Model může být silný, ale agentní práce ve větším měřítku rychle naráží na ekonomiku. U dlouhých úloh nejde jen o cenu jednoho promptu. Jde o celé sessions, opakované iterace, nástroje, testy a dlouhý kontext.

Moje takeaway: Fable 5 může být zajímavý právě pro těžké, dlouhé a hodnotné úlohy. Ale není to model, který by člověk chtěl bez přemýšlení pouštět na všechno.

Co si z toho vzít

Simonův text ukazuje dvě věci najednou.

Za prvé: Claude Fable 5 může být velmi schopný v agentních coding workflow, kde model nejen píše kód, ale řeší API design, testy, dokumentaci a navazující změny v knihovnách.

Za druhé: taková schopnost něco stojí. Nejen peníze, ale i čas čekání, kontrolu výstupů a dobrý úsudek, kdy takový model vůbec použít.

Praktický dopad pro vývojáře není “všechno teď dělejme přes největší model”.

Spíš: největší modely mohou dávat smysl tam, kde je úloha dost složitá a hodnotná na to, aby se jejich cena vrátila.

U agentní AI se tak čím dál víc vrací stejná otázka:

Nejen co model dokáže.

Ale kdy se jeho použití opravdu vyplatí.