Mozilla opravila 271 bezpečnostních chyb ve Firefoxu pomocí Claude Mythos
Mozilla postavila automatizovaný harness na bázi Claude Mythos, který v jediné verzi Firefoxu odhalil 271 chyb včetně 15leté chyby v elementu legend.
Mozilla publikovala detailní popis toho, jak používá Claude Mythos Preview k systematickému hledání bezpečnostních chyb ve Firefoxu. Výsledky jsou působivé — a přístup zajímavý i pro každého, kdo uvažuje o AI v kontextu bezpečnostního testování.
Co je Claude Mythos
Claude Mythos je model od Anthropic zaměřený na komplexní reasoning nad víceprocesorovým kódem. Podle Mozilly výrazně překonává starší modely v detekci bezpečnostních defektů — dokáže nejen identifikovat potenciální zranitelnost, ale i pochopit kontext napříč komplexní codebase.
Jak Mozilla harness postavila
Mozilla nevyužila Claude Mythos jen jako "zeptej se a uvidíš". Postavila vlastní harness — infrastrukturu postavenou na fuzzing systému — která provádí třífázový proces:
- Identifikace potenciální zranitelnosti v kódu
- Vytvoření reprodukovatelného testovacího případu
- Dynamické ověření zda jde o skutečný problém
Třetí krok je klíčový. Starším LLM přístupy trpěly vysokým počtem falešných pozitivů — model označil problém, který reálně nešel zneužít. Ověřovací fáze tento problém výrazně eliminuje.
Výsledky: Firefox 150
Firefox 150 obsahoval 271 chyb identifikovaných tímto systémem:
- 180 chyb kategorie sec-high (vysoká závažnost)
- 80 chyb kategorie sec-moderate (střední závažnost)
- 11 chyb kategorie sec-low (nízká závažnost)
Mezi nalezenými zranitelnostmi figurují sandbox escapes, race conditions a use-after-free chyby. Zajímavé jsou i historické nálezy — systém odhalil 15letou chybu v elementu <legend> a problém ve 30leté XSLT funkci. Tedy chyby, které přežily roky manuálních code review i tradičního fuzzingu.
Co z toho plyne
Případ Mozilly ukazuje, že AI v bezpečnostním testování funguje nejlépe ne jako náhrada za existující procesy, ale jako vrstva navíc. Harness kombinuje fuzzing (kde AI generuje testovací případy) s dynamickým ověřením — a výsledkem je nástroj, který nachází chyby které by jinak zůstaly skryté roky.
Zdroj
Behind the Scenes Hardening Firefox with Claude Mythos Preview