Anthropic dnes, 28. května 2026, vypustilo Claude Opus 4.8 — zhruba šest týdnů po verzi 4.7. Firma ho označuje za svůj nejschopnější veřejně dostupný model. Zajímavější než další desetinka na benchmarku je ale to, co model umí v praxi: udržet milion tokenů kontextu, rozjet stovky paralelních agentů v jednom běhu a počítat Fast mode skoro třikrát levněji než dřív.
Co se vlastně změnilo
Pokrok v kódování je tentokrát menší než u skoku z 4.6 na 4.7, ale pořád měřitelný. Na SWE-bench Verified Opus 4.8 dosáhl 88,6 % (z 87,6 %), na obtížnější SWE-bench Pro 69,2 % (z 64,3 %) — a tím nechává za sebou GPT-5.5 s 58,6 % i Gemini 3.1 Pro s 54,2 %. Na OSWorld, který měří ovládání reálného počítače, vykazuje Anthropic 83,4 %, nejlepší výsledek v oboru. GPQA Diamond, vědecký test na úrovni doktorandů, atakuje 93,6 %.
Není to ale jednoznačné vítězství po celé čáře. Na Terminal-Bench 2.1, který testuje práci v příkazové řádce, Opus 4.8 dosahuje 74,6 % a prohrává s GPT-5.5 (78,2 %). Nezávislý Artificial Analysis Intelligence Index dává Opusu 4.8 hodnotu 61,4 — vede žebříček, ale jen těsně před GPT-5.5 (60,2). Skok oproti verzi 4.7 (57,3) je reálný, ne ohromující.
Upřímnější ke svému vlastnímu kódu
Nejpraktičtější změna se neměří benchmarkem. Anthropic uvádí, že Opus 4.8 je zhruba čtyřikrát méně náchylný k tomu, aby přešel vlastní chybu v kódu bez komentáře, než 4.7. Lépe se taky trefuje do toho, kdy má sáhnout po nástroji — což byla jedna z nejčastějších stížností na předchozí verzi. Na dlouhých agentních úlohách dělá méně tzv. kompakcí (ztráta kontextu při zhušťování historie) a snáz se zotaví, když narazí na slepou uličku.
„Opus 4.8 je zhruba čtyřikrát méně náchylný k tomu, aby přešel vlastní chybu v kódu bez povšimnutí, než předchozí generace.“
Cena, kontext a integrace
Sazba za tokeny zůstává beze změny: 5 dolarů za milion vstupních, 25 dolarů za milion výstupních. Dávkové zpracování stojí 2,50 / 12,50 dolaru a minimum pro prompt caching kleslo na 1 024 tokenů. Největší cenový posun je u Fast mode — zrychleného režimu pro nízkou latenci. Ten teď stojí 10 / 50 dolarů místo dřívějších 30 / 150, tedy zhruba třikrát méně, a běží až 2,5× rychleji na výstupu.
Kontextové okno je standardně milion tokenů přes API, Amazon Bedrock i Google Vertex AI (na Microsoft Foundry zatím 200 tisíc). Maximální výstup je 128 tisíc tokenů. Model jede výhradně v režimu adaptivního uvažování — rozpočet na „thinking“ ani teplotu už ručně nenastavíte. Drobné písmo zůstává stejné jako u 4.7: nový tokenizer může stejný text rozdělit až o třetinu víc tokenů, takže reálná faktura nemusí klesnout tolik, kolik slibuje ceník.
- ▸Cena: 5 USD vstup / 25 USD výstup za 1M tokenů (beze změny)
- ▸Fast mode: 10 / 50 USD — zhruba 3× levněji než dřív
- ▸Kontext: 1M tokenů (API, Bedrock, Vertex; 200k na Foundry)
- ▸SWE-bench Verified: 88,6 % · SWE-bench Pro: 69,2 %
- ▸Dostupnost: Claude Pro/Max/Team/Enterprise, API, Bedrock, Vertex, Foundry
Dynamic Workflows: stovky agentů v jednom běhu
Vlajková novinka se jmenuje Dynamic Workflows a vychází jako research preview v Claude Code. Model si sám naplánuje práci, rozdělí ji a spustí až stovky paralelních subagentů v rámci jediného běhu — každý řeší svůj kus úkolu a jejich výstupy se zpětně ověřují. Místo jednoho lineárního vlákna tak dostanete něco jako malý tým, který pracuje současně a sám si kontroluje výsledky.
Mimochodem — tenhle článek jsme nechali nasbírat a ověřit několika paralelními agenty najednou. Přesně tahle disciplína (rozdělit research, běžet souběžně, křížově ověřit zdroje) je to, co Dynamic Workflows posouvá z dema do denní práce.
Co s tím
Pokud jedete na Claude Code, Cursoru nebo vlastní agentní pipeline, upgrade dává smysl hlavně kvůli stabilitě na dlouhých úlohách a levnějšímu Fast mode — ne kvůli desetinkám na SWE-benchi. Pro českou agenturu nebo tým je nejhmatatelnější právě to zlevnění Fast mode: rychlé iterace nad kódem najednou nestojí trojnásobek.
Reakce nejsou nekritické. Část vývojářů na Hacker News připomíná, že někteří se z verze 4.7 vraceli zpět na 4.6, a u 4.8 oceňují hlavně to, že model přestal donekonečna rozporovat, jestli oprava vůbec je potřeba. Pro firmy v EU platí stejné jako u 4.7: provoz přes Bedrock ve Frankfurtu nebo Vertex v Belgii řeší většinu otázek datové rezidence. A na Free tier se Opus 4.8 zatím nedostal.