Claude Opus 4.8: milion tokenů kontextu, stovky agentů a levnější Fast mode

Anthropic dnes, 28. května 2026, vypustilo Claude Opus 4.8 — zhruba šest týdnů po verzi 4.7. Firma ho označuje za svůj nejschopnější veřejně dostupný model. Zajímavější než další desetinka na benchmarku je ale to, co model umí v praxi: udržet milion tokenů kontextu, rozjet stovky paralelních agentů v jednom běhu a počítat Fast mode skoro třikrát levněji než dřív.

Co se vlastně změnilo

Pokrok v kódování je tentokrát menší než u skoku z 4.6 na 4.7, ale pořád měřitelný. Na SWE-bench Verified Opus 4.8 dosáhl 88,6 % (z 87,6 %), na obtížnější SWE-bench Pro 69,2 % (z 64,3 %) — a tím nechává za sebou GPT-5.5 s 58,6 % i Gemini 3.1 Pro s 54,2 %. Na OSWorld, který měří ovládání reálného počítače, vykazuje Anthropic 83,4 %, nejlepší výsledek v oboru. GPQA Diamond, vědecký test na úrovni doktorandů, atakuje 93,6 %.

Není to ale jednoznačné vítězství po celé čáře. Na Terminal-Bench 2.1, který testuje práci v příkazové řádce, Opus 4.8 dosahuje 74,6 % a prohrává s GPT-5.5 (78,2 %). Nezávislý Artificial Analysis Intelligence Index dává Opusu 4.8 hodnotu 61,4 — vede žebříček, ale jen těsně před GPT-5.5 (60,2). Skok oproti verzi 4.7 (57,3) je reálný, ne ohromující.

Upřímnější ke svému vlastnímu kódu

Nejpraktičtější změna se neměří benchmarkem. Anthropic uvádí, že Opus 4.8 je zhruba čtyřikrát méně náchylný k tomu, aby přešel vlastní chybu v kódu bez komentáře, než 4.7. Lépe se taky trefuje do toho, kdy má sáhnout po nástroji — což byla jedna z nejčastějších stížností na předchozí verzi. Na dlouhých agentních úlohách dělá méně tzv. kompakcí (ztráta kontextu při zhušťování historie) a snáz se zotaví, když narazí na slepou uličku.

„Opus 4.8 je zhruba čtyřikrát méně náchylný k tomu, aby přešel vlastní chybu v kódu bez povšimnutí, než předchozí generace.“
— Anthropic, oznámení Claude Opus 4.8

Cena, kontext a integrace

Sazba za tokeny zůstává beze změny: 5 dolarů za milion vstupních, 25 dolarů za milion výstupních. Dávkové zpracování stojí 2,50 / 12,50 dolaru a minimum pro prompt caching kleslo na 1 024 tokenů. Největší cenový posun je u Fast mode — zrychleného režimu pro nízkou latenci. Ten teď stojí 10 / 50 dolarů místo dřívějších 30 / 150, tedy zhruba třikrát méně, a běží až 2,5× rychleji na výstupu.

Kontextové okno je standardně milion tokenů přes API, Amazon Bedrock i Google Vertex AI (na Microsoft Foundry zatím 200 tisíc). Maximální výstup je 128 tisíc tokenů. Model jede výhradně v režimu adaptivního uvažování — rozpočet na „thinking“ ani teplotu už ručně nenastavíte. Drobné písmo zůstává stejné jako u 4.7: nový tokenizer může stejný text rozdělit až o třetinu víc tokenů, takže reálná faktura nemusí klesnout tolik, kolik slibuje ceník.

▸Cena: 5 USD vstup / 25 USD výstup za 1M tokenů (beze změny)
▸Fast mode: 10 / 50 USD — zhruba 3× levněji než dřív
▸Kontext: 1M tokenů (API, Bedrock, Vertex; 200k na Foundry)
▸SWE-bench Verified: 88,6 % · SWE-bench Pro: 69,2 %
▸Dostupnost: Claude Pro/Max/Team/Enterprise, API, Bedrock, Vertex, Foundry

Dynamic Workflows: stovky agentů v jednom běhu

Vlajková novinka se jmenuje Dynamic Workflows a vychází jako research preview v Claude Code. Model si sám naplánuje práci, rozdělí ji a spustí až stovky paralelních subagentů v rámci jediného běhu — každý řeší svůj kus úkolu a jejich výstupy se zpětně ověřují. Místo jednoho lineárního vlákna tak dostanete něco jako malý tým, který pracuje současně a sám si kontroluje výsledky.

Mimochodem — tenhle článek jsme nechali nasbírat a ověřit několika paralelními agenty najednou. Přesně tahle disciplína (rozdělit research, běžet souběžně, křížově ověřit zdroje) je to, co Dynamic Workflows posouvá z dema do denní práce.

Co s tím

Pokud jedete na Claude Code, Cursoru nebo vlastní agentní pipeline, upgrade dává smysl hlavně kvůli stabilitě na dlouhých úlohách a levnějšímu Fast mode — ne kvůli desetinkám na SWE-benchi. Pro českou agenturu nebo tým je nejhmatatelnější právě to zlevnění Fast mode: rychlé iterace nad kódem najednou nestojí trojnásobek.

Reakce nejsou nekritické. Část vývojářů na Hacker News připomíná, že někteří se z verze 4.7 vraceli zpět na 4.6, a u 4.8 oceňují hlavně to, že model přestal donekonečna rozporovat, jestli oprava vůbec je potřeba. Pro firmy v EU platí stejné jako u 4.7: provoz přes Bedrock ve Frankfurtu nebo Vertex v Belgii řeší většinu otázek datové rezidence. A na Free tier se Opus 4.8 zatím nedostal.

§·· Zdroje

§·· Z té samé kategorie

⌬ AI svět

Claude Mythos: AI tak nebezpečná, že ji zakázala i vláda USA

Anthropic označil Claude Mythos za příliš nebezpečný na vydání — a hned první den se k němu někdo dostal pouhým uhádnutím adresy. O dva měsíce později ho i s veřejným Fable 5 zakázala americká vláda a oba modely musely ze dne na den zhasnout. Rozplétáme tři různé „zákazy“, které se v titulcích slévají do jednoho.

⌬ AI svět

Claude Fable 5: první Mythos model, rekordní benchmarky a dvojnásobná cena

Anthropic vydal Claude Fable 5 — první veřejně dostupný model třídy Mythos. Na benchmarcích válcuje GPT-5.5 i Gemini, stojí dvojnásobek Opusu 4.8 a citlivé dotazy si tiše přesměrovává jinam. Rozebíráme, co je průlom a co problém.

⌬ AI svět

Claude Opus 4.7: Anthropic přepsalo žebříček SWE-benchu

Nový model od Anthropicu zvládá osmihodinové úkoly bez dohledu, na SWE-bench Verified atakuje 87,6 % a cena zůstává stejná. Co to znamená v praxi?