SquellSquell
Zpět na archiv
AI svět28. května 2026·8 min čtení

Claude Opus 4.8: milion tokenů kontextu, stovky agentů a levnější Fast mode

Anthropic vydalo Opus 4.8 — milion tokenů kontextu, Dynamic Workflows se stovkami paralelních agentů a Fast mode skoro třikrát levněji. Cena za tokeny zůstává. Rozebíráme, co je hype a co realita.

AutorDavid Jurica
Abstraktní vizualizace neuronové sítě a paralelního zpracování
Foto: Unsplash

Anthropic dnes, 28. května 2026, vypustilo Claude Opus 4.8 — zhruba šest týdnů po verzi 4.7. Firma ho označuje za svůj nejschopnější veřejně dostupný model. Zajímavější než další desetinka na benchmarku je ale to, co model umí v praxi: udržet milion tokenů kontextu, rozjet stovky paralelních agentů v jednom běhu a počítat Fast mode skoro třikrát levněji než dřív.

Co se vlastně změnilo

Pokrok v kódování je tentokrát menší než u skoku z 4.6 na 4.7, ale pořád měřitelný. Na SWE-bench Verified Opus 4.8 dosáhl 88,6 % (z 87,6 %), na obtížnější SWE-bench Pro 69,2 % (z 64,3 %) — a tím nechává za sebou GPT-5.5 s 58,6 % i Gemini 3.1 Pro s 54,2 %. Na OSWorld, který měří ovládání reálného počítače, vykazuje Anthropic 83,4 %, nejlepší výsledek v oboru. GPQA Diamond, vědecký test na úrovni doktorandů, atakuje 93,6 %.

Není to ale jednoznačné vítězství po celé čáře. Na Terminal-Bench 2.1, který testuje práci v příkazové řádce, Opus 4.8 dosahuje 74,6 % a prohrává s GPT-5.5 (78,2 %). Nezávislý Artificial Analysis Intelligence Index dává Opusu 4.8 hodnotu 61,4 — vede žebříček, ale jen těsně před GPT-5.5 (60,2). Skok oproti verzi 4.7 (57,3) je reálný, ne ohromující.

Upřímnější ke svému vlastnímu kódu

Nejpraktičtější změna se neměří benchmarkem. Anthropic uvádí, že Opus 4.8 je zhruba čtyřikrát méně náchylný k tomu, aby přešel vlastní chybu v kódu bez komentáře, než 4.7. Lépe se taky trefuje do toho, kdy má sáhnout po nástroji — což byla jedna z nejčastějších stížností na předchozí verzi. Na dlouhých agentních úlohách dělá méně tzv. kompakcí (ztráta kontextu při zhušťování historie) a snáz se zotaví, když narazí na slepou uličku.

„Opus 4.8 je zhruba čtyřikrát méně náchylný k tomu, aby přešel vlastní chybu v kódu bez povšimnutí, než předchozí generace.“

Anthropic, oznámení Claude Opus 4.8

Cena, kontext a integrace

Sazba za tokeny zůstává beze změny: 5 dolarů za milion vstupních, 25 dolarů za milion výstupních. Dávkové zpracování stojí 2,50 / 12,50 dolaru a minimum pro prompt caching kleslo na 1 024 tokenů. Největší cenový posun je u Fast mode — zrychleného režimu pro nízkou latenci. Ten teď stojí 10 / 50 dolarů místo dřívějších 30 / 150, tedy zhruba třikrát méně, a běží až 2,5× rychleji na výstupu.

Kontextové okno je standardně milion tokenů přes API, Amazon Bedrock i Google Vertex AI (na Microsoft Foundry zatím 200 tisíc). Maximální výstup je 128 tisíc tokenů. Model jede výhradně v režimu adaptivního uvažování — rozpočet na „thinking“ ani teplotu už ručně nenastavíte. Drobné písmo zůstává stejné jako u 4.7: nový tokenizer může stejný text rozdělit až o třetinu víc tokenů, takže reálná faktura nemusí klesnout tolik, kolik slibuje ceník.

  • Cena: 5 USD vstup / 25 USD výstup za 1M tokenů (beze změny)
  • Fast mode: 10 / 50 USD — zhruba 3× levněji než dřív
  • Kontext: 1M tokenů (API, Bedrock, Vertex; 200k na Foundry)
  • SWE-bench Verified: 88,6 % · SWE-bench Pro: 69,2 %
  • Dostupnost: Claude Pro/Max/Team/Enterprise, API, Bedrock, Vertex, Foundry

Dynamic Workflows: stovky agentů v jednom běhu

Vlajková novinka se jmenuje Dynamic Workflows a vychází jako research preview v Claude Code. Model si sám naplánuje práci, rozdělí ji a spustí až stovky paralelních subagentů v rámci jediného běhu — každý řeší svůj kus úkolu a jejich výstupy se zpětně ověřují. Místo jednoho lineárního vlákna tak dostanete něco jako malý tým, který pracuje současně a sám si kontroluje výsledky.

Mimochodem — tenhle článek jsme nechali nasbírat a ověřit několika paralelními agenty najednou. Přesně tahle disciplína (rozdělit research, běžet souběžně, křížově ověřit zdroje) je to, co Dynamic Workflows posouvá z dema do denní práce.

Co s tím

Pokud jedete na Claude Code, Cursoru nebo vlastní agentní pipeline, upgrade dává smysl hlavně kvůli stabilitě na dlouhých úlohách a levnějšímu Fast mode — ne kvůli desetinkám na SWE-benchi. Pro českou agenturu nebo tým je nejhmatatelnější právě to zlevnění Fast mode: rychlé iterace nad kódem najednou nestojí trojnásobek.

Reakce nejsou nekritické. Část vývojářů na Hacker News připomíná, že někteří se z verze 4.7 vraceli zpět na 4.6, a u 4.8 oceňují hlavně to, že model přestal donekonečna rozporovat, jestli oprava vůbec je potřeba. Pro firmy v EU platí stejné jako u 4.7: provoz přes Bedrock ve Frankfurtu nebo Vertex v Belgii řeší většinu otázek datové rezidence. A na Free tier se Opus 4.8 zatím nedostal.