Trendy

Anthropic vrací úder Googlu s modelem Claude Opus 4.5. V programování je nejlepší, tvrdí

Anthropic představuje Claude Opus 4.5 jako nejinteligentnější model pro programování, agenty a ovládání počítače
Nový model překonal všechny lidské kandidáty v interním testu programovacích dovedností společnosti Anthropic
Claude Opus 4.5 je dostupný za 5 dolarů za milion vstupních tokenů a 25 dolarů za milion výstupních tokenů

Sdílejte:

Adam Kurfürst

Publikováno: 24.11.2025 22:08

Žádné komentáře

umela inteligence programujici s logem claude ilustrace k opus 4.5

Jen několik dní poté, co Google oznámil svůj dosud nejpokročilejší model Gemini 3 Pro, přichází konkurenční Anthropic s vlastní odpovědí. Nový Claude Opus 4.5 má podle tvůrců představovat vůbec nejlepší model na světě pro programování, práci s agenty a samostatné ovládání počítače. Zatímco Google vsadil na multimodální schopnosti a generování interaktivního obsahu, Anthropic se zaměřuje na praktickou využitelnost při vývoji softwaru.

Programátor, který překonal všechny kandidáty

Anthropic testuje nové modely na interním přijímacím testu pro programátory, který je považován za mimořádně náročný. Claude Opus 4.5 v rámci stanoveného dvouhodinového časového limitu dosáhl vyššího skóre než jakýkoli lidský kandidát v historii společnosti. Bez časového omezení pak model dokázal vyrovnat nejlepší lidský výsledek vůbec.

claude opus 4.5 vysledky v testech

V praxi to znamená, že Claude Opus 4.5 dokáže analyzovat komplexní chyby napříč více systémy a samostatně navrhnout opravu. Testeři z Anthropic opakovaně zmiňovali, že model zvládá nejednoznačné zadání bez nutnosti podrobného vysvětlování a úlohy, které byly pro předchozí Sonnet 4.5 téměř nemožné, nyní řeší bez větších problémů.

Ovládání počítače s funkcí přiblížení

Jednou z klíčových novinek je vylepšené ovládání počítače (computer use). Claude Opus 4.5 přináší novou funkci zoom, která umožňuje detailní prozkoumání konkrétních oblastí obrazovky v plném rozlišení. Model tak dokáže analyzovat drobné prvky uživatelského rozhraní, číst malý text nebo ověřovat přesné vizuální detaily před provedením akce.

Tato schopnost je užitečná například při práci s komplexními rozhraními obsahujícími velké množství informací nebo při automatizaci úloh vyžadujících přesnou interakci s drobnými ovládacími prvky.

Nastavitelná úroveň úsilí

Claude Opus 4.5 je jediným modelem z rodiny Claude 4.5, který podporuje takzvaný effort parameter. Ten umožňuje vývojářům nastavit, kolik tokenů má model při odpovědi využít. K dispozici jsou tři úrovně: vysoká pro maximální důkladnost, střední pro běžné produkční nasazení a nízká pro efektivní zpracování velkého objemu požadavků.

Při střední úrovni dosahuje Opus 4.5 stejného skóre na benchmarku SWE-bench Verified jako Sonnet 4.5, ale spotřebuje o 76 % méně výstupních tokenů. Při nejvyšší úrovni pak Sonnet překonává o 4,3 procentního bodu při spotřebě o 48 % nižší.

Výsledky v testech

Anthropic prezentuje Claude Opus 4.5 jako nejlepší model pro reálné softwarové inženýrství. Na benchmarku SWE-bench Verified, který měří schopnost řešit skutečné programátorské úlohy, dosahuje model nejvyššího skóre mezi konkurencí. Zajímavý je i případ z testu τ2-bench, kde měl model odmítnout změnu rezervace v základní ekonomické třídě. Místo toho našel legitimní způsob, jak zákazníkovi pomoci – nejprve upgradovat třídu a poté provést změnu.

claude opus 4.5 swe benchmark graf

Model také vede v programování napříč sedmi z osmi programovacích jazyků na benchmarku SWE-bench Multilingual.

Bezpečnost a odolnost proti útokům

Anthropic označuje Claude Opus 4.5 za nejrobustněji zarovnaný model, jaký kdy vydal. Podle společnosti jde pravděpodobně o nejlépe zarovnaný frontier model od jakéhokoli vývojáře. Model vykazuje výrazně nižší míru nežádoucího chování a je odolnější proti takzvaným prompt injection útokům, kdy se útočníci snaží prostřednictvím skrytých instrukcí přimět model k nežádoucímu chování.

Cena a dostupnost

Claude Opus 4.5 je k dispozici prostřednictvím webového rozhraní, mobilní aplikace, API i na cloudových platformách. Cena činí 5 dolarů za milion vstupních tokenů a 25 dolarů za milion výstupních tokenů. Vývojáři mohou model volat pomocí identifikátoru claude-opus-4-5-20251101.

Pro uživatele služby Claude s přístupem k Opus 4.5 Anthropic odstranil specifické limity pro tento model. Předplatitelé Max a Team Premium mají navýšené celkové limity využití.

Jaký AI model pro programování používáte vy?

Zdroje: Anthropic, Anthropic Docs

O autorovi

Adam Kurfürst

Adam studuje na gymnáziu a technologické žurnalistice se věnuje od svých 14 let. Pakliže pomineme jeho vášeň pro chytré telefony, tablety a příslušenství, rád se… Více o autorovi

Sdílejte:

Žádné komentáře

Vložit komentář

Mohlo by vás zajímat

Integrace Google Gemini do Android Auto

Android Auto dostane schopnějšího asistenta! Takto (zhruba) vypadá Gemini v akci

Fotky Google, třídění fotografií

Fotky Google dají uživatelům větší kontrolu, chyby AI půjde opravit

Libor Foltýnek

Samsung Ballie

Roztomilý robůtek od Samsungu zamíří do domácností. Malý AI asistent pomůže zahnat nudu i samotu

Předpověď počasí vstupuje do nové éry. Google představil převratnou technologii a uvolnil ji zdarma

nvidia 5000

RTX 5070 nabídne výkon vlajkové RTX 4090! Nvidia odhalila novou generaci grafických karet, známe české ceny

Google Gemini ilustrace

Google uhodil hřebíček na hlavičku. Novou funkci Gemini si uživatelé zamilovali a teď je navíc ještě lepší