Klíčové body

Anthropic uvedla modely Claude Opus 4 a Sonnet 4 s vyšší přesností a schopností uvažování
Opus 4 překonává konkurenci v programovacím testu SWE-bench Verified
Společnost plánuje častější aktualizace, aby udržela krok s vývojem AI technologií

Dva nové modely – Claude Opus 4 a Claude Sonnet 4 – podle vyjádření firmy patří k tomu nejlepšímu, co je dnes v oboru k dispozici, zejména pokud jde o jejich výkon v klíčových benchmarkových testech.

Oba modely dokážou pracovat s rozsáhlými daty, uvažovat v několika krocích a řešit úkoly s dlouhým časovým horizontem. Anthropic tvrdí, že právě v těchto oblastech modely vynikají díky vylepšené schopnosti soustředění a vyšší přesnosti. Modely byly navíc optimalizovány pro programování a práci s kódem, což je předurčuje k využití vývojáři softwaru.

Přístup a ceny nových modelů

Claude Sonnet 4 bude dostupný široké veřejnosti, včetně neplatících uživatelů, zatímco Claude Opus 4 bude určen pouze pro platící zákazníky. Cena za použití přes API (dostupné skrze Amazon Bedrock a Google Vertex AI) činí 15/75 USD za milion tokenů (vstup/výstup) u Opus 4 a 3/15 USD u Sonnet 4. Jeden milion tokenů odpovídá zhruba 750 000 slovům, což je objem dat přesahující například rozsah slavného románu Vojna a mír.

Uvedení modelů přichází v době, kdy společnost Anthropic, založená bývalými výzkumníky z OpenAI, usiluje o masivní růst tržeb – plánuje do roku 2027 dosáhnout příjmů ve výši 12 miliard dolarů, oproti letošním 2,2 miliardy. Firma se zároveň připravuje na nákladnou expanzi: získala 2,5 miliardy dolarů ve formě úvěrové linky a obdržela miliardové investice od Amazonu a dalších strategických partnerů.

Výkon, bezpečnost a schopnosti modelů Claude 4

Podle společnosti je výkonnější model Opus 4 schopen udržet logické myšlenkové toky napříč složitými úlohami. Sonnet 4, navržený jako přímý nástupce dřívější verze 3.7, přináší vyšší přesnost v matematice i kódování. Oba modely jsou zároveň méně náchylné k tzv. „hackování odměn“ – tedy k tomu, že využívají mezery ve specifikaci úkolu k jeho neetickému dokončení.

Přesto není Claude 4 jasným vítězem ve všech metrikách. Například Claude Opus 4 překonává konkurenci od Google a OpenAI v benchmarku SWE-bench Verified, zaměřeném na programování. V jiných testech – jako MMMU nebo GPQA Diamond, zaměřených na komplexní otázky z fyziky, chemie a biologie – však zaostává.

Anthropic zdůrazňuje, že s uvedením nových modelů zavádí přísnější bezpečnostní opatření, včetně detekce škodlivého obsahu a kyberbezpečnostních prvků. Interní testy společnosti například ukázaly, že Opus 4 může potenciálně usnadnit přístup k informacím týkajícím se výroby zbraní hromadného ničení, což je důvod, proč firma aplikuje klasifikaci „ASL-3“.

Chcete využít této příležitosti?

Kódovací nástroje, paměť a strategie pro vývojáře

Oba modely Claude 4 jsou hybridní AI systémy. Dokážou střídat rychlé odpovědi a hlubší analýzu problému díky tzv. režimu uvažování. Ten modelu umožňuje „zvážit“ různé možnosti před generováním finální odpovědi. Během uvažování generuje model i srozumitelný popis toho, jaký logický postup vedl k výstupu – alespoň do té míry, jak je to možné bez ohrožení firemních tajemství.

Modely navíc mohou paralelně používat různé nástroje, například webové vyhledávače, a mezi nimi přepínat. Také si mohou ukládat relevantní informace do interní paměti, což jim umožňuje lépe řešit úlohy vyžadující souvislosti nebo opakované operace. Firma tento přístup označuje za budování „tacitních znalostí“.

Z hlediska vývoje softwaru je zásadní aktualizace nástroje Claude Code, který nyní nabízí integraci s vývojovým prostředím (IDE) a umožňuje spouštění AI přímo z terminálu. Nově představené SDK pak vývojářům umožňuje zapojit modely Claude do vlastních aplikací. K dispozici jsou také rozšíření pro GitHub, JetBrains či VS Code, která umožňují Claude Code reagovat na komentáře v pull requestech nebo upravovat kód na základě zpětné vazby.

Anthropic si je vědoma, že modely AI stále nejsou schopné psát plně bezpečný a bezchybný kód. Proto firma slibuje častější aktualizace modelů, aby vývojářům nabídla plynulý přístup k neustále se zlepšujícím nástrojům.

Společnost Anthropic představila na své první vývojářské konferenci novou rodinu modelů umělé inteligence Claude 4, která má ambici posunout hranice současných možností AI. Dva nové modely – Claude Opus 4 a Claude Sonnet 4 – podle vyjádření firmy patří k tomu nejlepšímu, co je dnes v oboru k dispozici, zejména pokud jde o jejich výkon v klíčových benchmarkových testech. Oba modely dokážou pracovat s rozsáhlými daty, uvažovat v několika krocích a řešit úkoly s dlouhým časovým horizontem. Anthropic tvrdí, že právě v těchto oblastech modely vynikají díky vylepšené schopnosti soustředění a vyšší přesnosti. Modely byly navíc optimalizovány pro programování a práci s kódem, což je předurčuje k využití vývojáři softwaru. Zdroj: Shutterstock Přístup a ceny nových modelů Claude Sonnet 4 bude dostupný široké veřejnosti, včetně neplatících uživatelů, zatímco Claude Opus 4 bude určen pouze pro platící zákazníky. Cena za použití přes API (dostupné skrze Amazon Bedrock a Google Vertex AI) činí 15/75 USD za milion tokenů (vstup/výstup) u Opus 4 a 3/15 USD u Sonnet 4. Jeden milion tokenů odpovídá zhruba 750 000 slovům, což je objem dat přesahující například rozsah slavného románu Vojna a mír. Uvedení modelů přichází v době, kdy společnost Anthropic, založená bývalými výzkumníky z OpenAI, usiluje o masivní růst tržeb – plánuje do roku 2027 dosáhnout příjmů ve výši 12 miliard dolarů, oproti letošním 2,2 miliardy. Firma se zároveň připravuje na nákladnou expanzi: získala 2,5 miliardy dolarů ve formě úvěrové linky a obdržela miliardové investice od Amazonu a dalších strategických partnerů. Výkon, bezpečnost a schopnosti modelů Claude 4 Podle společnosti je výkonnější model Opus 4 schopen udržet logické myšlenkové toky napříč složitými úlohami. Sonnet 4, navržený jako přímý nástupce dřívější verze 3.7, přináší vyšší přesnost v matematice i kódování. Oba modely jsou zároveň méně náchylné k tzv. „hackování odměn“ – tedy k tomu, že využívají mezery ve specifikaci úkolu k jeho neetickému dokončení. Přesto není Claude 4 jasným vítězem ve všech metrikách. Například Claude Opus 4 překonává konkurenci od Google a OpenAI v benchmarku SWE-bench Verified, zaměřeném na programování. V jiných testech – jako MMMU nebo GPQA Diamond, zaměřených na komplexní otázky z fyziky, chemie a biologie – však zaostává. Anthropic zdůrazňuje, že s uvedením nových modelů zavádí přísnější bezpečnostní opatření, včetně detekce škodlivého obsahu a kyberbezpečnostních prvků. Interní testy společnosti například ukázaly, že Opus 4 může potenciálně usnadnit přístup k informacím týkajícím se výroby zbraní hromadného ničení, což je důvod, proč firma aplikuje klasifikaci „ASL-3“. Kódovací nástroje, paměť a strategie pro vývojáře Oba modely Claude 4 jsou hybridní AI systémy. Dokážou střídat rychlé odpovědi a hlubší analýzu problému díky tzv. režimu uvažování. Ten modelu umožňuje „zvážit“ různé možnosti před generováním finální odpovědi. Během uvažování generuje model i srozumitelný popis toho, jaký logický postup vedl k výstupu – alespoň do té míry, jak je to možné bez ohrožení firemních tajemství. Modely navíc mohou paralelně používat různé nástroje, například webové vyhledávače, a mezi nimi přepínat. Také si mohou ukládat relevantní informace do interní paměti, což jim umožňuje lépe řešit úlohy vyžadující souvislosti nebo opakované operace. Firma tento přístup označuje za budování „tacitních znalostí“. Z hlediska vývoje softwaru je zásadní aktualizace nástroje Claude Code, který nyní nabízí integraci s vývojovým prostředím (IDE) a umožňuje spouštění AI přímo z terminálu. Nově představené SDK pak vývojářům umožňuje zapojit modely Claude do vlastních aplikací. K dispozici jsou také rozšíření pro GitHub, JetBrains či VS Code, která umožňují Claude Code reagovat na komentáře v pull requestech nebo upravovat kód na základě zpětné vazby. Anthropic si je vědoma, že modely AI stále nejsou schopné psát plně bezpečný a bezchybný kód. Proto firma slibuje častější aktualizace modelů, aby vývojářům nabídla plynulý přístup k neustále se zlepšujícím nástrojům. Zdroj: Anthropic

Tagy: AI anthropic Claude

Nadcházející IPO.

Minulé IPO.

Nadcházející IPO.

Minulé IPO.

Claude 4 posouvá AI na vyšší úroveň v uvažování i programování

Klíčové body

Přístup a ceny nových modelů

Výkon, bezpečnost a schopnosti modelů Claude 4

Kódovací nástroje, paměť a strategie pro vývojáře

Breaking.

Příležitosti.

IPO Radar.

Nejčtenější zprávy.

Tip editora.

Retrieve your password