Claude 4 posouvá AI na vyšší úroveň v uvažování i programování
Společnost Anthropic představila na své první vývojářské konferenci novou rodinu modelů umělé inteligence Claude 4, která má ambici posunout hranice současných možností AI.
Anthropic uvedla modely Claude Opus 4 a Sonnet 4 s vyšší přesností a schopností uvažování
Opus 4 překonává konkurenci v programovacím testu SWE-bench Verified
Společnost plánuje častější aktualizace, aby udržela krok s vývojem AI technologií
Dva nové modely – Claude Opus 4 a Claude Sonnet 4 – podle vyjádření firmy patří k tomu nejlepšímu, co je dnes v oboru k dispozici, zejména pokud jde o jejich výkon v klíčových benchmarkových testech.
Oba modely dokážou pracovat s rozsáhlými daty, uvažovat v několika krocích a řešit úkoly s dlouhým časovým horizontem. Anthropic tvrdí, že právě v těchto oblastech modely vynikají díky vylepšené schopnosti soustředění a vyšší přesnosti. Modely byly navíc optimalizovány pro programování a práci s kódem, což je předurčuje k využití vývojáři softwaru.
Zdroj: Shutterstock
Přístup a ceny nových modelů
Claude Sonnet 4 bude dostupný široké veřejnosti, včetně neplatících uživatelů, zatímco Claude Opus 4 bude určen pouze pro platící zákazníky. Cena za použití přes API (dostupné skrze Amazon Bedrock a Google Vertex AI) činí 15/75 USD za milion tokenů (vstup/výstup) u Opus 4 a 3/15 USD u Sonnet 4. Jeden milion tokenů odpovídá zhruba 750 000 slovům, což je objem dat přesahující například rozsah slavného románu Vojna a mír.
Uvedení modelů přichází v době, kdy společnost Anthropic, založená bývalými výzkumníky z OpenAI, usiluje o masivní růst tržeb – plánuje do roku 2027 dosáhnout příjmů ve výši 12 miliard dolarů, oproti letošním 2,2 miliardy. Firma se zároveň připravuje na nákladnou expanzi: získala 2,5 miliardy dolarů ve formě úvěrové linky a obdržela miliardové investice od Amazonu a dalších strategických partnerů.
Výkon, bezpečnost a schopnosti modelů Claude 4
Podle společnosti je výkonnější model Opus 4 schopen udržet logické myšlenkové toky napříč složitými úlohami. Sonnet 4, navržený jako přímý nástupce dřívější verze 3.7, přináší vyšší přesnost v matematice i kódování. Oba modely jsou zároveň méně náchylné k tzv. „hackování odměn“ – tedy k tomu, že využívají mezery ve specifikaci úkolu k jeho neetickému dokončení.
Přesto není Claude 4 jasným vítězem ve všech metrikách. Například Claude Opus 4 překonává konkurenci od Google a OpenAI v benchmarku SWE-bench Verified, zaměřeném na programování. V jiných testech – jako MMMU nebo GPQA Diamond, zaměřených na komplexní otázky z fyziky, chemie a biologie – však zaostává.
Anthropic zdůrazňuje, že s uvedením nových modelů zavádí přísnější bezpečnostní opatření, včetně detekce škodlivého obsahu a kyberbezpečnostních prvků. Interní testy společnosti například ukázaly, že Opus 4 může potenciálně usnadnit přístup k informacím týkajícím se výroby zbraní hromadného ničení, což je důvod, proč firma aplikuje klasifikaci „ASL-3“.
Kódovací nástroje, paměť a strategie pro vývojáře
Oba modely Claude 4 jsou hybridní AI systémy. Dokážou střídat rychlé odpovědi a hlubší analýzu problému díky tzv. režimu uvažování. Ten modelu umožňuje „zvážit“ různé možnosti před generováním finální odpovědi. Během uvažování generuje model i srozumitelný popis toho, jaký logický postup vedl k výstupu – alespoň do té míry, jak je to možné bez ohrožení firemních tajemství.
Modely navíc mohou paralelně používat různé nástroje, například webové vyhledávače, a mezi nimi přepínat. Také si mohou ukládat relevantní informace do interní paměti, což jim umožňuje lépe řešit úlohy vyžadující souvislosti nebo opakované operace. Firma tento přístup označuje za budování „tacitních znalostí“.
Z hlediska vývoje softwaru je zásadní aktualizace nástroje Claude Code, který nyní nabízí integraci s vývojovým prostředím (IDE) a umožňuje spouštění AI přímo z terminálu. Nově představené SDK pak vývojářům umožňuje zapojit modely Claude do vlastních aplikací. K dispozici jsou také rozšíření pro GitHub, JetBrains či VS Code, která umožňují Claude Code reagovat na komentáře v pull requestech nebo upravovat kód na základě zpětné vazby.
Anthropic si je vědoma, že modely AI stále nejsou schopné psát plně bezpečný a bezchybný kód. Proto firma slibuje častější aktualizace modelů, aby vývojářům nabídla plynulý přístup k neustále se zlepšujícím nástrojům.
Zdroj: Anthropic
Dva nové modely – Claude Opus 4 a Claude Sonnet 4 – podle vyjádření firmy patří k tomu nejlepšímu, co je dnes v oboru k dispozici, zejména pokud jde o jejich výkon v klíčových benchmarkových testech.Oba modely dokážou pracovat s rozsáhlými daty, uvažovat v několika krocích a řešit úkoly s dlouhým časovým horizontem. Anthropic tvrdí, že právě v těchto oblastech modely vynikají díky vylepšené schopnosti soustředění a vyšší přesnosti. Modely byly navíc optimalizovány pro programování a práci s kódem, což je předurčuje k využití vývojáři softwaru.Přístup a ceny nových modelůClaude Sonnet 4 bude dostupný široké veřejnosti, včetně neplatících uživatelů, zatímco Claude Opus 4 bude určen pouze pro platící zákazníky. Cena za použití přes API činí 15/75 USD za milion tokenů u Opus 4 a 3/15 USD u Sonnet 4. Jeden milion tokenů odpovídá zhruba 750 000 slovům, což je objem dat přesahující například rozsah slavného románu Vojna a mír.Uvedení modelů přichází v době, kdy společnost Anthropic, založená bývalými výzkumníky z OpenAI, usiluje o masivní růst tržeb – plánuje do roku 2027 dosáhnout příjmů ve výši 12 miliard dolarů, oproti letošním 2,2 miliardy. Firma se zároveň připravuje na nákladnou expanzi: získala 2,5 miliardy dolarů ve formě úvěrové linky a obdržela miliardové investice od Amazonu a dalších strategických partnerů.Výkon, bezpečnost a schopnosti modelů Claude 4Podle společnosti je výkonnější model Opus 4 schopen udržet logické myšlenkové toky napříč složitými úlohami. Sonnet 4, navržený jako přímý nástupce dřívější verze 3.7, přináší vyšší přesnost v matematice i kódování. Oba modely jsou zároveň méně náchylné k tzv. „hackování odměn“ – tedy k tomu, že využívají mezery ve specifikaci úkolu k jeho neetickému dokončení.Přesto není Claude 4 jasným vítězem ve všech metrikách. Například Claude Opus 4 překonává konkurenci od Google a OpenAI v benchmarku SWE-bench Verified, zaměřeném na programování. V jiných testech – jako MMMU nebo GPQA Diamond, zaměřených na komplexní otázky z fyziky, chemie a biologie – však zaostává.Anthropic zdůrazňuje, že s uvedením nových modelů zavádí přísnější bezpečnostní opatření, včetně detekce škodlivého obsahu a kyberbezpečnostních prvků. Interní testy společnosti například ukázaly, že Opus 4 může potenciálně usnadnit přístup k informacím týkajícím se výroby zbraní hromadného ničení, což je důvod, proč firma aplikuje klasifikaci „ASL-3“.Kódovací nástroje, paměť a strategie pro vývojářeOba modely Claude 4 jsou hybridní AI systémy. Dokážou střídat rychlé odpovědi a hlubší analýzu problému díky tzv. režimu uvažování. Ten modelu umožňuje „zvážit“ různé možnosti před generováním finální odpovědi. Během uvažování generuje model i srozumitelný popis toho, jaký logický postup vedl k výstupu – alespoň do té míry, jak je to možné bez ohrožení firemních tajemství.Modely navíc mohou paralelně používat různé nástroje, například webové vyhledávače, a mezi nimi přepínat. Také si mohou ukládat relevantní informace do interní paměti, což jim umožňuje lépe řešit úlohy vyžadující souvislosti nebo opakované operace. Firma tento přístup označuje za budování „tacitních znalostí“.Z hlediska vývoje softwaru je zásadní aktualizace nástroje Claude Code, který nyní nabízí integraci s vývojovým prostředím a umožňuje spouštění AI přímo z terminálu. Nově představené SDK pak vývojářům umožňuje zapojit modely Claude do vlastních aplikací. K dispozici jsou také rozšíření pro GitHub, JetBrains či VS Code, která umožňují Claude Code reagovat na komentáře v pull requestech nebo upravovat kód na základě zpětné vazby.Anthropic si je vědoma, že modely AI stále nejsou schopné psát plně bezpečný a bezchybný kód. Proto firma slibuje častější aktualizace modelů, aby vývojářům nabídla plynulý přístup k neustále se zlepšujícím nástrojům.
Investice do nemovitostí zůstávají jedním z nejoblíbenějších způsobů, jak budovat pasivní příjem, a realitní investiční fondy (REIT) nabízejí ideální vstupní...
Společnost Chime Financial, působící v oblasti digitálního bankovnictví, ohlásila svůj záměr vstoupit na burzu prostřednictvím primární veřejné nabídky akcií (IPO)....