OpenAI vyvíjí AI agenty schopné plnit komplexní úkoly podobně jako lidé
Konkurence v oblasti AI agentů roste – Google (GOOG) (GOOGL), Meta (META), Anthropic i xAI zrychlují vývoj
OpenAI míří k intuitivnímu systému, který zvládne úkoly bez podrobného zadání
Zatímco jeho kolegové ladili spotřebitelskou aplikaci, Lightman pracoval v týmu MathGen na vylepšení schopností modelů v matematickém uvažování. Tato snaha, zprvu nenápadná, se ukázala jako zásadní pro ambici OpenAI vyvinout AI agenty, kteří budou schopni vykonávat úkoly stejně jako lidé – a možná i lépe.
Zlepšení schopnosti modelů řešit matematické úlohy se projevilo i mimo akademické prostředí. Jeden z modelů OpenAI získal zlatou medaili na Mezinárodní matematické olympiádě, což je prestižní soutěž určená nejlepším středoškolským matematikům na světě. Společnost věří, že právě tato forma strukturálního uvažování bude klíčová pro vývoj univerzálních agentů, schopných pracovat napříč různými obory.
Zdroj: Shutterstock
Od náhody k systematickému výzkumu
Zatímco ChatGPT vznikl částečně jako vedlejší produkt interního výzkumu a jeho masová popularita OpenAI překvapila, AI agenti se stali cílem promyšleného dlouhodobého úsilí. Generální ředitel společnosti Sam Altman na vývojářské konferenci v roce 2023 prohlásil, že v budoucnosti bude možné požádat počítač o jakýkoli úkol – a on jej jednoduše vykoná.
Zásadní průlom přišel koncem roku 2023 s vývojem systému s kódovým označením „Strawberry“, který zkombinoval velké jazykové modely, učení se posilováním (RL) a techniku zvanou test-time computation. Tato kombinace umožnila modelům lépe plánovat, ověřovat si výsledky a dělat méně chyb při komplexních úlohách. Právě tato technologie stála za vznikem modelu o1, prvního systému OpenAI zaměřeného na hlubší uvažování.
Model o1 posílil ambici společnosti vytvořit AI agenty, kteří budou zvládat více než jen odpovídat na dotazy – budou schopni plnit úkoly, které doposud vyžadovaly lidskou práci. Na rozdíl od předchozích generací modelů tak už nejde jen o porozumění textu, ale o skutečné rozhodování a plánování v rámci simulovaného prostředí.
Vzestup týmu „Agents“ a rostoucí konkurence
Krátce po úspěchu modelu Strawberry založila OpenAI specializovaný tým s názvem Agents, který vedl výzkumník Daniel Selsam. Ten se zaměřil na vývoj systémů schopných zvládat složité, vícestupňové úkoly. Jejich práce se postupně integrovala do vývoje modelu o1, na kterém se podíleli i zakladatel OpenAI Ilya Sutskever, Mark Chen a Jakub Pachocki.
V Silicon Valley nový směr vzbudil značný ohlas. O talentované výzkumníky z OpenAI projevila zájem řada konkurenčních společností. Například Meta Platforms(META) najala pět odborníků z týmu o1 a nabídla jim mimořádně štědré kontrakty, přesahující 100 milionů dolarů. Jedním z nich je Shengjia Zhao, který se stal hlavním vědcem nové výzkumné jednotky Meta Superintelligence Labs.
Zatímco OpenAI rozvíjí koncept AI agentů, konkurenční firmy jako Google (GOOG)(GOOGL), Anthropic, Perplexity nebo xAI pracují na vlastních systémech, které mají podobný cíl – vyvinout nástroje, které dokáží samostatně přemýšlet, plánovat a rozhodovat. Ačkoli OpenAI ještě v roce 2022 dominovala celému odvětví, dnes čelí rostoucí konkurenci a její další úspěch bude záviset i na tom, zda dokáže vývoj AI agentů dotáhnout do praxe dříve než ostatní.
Výzvy subjektivních úkolů a další vývoj
Dnes dostupní AI agenti nejlépe fungují v oblastech, které mají jasné cíle a zpětnou vazbu – například v kódování. OpenAI Codex pomáhá softwarovým inženýrům automatizovat jednoduché úkoly. Obdobně modely společnosti Anthropic se staly populární díky využití v nástrojích jako Cursor nebo Claude Code.
Obtížnější je však nasazení agentů do méně strukturovaných oblastí, jako je online nakupování nebo vyhledávání parkování, kde selhávají kvůli nejednoznačnosti zadání. Výzkumníci se proto nyní snaží zlepšit tréninkové metody pro subjektivní úkoly, které nejsou snadno ověřitelné.
Jednou z cest je rozdělení jednoho úkolu mezi více agentů, kteří navrhnou různé postupy a následně kolektivně vyhodnotí nejlepší řešení. Tento přístup již OpenAI otestovala při vývoji svého modelu IMO, který si připsal úspěch v matematických soutěžích. Modely fungující tímto způsobem aktuálně zkoumají také Google, xAI i další hráči.
Další klíčový směr vývoje je snaha o intuitivnější ovládání agentů. Cílem OpenAI je vytvořit systémy, které automaticky pochopí, jaký úkol má být vykonán, kdy a s jakými nástroji, bez nutnosti detailního zadávání pokynů. Takový agent by uživatelům umožnil zvládat komplexní digitální úkoly bez technického know-how – od rezervace dovolené po automatizaci obchodních procesů.
Budoucnost AI agentů tak není jen otázkou technologií, ale i přístupnosti, efektivity a důvěry. OpenAI chce s blížícím se uvedením modelu GPT-5 potvrdit svou vedoucí pozici a nabídnout nástroje, které budou nejen výkonné, ale i prakticky použitelné. O tom, kdo ovládne nový trh AI agentů, se ale rozhodne až v příštích měsících – a vítěz může být jen jeden.
Zdroj: Shutterstock
Zatímco jeho kolegové ladili spotřebitelskou aplikaci, Lightman pracoval v týmu MathGen na vylepšení schopností modelů v matematickém uvažování. Tato snaha, zprvu nenápadná, se ukázala jako zásadní pro ambici OpenAI vyvinout AI agenty, kteří budou schopni vykonávat úkoly stejně jako lidé – a možná i lépe.Zlepšení schopnosti modelů řešit matematické úlohy se projevilo i mimo akademické prostředí. Jeden z modelů OpenAI získal zlatou medaili na Mezinárodní matematické olympiádě, což je prestižní soutěž určená nejlepším středoškolským matematikům na světě. Společnost věří, že právě tato forma strukturálního uvažování bude klíčová pro vývoj univerzálních agentů, schopných pracovat napříč různými obory.Od náhody k systematickému výzkumuZatímco ChatGPT vznikl částečně jako vedlejší produkt interního výzkumu a jeho masová popularita OpenAI překvapila, AI agenti se stali cílem promyšleného dlouhodobého úsilí. Generální ředitel společnosti Sam Altman na vývojářské konferenci v roce 2023 prohlásil, že v budoucnosti bude možné požádat počítač o jakýkoli úkol – a on jej jednoduše vykoná.Zásadní průlom přišel koncem roku 2023 s vývojem systému s kódovým označením „Strawberry“, který zkombinoval velké jazykové modely, učení se posilováním a techniku zvanou test-time computation. Tato kombinace umožnila modelům lépe plánovat, ověřovat si výsledky a dělat méně chyb při komplexních úlohách. Právě tato technologie stála za vznikem modelu o1, prvního systému OpenAI zaměřeného na hlubší uvažování.Model o1 posílil ambici společnosti vytvořit AI agenty, kteří budou zvládat více než jen odpovídat na dotazy – budou schopni plnit úkoly, které doposud vyžadovaly lidskou práci. Na rozdíl od předchozích generací modelů tak už nejde jen o porozumění textu, ale o skutečné rozhodování a plánování v rámci simulovaného prostředí.Vzestup týmu „Agents“ a rostoucí konkurenceKrátce po úspěchu modelu Strawberry založila OpenAI specializovaný tým s názvem Agents, který vedl výzkumník Daniel Selsam. Ten se zaměřil na vývoj systémů schopných zvládat složité, vícestupňové úkoly. Jejich práce se postupně integrovala do vývoje modelu o1, na kterém se podíleli i zakladatel OpenAI Ilya Sutskever, Mark Chen a Jakub Pachocki.V Silicon Valley nový směr vzbudil značný ohlas. O talentované výzkumníky z OpenAI projevila zájem řada konkurenčních společností. Například Meta Platforms najala pět odborníků z týmu o1 a nabídla jim mimořádně štědré kontrakty, přesahující 100 milionů dolarů. Jedním z nich je Shengjia Zhao, který se stal hlavním vědcem nové výzkumné jednotky Meta Superintelligence Labs.Zatímco OpenAI rozvíjí koncept AI agentů, konkurenční firmy jako Google , Anthropic, Perplexity nebo xAI pracují na vlastních systémech, které mají podobný cíl – vyvinout nástroje, které dokáží samostatně přemýšlet, plánovat a rozhodovat. Ačkoli OpenAI ještě v roce 2022 dominovala celému odvětví, dnes čelí rostoucí konkurenci a její další úspěch bude záviset i na tom, zda dokáže vývoj AI agentů dotáhnout do praxe dříve než ostatní.Výzvy subjektivních úkolů a další vývojDnes dostupní AI agenti nejlépe fungují v oblastech, které mají jasné cíle a zpětnou vazbu – například v kódování. OpenAI Codex pomáhá softwarovým inženýrům automatizovat jednoduché úkoly. Obdobně modely společnosti Anthropic se staly populární díky využití v nástrojích jako Cursor nebo Claude Code.Obtížnější je však nasazení agentů do méně strukturovaných oblastí, jako je online nakupování nebo vyhledávání parkování, kde selhávají kvůli nejednoznačnosti zadání. Výzkumníci se proto nyní snaží zlepšit tréninkové metody pro subjektivní úkoly, které nejsou snadno ověřitelné.Jednou z cest je rozdělení jednoho úkolu mezi více agentů, kteří navrhnou různé postupy a následně kolektivně vyhodnotí nejlepší řešení. Tento přístup již OpenAI otestovala při vývoji svého modelu IMO, který si připsal úspěch v matematických soutěžích. Modely fungující tímto způsobem aktuálně zkoumají také Google, xAI i další hráči.Další klíčový směr vývoje je snaha o intuitivnější ovládání agentů. Cílem OpenAI je vytvořit systémy, které automaticky pochopí, jaký úkol má být vykonán, kdy a s jakými nástroji, bez nutnosti detailního zadávání pokynů. Takový agent by uživatelům umožnil zvládat komplexní digitální úkoly bez technického know-how – od rezervace dovolené po automatizaci obchodních procesů.Budoucnost AI agentů tak není jen otázkou technologií, ale i přístupnosti, efektivity a důvěry. OpenAI chce s blížícím se uvedením modelu GPT-5 potvrdit svou vedoucí pozici a nabídnout nástroje, které budou nejen výkonné, ale i prakticky použitelné. O tom, kdo ovládne nový trh AI agentů, se ale rozhodne až v příštích měsících – a vítěz může být jen jeden.