Auto-GPT v podstatě využívá všestrannost nejnovějších modelů umělé inteligence OpenAI k interakci se softwarem a službami online, což mu umožňuje „autonomně“ provádět úkoly jako X a Y. Jak se však učíme s velkými jazykovými modely, zdá se, že tato schopnost je široká jako oceán, ale hluboká jako louže.
Auto-GPT – kterou jste mohli nedávno vidět na sociálních sítích – je open source aplikace vytvořená herním vývojářem Toranem Brucem Richardsem, která využívá modely OpenAI pro generování textu, především GPT-3.5 a GPT-4, k „autonomnímu“ jednání.
V této autonomii není žádné kouzlo. Auto-GPT jednoduše zpracovává následné dotazy na počáteční výzvu modelů OpenAI, a to jak dotazy, tak odpovědi, dokud není úkol dokončen.
Auto-GPT je v podstatě GPT-3.5 a GPT-4 spárovaný s doprovodným botem, který dává GPT-3.5 a GPT-4 pokyny, co mají dělat. Uživatel řekne programu Auto-GPT, jaký je jeho cíl, a bot následně použije GPT-3.5 a GPT-4 a několik programů k provedení všech kroků potřebných k dosažení cíle, který si uživatel stanovil.

To, co dělá Auto-GPT přiměřeně schopným, je jeho schopnost spolupracovat s aplikacemi, softwarem a službami online i místními, jako jsou webové prohlížeče a textové procesory. Pokud například zadáte výzvu typu „pomozte mi rozvíjet můj květinový obchod“, Auto-GPT dokáže vytvořit do jisté míry věrohodnou reklamní strategii a vytvořit základní webové stránky.
Jak vysvětlil Joe Koen, softwarový vývojář, který s Auto-GPT experimentoval, prostřednictvím e-mailu pro TechCrunch, Auto-GPT v podstatě automatizuje vícekrokové projekty, které by vyžadovaly zpětné výzvy s modelem AI orientovaným na chatboty, jako je například ChatGPT od OpenAI.
„Auto-GPT definuje agenta, který komunikuje s API OpenAI,“ řekl Koen. „Cílem tohoto agenta je provádět různé příkazy, které umělá inteligence generuje v reakci na požadavky agenta. Uživatel je vyzván k zadání vstupních údajů, aby určil roli a cíle UI předtím, než agent začne provádět příkazy.“
V terminálu uživatelé popíší jméno, roli a cíl agenta Auto-GPT a zadají až pět způsobů, jak tohoto cíle dosáhnout. Například:
- Jméno: Smartphone-GPT
- Role: Umělá inteligence navržená tak, aby našla nejlepší smartphone
- Cíl: Najděte nejlepší chytré telefony na trhu
- Cíl 1: Proveďte průzkum trhu různých chytrých telefonů na současném trhu.
- Cíl 2: Získejte pět nejlepších chytrých telefonů a uveďte jejich výhody a nevýhody.
V zákulisí se systém Auto-GPT spoléhá na funkce, jako je správa paměti pro provádění úloh, spolu s GPT-4 a GPT-3.5 pro generování textu, ukládání souborů a shrnutí.

Systém Auto-GPT lze také připojit k syntetizátorům řeči, jako je například systém ElevenLabs, takže může například „uskutečňovat“ telefonní hovory.
Nástroj Auto-GPT je veřejně dostupný na serveru GitHub, ale jeho zprovoznění vyžaduje určité nastavení a znalosti. Aby bylo možné Auto-GPT používat, musí být nainstalováno ve vývojovém prostředí, jako je Docker, a musí být zaregistrováno pomocí klíče API od OpenAI – což vyžaduje placený účet OpenAI.
Možná to stojí za to – i když to ještě není jisté. První uživatelé používají Auto-GPT k převzetí běžných úkolů, které je lepší svěřit botovi. Auto-GPT může například řešit věci, jako je ladění kódu a psaní e-mailu, nebo pokročilejší věci, jako je vytvoření obchodního plánu pro nový startup.
„Pokud Auto-GPT narazí na nějaké překážky nebo neschopnost dokončit úkol, vytvoří nové výzvy, které mu pomohou zorientovat se v situaci a určit vhodné další kroky,“ uvedl v e-mailu pro TechCrunch Adnan Masood, hlavní architekt technologické konzultační společnosti UST. „Velké jazykové modely vynikají v generování odpovědí podobných lidským, přesto se při dosahování požadovaných výsledků spoléhají na podněty a interakci s uživatelem. Naproti tomu Auto-GPT využívá pokročilé možnosti rozhraní API OpenAI, aby fungovalo nezávisle bez zásahu uživatele.“
V posledních týdnech se objevily nové aplikace, které používání automatického GPT ještě více usnadňují, například AgentGPT a GodMode, které poskytují jednoduché rozhraní, do kterého mohou uživatelé zadat, čeho chtějí dosáhnout, přímo na stránce prohlížeče. Všimněte si, že stejně jako Agent-GPT vyžadují obě aplikace k odemknutí všech svých možností klíč API od OpenAI.
Jako každý výkonný nástroj má však i Auto-GPT svá omezení a rizika
V závislosti na cíli, který nástroj poskytuje, se může Auto-GPT chovat velmi… neočekávaným způsobem. Jeden z uživatelů Redditu tvrdí, že když dostal k dispozici rozpočet 100 dolarů, který měl utratit v rámci serverové instance, vytvořil Auto-GPT stránku na wiki o kočkách, využil chybu v instanci, aby získal přístup na úrovni správce, a převzal prostředí Pythonu, ve kterém běžel – a pak se „zabil“.

K dispozici je také ChaosGPT, upravená verze Auto-GPT, která má za úkol například „zničit lidstvo“ a „nastolit globální nadvládu“. Není překvapením, že ChaosGPT se zatím nepřiblížil k vyvolání apokalypsy robotů – ale na Twitteru se o lidstvu vyjadřuje dost nelichotivě.
Pravděpodobně nebezpečnější než snaha automatického GPT „zničit lidstvo“ jsou však neočekávané problémy, které se mohou objevit v jinak zcela normálních scénářích. Protože je postaven na jazykových modelech OpenAI – modelech, které jsou jako všechny jazykové modely náchylné k nepřesnostem – může se dopustit chyb.
To není jediný problém. Po úspěšném dokončení úlohy si program Auto-GPT obvykle nepamatuje, jak ji provést pro pozdější použití, a – i když si to pamatuje – často si nezapamatuje, jak program použít. Program Auto-GPT má také potíže s efektivním rozdělením složitých úkolů na jednodušší dílčí úkoly a má problémy pochopit, jak se různé cíle překrývají.
„Auto-GPT ilustruje sílu a neznámá rizika generativní umělé inteligence,“ uvedla e-mailem Clara Shih, generální ředitelka služby Service Cloud společnosti Salesforce a nadšenkyně pro Auto-GPT. „Pro podniky je obzvláště důležité, aby při vývoji a používání technologií generativní AI, jako je Auto-GPT, zahrnovaly přístup člověka v cyklu.“
Chcete využít této příležitosti?
Zanechte svůj telefon a email a budete kontaktováni licencovanými odborníky