Nyní Demis Hassabis, spoluzakladatel a generální ředitel DeepMind, říká, že jeho inženýři využívají techniky AlphaGo k vytvoření systému umělé inteligence nazvaného Gemini, který bude schopnější než systém ChatGPT společnosti OpenAI.
Systém Gemini společnosti DeepMind, který je stále ve vývoji, je rozsáhlý jazykový model, který pracuje s textem a má podobnou povahu jako GPT-4, který pohání ChatGPT. Hassabis však říká, že jeho tým bude tuto technologii kombinovat s technikami používanými v AlphaGo, přičemž cílem je poskytnout systému nové schopnosti, jako je plánování nebo schopnost řešit problémy.
„Na vysoké úrovni si můžete Gemini představit jako kombinaci některých silných stránek systémů typu AlphaGo s úžasnými jazykovými schopnostmi velkých modelů,“ říká Hassabis. „Máme také několik nových inovací, které budou velmi zajímavé.“ Gemini byl poprvé naznačen na vývojářské konferenci společnosti Google minulý měsíc, kdy společnost oznámila řadu nových projektů umělé inteligence.
AlphaGo byl založen na technice, kterou společnost DeepMind zavedla a která se nazývá posilovací učení, při němž se software učí řešit náročné problémy, které vyžadují volbu, jaké akce provést, jako je tomu například ve hře Go nebo ve videohrách, tím, že provádí opakované pokusy a dostává zpětnou vazbu o svém výkonu. K prozkoumání a zapamatování si možných tahů na šachovnici použil také metodu zvanou stromové vyhledávání. Další velký skok pro jazykové modely může spočívat v tom, že budou plnit více úkolů na internetu a na počítačích.
Gemini je stále ve vývoji, což je proces, který potrvá řadu měsíců, říká Hassabis. Může stát desítky nebo stovky milionů dolarů. Sam Altman, generální ředitel OpenAI, v dubnu uvedl, že vytvoření GPT-4 stálo více než 100 milionů dolarů.
Až bude Gemini dokončen, mohl by hrát významnou roli v reakci společnosti Google na konkurenční hrozbu, kterou představuje ChatGPT a další technologie generativní umělé inteligence. Vyhledávací společnost byla průkopníkem mnoha technik, které umožnily nedávný příval nových nápadů v oblasti umělé inteligence, ale rozhodla se vyvíjet a nasazovat produkty na jejich základě opatrně.
Od debutu ChatGPT Google přispěchal s vlastním chatbotem Bardem a generativní AI nasadil do svého vyhledávače a mnoha dalších produktů. Aby společnost dodala výzkumu AI šťávu, spojila v dubnu Hassabisovu jednotku DeepMind s primární laboratoří Google pro umělou inteligenci Brain a vytvořila Google DeepMind. Podle Hassabise se v novém týmu spojí dva výkonné týmy, které byly základem nedávného pokroku v oblasti AI. „Když se podíváte na to, kde se v oblasti AI nacházíme, řekl bych, že 80 nebo 90 procent inovací pochází z jedné nebo druhé,“ říká Hassabis. „Existují geniální věci, které obě organizace v posledním desetiletí udělaly.“
Hassabis má zkušenosti s navigací ve zlatých horečkách AI, které zmítají technologickými giganty – i když naposledy sám vyvolal šílenství.
V roce 2014 společnost Google koupila DeepMind poté, co prokázala pozoruhodné výsledky softwaru, který využíval posilování učení ke zvládnutí jednoduchých videoher. Během několika následujících let DeepMind ukázal, jak tato technika zvládá věci, které se dříve zdály být jedinečně lidské – často s nadlidskou zručností. Když AlphaGo v roce 2016 porazil šampiona ve hře Go Lee Sedola, mnoho odborníků na umělou inteligenci to ohromilo, protože se domnívali, že bude trvat desítky let, než se stroje zdokonalí v tak složité hře.
Nové myšlení
Trénování rozsáhlého jazykového modelu, jako je GPT-4 společnosti OpenAI, zahrnuje vkládání obrovského množství kurátorských textů z knih, webových stránek a dalších zdrojů do softwaru pro strojové učení známého jako transformátor. Ten využívá vzorů v těchto tréninkových datech k tomu, aby se zdokonalil v předpovídání písmen a slov, která by měla následovat po části textu, což je jednoduchý mechanismus, který se ukazuje jako nápadně výkonný při zodpovídání otázek a generování textu nebo kódu.
Důležitým dalším krokem při tvorbě ChatGPT a podobně schopných jazykových modelů je využití posilovacího učení založeného na zpětné vazbě od lidí na odpovědi modelu umělé inteligence, aby se jeho výkon zjemnil. Hluboké zkušenosti společnosti DeepMind s posilováním učení by mohly jejím výzkumníkům umožnit poskytnout Gemini nové schopnosti.
Hassabis a jeho tým by se také mohli pokusit vylepšit technologii velkých jazykových modelů o nápady z jiných oblastí umělé inteligence. Výzkumníci DeepMind pracují v různých oblastech, od robotiky po neurovědy, a na začátku tohoto týdne společnost předvedla algoritmus schopný naučit se provádět manipulační úkoly s celou řadou různých robotických paží.
Všeobecně se očekává, že učení se na základě fyzických zkušeností se světem, jak to dělají lidé a zvířata, bude důležité pro zvýšení schopností umělé inteligence. Skutečnost, že se jazykové modely učí o světě nepřímo, prostřednictvím textu, považují někteří odborníci na umělou inteligenci za hlavní omezení.
Jak moc byste se měli obávat?
Hassabis říká, že nikdo neví jistě, zda se umělá inteligence stane velkým nebezpečím. Je si však jistý, že pokud bude pokrok pokračovat současným tempem, nezbývá mnoho času na vývoj ochranných opatření. „Vidím druhy věcí, které do řady Gemini přímo zabudováváme, a nemáme důvod se domnívat, že nebudou fungovat,“ říká.
Chcete využít této příležitosti?
Zanechte svůj telefon a email a budete kontaktováni licencovanými odborníky