Klíčové body
- ChatGPT nyní podporuje generování a úpravu obrázků díky modelu GPT-4o, který zvyšuje přesnost a detailnost obrazů
- Nová funkce je k dispozici pro předplatitele plánu Pro a brzy bude dostupná i pro širší uživatelskou základnu
- Tato nová schopnost konkurence v generování obrázků, jako je Google Gemini 2.0, přichází s většími ochrannými mechanismy
Tato funkce je dostupná pro předplatitele plánu Pro a brzy i pro širší uživatelskou základnu.
Během úterního livestreamu oznámil generální ředitel společnosti OpenAI Sam Altman významnou aktualizaci v oblasti generování obrázků v aplikaci ChatGPT, která byla poprvé představena před více než rokem. Tato aktualizace přináší novou funkci, díky které ChatGPT nyní využívá model GPT-4o pro nativní generování a úpravy obrázků a fotografií. Tento model byl doposud známý především pro generování a úpravy textu, ale až dosud se nevyužíval k práci s obrázky. Tento krok je tedy výrazným posunem v možnostech ChatGPT, což by mělo uživatelům umožnit ještě širší využití generativní umělé inteligence.
Nové možnosti generování obrázků
S příchodem GPT-4o je nyní ChatGPT schopný nejen generovat obrázky, ale také upravovat již existující obrázky. Tento model je od svého předchůdce, DALL-E 3, o něco pomalejší, ale vytváří přesnější a detailnější obrazy. Podle vyjádření společnosti OpenAI je GPT-4o schopno nejen tvořit nové obrázky, ale i transformovat existující. Uživatelé mohou požádat o úpravy obrázků, včetně vykreslování nových detailů, například objektů v pozadí nebo popředí. Tento přístup umožňuje širší kreativní využití, což je pro mnohé uživatele velmi atraktivní.
Další zajímavou funkcí, kterou GPT-4o nabízí, je úprava obrázků s lidmi. To zahrnuje změnu vzhledu postav nebo prostředí na obrázku, čímž se otevírají nové možnosti pro umělce, designéry a další profesionály, kteří potřebují upravit vizuální obsah.

Dostupnost a rozšíření funkce
Aktuálně je tato funkce dostupná pro předplatitele plánu Pro společnosti OpenAI za 200 dolarů měsíčně. V současnosti je možné tuto novou schopnost využívat v aplikacích ChatGPT a Sora, což je produkt zaměřený na generování videí s umělou inteligencí. OpenAI uvedla, že v příštích týdnech plánuje tuto funkci rozšířit i na uživatele služby Plus a na bezplatné uživatele ChatGPT. Tato expanze umožní širšímu spektru uživatelů přístup k těmto pokročilým funkcím generování obrázků.
Kromě toho OpenAI plánuje umožnit tuto funkci i vývojářům, kteří budou moci tuto technologii integrovat do svých vlastních aplikací pomocí API. To znamená, že generování a úprava obrázků se brzy stane součástí mnoha dalších nástrojů a produktů.
Při vývoji nové funkce generování obrázků využila OpenAI veřejně dostupná data a partnerství s dalšími společnostmi, jako je Shutterstock, pro trénování modelu GPT-4o. Tato data jsou však zdrojem konkurenceschopnosti, a proto OpenAI nezveřejňuje podrobnosti o tom, jaká konkrétní data byla použita.
V souvislosti s používáním těchto dat se vyskytují i obavy týkající se duševního vlastnictví. Aby se předešlo právním problémům, OpenAI ujišťuje, že respektuje práva umělců a má nastavené zásady, které zabraňují generování obrázků, které by přímo napodobovaly díla jakýchkoli žijících umělců. K tomu OpenAI poskytuje formulář pro odhlášení, který umožňuje tvůrcům požádat o odstranění jejich děl z tréninkových datových sad, pokud si to přejí. Tato opatření pomáhají zajišťovat, že nová funkce nebude zneužívána k porušování autorských práv.
Konkurenční prostředí a budoucí vývoj
Tento krok OpenAI přichází krátce po experimentální implementaci nativního generování obrázků v produktu Gemini 2.0 Flash od společnosti Google. Tento produkt získal velkou pozornost na sociálních sítích, ale narazil na problémy s ochranou autorských práv. Gemini 2.0 Flash totiž neobsahoval dostatečné ochranné mechanismy, což umožnilo uživatelům snadno odstraňovat vodoznaky a vytvářet obrázky chráněné autorskými právy. Tento incident zvýšil tlak na vývojáře, aby se zaměřili na etické využívání generativní umělé inteligence, zejména v oblasti vizuálního obsahu.
Zatímco GPT-4o nabízí výhody ve formě přesnějších a detailnějších obrázků, jeho výkonnostní rozdíl oproti předchůdci, DALL-E 3, znamená, že pro některé uživatele bude stále výhodnější využívat starší model. Nicméně nová funkce generování obrázků v ChatGPT představuje velký pokrok v oblasti generativní umělé inteligence a může se stát nástrojem pro širokou veřejnost i profesionály ve všech oblastech, které vyžadují tvorbu vizuálního obsahu.
Budoucnost generování obrázků v ChatGPT
OpenAI se zaměřuje na další rozšiřování této technologie, která bude mít významný vliv na oblast kreativního průmyslu. Jakmile bude generování obrázků zpřístupněno širší veřejnosti, očekává se, že se výrazně změní způsob, jakým budou lidé vytvářet a upravovat vizuální obsah. Tato technologie by mohla mít dalekosáhlý dopad na marketing, design a další průmyslové odvětví, kde je vizuální komunikace klíčová. Kromě toho se očekává, že OpenAI bude pokračovat v inovacích, které posunou hranice toho, co je možné s umělou inteligencí v oblasti generování obrázků.
V konečném důsledku tato funkce představuje zásadní krok vpřed ve vývoji generativní umělé inteligence a její aplikaci na každodenní použití, což bude mít široké uplatnění ve všech oblastech, kde vizuální tvorba hraje klíčovou roli.

Chcete využít této příležitosti?
Zanechte svůj telefon a email a budete kontaktováni licencovanými odborníky