Klíčové body
- Amazon Nova zahrnuje čtyři textové modely a dva multimediální nástroje
- Modely jsou optimalizovány pro text, obrázky, video a multimodální úlohy
- AWS plánuje budoucí rozšíření, včetně modelů speech-to-speech a any-to-any
Tato novinka přináší čtyři modely generující text – Micro, Lite, Pro a Premier – a dva další modely pro generování obrázků a videí nazvané Nova Canvas a Nova Reel.
Modely Micro, Lite a Pro jsou již k dispozici zákazníkům AWS, zatímco model Premier bude uveden na začátku roku 2025. Generální ředitel Amazonu Andy Jassy uvedl, že tyto nové modely představují významný pokrok v oblasti umělé inteligence a jsou výsledkem intenzivního vývoje za posledních několik měsíců.
Klíčové vlastnosti textových modelů
Textové modely Nova jsou optimalizovány pro 15 jazyků, přičemž jejich hlavním zaměřením zůstává angličtina. Každý model má své specifické zaměření a výkon:

Micro: Specializuje se na textové úlohy, nabízí nejnižší latenci a je vhodný pro rychlé a jednoduché operace.
Lite: Dokáže zpracovávat text, obrázky i video a poskytuje vyvážený výkon pro různé multimodální úlohy.
Pro: Nabízí kombinaci přesnosti, rychlosti a nákladové efektivity, což jej činí vhodným pro široké spektrum aplikací.
Premier: Nejvyspělejší model určený pro komplexní úlohy, jako je analýza složitých dat a vytváření vlastních modelů.
Každý model má odlišné kontextové okno, tedy schopnost zpracovávat určitý objem dat. Micro podporuje až 128 000 tokenů
AWS uvedl, že tyto modely jsou dostupné prostřednictvím platformy AWS Bedrock, kde je lze doladit na konkrétní úlohy a zlepšit jejich efektivitu. Důraz je kladen na snadnou integraci s dalšími systémy a API, což umožňuje široké spektrum automatizovaných procesů.
Nova Canvas a Nova Reel
Modely Nova Canvas a Nova Reel rozšiřují možnosti AWS v oblasti generativních médií. Canvas umožňuje uživatelům vytvářet a upravovat obrázky na základě textových výzev, například měnit pozadí nebo barevná schémata. Reel se zaměřuje na generování videí o délce až šesti sekund. I když je jeho současné využití omezené, AWS plánuje do budoucna podporu delších videí, a to až do dvou minut.
Reel umožňuje vytvářet videa s pokročilými efekty, jako je otáčení o 360 stupňů, zoom nebo simulace pohybu kamery. Generování videa trvá přibližně tři minuty, což AWS považuje za přijatelný čas s ohledem na složitost technologie.
Oba modely zahrnují vestavěná kontrolní opatření, jako je moderace obsahu a vodoznaky, které mají zabránit zneužívání technologie k vytváření škodlivého obsahu. Tato opatření reflektují rostoucí důraz na etické a odpovědné využití umělé inteligence.
Budoucí plány s Nova
AWS již pracuje na dalších rozšířeních rodiny Nova. Mezi plánované novinky patří model „speech-to-speech“, který bude schopen interpretovat řeč, její tón, kadenci a převést ji do nové podoby s přirozeným hlasem. Tento model by měl být uveden v prvním čtvrtletí roku 2025. Dalším připravovaným projektem je model „any-to-any“, který umožní převod mezi textem, obrazem, videem a řečí v obou směrech.
Podle Jassyho by tento model mohl zásadně ovlivnit budoucnost multimodálních aplikací, od překladačů přes editory obsahu až po asistenty poháněné umělou inteligencí.
„Budete moci zadávat text, řeč, obrázky nebo video a obdržet libovolný z těchto výstupů,“ uvedl Jassy. „To je budoucnost generativních modelů.“
Otázky kolem transparentnosti
Ačkoli AWS zdůrazňuje výhody a etická opatření svých modelů, stále neposkytl detailní informace o datech použitých pro jejich trénink. Společnost uvádí, že se jedná o kombinaci vlastních a licencovaných dat, avšak podrobnosti zůstávají tajné.

Tento přístup je běžný mezi dodavateli umělé inteligence, kteří tréninková data považují za konkurenční výhodu. AWS však nabízí politiku odškodnění pro případ, že by některý z modelů neúmyslně vytvořil obsah porušující autorská práva.
Rodina multimodálních modelů Nova představuje ambiciózní krok AWS směrem k rozšíření svého portfolia generativní umělé inteligence. S dostupností modelů Micro, Lite a Pro a blížícím se uvedením Premieru a dalších technologií se AWS snaží upevnit svou pozici na trhu.
Výzvy spojené s transparentností a regulací zůstávají, ale inovace jako Nova Canvas, Nova Reel a připravované modely ukazují, že společnost se intenzivně připravuje na budoucnost generativní AI.
Chcete využít této příležitosti?
Zanechte svůj telefon a email a budete kontaktováni licencovanými odborníky