Startup Inception získal 50 milionů na vývoj difúzních AI modelů
Ve světě umělé inteligence, kde investice proudí rekordním tempem, se stále častěji objevují nové nezávislé projekty vedené výzkumníky, kteří se rozhodli opustit velké technologické laboratoře a rozvíjet vlastní nápady.
Startup Inception získal 50 milionů dolarů na vývoj difúzních modelů pro AI
Investory jsou Menlo Ventures, Microsoft (MSFT), Nvidia (NVDA) a další významné fondy
Difúzní modely umožňují paralelní zpracování s nižší latencí a vyšší efektivitou
Jedním z nich je Inception, mladý startup zaměřený na vývoj difúzních modelů umělé inteligence, který nyní získal 50 milionů dolarů v rámci počátečního investičního kola.
Financování vedla společnost Menlo Ventures, přičemž se připojily i další významné fondy – Mayfield, Innovation Endeavors, fond M12 společnosti Microsoft (MSFT), Snowflake Ventures, Databricks Investment a NVentures, investiční divize Nvidia (NVDA). Mezi soukromými investory se objevila také dvě známá jména ze světa AI – Andrew Ng a Andrej Karpathy.
Zakladatelem a vedoucím projektu je profesor Stanfordské univerzity Stefano Ermon, jehož výzkum se dlouhodobě zaměřuje na difúzní modely, tedy architekturu, která generuje výstupy prostřednictvím postupného zdokonalování, nikoliv po jednotlivých slovech. Tyto modely dnes pohánějí vizuální systémy umělé inteligence jako Stable Diffusion, Midjourney nebo Sora, přičemž Ermon se na jejich principu podílel už dávno předtím, než se rozmach AI stal celosvětovým fenoménem.
Zdroj: Shutterstock
Nový model Mercury a průlom v rychlosti
Společnost Inception spolu s oznámením investice představila i nejnovější verzi svého modelu Mercury, který je určený pro vývoj softwaru. Tento model je již integrován do několika vývojářských nástrojů, například ProxyAI, Buildglare nebo Kilo Code.
Podle Ermona mají právě difúzní modely potenciál zásadně zrychlit generování kódu i textu, protože fungují na jiném principu než tradiční autoregresní modely, jaké využívají například systémy typu GPT-5 nebo Gemini.
„Tyto difúzní LLM jsou mnohem rychlejší a efektivnější než to, co dnes vyvíjejí ostatní,“ říká Ermon. „Je to úplně jiný přístup, který otevírá prostor pro další vlnu inovací.“
Zatímco autoregresní modely vytvářejí výstup slovo po slově, difúzní modely zpracovávají celý výstup iterativně, tedy postupně upravují a zpřesňují výsledek, dokud se co nejvíce nepřiblíží cíli. Tento přístup, který se osvědčil při generování obrazů, se nyní testuje i na textových a programátorských úlohách.
Aby bylo možné pochopit význam inovace, je třeba se podívat na rozdíl mezi oběma přístupy. Autoregresní modely – typicky používané v jazykových systémech – předpovídají každé další slovo podle kontextu předchozích slov. Tento postup je sekvenční, a tedy i časově náročný, protože každá další část textu závisí na té předchozí.
Difúzní modely však fungují odlišně. Namísto sekvenčního generování textu přistupují k úloze holisticky – pracují s celkovou strukturou výstupu a během několika kroků ji postupně zpřesňují. Výsledkem je rychlejší, flexibilnější a často i kvalitnější generování složitých struktur, jako je například zdrojový kód nebo dlouhý dokument.
Ermon vysvětluje, že právě tento přístup umožňuje jeho týmu dosahovat lepší rovnováhy mezi latencí(rychlostí odezvy) a výpočetními náklady. „Naše modely jsou optimalizované pro paralelní výpočty. Dokážeme zpracovávat více než 1 000 tokenů za sekundu, což je výrazně nad možnosti klasických autoregresních technologií,“ uvádí.
Difúzní modely tak podle něj představují nový směr, který dokáže lépe využít moderní hardwarovou infrastrukturu. Protože umí provádět více operací zároveň, mohou být efektivnější a méně náročné na výpočetní výkon, což je klíčové v době, kdy poptávka po GPU serverech prudce roste.
Nová kapitola ve vývoji umělé inteligence
Zájem investorů o startupy, jako je Inception, ukazuje, že trh s umělou inteligencí se posouvá od experimentů k průmyslové praxi. Inception se nesnaží konkurovat velkým jazykovým modelům, ale zaměřuje se na oblast, kde může být difúzní přístup výhodnější – tedy na práci s rozsáhlými kódovými základnami a úlohami vyžadujícími vysokou přesnost a nízkou latenci.
Tento přístup by mohl přinést zásadní posun ve způsobu, jakým vývojáři pracují s automatizací kódu. Difúzní modely totiž díky paralelnímu zpracování umožňují rychlejší generování a ladění programů, což by mohlo zjednodušit práci vývojářů po celém světě.
Podle Ermona jde o přirozený vývoj: „Když jsme začali s výzkumem difúzních metod, většina lidí se soustředila na obrazy. Dnes vidíme, že ty samé principy mohou zásadně zlepšit i textové a kódové aplikace.“
Vývoj Inception tak symbolizuje novou etapu v oblasti generativní AI – éru, kdy se jednotlivé modely specializují na konkrétní oblasti a optimalizují se nejen pro přesnost, ale i pro rychlost a efektivitu.
Difúzní přístup otevírá dveře inovacím i v tom, jak se AI učí a reaguje. Namísto pevně daného postupu krok za krokem dokáže adaptivně pracovat s celým kontextem, což může být užitečné nejen pro programování, ale i pro další oblasti, jako je vědecký výzkum, analýza dat či generování dokumentace.
Startup Inception se tak stává jedním z nejzajímavějších hráčů v nastupující vlně specializovaných AI projektů. Díky podpoře investorů a zapojení předních odborníků z univerzit i technologických gigantů má potenciál stát se jedním z hlavních průkopníků nové generace difúzních jazykových modelů.
Zdroj: Shutterstock
Jedním z nich je Inception, mladý startup zaměřený na vývoj difúzních modelů umělé inteligence, který nyní získal 50 milionů dolarů v rámci počátečního investičního kola.Financování vedla společnost Menlo Ventures, přičemž se připojily i další významné fondy – Mayfield, Innovation Endeavors, fond M12 společnosti Microsoft , Snowflake Ventures, Databricks Investment a NVentures, investiční divize Nvidia . Mezi soukromými investory se objevila také dvě známá jména ze světa AI – Andrew Ng a Andrej Karpathy.Zakladatelem a vedoucím projektu je profesor Stanfordské univerzity Stefano Ermon, jehož výzkum se dlouhodobě zaměřuje na difúzní modely, tedy architekturu, která generuje výstupy prostřednictvím postupného zdokonalování, nikoliv po jednotlivých slovech. Tyto modely dnes pohánějí vizuální systémy umělé inteligence jako Stable Diffusion, Midjourney nebo Sora, přičemž Ermon se na jejich principu podílel už dávno předtím, než se rozmach AI stal celosvětovým fenoménem.Nový model Mercury a průlom v rychlostiSpolečnost Inception spolu s oznámením investice představila i nejnovější verzi svého modelu Mercury, který je určený pro vývoj softwaru. Tento model je již integrován do několika vývojářských nástrojů, například ProxyAI, Buildglare nebo Kilo Code.Podle Ermona mají právě difúzní modely potenciál zásadně zrychlit generování kódu i textu, protože fungují na jiném principu než tradiční autoregresní modely, jaké využívají například systémy typu GPT-5 nebo Gemini.„Tyto difúzní LLM jsou mnohem rychlejší a efektivnější než to, co dnes vyvíjejí ostatní,“ říká Ermon. „Je to úplně jiný přístup, který otevírá prostor pro další vlnu inovací.“Zatímco autoregresní modely vytvářejí výstup slovo po slově, difúzní modely zpracovávají celý výstup iterativně, tedy postupně upravují a zpřesňují výsledek, dokud se co nejvíce nepřiblíží cíli. Tento přístup, který se osvědčil při generování obrazů, se nyní testuje i na textových a programátorských úlohách.Chcete využít této příležitosti?Rozdíl mezi difúzními a autoregresními modelyAby bylo možné pochopit význam inovace, je třeba se podívat na rozdíl mezi oběma přístupy. Autoregresní modely – typicky používané v jazykových systémech – předpovídají každé další slovo podle kontextu předchozích slov. Tento postup je sekvenční, a tedy i časově náročný, protože každá další část textu závisí na té předchozí.Difúzní modely však fungují odlišně. Namísto sekvenčního generování textu přistupují k úloze holisticky – pracují s celkovou strukturou výstupu a během několika kroků ji postupně zpřesňují. Výsledkem je rychlejší, flexibilnější a často i kvalitnější generování složitých struktur, jako je například zdrojový kód nebo dlouhý dokument.Ermon vysvětluje, že právě tento přístup umožňuje jeho týmu dosahovat lepší rovnováhy mezi latencí a výpočetními náklady. „Naše modely jsou optimalizované pro paralelní výpočty. Dokážeme zpracovávat více než 1 000 tokenů za sekundu, což je výrazně nad možnosti klasických autoregresních technologií,“ uvádí.Difúzní modely tak podle něj představují nový směr, který dokáže lépe využít moderní hardwarovou infrastrukturu. Protože umí provádět více operací zároveň, mohou být efektivnější a méně náročné na výpočetní výkon, což je klíčové v době, kdy poptávka po GPU serverech prudce roste.Nová kapitola ve vývoji umělé inteligenceZájem investorů o startupy, jako je Inception, ukazuje, že trh s umělou inteligencí se posouvá od experimentů k průmyslové praxi. Inception se nesnaží konkurovat velkým jazykovým modelům, ale zaměřuje se na oblast, kde může být difúzní přístup výhodnější – tedy na práci s rozsáhlými kódovými základnami a úlohami vyžadujícími vysokou přesnost a nízkou latenci.Tento přístup by mohl přinést zásadní posun ve způsobu, jakým vývojáři pracují s automatizací kódu. Difúzní modely totiž díky paralelnímu zpracování umožňují rychlejší generování a ladění programů, což by mohlo zjednodušit práci vývojářů po celém světě.Podle Ermona jde o přirozený vývoj: „Když jsme začali s výzkumem difúzních metod, většina lidí se soustředila na obrazy. Dnes vidíme, že ty samé principy mohou zásadně zlepšit i textové a kódové aplikace.“Vývoj Inception tak symbolizuje novou etapu v oblasti generativní AI – éru, kdy se jednotlivé modely specializují na konkrétní oblasti a optimalizují se nejen pro přesnost, ale i pro rychlost a efektivitu.Difúzní přístup otevírá dveře inovacím i v tom, jak se AI učí a reaguje. Namísto pevně daného postupu krok za krokem dokáže adaptivně pracovat s celým kontextem, což může být užitečné nejen pro programování, ale i pro další oblasti, jako je vědecký výzkum, analýza dat či generování dokumentace.Startup Inception se tak stává jedním z nejzajímavějších hráčů v nastupující vlně specializovaných AI projektů. Díky podpoře investorů a zapojení předních odborníků z univerzit i technologických gigantů má potenciál stát se jedním z hlavních průkopníků nové generace difúzních jazykových modelů.