Čínští technologičtí giganti přesouvají trénink AI do zahraničí
Přední čínské technologické společnosti začaly ve velkém trénovat své modely umělé inteligence v zahraničí, aby si zachovaly přístup k čipům Nvidia (NVDA) a zároveň formálně neporušovaly americká vývozní omezení.
Alibaba (BABA) a ByteDance trénují LLM v jihovýchodní Asii kvůli čipům Nvidia (NVDA)
Firmy využívají pronájem cizích datacenter, aby neporušily exportní restrikce
DeepSeek a Huawei budují domácí AI čipovou a výpočetní infrastrukturu v Číně
Zákaz přesunu citlivých dat brzdí úplný odchod AI tréninku z Číny
Mezi nejvýznamnější hráče patří zejména Alibaba (BABA) a ByteDance, které své nejnovější velké jazykové modely (LLM) trénují v datových centrech v jihovýchodní Asii, především v Singapuru a Malajsii. Tento posun zrychlil po dubnovém rozhodnutí americké administrativy Donalda Trumpa dále omezit prodej čipů H20, speciálně navržených pro čínský trh, což donutilo čínské firmy hledat cesty, jak se k potřebnému výpočetnímu výkonu dostat mimo domácí území.
Jihovýchodní Asie jako pomyslný únikový východ pro čínskou AI
Datová centra v Singapuru a Malajsii zažívají boom právě díky rostoucí čínské poptávce po výpočetním výkonu pro trénink LLM. Tato centra jsou vybavena špičkovými akcelerátory Nvidia, podobnými těm, které používají i američtí technologičtí giganti k trénování vlastních modelů. Podle lidí obeznámených se situací čínské společnosti obvykle uzavírají nájemní smlouvy na využívání těchto zahraničních datových center, která vlastní a provozují nečínské subjekty. Právě tento model „pronájmu cizí infrastruktury“ jim umožňuje zůstat v souladu s americkými vývozními pravidly, protože formálně nekupují zakázaný hardware přímo pro čínské datové parky.
Důležitou roli v tomto vývoji sehrálo i zrušení tzv. „difúzního pravidla“, které v éře prezidenta Joea Bidena mělo omezit možnost obcházení exportních restrikcí přes třetí země. Donald Trump toto pravidlo v letošním roce zrušil, čímž otevřel prostor pro využívání zahraničních datových center jako legálního kanálu k čipům Nvidia pro čínské firmy. Výsledkem je stálý nárůst objemu tréninku prováděného mimo Čínu, protože firmy hledají kombinaci maximálního výkonu, dostupnosti čipů a regulatorní „bezpečné zóny“.
Zdroj: Shutterstock
Qwen, Doubao a výjimka jménem DeepSeek
Za poslední rok se modely Qwen od Alibaby a Doubao od ByteDance zařadily mezi nejvýkonnější velké jazykové modely na světě, přičemž Qwen je navíc široce využíván vývojáři mimo Čínu díky tomu, že je nabízen jako otevřený, volně dostupný model. Právě tyto modely patří mezi hlavní „zákazníky“ výpočetních kapacit v jihovýchodní Asii, kde běží jejich trénink na clusterech vybavených moderními GPU Nvidia.
Výjimku z trendu přesouvání tréninku do zahraničí představuje společnost DeepSeek, která své vysoce kvalitní a cenově dostupné modely AI trénuje podle dostupných informací převážně na domácím trhu. Firmě se ještě před zpřísněním amerických exportních zákazů podařilo vybudovat rozsáhlý cluster čipů Nvidia v Číně, což jí dává větší míru nezávislosti na zahraničních datových centrech. Zároveň úzce spolupracuje s domácími výrobci čipů v čele s Huawei, s cílem optimalizovat a vyvíjet novou generaci čínských AI akcelerátorů. Huawei má podle zdrojů tým inženýrů přímo v centrále DeepSeek v Chang-čou a považuje toto partnerství za strategický nástroj pro rozvoj domácí polovodičové základny i softwarových systémů pro výcvik AI v celé zemi.
Trénink vs. odvozování a globální expanze čínských cloudů
Výcvik velkých jazykových modelů je extrémně náročný na výpočetní výkon a vyžaduje zpracování obrovských objemů dat, což vede většinu čínských skupin k tomu, že pro tuto fázi stále upřednostňují nejpokročilejší produkty Nvidia. Současně se však tyto firmy stále častěji obracejí k místně vyráběným čínským čipům pro takzvanou „inferenci“, tedy fázi, kdy již natrénované modely reagují na dotazy uživatelů. Inference tvoří rostoucí část celkové AI zátěže a představuje vhodnější prostor pro nasazení domácích akcelerátorů, které jsou méně závislé na nejvýkonnějších západních GPU, ale dovolují snížit náklady a politickou závislost.
Kromě samotného tréninku využívají čínské technologické firmy datová centra v jihovýchodní Asii také pro obsluhu svých zahraničních zákazníků, protože Alibaba a ByteDance usilují o zvýšení svého podílu na globálním trhu cloud computingu. Současně rozšiřují přístup k datovým centrům v dalších regionech, například na Blízkém východě, kde poptávka po AI službách rychle roste. Jedno z důležitých omezení však zůstává: čínské zákony neumožňují volný přesun citlivých soukromých dat mimo území země. Pokud tedy potřebuje firma přizpůsobit model AI na základě specifických dat od lokálního klienta v Číně, musí příslušné tréninkové či doladovací procesy probíhat na domácí infrastruktuře.
Na žádosti o komentář k této praxi nereagovaly ani Alibaba, ByteDance, DeepSeek a Huawei, zatímco Nvidia se k celé věci odmítla vyjádřit. I bez jejich oficiálních reakcí ale současný vývoj jasně ukazuje, že boj o špičkové AI čipy a kontrolu nad tím, kdo s nimi může trénovat nejvýkonnější modely, se stále více přesouvá do šedé zóny mezi formálním dodržováním pravidel a jejich praktickým obcházením prostřednictvím zahraniční infrastruktury.
Mezi nejvýznamnější hráče patří zejména Alibaba a ByteDance, které své nejnovější velké jazykové modely trénují v datových centrech v jihovýchodní Asii, především v Singapuru a Malajsii. Tento posun zrychlil po dubnovém rozhodnutí americké administrativy Donalda Trumpa dále omezit prodej čipů H20, speciálně navržených pro čínský trh, což donutilo čínské firmy hledat cesty, jak se k potřebnému výpočetnímu výkonu dostat mimo domácí území.Jihovýchodní Asie jako pomyslný únikový východ pro čínskou AIDatová centra v Singapuru a Malajsii zažívají boom právě díky rostoucí čínské poptávce po výpočetním výkonu pro trénink LLM. Tato centra jsou vybavena špičkovými akcelerátory Nvidia, podobnými těm, které používají i američtí technologičtí giganti k trénování vlastních modelů. Podle lidí obeznámených se situací čínské společnosti obvykle uzavírají nájemní smlouvy na využívání těchto zahraničních datových center, která vlastní a provozují nečínské subjekty. Právě tento model „pronájmu cizí infrastruktury“ jim umožňuje zůstat v souladu s americkými vývozními pravidly, protože formálně nekupují zakázaný hardware přímo pro čínské datové parky.Důležitou roli v tomto vývoji sehrálo i zrušení tzv. „difúzního pravidla“, které v éře prezidenta Joea Bidena mělo omezit možnost obcházení exportních restrikcí přes třetí země. Donald Trump toto pravidlo v letošním roce zrušil, čímž otevřel prostor pro využívání zahraničních datových center jako legálního kanálu k čipům Nvidia pro čínské firmy. Výsledkem je stálý nárůst objemu tréninku prováděného mimo Čínu, protože firmy hledají kombinaci maximálního výkonu, dostupnosti čipů a regulatorní „bezpečné zóny“.Qwen, Doubao a výjimka jménem DeepSeekZa poslední rok se modely Qwen od Alibaby a Doubao od ByteDance zařadily mezi nejvýkonnější velké jazykové modely na světě, přičemž Qwen je navíc široce využíván vývojáři mimo Čínu díky tomu, že je nabízen jako otevřený, volně dostupný model. Právě tyto modely patří mezi hlavní „zákazníky“ výpočetních kapacit v jihovýchodní Asii, kde běží jejich trénink na clusterech vybavených moderními GPU Nvidia.Výjimku z trendu přesouvání tréninku do zahraničí představuje společnost DeepSeek, která své vysoce kvalitní a cenově dostupné modely AI trénuje podle dostupných informací převážně na domácím trhu. Firmě se ještě před zpřísněním amerických exportních zákazů podařilo vybudovat rozsáhlý cluster čipů Nvidia v Číně, což jí dává větší míru nezávislosti na zahraničních datových centrech. Zároveň úzce spolupracuje s domácími výrobci čipů v čele s Huawei, s cílem optimalizovat a vyvíjet novou generaci čínských AI akcelerátorů. Huawei má podle zdrojů tým inženýrů přímo v centrále DeepSeek v Chang-čou a považuje toto partnerství za strategický nástroj pro rozvoj domácí polovodičové základny i softwarových systémů pro výcvik AI v celé zemi.Trénink vs. odvozování a globální expanze čínských cloudůVýcvik velkých jazykových modelů je extrémně náročný na výpočetní výkon a vyžaduje zpracování obrovských objemů dat, což vede většinu čínských skupin k tomu, že pro tuto fázi stále upřednostňují nejpokročilejší produkty Nvidia. Současně se však tyto firmy stále častěji obracejí k místně vyráběným čínským čipům pro takzvanou „inferenci“, tedy fázi, kdy již natrénované modely reagují na dotazy uživatelů. Inference tvoří rostoucí část celkové AI zátěže a představuje vhodnější prostor pro nasazení domácích akcelerátorů, které jsou méně závislé na nejvýkonnějších západních GPU, ale dovolují snížit náklady a politickou závislost.Chcete využít této příležitosti?Kromě samotného tréninku využívají čínské technologické firmy datová centra v jihovýchodní Asii také pro obsluhu svých zahraničních zákazníků, protože Alibaba a ByteDance usilují o zvýšení svého podílu na globálním trhu cloud computingu. Současně rozšiřují přístup k datovým centrům v dalších regionech, například na Blízkém východě, kde poptávka po AI službách rychle roste. Jedno z důležitých omezení však zůstává: čínské zákony neumožňují volný přesun citlivých soukromých dat mimo území země. Pokud tedy potřebuje firma přizpůsobit model AI na základě specifických dat od lokálního klienta v Číně, musí příslušné tréninkové či doladovací procesy probíhat na domácí infrastruktuře.Na žádosti o komentář k této praxi nereagovaly ani Alibaba, ByteDance, DeepSeek a Huawei, zatímco Nvidia se k celé věci odmítla vyjádřit. I bez jejich oficiálních reakcí ale současný vývoj jasně ukazuje, že boj o špičkové AI čipy a kontrolu nad tím, kdo s nimi může trénovat nejvýkonnější modely, se stále více přesouvá do šedé zóny mezi formálním dodržováním pravidel a jejich praktickým obcházením prostřednictvím zahraniční infrastruktury.