Alibaba představuje Qwen3 jako konkurenci špičkovým globálním AI modelům
Čínská technologická společnost Alibaba tento týden oficiálně představila Qwen3, nejnovější generaci svých velkých jazykových modelů (LLM), které mají podle tvrzení firmy potenciál konkurovat i těm nejlepším modelům od amerických gigantů, jako jsou OpenAI nebo Google.
Alibaba uvedla modely Qwen3 s až 235 miliardami parametrů
Modely jsou částečně otevřené a dostupné na Hugging Face a GitHub
Nové modely přicházejí navzdory tlaku USA na omezení čínské AI
Nová modelová řada zahrnuje jak husté modely, tak modely s architekturou kombinace expertů (MoE), přičemž některé z nich jsou již dostupné pod otevřenou licencí na platformách Hugging Face a GitHub. Alibaba tak pokračuje ve své snaze hrát klíčovou roli v globální AI komunitě, a to i přes sílící omezení přístupu k výkonným čipům ze strany Spojených států.
Modely Qwen3 se liší svou velikostí – od nejmenších s 0,6 miliardy parametrů až po vlajkovou loď s označením Qwen3-235B-A22B, která disponuje 235 miliardami parametrů. Tento parametr odkazuje na množství naučených vazeb mezi vstupními daty a odpověďmi modelu – čím více parametrů, tím větší je obvykle výkonnost, ale také výpočetní náročnost. Alibaba tvrdí, že některé její modely dosahují srovnatelných nebo dokonce lepších výsledků než špičkové produkty západních technologických lídrů.
Zdroj: Getty Images
Hybridní přístup a nové schopnosti modelů
Modely Qwen3 byly navrženy jako hybridní systémy, které dokážou rychle reagovat na jednoduché požadavky, ale zároveň mají schopnost „uvažovat“ o složitějších problémech, i když za cenu vyšší latence. Tento flexibilní přístup umožňuje uživatelům volit mezi rychlostí a hloubkou zpracování, což může být výhodné zejména ve firemním prostředí, kde se často pracuje s různorodými typy úloh.
Tým stojící za Qwen v blogovém příspěvku uvedl, že modely byly navrženy s důrazem na efektivní správu rozpočtu na výpočetní výkon, a uživatelé si tak mohou sami nastavit, kdy má model „uvažovat“ a kdy využít jednodušší variantu výpočtu. Některé z modelů zároveň využívají architekturu kombinace expertů (Mixture of Experts, MoE), která umožňuje rozdělit vstupní úlohy mezi menší specializované části systému. To snižuje výpočetní zátěž a zvyšuje efektivitu při zpracování dotazů.
Společnost dále uvedla, že Qwen3 podporuje 119 jazyků a byl trénován na rozsáhlém datovém souboru obsahujícím více než 36 bilionů tokenů. Tréninkové datasety zahrnovaly jak tradiční texty jako učebnice, tak i datové páry otázek a odpovědí, úryvky kódu či data vygenerovaná jinými modely. Díky této rozmanitosti se Qwen3 výrazně posunul oproti předchozí generaci Qwen2, a to jak ve výkonnosti, tak v jazykovém pokrytí.
Výsledky testování a srovnávacích benchmarků
Největší a nejvýkonnější model Qwen3 – Qwen3-235B-A22B – dosáhl výborných výsledků v několika veřejně dostupných testech. Na platformě Codeforces, zaměřené na programátorské soutěže, překonal o3-mini od OpenAI i Gemini 2.5 Pro od Google. Podobně si vedl i v matematickém benchmarku AIME a v testu BFCL, který hodnotí schopnost modelu „uvažovat“ nad komplexními problémy. Přesto však tento konkrétní model zatím není veřejně dostupný.
Z hlediska otevřeného přístupu je největším dostupným modelem Qwen3-32B, který podle výsledků od Alibaby předčil model o1 od OpenAI v několika testech, včetně LiveCodeBench, což je benchmark zaměřený na schopnosti modelu psát kód v reálném čase. Qwen3-32B si tak udržuje silnou pozici i v porovnání s proprietárními systémy.
Alibaba také upozorňuje, že modely Qwen3 vynikají v přesném následování pokynů, volání externích nástrojů a zachování formátování specifických datových struktur, což jsou dovednosti důležité například v oblasti automatizace podnikových procesů.
Mezinárodní kontext a geopolitický tlak
Rozmach modelových řad, jako je Qwen, přichází v době, kdy se západní vlády snaží omezit přístup čínských firem k špičkovým výpočetním čipům, které jsou klíčové pro trénink pokročilých modelů. Spojené státy zavedly několik kol exportních omezení, která se dotýkají i čipů vyráběných mimo USA, pokud v sobě obsahují americké technologie. Tento tlak ale zatím nevedl k utlumení čínských ambicí – spíše naopak.
Spoluzakladatel a generální ředitel společnosti Baseten, Tuhin Srivastava, označil uvedení Qwen3 za další důkaz, že otevřené modely z Číny drží krok s uzavřenými západními alternativami. Uvedl, že i přes americká omezení budou podobné modely „nepochybně používány na domácím trhu“, protože firmy si budují vlastní řešení na míru a zároveň využívají komerčně dostupné systémy od hráčů, jako jsou OpenAI nebo Anthropic.
Alibaba zpřístupňuje modely Qwen3 nejen formou stahování, ale také prostřednictvím cloudových platforem, včetně Fireworks AI a Hyperbolic, čímž zajišťuje jejich snadnou integraci do firemního prostředí.
Zdroj: Unsplash
Nová modelová řada zahrnuje jak husté modely, tak modely s architekturou kombinace expertů , přičemž některé z nich jsou již dostupné pod otevřenou licencí na platformách Hugging Face a GitHub. Alibaba tak pokračuje ve své snaze hrát klíčovou roli v globální AI komunitě, a to i přes sílící omezení přístupu k výkonným čipům ze strany Spojených států.Modely Qwen3 se liší svou velikostí – od nejmenších s 0,6 miliardy parametrů až po vlajkovou loď s označením Qwen3-235B-A22B, která disponuje 235 miliardami parametrů. Tento parametr odkazuje na množství naučených vazeb mezi vstupními daty a odpověďmi modelu – čím více parametrů, tím větší je obvykle výkonnost, ale také výpočetní náročnost. Alibaba tvrdí, že některé její modely dosahují srovnatelných nebo dokonce lepších výsledků než špičkové produkty západních technologických lídrů.Hybridní přístup a nové schopnosti modelůModely Qwen3 byly navrženy jako hybridní systémy, které dokážou rychle reagovat na jednoduché požadavky, ale zároveň mají schopnost „uvažovat“ o složitějších problémech, i když za cenu vyšší latence. Tento flexibilní přístup umožňuje uživatelům volit mezi rychlostí a hloubkou zpracování, což může být výhodné zejména ve firemním prostředí, kde se často pracuje s různorodými typy úloh.Tým stojící za Qwen v blogovém příspěvku uvedl, že modely byly navrženy s důrazem na efektivní správu rozpočtu na výpočetní výkon, a uživatelé si tak mohou sami nastavit, kdy má model „uvažovat“ a kdy využít jednodušší variantu výpočtu. Některé z modelů zároveň využívají architekturu kombinace expertů , která umožňuje rozdělit vstupní úlohy mezi menší specializované části systému. To snižuje výpočetní zátěž a zvyšuje efektivitu při zpracování dotazů.Společnost dále uvedla, že Qwen3 podporuje 119 jazyků a byl trénován na rozsáhlém datovém souboru obsahujícím více než 36 bilionů tokenů. Tréninkové datasety zahrnovaly jak tradiční texty jako učebnice, tak i datové páry otázek a odpovědí, úryvky kódu či data vygenerovaná jinými modely. Díky této rozmanitosti se Qwen3 výrazně posunul oproti předchozí generaci Qwen2, a to jak ve výkonnosti, tak v jazykovém pokrytí.Výsledky testování a srovnávacích benchmarkůNejvětší a nejvýkonnější model Qwen3 – Qwen3-235B-A22B – dosáhl výborných výsledků v několika veřejně dostupných testech. Na platformě Codeforces, zaměřené na programátorské soutěže, překonal o3-mini od OpenAI i Gemini 2.5 Pro od Google. Podobně si vedl i v matematickém benchmarku AIME a v testu BFCL, který hodnotí schopnost modelu „uvažovat“ nad komplexními problémy. Přesto však tento konkrétní model zatím není veřejně dostupný.Z hlediska otevřeného přístupu je největším dostupným modelem Qwen3-32B, který podle výsledků od Alibaby předčil model o1 od OpenAI v několika testech, včetně LiveCodeBench, což je benchmark zaměřený na schopnosti modelu psát kód v reálném čase. Qwen3-32B si tak udržuje silnou pozici i v porovnání s proprietárními systémy.Alibaba také upozorňuje, že modely Qwen3 vynikají v přesném následování pokynů, volání externích nástrojů a zachování formátování specifických datových struktur, což jsou dovednosti důležité například v oblasti automatizace podnikových procesů.Mezinárodní kontext a geopolitický tlakRozmach modelových řad, jako je Qwen, přichází v době, kdy se západní vlády snaží omezit přístup čínských firem k špičkovým výpočetním čipům, které jsou klíčové pro trénink pokročilých modelů. Spojené státy zavedly několik kol exportních omezení, která se dotýkají i čipů vyráběných mimo USA, pokud v sobě obsahují americké technologie. Tento tlak ale zatím nevedl k utlumení čínských ambicí – spíše naopak.Spoluzakladatel a generální ředitel společnosti Baseten, Tuhin Srivastava, označil uvedení Qwen3 za další důkaz, že otevřené modely z Číny drží krok s uzavřenými západními alternativami. Uvedl, že i přes americká omezení budou podobné modely „nepochybně používány na domácím trhu“, protože firmy si budují vlastní řešení na míru a zároveň využívají komerčně dostupné systémy od hráčů, jako jsou OpenAI nebo Anthropic.Alibaba zpřístupňuje modely Qwen3 nejen formou stahování, ale také prostřednictvím cloudových platforem, včetně Fireworks AI a Hyperbolic, čímž zajišťuje jejich snadnou integraci do firemního prostředí.
Společnost AppLovin, významný hráč v oblasti reklamních technologií, znovu přitáhla pozornost investorů i analytiků poté, co ve středu oznámila výsledky...