Alibaba Group Holdings Ltd ADR (NYSE:BABA) v úterý představila svou novou řadu velkých jazykových modelů Qwen3, čímž rozšířila svou nabídku umělé inteligence o řadu modelů různých velikostí a architektur. Novinka zahrnuje osm modelů s otevřenou váhou, šest hustých a dva mixované (MoE), s počtem parametrů od 0,6 miliardy do 235 miliard.
Vlajková loď Qwen3-235B-A22B prokázala ve srovnání s předními modely, jako jsou DeepSeek-R1, Grok-3 a Gemini-2.5-Pro, konkurenceschopný výkon v benchmarkových testech v oblasti kódování, matematiky a obecných úkolů. Menší modely, jako je Qwen3-30B-A3B, také předčily modely s větším počtem parametrů, což svědčí o zvýšení efektivity struktury a tréninku.
Všechny modely, včetně předem a dodatečně trénovaných variant, jsou veřejně dostupné prostřednictvím Hugging Face, ModelScope a Kaggle. Pro nasazení Alibaba doporučuje SGLang a vLLM, zatímco místní uživatelé mohou Qwen3 spouštět pomocí nástrojů jako LMStudio, llama.cpp a KTransformers.
Qwen3 nabízí škálovatelný a adaptivní výkon, který uživatelům umožňuje přizpůsobit výpočetní rozpočet tak, aby vyvážil přesnost a náklady na zdroje. Tato flexibilita má za cíl uspokojit stále rozmanitější požadavky vývojářů, kteří integrují AI do pracovních postupů na úrovni spotřebitelů nebo podniků.
Alibaba Group Holdings Ltd ADR v úterý představila svou novou řadu velkých jazykových modelů Qwen3, čímž rozšířila svou nabídku umělé inteligence o řadu modelů různých velikostí a architektur. Novinka zahrnuje osm modelů s otevřenou váhou, šest hustých a dva mixované , s počtem parametrů od 0,6 miliardy do 235 miliard.
Vlajková loď Qwen3-235B-A22B prokázala ve srovnání s předními modely, jako jsou DeepSeek-R1, Grok-3 a Gemini-2.5-Pro, konkurenceschopný výkon v benchmarkových testech v oblasti kódování, matematiky a obecných úkolů. Menší modely, jako je Qwen3-30B-A3B, také předčily modely s větším počtem parametrů, což svědčí o zvýšení efektivity struktury a tréninku.
Všechny modely, včetně předem a dodatečně trénovaných variant, jsou veřejně dostupné prostřednictvím Hugging Face, ModelScope a Kaggle. Pro nasazení Alibaba doporučuje SGLang a vLLM, zatímco místní uživatelé mohou Qwen3 spouštět pomocí nástrojů jako LMStudio, llama.cpp a KTransformers.
Qwen3 nabízí škálovatelný a adaptivní výkon, který uživatelům umožňuje přizpůsobit výpočetní rozpočet tak, aby vyvážil přesnost a náklady na zdroje. Tato flexibilita má za cíl uspokojit stále rozmanitější požadavky vývojářů, kteří integrují AI do pracovních postupů na úrovni spotřebitelů nebo podniků.