Alibaba (NYSE:BABA) uvedla na trh Qwen-Image, 20B MMDiT obrazový základní model, který přináší významné pokroky v oblasti komplexního vykreslování textu a přesných funkcí pro úpravy obrazu.
Nový model, ke kterému mají uživatelé přístup prostřednictvím Qwen Chat po výběru možnosti „Image Generation“ (Generování obrázků), se vyznačuje vynikajícími schopnostmi vykreslování textu, které zvládají víceřádkové rozložení, sémantiku na úrovni odstavců a jemné detaily. S vysokou věrností podporuje jak abecední jazyky, jako je angličtina, tak logografické jazyky, jako je čínština.
Qwen-Image také nabízí konzistentní úpravy obrázků díky vylepšenému paradigmatu multitaskingového tréninku, který dosahuje výjimečného výkonu při zachování sémantického významu i vizuálního realismu během úprav.
Podle společnosti Alibaba tento model překonává stávající řešení v několika veřejných benchmarkových testech pro generování i úpravy, včetně GenEval, DPG, OneIG-Bench, GEdit, ImgEdit a GSO. Zvláště vyniká v benchmarkových testech vykreslování textu, jako jsou LongText-Bench, ChineseWord a TextCraft, kde výrazně překonává současné špičkové modely.
Alibaba uvedla na trh Qwen-Image, 20B MMDiT obrazový základní model, který přináší významné pokroky v oblasti komplexního vykreslování textu a přesných funkcí pro úpravy obrazu.
Nový model, ke kterému mají uživatelé přístup prostřednictvím Qwen Chat po výběru možnosti „Image Generation“ , se vyznačuje vynikajícími schopnostmi vykreslování textu, které zvládají víceřádkové rozložení, sémantiku na úrovni odstavců a jemné detaily. S vysokou věrností podporuje jak abecední jazyky, jako je angličtina, tak logografické jazyky, jako je čínština.
Qwen-Image také nabízí konzistentní úpravy obrázků díky vylepšenému paradigmatu multitaskingového tréninku, který dosahuje výjimečného výkonu při zachování sémantického významu i vizuálního realismu během úprav.
Podle společnosti Alibaba tento model překonává stávající řešení v několika veřejných benchmarkových testech pro generování i úpravy, včetně GenEval, DPG, OneIG-Bench, GEdit, ImgEdit a GSO. Zvláště vyniká v benchmarkových testech vykreslování textu, jako jsou LongText-Bench, ChineseWord a TextCraft, kde výrazně překonává současné špičkové modely.