Pomoc investorům
Invest mentoring
ODEBÍRAT BULLIONÁŘŮV NEWSLETTER
Podcast
Burzovnisvet Logo
  • Headlines
    • Breaking
    • Bullionář Daily
    • Akcie
    • Hospodářské výsledky
    • ETF
    • Dividendy
    • IPO
    • Forex
    • Komodity
    • Kryptoměny
    • Ekonomika
  • Příležitost
  • IPO Radar

    Nadcházející IPO.

    SK Hynix Inc.
    10. července 2026

    SK Hynix Inc.

    SHEIN
    2026

    SHEIN

    Revolut Group Holdings Ltd
    2026

    Revolut Group Holdings Ltd

    Reliance Jio Infocomm Limited
    2026

    Reliance Jio Infocomm Limited

    Databricks, Inc.
    2026

    Databricks, Inc.

    Zopa Bank plc
    2026

    Zopa Bank plc

    Discord Inc.
    TBA

    Discord Inc.

    SeatGeek, Inc.
    2026

    SeatGeek, Inc.

    Minulé IPO.

    ITG Incorporated
    1. července 2026

    ITG Incorporated

    Doncasters
    25. června 2026

    Doncasters

    SpaceX
    12. června 2026

    SpaceX

    Lincoln International
    20. května 2026

    Lincoln International

    Cerebras Systems Inc.
    14. května 2026

    Cerebras Systems Inc.

    HawkEye 360
    ~ 7. května 2026

    HawkEye 360

    Pershing Square Inc.
    29. dubna 2026

    Pershing Square Inc.

    Victory Giant Technology Co., Ltd.
    21. dubna 2026

    Victory Giant Technology Co., Ltd.

    Arxis
    16. dubna 2026

    Arxis

  • Úspěch
    • Alternativní investice
    • Škola bullionáře
    • Miliardáři
    • Business
    • Bullionářova knihspirace
    • Bullionářův almanach
    • Bullionářův slovníček
  • AI
  • Česko
  • E-booky
  • Srovnávač brokerů
  • Kariéra
  • Login
Burzovnisvet.cz - Akcie, kurzy, burza, forex, komodity, IPO, dluhopisy - zpravodajství
  • Headlines
    • Breaking
    • Bullionář Daily
    • Akcie
    • Hospodářské výsledky
    • ETF
    • Dividendy
    • IPO
    • Forex
    • Komodity
    • Kryptoměny
    • Ekonomika
  • Příležitost
  • IPO Radar

    Nadcházející IPO.

    SK Hynix Inc.
    10. července 2026

    SK Hynix Inc.

    SHEIN
    2026

    SHEIN

    Revolut Group Holdings Ltd
    2026

    Revolut Group Holdings Ltd

    Reliance Jio Infocomm Limited
    2026

    Reliance Jio Infocomm Limited

    Databricks, Inc.
    2026

    Databricks, Inc.

    Zopa Bank plc
    2026

    Zopa Bank plc

    Discord Inc.
    TBA

    Discord Inc.

    SeatGeek, Inc.
    2026

    SeatGeek, Inc.

    Minulé IPO.

    ITG Incorporated
    1. července 2026

    ITG Incorporated

    Doncasters
    25. června 2026

    Doncasters

    SpaceX
    12. června 2026

    SpaceX

    Lincoln International
    20. května 2026

    Lincoln International

    Cerebras Systems Inc.
    14. května 2026

    Cerebras Systems Inc.

    HawkEye 360
    ~ 7. května 2026

    HawkEye 360

    Pershing Square Inc.
    29. dubna 2026

    Pershing Square Inc.

    Victory Giant Technology Co., Ltd.
    21. dubna 2026

    Victory Giant Technology Co., Ltd.

    Arxis
    16. dubna 2026

    Arxis

  • Úspěch
    • Alternativní investice
    • Škola bullionáře
    • Miliardáři
    • Business
    • Bullionářova knihspirace
    • Bullionářův almanach
    • Bullionářův slovníček
  • AI
  • Česko
  • E-booky
  • Srovnávač brokerů
  • Kariéra
BS Logo

Meta vydává model AI, který dokáže přepsat a přeložit téměř 100 jazyků

V rámci snahy vyvinout umělou inteligenci, která by rozuměla různým dialektům, vytvořila společnost Meta model umělé inteligence SeamlessM4T, který dokáže přeložit a přepsat téměř 100 jazyků textu a řeči.

David Škvára Autor: David Škvára
7 září, 2023
5 min. čtení
Zdroj: Burzovnísvět.cz

Zdroj: Burzovnísvět.cz

5 min.
čtení
Přihlaste se k odběru newsletteru
Chcete využít této příležitosti?

Společnost Meta tvrdí, že SeamlessM4T, který je k dispozici jako otevřený zdrojový kód spolu s novou sadou dat pro překlad SeamlessAlign, představuje „významný průlom“ v oblasti převodu řeči a textu na základě umělé inteligence.

„Náš jednotný model poskytuje překlady na vyžádání, které umožňují lidem hovořícím různými jazyky efektivněji komunikovat,“ píše Meta v příspěvku na blogu, který sdílel TechCrunch. „SeamlessM4T implicitně rozpoznává zdrojové jazyky, aniž by bylo nutné používat samostatný model identifikace jazyka.“

SeamlessM4T je jakýmsi duchovním nástupcem modelu strojového překladu z textu do textu No Language Left Behind společnosti Meta a překladače Universal Speech Translator, jednoho z mála systémů přímého překladu z řeči do řeči, který podporuje jazyk hokkien. Vychází z Massively Multilingual Speech, frameworku společnosti Meta, který poskytuje technologie rozpoznávání řeči, identifikace jazyka a syntézy řeči ve více než 1 100 jazycích.

Zdroj: Meta

Společnost Meta není jediná, kdo investuje prostředky do vývoje sofistikovaných nástrojů pro překlad a přepis umělou inteligencí.

Kromě řady komerčních služeb a modelů s otevřeným zdrojovým kódem, které jsou již k dispozici od společností Amazon, Microsoft, OpenAI a řady startupů, vytváří společnost Google takzvaný univerzální řečový model, který je součástí širšího úsilí technologického gigantu o vytvoření modelu, který by dokázal porozumět 1000 nejpoužívanějším jazykům na světě. Společnost Mozilla mezitím stála v čele projektu Common Voice, jedné z největších vícejazyčných sbírek hlasů pro trénování algoritmů automatického rozpoznávání řeči.

Advertisement

SeamlessM4T však patří k dosud nejambicióznějším pokusům o spojení překladatelských a přepisovatelských schopností do jediného modelu.

Chcete využít této příležitosti?

Společnost Meta uvádí, že při jeho vývoji vybrala z webu veřejně dostupné texty (řádově „desítky miliard“ vět) a řeč (4 miliony hodin). V rozhovoru pro TechCrunch Juan Pino, vědecký pracovník výzkumné divize umělé inteligence společnosti Meta, který se na projektu podílel, nechtěl prozradit přesné zdroje dat, řekl pouze, že jich byla „celá řada“.

Ne každý tvůrce obsahu souhlasí s využíváním veřejných dat k trénování modelů, které by mohly být použity komerčně. Někteří z nich podali žaloby na společnosti, které vytvářejí nástroje umělé inteligence na základě veřejně dostupných dat, a tvrdí, že dodavatelé by měli být nuceni poskytnout uznání, pokud ne kompenzaci – a jasné způsoby, jak se z toho odhlásit.

While visiting Sweden, I came across this globe in a friend’s home. Its always interesting to see names of countries in different languages and Swedish is no different. The lighting made for an interesting selective focus shot.
Zdroj: Unsplash

Společnost Meta však tvrdí, že získaná data, která mohou obsahovat osobní údaje, nejsou chráněna autorskými právy a pocházejí především z otevřených nebo licencovaných zdrojů.

„Díky nejmodernějším výsledkům věříme, že SeamlessM4T je důležitým průlomem v úsilí komunity AI o vytvoření univerzálních multitaskingových systémů,“ napsala Meta na blogu.

Nedávný článek v The Conversation poukazuje na mnoho nedostatků v překladu pomocí umělé inteligence, včetně různých forem genderové zaujatosti. Překladač Google například kdysi v některých jazycích předpokládal, že lékaři jsou muži, zatímco zdravotní sestry jsou ženy.

Také algoritmy rozpoznávání řeči často obsahují zkreslení. Studie zveřejněná v časopise The Proceedings of the National Academy of Sciences ukázala, že systémy rozpoznávání řeči od předních společností dvakrát častěji nesprávně přepisovaly zvuk černošských mluvčích než bělošských.

Není překvapením, že SeamlessM4T není v tomto ohledu ojedinělý.

Zdroj: Getty Images

V dokumentu zveřejněném společně s blogovým příspěvkem společnost Meta odhaluje, že model „při překladu z neutrálních výrazů příliš zobecňuje na mužské tvary“ a u většiny jazyků funguje lépe při překladu z mužského rodu (např. podstatných jmen jako „on“ v angličtině).

Kromě toho, bez informace o pohlaví, SeamlessM4T preferuje překlad mužského rodu přibližně v 10 % případů – možná kvůli „nadměrnému zastoupení mužské lexiky“ v trénovacích datech, spekuluje Meta.

Společnost Meta tvrdí, že SeamlessM4T nepřidává do svých překladů nadměrné množství toxického textu, což je běžný problém překladů a generativních textových modelů AI obecně. Není však dokonalý. V některých jazycích, například v bengálštině a kyrgyzštině, vytváří SeamlessM4T více toxických překladů – tedy nenávistných nebo vulgárních překladů – týkajících se socioekonomického statusu a kultury. A obecně je SeamlessM4T toxičtější v překladech týkajících se sexuální orientace a náboženství.

Společnost Meta poznamenává, že veřejná ukázka pro SeamlessM4T obsahuje filtr pro toxicitu ve vstupní řeči i filtr pro potenciálně toxickou výstupní řeč. Tento filtr však není ve výchozím nastavení přítomen v otevřené verzi modelu.

V rámci snahy vyvinout umělou inteligenci, která by rozuměla různým dialektům, vytvořila společnost Meta model umělé inteligence SeamlessM4T, který dokáže přeložit a přepsat téměř 100 jazyků textu a řeči. Společnost Meta tvrdí, že SeamlessM4T, který je k dispozici jako otevřený zdrojový kód spolu s novou sadou dat pro překlad SeamlessAlign, představuje "významný průlom" v oblasti převodu řeči a textu na základě umělé inteligence. "Náš jednotný model poskytuje překlady na vyžádání, které umožňují lidem hovořícím různými jazyky efektivněji komunikovat," píše Meta v příspěvku na blogu, který sdílel TechCrunch. "SeamlessM4T implicitně rozpoznává zdrojové jazyky, aniž by bylo nutné používat samostatný model identifikace jazyka." SeamlessM4T je jakýmsi duchovním nástupcem modelu strojového překladu z textu do textu No Language Left Behind společnosti Meta a překladače Universal Speech Translator, jednoho z mála systémů přímého překladu z řeči do řeči, který podporuje jazyk hokkien. Vychází z Massively Multilingual Speech, frameworku společnosti Meta, který poskytuje technologie rozpoznávání řeči, identifikace jazyka a syntézy řeči ve více než 1 100 jazycích. Společnost Meta není jediná, kdo investuje prostředky do vývoje sofistikovaných nástrojů pro překlad a přepis umělou inteligencí. Kromě řady komerčních služeb a modelů s otevřeným zdrojovým kódem, které jsou již k dispozici od společností Amazon, Microsoft, OpenAI a řady startupů, vytváří společnost Google takzvaný univerzální řečový model, který je součástí širšího úsilí technologického gigantu o vytvoření modelu, který by dokázal porozumět 1000 nejpoužívanějším jazykům na světě. Společnost Mozilla mezitím stála v čele projektu Common Voice, jedné z největších vícejazyčných sbírek hlasů pro trénování algoritmů automatického rozpoznávání řeči. SeamlessM4T však patří k dosud nejambicióznějším pokusům o spojení překladatelských a přepisovatelských schopností do jediného modelu. Společnost Meta uvádí, že při jeho vývoji vybrala z webu veřejně dostupné texty (řádově "desítky miliard" vět) a řeč (4 miliony hodin). V rozhovoru pro TechCrunch Juan Pino, vědecký pracovník výzkumné divize umělé inteligence společnosti Meta, který se na projektu podílel, nechtěl prozradit přesné zdroje dat, řekl pouze, že jich byla "celá řada". Ne každý tvůrce obsahu souhlasí s využíváním veřejných dat k trénování modelů, které by mohly být použity komerčně. Někteří z nich podali žaloby na společnosti, které vytvářejí nástroje umělé inteligence na základě veřejně dostupných dat, a tvrdí, že dodavatelé by měli být nuceni poskytnout uznání, pokud ne kompenzaci - a jasné způsoby, jak se z toho odhlásit. Společnost Meta však tvrdí, že získaná data, která mohou obsahovat osobní údaje, nejsou chráněna autorskými právy a pocházejí především z otevřených nebo licencovaných zdrojů. "Díky nejmodernějším výsledkům věříme, že SeamlessM4T je důležitým průlomem v úsilí komunity AI o vytvoření univerzálních multitaskingových systémů," napsala Meta na blogu. Nedávný článek v The Conversation poukazuje na mnoho nedostatků v překladu pomocí umělé inteligence, včetně různých forem genderové zaujatosti. Překladač Google například kdysi v některých jazycích předpokládal, že lékaři jsou muži, zatímco zdravotní sestry jsou ženy. Také algoritmy rozpoznávání řeči často obsahují zkreslení. Studie zveřejněná v časopise The Proceedings of the National Academy of Sciences ukázala, že systémy rozpoznávání řeči od předních společností dvakrát častěji nesprávně přepisovaly zvuk černošských mluvčích než bělošských. Není překvapením, že SeamlessM4T není v tomto ohledu ojedinělý. V dokumentu zveřejněném společně s blogovým příspěvkem společnost Meta odhaluje, že model "při překladu z neutrálních výrazů příliš zobecňuje na mužské tvary" a u většiny jazyků funguje lépe při překladu z mužského rodu (např. podstatných jmen jako "on" v angličtině). Kromě toho, bez informace o pohlaví, SeamlessM4T preferuje překlad mužského rodu přibližně v 10 % případů - možná kvůli "nadměrnému zastoupení mužské lexiky" v trénovacích datech, spekuluje Meta. Společnost Meta tvrdí, že SeamlessM4T nepřidává do svých překladů nadměrné množství toxického textu, což je běžný problém překladů a generativních textových modelů AI obecně. Není však dokonalý. V některých jazycích, například v bengálštině a kyrgyzštině, vytváří SeamlessM4T více toxických překladů - tedy nenávistných nebo vulgárních překladů - týkajících se socioekonomického statusu a kultury. A obecně je SeamlessM4T toxičtější v překladech týkajících se sexuální orientace a náboženství. Společnost Meta poznamenává, že veřejná ukázka pro SeamlessM4T obsahuje filtr pro toxicitu ve vstupní řeči i filtr pro potenciálně toxickou výstupní řeč. Tento filtr však není ve výchozím nastavení přítomen v otevřené verzi modelu.
Tagy: AIAkcieMeta Platformsumela inteligence


    Chcete využít této příležitosti?


    Zanechte své kontaktní údaje, ozve se Vám licencovaný specialista a zároveň získáte:

    • Přístup k nejžhavějším IPO a investičním trendům.

    • Pravidelnou dávku aktuálních tipů pro Vaše portfolio v našem Newsletteru.

    • Investiční portfolio

    Máte zkušenosti s investováním?

    Jakou částku jste připraven použít na investování?



    Odesláním formuláře souhlasíte se zasíláním newsletteru Burzovní svět. Odhlásit se můžete kdykoli.

    Advertisement
    Burzovní svět

    Bullionářovo odpolední menu

    Bullionářův newsletter přináší úžasné investiční příležitosti pro vaše portfolio.
    Zadejte své údaje a získejte 4 originální e-booky ZDARMA!

    Telefonní číslo není platné

    Vyplnění telefonního čísla je zcela dobrovolné. Rozhodně vás nebudeme nijak spamovat – v případě příležitosti, která bude stát za vaši pozornost, se vám ale může ozvat náš analytik.

    Burzovní svět

    Bullionářovo odpolední menu

    Bullionářův newsletter přináší úžasné investiční příležitosti pro vaše portfolio.
    Zadejte své údaje a získejte 4 originální e-booky ZDARMA!

    Telefonní číslo není platné

    Vyplnění telefonního čísla je zcela dobrovolné. Rozhodně vás nebudeme nijak spamovat – v případě příležitosti, která bude stát za vaši pozornost, se vám ale může ozvat náš analytik.

    Breaking.

    14:33

    Regionální banky po výsledcích za Q4 posilují, excelují German American Bancorp a UMB Financial

    14:15

    Hodnotové akcie: Jedna skrytá příležitost k nákupu a dva varovné signály

    13:58

    Výsledky regionálních bank za Q1: First Hawaiian Bank roste, hvězdou sektoru je UMB Financial

    13:37

    Argentinský plán na firmy řízené AI se bez lidí neobejde

    13:12

    Pozor na spalování hotovosti: Tři akcie, u kterých hrozí vysoké riziko poklesu

    12:50

    Zájem o globální akciové fondy roste, investoři po poklesu trhu nakupují technologie

    Advertisement

    Příležitosti.

    Zdroj: Shutterstock
    Příležitost

    Robinhood útočí na pozici prvního globálního hyperškálovače, Mizuho predikuje růst

    3 července, 2026

    Cesta k prvnímu globálnímu hyperškálovači Společnost Robinhood (HOOD) má podle nejnovější analýzy prestižní investiční banky Mizuho nakročeno k dalšímu strmému...

    UBS vidí v těchto defenzivních akciích příležitosti. Navíc vyplácejí dividendy

    3 července, 2026
    Zdroj: Getty Images

    Akcie Palantir letos ztrácí dech, D.A. Davidson však nabádá k nákupu

    3 července, 2026
    Zdroj: Reuters

    Grindr spouští přelomové produkty, Morgan Stanley predikuje akciím růst

    3 července, 2026
    Zdroj: Getty Images

    Kam směřovat investice do technologií ve druhém pololetí

    2 července, 2026

    Bullionářovo odpolední menu

    Bullionářův newsletter přináší úžasné investiční příležitosti pro vaše portfolio. Zadejte své telefonní číslo a získejte originální e-booky ZDARMA!

    Telefonní číslo není platné

    Vyplnění telefonního čísla je zcela dobrovolné. Rozhodně vás nebudeme nijak spamovat – v případě příležitosti, která bude stát za vaši pozornost, se vám ale může ozvat náš analytik.

    IPO Radar.

    SK Hynix Inc.
    Aktivní NASDAQ
    SK Hynix Inc.
    Jihokorejský lídr ve výrobě AI pamětí HBM míří na Nasdaq s emisí až za 29,4 miliardy USD. Největší AI kapitálová operace roku.
    Ticker
    SKHY
    Burza
    NASDAQ
    Datum IPO
    10. července 2026
    CÍL IPO
    $29.4MLD
    Potenciální ocenění
    -
    Zobrazit detail

    Nejčtenější zprávy.

    Americké akcie se obchodovaly smíšeně

    2 července, 2026

    Schodek státního rozpočtu vzrostl na 183,6 miliardy korun

    1 července, 2026

    Wall Street prudce ožila; Nasdaq vyskočil o více než 2 %, Dow uzavřel na rekordu

    29 června, 2026

    Americké akcie uzavřely smíšeně; Meta výrazně posílila

    1 července, 2026

    Britská libra čelí rozhodujícímu testu na klíčové zóně podpory 1,3140

    29 června, 2026

    Wall Street uzavřela zkrácený týden v plusu

    2 července, 2026

    Joby Aviation zdolává klíčovou regulační překážku. Představují akcie nákupní příležitost?

    3 července, 2026

    S&P 500 a Nasdaq zaznamenaly nejlepší čtvrtletí od roku 2020

    30 června, 2026
    Advertisement

    Tip editora.

    Zdroj: Getty Images
    Akcie

    Kyberbezpečnost zažívá boom, Palo Alto a CrowdStrike zažívají nejlepší čtvrtletí

    1 července, 2026

    Historický triumf na křídlech umělé inteligence Technologické akcie mají za sebou mimořádně úspěšné období a přední hráči v oblasti digitální...

    Advertisement

    Veškeré materiály a informace umístěné na internetových stránkách Burzovního Světa jsou čerpány z veřejně dostupných zdrojů, jako napriklad tyto a slouží výhradně pro informační účely. Při jejich tvorbě bylo postupováno s vynaložením maximální péče. Informace uveřejněné na internetových stránkách Burzovní Svět nemají charakter právních, daňových či jiného doporučení, analýz nebo návrhů a nabídek ke koupi či prodeji investičních nástrojů, jejichž realizací může dojít k poklesu či ztrátě investovaného majetku. Investiční doporučení, která jsou takto označena, jsou pouze informativní a nezávazná. Burzovní Svět neodpovídá za jakoukoli případnou škodu, která v souvislosti s nimi vznikne. Pro obchodování s investičními nástroji proto využívejte výhradně společnosti s udělenou licencí ČNB, popřípadě s platným povolením k činnosti na území České Republiky.

    Burzovní Svět zároveň prohlašuje, že neodpovídá za přímou i nepřímou škodu vzniklou v důsledku obchodování na kapitálových trzích všeobecně a příspěvky v diskusích vyjadřující názory čtenářů, nemusí být v souladu s postojem provozovatele a není možno je tím pádem považovat za jeho názory. Udělením souhlasu / přijetím podmínek zároveň souhlasíte s možností zasílání, či jiného kontaktování v rámci marketingových služeb obchodních partnerů Burzovního Světa. Více informací o cookies

    • Zásady ochrany osobních údajů a cookies
    • Reklama
    • Kontakt

    Burzovnisvet.cz © 2026

    Burzovnisvet.cz © 2026

    Název nebo symbol
    Žádný výsledek
    Zobrazit všechny výsledky
    • Burzy
      • Headlines
      • Breaking
      • Akcie
      • ETF
      • Dividendy
      • IPO
      • Forex
      • Komodity
      • Kryptoměny
      • Ekonomika
      • Hospodářské výsledky
    • Příležitost
    • IPO Radar
    • Nejčtenější
    • Bullionář Daily
    • Úspěch
      • Alternativní investice
      • Škola bullionáře
      • Miliardáři
      • Business
      • Bullionářova knihspirace
      • Bullionářův almanach
      • Bullionářův slovníček
    • AI
    • Česko
    • Invest mentoring
    • E-booky
    • Srovnávač brokerů
    • Kariéra
    • Pomoc investorům
    BULLIONÁŘŮV NEWSLETTER Podcast

    Retrieve your password

    Please enter your username or email address to reset your password.

    ·
    Poslední událost
    Poslední událost
      Kontaktujte nás
      News Watchlist Markets Media Nastavení

      Používáme soubory cookie a podobné technologie, které jsou nezbytné pro provoz webových stránek. Další soubory cookie se používají k provádění analýzy používání webových stránek. Pokračováním v používání našich webových stránek vyjadřujete souhlas s používáním souborů cookie. Další informace naleznete v našich Zásadách ochrany osobních údajů.