Invest mentoring
Odebírat Ranního Bullionáře
Burzovnisvet Logo
  • Headlines
    • Breaking
    • Bullionář Daily
    • Akcie
    • Hospodářské výsledky
    • ETF
    • Dividendy
    • IPO
    • Forex
    • Komodity
    • Kryptoměny
    • Ekonomika
  • Příležitost
  • DIP
  • IPO Radar
    TBA Bude oznámeno

    Finančně-technologická společnost, která nabízí digitální bankovní služby

    TBA Bude oznámeno

    Finančně-technologická společnost nabízející širokou škálu finančních služeb

    TBA Bude oznámeno

    ​Komunikační platforma umožňující uživatelům komunikovat pomoci hlasu a textu

    TBA Bude oznámeno

    Britská digitální banka a první peer-to-peer (P2P) platforma na světě

    TBA Bude oznámeno

    Technologická společnost poskytující infrastrukturu pro online platby

    TBA Bude oznámeno

    Čínska společnost pro globální online prodej rychlé módy za dostupné ceny

    TBA Bude oznámeno

    Společnost poskytující cloudovou platformu pro datovou analytiku

    TBA Bude oznámeno

    Švédská fintech společnost, která poskytuje služby „kup teď, zaplať později“

  • Úspěch
    • Alternativní investice
    • Škola bullionáře
    • Miliardáři
    • Business
    • Bullionářova knihspirace
    • Bullionářův almanach
    • Bullionářův slovníček
  • AI
  • Česko
  • E-booky
  • Srovnávač brokerů
  • Kariéra
  • Login
Burzovnisvet.cz - Akcie, kurzy, burza, forex, komodity, IPO, dluhopisy - zpravodajství
  • Headlines
    • Breaking
    • Bullionář Daily
    • Akcie
    • Hospodářské výsledky
    • ETF
    • Dividendy
    • IPO
    • Forex
    • Komodity
    • Kryptoměny
    • Ekonomika
  • Příležitost
  • DIP
  • IPO Radar
    TBA Bude oznámeno

    Finančně-technologická společnost, která nabízí digitální bankovní služby

    TBA Bude oznámeno

    Finančně-technologická společnost nabízející širokou škálu finančních služeb

    TBA Bude oznámeno

    ​Komunikační platforma umožňující uživatelům komunikovat pomoci hlasu a textu

    TBA Bude oznámeno

    Britská digitální banka a první peer-to-peer (P2P) platforma na světě

    TBA Bude oznámeno

    Technologická společnost poskytující infrastrukturu pro online platby

    TBA Bude oznámeno

    Čínska společnost pro globální online prodej rychlé módy za dostupné ceny

    TBA Bude oznámeno

    Společnost poskytující cloudovou platformu pro datovou analytiku

    TBA Bude oznámeno

    Švédská fintech společnost, která poskytuje služby „kup teď, zaplať později“

  • Úspěch
    • Alternativní investice
    • Škola bullionáře
    • Miliardáři
    • Business
    • Bullionářova knihspirace
    • Bullionářův almanach
    • Bullionářův slovníček
  • AI
  • Česko
  • E-booky
  • Srovnávač brokerů
  • Kariéra
    • Žádný výsledek
      Zobrazit všechny výsledky
BS Logo

Meta vydává model AI, který dokáže přepsat a přeložit téměř 100 jazyků

V rámci snahy vyvinout umělou inteligenci, která by rozuměla různým dialektům, vytvořila společnost Meta model umělé inteligence SeamlessM4T, který dokáže přeložit a přepsat téměř 100 jazyků textu a řeči.

David Škvára Autor: David Škvára
7 září, 2023
5 min. čtení
Zdroj: Burzovnísvět.cz

Zdroj: Burzovnísvět.cz

5 min.
čtení
Chcete využít této příležitosti? Přihlaste se k odběru newsletteru

Společnost Meta tvrdí, že SeamlessM4T, který je k dispozici jako otevřený zdrojový kód spolu s novou sadou dat pro překlad SeamlessAlign, představuje „významný průlom“ v oblasti převodu řeči a textu na základě umělé inteligence.

„Náš jednotný model poskytuje překlady na vyžádání, které umožňují lidem hovořícím různými jazyky efektivněji komunikovat,“ píše Meta v příspěvku na blogu, který sdílel TechCrunch. „SeamlessM4T implicitně rozpoznává zdrojové jazyky, aniž by bylo nutné používat samostatný model identifikace jazyka.“

SeamlessM4T je jakýmsi duchovním nástupcem modelu strojového překladu z textu do textu No Language Left Behind společnosti Meta a překladače Universal Speech Translator, jednoho z mála systémů přímého překladu z řeči do řeči, který podporuje jazyk hokkien. Vychází z Massively Multilingual Speech, frameworku společnosti Meta, který poskytuje technologie rozpoznávání řeči, identifikace jazyka a syntézy řeči ve více než 1 100 jazycích.

Zdroj: Meta

Společnost Meta není jediná, kdo investuje prostředky do vývoje sofistikovaných nástrojů pro překlad a přepis umělou inteligencí.

Kromě řady komerčních služeb a modelů s otevřeným zdrojovým kódem, které jsou již k dispozici od společností Amazon, Microsoft, OpenAI a řady startupů, vytváří společnost Google takzvaný univerzální řečový model, který je součástí širšího úsilí technologického gigantu o vytvoření modelu, který by dokázal porozumět 1000 nejpoužívanějším jazykům na světě. Společnost Mozilla mezitím stála v čele projektu Common Voice, jedné z největších vícejazyčných sbírek hlasů pro trénování algoritmů automatického rozpoznávání řeči.

Advertisement

SeamlessM4T však patří k dosud nejambicióznějším pokusům o spojení překladatelských a přepisovatelských schopností do jediného modelu.

Společnost Meta uvádí, že při jeho vývoji vybrala z webu veřejně dostupné texty (řádově „desítky miliard“ vět) a řeč (4 miliony hodin). V rozhovoru pro TechCrunch Juan Pino, vědecký pracovník výzkumné divize umělé inteligence společnosti Meta, který se na projektu podílel, nechtěl prozradit přesné zdroje dat, řekl pouze, že jich byla „celá řada“.

Ne každý tvůrce obsahu souhlasí s využíváním veřejných dat k trénování modelů, které by mohly být použity komerčně. Někteří z nich podali žaloby na společnosti, které vytvářejí nástroje umělé inteligence na základě veřejně dostupných dat, a tvrdí, že dodavatelé by měli být nuceni poskytnout uznání, pokud ne kompenzaci – a jasné způsoby, jak se z toho odhlásit.

While visiting Sweden, I came across this globe in a friend’s home. Its always interesting to see names of countries in different languages and Swedish is no different. The lighting made for an interesting selective focus shot.
Zdroj: Unsplash

Společnost Meta však tvrdí, že získaná data, která mohou obsahovat osobní údaje, nejsou chráněna autorskými právy a pocházejí především z otevřených nebo licencovaných zdrojů.

„Díky nejmodernějším výsledkům věříme, že SeamlessM4T je důležitým průlomem v úsilí komunity AI o vytvoření univerzálních multitaskingových systémů,“ napsala Meta na blogu.

Nedávný článek v The Conversation poukazuje na mnoho nedostatků v překladu pomocí umělé inteligence, včetně různých forem genderové zaujatosti. Překladač Google například kdysi v některých jazycích předpokládal, že lékaři jsou muži, zatímco zdravotní sestry jsou ženy.

Také algoritmy rozpoznávání řeči často obsahují zkreslení. Studie zveřejněná v časopise The Proceedings of the National Academy of Sciences ukázala, že systémy rozpoznávání řeči od předních společností dvakrát častěji nesprávně přepisovaly zvuk černošských mluvčích než bělošských.

Není překvapením, že SeamlessM4T není v tomto ohledu ojedinělý.

Zdroj: Getty Images

V dokumentu zveřejněném společně s blogovým příspěvkem společnost Meta odhaluje, že model „při překladu z neutrálních výrazů příliš zobecňuje na mužské tvary“ a u většiny jazyků funguje lépe při překladu z mužského rodu (např. podstatných jmen jako „on“ v angličtině).

Kromě toho, bez informace o pohlaví, SeamlessM4T preferuje překlad mužského rodu přibližně v 10 % případů – možná kvůli „nadměrnému zastoupení mužské lexiky“ v trénovacích datech, spekuluje Meta.

Společnost Meta tvrdí, že SeamlessM4T nepřidává do svých překladů nadměrné množství toxického textu, což je běžný problém překladů a generativních textových modelů AI obecně. Není však dokonalý. V některých jazycích, například v bengálštině a kyrgyzštině, vytváří SeamlessM4T více toxických překladů – tedy nenávistných nebo vulgárních překladů – týkajících se socioekonomického statusu a kultury. A obecně je SeamlessM4T toxičtější v překladech týkajících se sexuální orientace a náboženství.

Společnost Meta poznamenává, že veřejná ukázka pro SeamlessM4T obsahuje filtr pro toxicitu ve vstupní řeči i filtr pro potenciálně toxickou výstupní řeč. Tento filtr však není ve výchozím nastavení přítomen v otevřené verzi modelu.

Společnost Meta tvrdí, že SeamlessM4T, který je k dispozici jako otevřený zdrojový kód spolu s novou sadou dat pro překlad SeamlessAlign, představuje „významný průlom“ v oblasti převodu řeči a textu na základě umělé inteligence.„Náš jednotný model poskytuje překlady na vyžádání, které umožňují lidem hovořícím různými jazyky efektivněji komunikovat,“ píše Meta v příspěvku na blogu, který sdílel TechCrunch. „SeamlessM4T implicitně rozpoznává zdrojové jazyky, aniž by bylo nutné používat samostatný model identifikace jazyka.“SeamlessM4T je jakýmsi duchovním nástupcem modelu strojového překladu z textu do textu No Language Left Behind společnosti Meta a překladače Universal Speech Translator, jednoho z mála systémů přímého překladu z řeči do řeči, který podporuje jazyk hokkien. Vychází z Massively Multilingual Speech, frameworku společnosti Meta, který poskytuje technologie rozpoznávání řeči, identifikace jazyka a syntézy řeči ve více než 1 100 jazycích.Společnost Meta není jediná, kdo investuje prostředky do vývoje sofistikovaných nástrojů pro překlad a přepis umělou inteligencí.Kromě řady komerčních služeb a modelů s otevřeným zdrojovým kódem, které jsou již k dispozici od společností Amazon, Microsoft, OpenAI a řady startupů, vytváří společnost Google takzvaný univerzální řečový model, který je součástí širšího úsilí technologického gigantu o vytvoření modelu, který by dokázal porozumět 1000 nejpoužívanějším jazykům na světě. Společnost Mozilla mezitím stála v čele projektu Common Voice, jedné z největších vícejazyčných sbírek hlasů pro trénování algoritmů automatického rozpoznávání řeči.SeamlessM4T však patří k dosud nejambicióznějším pokusům o spojení překladatelských a přepisovatelských schopností do jediného modelu.Společnost Meta uvádí, že při jeho vývoji vybrala z webu veřejně dostupné texty a řeč . V rozhovoru pro TechCrunch Juan Pino, vědecký pracovník výzkumné divize umělé inteligence společnosti Meta, který se na projektu podílel, nechtěl prozradit přesné zdroje dat, řekl pouze, že jich byla „celá řada“.Ne každý tvůrce obsahu souhlasí s využíváním veřejných dat k trénování modelů, které by mohly být použity komerčně. Někteří z nich podali žaloby na společnosti, které vytvářejí nástroje umělé inteligence na základě veřejně dostupných dat, a tvrdí, že dodavatelé by měli být nuceni poskytnout uznání, pokud ne kompenzaci – a jasné způsoby, jak se z toho odhlásit.Společnost Meta však tvrdí, že získaná data, která mohou obsahovat osobní údaje, nejsou chráněna autorskými právy a pocházejí především z otevřených nebo licencovaných zdrojů.„Díky nejmodernějším výsledkům věříme, že SeamlessM4T je důležitým průlomem v úsilí komunity AI o vytvoření univerzálních multitaskingových systémů,“ napsala Meta na blogu.Nedávný článek v The Conversation poukazuje na mnoho nedostatků v překladu pomocí umělé inteligence, včetně různých forem genderové zaujatosti. Překladač Google například kdysi v některých jazycích předpokládal, že lékaři jsou muži, zatímco zdravotní sestry jsou ženy.Také algoritmy rozpoznávání řeči často obsahují zkreslení. Studie zveřejněná v časopise The Proceedings of the National Academy of Sciences ukázala, že systémy rozpoznávání řeči od předních společností dvakrát častěji nesprávně přepisovaly zvuk černošských mluvčích než bělošských.Není překvapením, že SeamlessM4T není v tomto ohledu ojedinělý.V dokumentu zveřejněném společně s blogovým příspěvkem společnost Meta odhaluje, že model „při překladu z neutrálních výrazů příliš zobecňuje na mužské tvary“ a u většiny jazyků funguje lépe při překladu z mužského rodu .Kromě toho, bez informace o pohlaví, SeamlessM4T preferuje překlad mužského rodu přibližně v 10 % případů – možná kvůli „nadměrnému zastoupení mužské lexiky“ v trénovacích datech, spekuluje Meta.Společnost Meta tvrdí, že SeamlessM4T nepřidává do svých překladů nadměrné množství toxického textu, což je běžný problém překladů a generativních textových modelů AI obecně. Není však dokonalý. V některých jazycích, například v bengálštině a kyrgyzštině, vytváří SeamlessM4T více toxických překladů – tedy nenávistných nebo vulgárních překladů – týkajících se socioekonomického statusu a kultury. A obecně je SeamlessM4T toxičtější v překladech týkajících se sexuální orientace a náboženství.Společnost Meta poznamenává, že veřejná ukázka pro SeamlessM4T obsahuje filtr pro toxicitu ve vstupní řeči i filtr pro potenciálně toxickou výstupní řeč. Tento filtr však není ve výchozím nastavení přítomen v otevřené verzi modelu.
Tagy: AIAkcieMeta Platformsumela inteligence

Chcete využít této příležitosti?

Zanechte svůj telefon a email a budete kontaktováni licencovanými odborníky

      Advertisement

      Breaking.

      20:32

      Zisk společnosti Alpha Metallurgical Resources zaostal o 5,67 USD, tržby nedosáhly odhadů

      20:20

      Daňový výbor americké Sněmovny reprezentantů představil částečný daňový plán k naplnění Trumpovy agendy

      20:00

      Zisk společnosti Inuvo odpovídal odhadům, tržby překonaly odhady

      19:55

      Zisk společnosti PAR Technology překonal očekávání o 0,05 USD, tržby však zaostaly za odhady

      19:47

      Co se dnes děje s Etherem?

      19:32

      Zisk společnosti Federal Agricultural Mortgage A překonal očekávání o 0,05 USD, tržby překonaly odhady

      Advertisement

      Příležitosti.

      Zdroj: Getty Images
      Akcie

      Akcie AppLovin mohou po zveřejnění silných výsledků vzrůst o více než 30 %

      9 května, 2025

      Společnost AppLovin, významný hráč v oblasti reklamních technologií, znovu přitáhla pozornost investorů i analytiků poté, co ve středu oznámila výsledky...

      Zdroj: Shutterstock

      Disney plánuje první zábavní park na Blízkém východě v Abú Dhabí

      8 května, 2025
      Zdroj: Unsplash

      Nvidia a další technologické tituly posilují díky očekávání silných výsledků

      6 května, 2025
      Zdroj: Getty Images

      Tato energetická společnost má našlápnuto k silným ziskům

      5 května, 2025
      zdroj: Getty Images

      Které společnosti si vybrala banka JPMorgan pro začátek května

      5 května, 2025

      Tip editora.

      AI

      Milion byl málo. AI e-book, který vydělal investorům přes 90 %

      9 května, 2025

      Na jaře 2024 jsme na Burzovním Světě publikovali e-book AI Portfolio – výběr deseti technologických akcií s vysokým potenciálem růstu....

      Nejčtenější zprávy.

      Index S&P 500 zakončil týden poklesem před obchodními jednáními mezi USA a Čínou

      9 května, 2025

      Americké akcie rostou díky obchodní dohodě mezi USA a Velkou Británií

      8 května, 2025

      S&P 500 klesá kvůli nedostatečnému pokroku v obchodních jednáních mezi USA a Čínou

      6 května, 2025

      S&P 500 uzavřel výše po rámcové obchodní dohodě USA a Velké Británie

      8 května, 2025

      Indie právě uzavřela rozsáhlou obchodní dohodu – ale ne s USA

      6 května, 2025

      ČNB letos čeká schodek veřejných financí 2,1 pct HDP, za rok vyšší kvůli obraně

      9 května, 2025

      Palantir překonává očekávání, investory však znepokojuje vysoké ocenění

      10 května, 2025

      S&P 500 končí výše po divokých výkyvech v důsledku zpráv o Fedu a obchodu

      7 května, 2025
      Advertisement

      IPO Radar.

      Chime Financial, Inc.

      Datum IPO: 2025
      Potenciální ocenění: 25 miliard dolarů

      Buďte u toho
      Advertisement

      Veškeré materiály a informace umístěné na internetových stránkách Burzovního Světa jsou čerpány z veřejně dostupných zdrojů, jako napriklad tyto a slouží výhradně pro informační účely. Při jejich tvorbě bylo postupováno s vynaložením maximální péče. Informace uveřejněné na internetových stránkách Burzovní Svět nemají charakter právních, daňových či jiného doporučení, analýz nebo návrhů a nabídek ke koupi či prodeji investičních nástrojů, jejichž realizací může dojít k poklesu či ztrátě investovaného majetku. Investiční doporučení, která jsou takto označena, jsou pouze informativní a nezávazná. Burzovní Svět neodpovídá za jakoukoli případnou škodu, která v souvislosti s nimi vznikne. Pro obchodování s investičními nástroji proto využívejte výhradně společnosti s udělenou licencí ČNB, popřípadě s platným povolením k činnosti na území České Republiky.

      Burzovní Svět zároveň prohlašuje, že neodpovídá za přímou i nepřímou škodu vzniklou v důsledku obchodování na kapitálových trzích všeobecně a příspěvky v diskusích vyjadřující názory čtenářů, nemusí být v souladu s postojem provozovatele a není možno je tím pádem považovat za jeho názory. Udělením souhlasu / přijetím podmínek zároveň souhlasíte s možností zasílání, či jiného kontaktování v rámci marketingových služeb obchodních partnerů Burzovního Světa. Více informací o cookies

      • Zásady ochrany osobních údajů a cookies
      • Reklama
      • Kontakt

      Burzovnisvet.cz © 2025

      Burzovnisvet.cz © 2025

      Název nebo symbol
      Žádný výsledek
      Zobrazit všechny výsledky
      • Burzy
        • Headlines
        • Breaking
        • Akcie
        • Hospodářské výsledky
        • ETF
        • Dividendy
        • IPO
        • Forex
        • Komodity
        • Kryptoměny
        • Ekonomika
      • Příležitost
      • DIP
      • IPO Radar
      • Nejčtenější
      • Bullionář Daily
      • Úspěch
        • Alternativní investice
        • Škola bullionáře
        • Miliardáři
        • Business
        • Bullionářova knihspirace
        • Bullionářův almanach
        • Bullionářův slovníček
      • AI
      • Česko
      • Invest mentoring
      • E-booky
      • Srovnávač brokerů
      • Kariéra
      Odebírat Ranního Bullionáře

      Retrieve your password

      Please enter your username or email address to reset your password.