Invest mentoring
Odebírat Ranního Bullionáře
Burzovnisvet Logo
  • Headlines
    • Breaking
    • Bullionář Daily
    • Akcie
    • Hospodářské výsledky
    • ETF
    • Dividendy
    • IPO
    • Forex
    • Komodity
    • Kryptoměny
    • Ekonomika
  • Příležitost
  • DIP
  • IPO Radar
    TBA Bude oznámeno

    Finančně-technologická společnost, která nabízí digitální bankovní služby

    TBA Bude oznámeno

    Finančně-technologická společnost nabízející širokou škálu finančních služeb

    TBA Bude oznámeno

    ​Komunikační platforma umožňující uživatelům komunikovat pomoci hlasu a textu

    TBA Bude oznámeno

    Britská digitální banka a první peer-to-peer (P2P) platforma na světě

    TBA Bude oznámeno

    Technologická společnost poskytující infrastrukturu pro online platby

    TBA Bude oznámeno

    Čínska společnost pro globální online prodej rychlé módy za dostupné ceny

    TBA Bude oznámeno

    Společnost poskytující cloudovou platformu pro datovou analytiku

    TBA Bude oznámeno

    Švédská fintech společnost, která poskytuje služby „kup teď, zaplať později“

  • Úspěch
    • Alternativní investice
    • Škola bullionáře
    • Miliardáři
    • Business
    • Bullionářova knihspirace
    • Bullionářův almanach
    • Bullionářův slovníček
  • AI
  • Česko
  • E-booky
  • Srovnávač brokerů
  • Kariéra
  • Login
Burzovnisvet.cz - Akcie, kurzy, burza, forex, komodity, IPO, dluhopisy - zpravodajství
  • Headlines
    • Breaking
    • Bullionář Daily
    • Akcie
    • Hospodářské výsledky
    • ETF
    • Dividendy
    • IPO
    • Forex
    • Komodity
    • Kryptoměny
    • Ekonomika
  • Příležitost
  • DIP
  • IPO Radar
    TBA Bude oznámeno

    Finančně-technologická společnost, která nabízí digitální bankovní služby

    TBA Bude oznámeno

    Finančně-technologická společnost nabízející širokou škálu finančních služeb

    TBA Bude oznámeno

    ​Komunikační platforma umožňující uživatelům komunikovat pomoci hlasu a textu

    TBA Bude oznámeno

    Britská digitální banka a první peer-to-peer (P2P) platforma na světě

    TBA Bude oznámeno

    Technologická společnost poskytující infrastrukturu pro online platby

    TBA Bude oznámeno

    Čínska společnost pro globální online prodej rychlé módy za dostupné ceny

    TBA Bude oznámeno

    Společnost poskytující cloudovou platformu pro datovou analytiku

    TBA Bude oznámeno

    Švédská fintech společnost, která poskytuje služby „kup teď, zaplať později“

  • Úspěch
    • Alternativní investice
    • Škola bullionáře
    • Miliardáři
    • Business
    • Bullionářova knihspirace
    • Bullionářův almanach
    • Bullionářův slovníček
  • AI
  • Česko
  • E-booky
  • Srovnávač brokerů
  • Kariéra
    • Žádný výsledek
      Zobrazit všechny výsledky
BS Logo

Společnost Meta tvrdí, že její nový model generování umění je nejlepší ve své třídě

Během posledních dvou let se generátory obrázků s umělou inteligencí staly víceméně komodifikovanými, a to díky široké dostupnosti a snižujícím se technickým překážkám.

Michal Kmeť Autor: Michal Kmeť
17 září, 2023
4 min. čtení
Zdroj: Unsplash

Zdroj: Unsplash

4 min.
čtení
Chcete využít této příležitosti? Přihlaste se k odběru newsletteru

Nasazují je prakticky všichni významní technologičtí hráči, včetně společností Google a Microsoft, a také nespočet začínajících firem, které se snaží urvat kus stále lukrativnějšího koláče generativní umělé inteligence.

To však neznamená, že jsou ještě konzistentní, pokud jde o výkon – zdaleka tomu tak není. Kvalita generátorů obrazu se sice zlepšila, ale jde o postupný, někdy až mučivý pokrok.

Meta však tvrdí, že se jí podařil průlom

Společnost Meta dnes oznámila model CM3Leon („chameleon“ v neobratné řeči leetspeaku), který podle společnosti dosahuje špičkového výkonu při generování textu na obraz. CM3Leon se vyznačuje také tím, že je jedním z prvních generátorů obrázků schopných generovat popisky k obrázkům, čímž podle společnosti Meta položil základy pro další modely schopné porozumět obrázkům.

Zdroj: Getty Images

„Díky schopnostem CM3Leon mohou nástroje pro generování obrázků vytvářet ucelenější snímky, které se lépe řídí vstupními pokyny,“ napsala Meta v příspěvku na blogu. „Věříme, že vysoký výkon CM3Leon v různých úlohách je krokem k vyšší věrnosti generování a porozumění obrazu.“

Většina moderních generátorů obrázků, včetně DALL-E 2 od OpenAI, Imagen od Googlu a Stable Diffusion, se při vytváření umění spoléhá na proces zvaný difúze. Při difúzi se model učí, jak postupně odečítat šum z výchozího obrazu tvořeného výhradně šumem – krok za krokem se přibližuje k cílovému podnětu.

Advertisement

Výsledky jsou působivé. Difuze je však výpočetně náročná, takže její provoz je drahý a dostatečně pomalý, takže většina aplikací v reálném čase je nepraktická.

Naproti tomu CM3Leon je transformační model, který využívá mechanismus zvaný „pozornost“ pro zvažování relevance vstupních dat, jako je text nebo obrázky. Pozornost a další architektonické zvláštnosti transformátorů mohou zvýšit rychlost trénování modelů a usnadnit jejich paralelizaci. Jinými slovy, větší a větší transformátory lze trénovat s výrazným, ale nikoli nedosažitelným nárůstem výpočetní kapacity.

Společnost Meta tvrdí, že CM3Leon je ještě efektivnější než většina transformátorů, protože vyžaduje pětkrát méně výpočtů a menší soubor trénovacích dat než předchozí metody založené na transformátorech.

Zdroj: Unsplash

Zajímavé je, že společnost OpenAI zkoumala transformátory jako prostředek generování obrazu již před několika lety v modelu nazvaném Image GPT. Nakonec však od této myšlenky upustila ve prospěch difúze – a možná brzy přejde na „konzistenci“.

K tréninku CM3Leon použila společnost Meta datovou sadu milionů licencovaných obrázků ze služby Shutterstock. Nejschopnější z několika verzí CM3Leon, které Meta vytvořila, má 7 miliard parametrů, což je více než dvakrát tolik než DALL-E 2. (Parametry jsou části modelu naučené z trénovacích dat a v podstatě definují dovednosti modelu v daném problému, jako je generování textu – nebo v tomto případě obrázků.)

Jedním z klíčů k vyššímu výkonu systému CM3Leon je technika zvaná supervised fine-tuning, zkráceně SFT. SFT se s velkým úspěchem používá k trénování modelů pro generování textu, jako je ChatGPT společnosti OpenAI, ale Meta předpokládá, že by mohla být užitečná i při použití v oblasti obrazu. Vyladění instrukcí skutečně zlepšilo výkon modelu CM3Leon nejen při generování obrázků, ale i při psaní popisků k obrázkům, což mu umožnilo odpovídat na otázky týkající se obrázků a upravovat obrázky podle textových instrukcí (např. „změň barvu oblohy na jasně modrou“).

Většina generátorů obrázků má problémy se „složitými“ objekty a textovými výzvami, které obsahují příliš mnoho omezení. Ale CM3Leon to nedělá – nebo alespoň ne tak často. V několika vybraných příkladech Meta nechala CM3Leon vygenerovat obrázky pomocí zadání typu „Malý kaktus ve slaměném klobouku a neonových slunečních brýlích na saharské poušti“, „Detailní fotografie lidské ruky, model ruky“, „Hlavní hrdina mýval v anime se připravuje na epickou bitvu se samurajským mečem“ a „Značka zastávky ve stylu Fantasy s textem ‚1991‘“.

Zdroj: Techcrunch

Nasazují je prakticky všichni významní technologičtí hráči, včetně společností Google a Microsoft, a také nespočet začínajících firem, které se snaží urvat kus stále lukrativnějšího koláče generativní umělé inteligence.To však neznamená, že jsou ještě konzistentní, pokud jde o výkon – zdaleka tomu tak není. Kvalita generátorů obrazu se sice zlepšila, ale jde o postupný, někdy až mučivý pokrok.Společnost Meta dnes oznámila model CM3Leon , který podle společnosti dosahuje špičkového výkonu při generování textu na obraz. CM3Leon se vyznačuje také tím, že je jedním z prvních generátorů obrázků schopných generovat popisky k obrázkům, čímž podle společnosti Meta položil základy pro další modely schopné porozumět obrázkům.„Díky schopnostem CM3Leon mohou nástroje pro generování obrázků vytvářet ucelenější snímky, které se lépe řídí vstupními pokyny,“ napsala Meta v příspěvku na blogu. „Věříme, že vysoký výkon CM3Leon v různých úlohách je krokem k vyšší věrnosti generování a porozumění obrazu.“Většina moderních generátorů obrázků, včetně DALL-E 2 od OpenAI, Imagen od Googlu a Stable Diffusion, se při vytváření umění spoléhá na proces zvaný difúze. Při difúzi se model učí, jak postupně odečítat šum z výchozího obrazu tvořeného výhradně šumem – krok za krokem se přibližuje k cílovému podnětu.Výsledky jsou působivé. Difuze je však výpočetně náročná, takže její provoz je drahý a dostatečně pomalý, takže většina aplikací v reálném čase je nepraktická.Naproti tomu CM3Leon je transformační model, který využívá mechanismus zvaný „pozornost“ pro zvažování relevance vstupních dat, jako je text nebo obrázky. Pozornost a další architektonické zvláštnosti transformátorů mohou zvýšit rychlost trénování modelů a usnadnit jejich paralelizaci. Jinými slovy, větší a větší transformátory lze trénovat s výrazným, ale nikoli nedosažitelným nárůstem výpočetní kapacity.Společnost Meta tvrdí, že CM3Leon je ještě efektivnější než většina transformátorů, protože vyžaduje pětkrát méně výpočtů a menší soubor trénovacích dat než předchozí metody založené na transformátorech.Zajímavé je, že společnost OpenAI zkoumala transformátory jako prostředek generování obrazu již před několika lety v modelu nazvaném Image GPT. Nakonec však od této myšlenky upustila ve prospěch difúze – a možná brzy přejde na „konzistenci“.K tréninku CM3Leon použila společnost Meta datovou sadu milionů licencovaných obrázků ze služby Shutterstock. Nejschopnější z několika verzí CM3Leon, které Meta vytvořila, má 7 miliard parametrů, což je více než dvakrát tolik než DALL-E 2. Jedním z klíčů k vyššímu výkonu systému CM3Leon je technika zvaná supervised fine-tuning, zkráceně SFT. SFT se s velkým úspěchem používá k trénování modelů pro generování textu, jako je ChatGPT společnosti OpenAI, ale Meta předpokládá, že by mohla být užitečná i při použití v oblasti obrazu. Vyladění instrukcí skutečně zlepšilo výkon modelu CM3Leon nejen při generování obrázků, ale i při psaní popisků k obrázkům, což mu umožnilo odpovídat na otázky týkající se obrázků a upravovat obrázky podle textových instrukcí .Většina generátorů obrázků má problémy se „složitými“ objekty a textovými výzvami, které obsahují příliš mnoho omezení. Ale CM3Leon to nedělá – nebo alespoň ne tak často. V několika vybraných příkladech Meta nechala CM3Leon vygenerovat obrázky pomocí zadání typu „Malý kaktus ve slaměném klobouku a neonových slunečních brýlích na saharské poušti“, „Detailní fotografie lidské ruky, model ruky“, „Hlavní hrdina mýval v anime se připravuje na epickou bitvu se samurajským mečem“ a „Značka zastávky ve stylu Fantasy s textem ‚1991‘“.
Tagy: CM3Leongenerovani obrazkumetaMeta Platforms

Chcete využít této příležitosti?

Zanechte svůj telefon a email a budete kontaktováni licencovanými odborníky

      Advertisement

      Breaking.

      17:32

      Chaos na letišti v Newarku frustruje dopravce a znepokojuje cestující

      17:15

      Indie a Pákistán se po jednáních zprostředkovaných USA dohodly na příměří, oznámil Trump

      15:55

      Google zaplatí Texasu 1,4 miliardy dolarů kvůli shromažďování osobních údajů

      15:15

      Zelenskyj se dohodl s evropskými lídry na příměří, Putinovi pohrozili sankcemi

      15:00

      Avatar oběti vytvořený pomocí AI u soudu oslovil svého vraha

      14:55

      Akcie Lyftu prudce rostou: Společnost zvyšuje program zpětného odkupu akcií na 750 milionů dolarů a v prvním čtvrtletí se dostala do zisku

      Advertisement

      Příležitosti.

      Zdroj: Getty Images
      Akcie

      Akcie AppLovin mohou po zveřejnění silných výsledků vzrůst o více než 30 %

      9 května, 2025

      Společnost AppLovin, významný hráč v oblasti reklamních technologií, znovu přitáhla pozornost investorů i analytiků poté, co ve středu oznámila výsledky...

      Zdroj: Shutterstock

      Disney plánuje první zábavní park na Blízkém východě v Abú Dhabí

      8 května, 2025
      Zdroj: Unsplash

      Nvidia a další technologické tituly posilují díky očekávání silných výsledků

      6 května, 2025
      Zdroj: Getty Images

      Tato energetická společnost má našlápnuto k silným ziskům

      5 května, 2025
      zdroj: Getty Images

      Které společnosti si vybrala banka JPMorgan pro začátek května

      5 května, 2025

      Tip editora.

      AI

      Milion byl málo. AI e-book, který vydělal investorům přes 90 %

      9 května, 2025

      Na jaře 2024 jsme na Burzovním Světě publikovali e-book AI Portfolio – výběr deseti technologických akcií s vysokým potenciálem růstu....

      Nejčtenější zprávy.

      Index S&P 500 zakončil týden poklesem před obchodními jednáními mezi USA a Čínou

      9 května, 2025

      Americké akcie rostou díky obchodní dohodě mezi USA a Velkou Británií

      8 května, 2025

      S&P 500 klesá kvůli nedostatečnému pokroku v obchodních jednáních mezi USA a Čínou

      6 května, 2025

      S&P 500 uzavřel výše po rámcové obchodní dohodě USA a Velké Británie

      8 května, 2025

      Indie právě uzavřela rozsáhlou obchodní dohodu – ale ne s USA

      6 května, 2025

      ČNB letos čeká schodek veřejných financí 2,1 pct HDP, za rok vyšší kvůli obraně

      9 května, 2025

      Palantir překonává očekávání, investory však znepokojuje vysoké ocenění

      10 května, 2025

      S&P 500 končí výše po divokých výkyvech v důsledku zpráv o Fedu a obchodu

      7 května, 2025
      Advertisement

      IPO Radar.

      Chime Financial, Inc.

      Datum IPO: 2025
      Potenciální ocenění: 25 miliard dolarů

      Buďte u toho
      Advertisement

      Veškeré materiály a informace umístěné na internetových stránkách Burzovního Světa jsou čerpány z veřejně dostupných zdrojů, jako napriklad tyto a slouží výhradně pro informační účely. Při jejich tvorbě bylo postupováno s vynaložením maximální péče. Informace uveřejněné na internetových stránkách Burzovní Svět nemají charakter právních, daňových či jiného doporučení, analýz nebo návrhů a nabídek ke koupi či prodeji investičních nástrojů, jejichž realizací může dojít k poklesu či ztrátě investovaného majetku. Investiční doporučení, která jsou takto označena, jsou pouze informativní a nezávazná. Burzovní Svět neodpovídá za jakoukoli případnou škodu, která v souvislosti s nimi vznikne. Pro obchodování s investičními nástroji proto využívejte výhradně společnosti s udělenou licencí ČNB, popřípadě s platným povolením k činnosti na území České Republiky.

      Burzovní Svět zároveň prohlašuje, že neodpovídá za přímou i nepřímou škodu vzniklou v důsledku obchodování na kapitálových trzích všeobecně a příspěvky v diskusích vyjadřující názory čtenářů, nemusí být v souladu s postojem provozovatele a není možno je tím pádem považovat za jeho názory. Udělením souhlasu / přijetím podmínek zároveň souhlasíte s možností zasílání, či jiného kontaktování v rámci marketingových služeb obchodních partnerů Burzovního Světa. Více informací o cookies

      • Zásady ochrany osobních údajů a cookies
      • Reklama
      • Kontakt

      Burzovnisvet.cz © 2025

      Burzovnisvet.cz © 2025

      Název nebo symbol
      Žádný výsledek
      Zobrazit všechny výsledky
      • Burzy
        • Headlines
        • Breaking
        • Akcie
        • Hospodářské výsledky
        • ETF
        • Dividendy
        • IPO
        • Forex
        • Komodity
        • Kryptoměny
        • Ekonomika
      • Příležitost
      • DIP
      • IPO Radar
      • Nejčtenější
      • Bullionář Daily
      • Úspěch
        • Alternativní investice
        • Škola bullionáře
        • Miliardáři
        • Business
        • Bullionářova knihspirace
        • Bullionářův almanach
        • Bullionářův slovníček
      • AI
      • Česko
      • Invest mentoring
      • E-booky
      • Srovnávač brokerů
      • Kariéra
      Odebírat Ranního Bullionáře

      Retrieve your password

      Please enter your username or email address to reset your password.