Nová éra videí generovaných z textu
Spoločnosť OpenAI nedávno predstavila Sora – revolučný generatívny model, ktorý dokáže vytvárať videá a obrázky z jednoduchého textového zadania. Vďaka svojej výnimočnej architektúre Sora generuje minútové videá vo vysokom rozlíšení, pričom zvláda rôzne pomery strán aj rozlíšenia.
Táto novinka predstavuje výrazný posun v oblasti AI vizuálneho modelovania a potenciálne otvára dvere k realistickejšiemu simulovaniu sveta pomocou umelej inteligencie.
Ako Sora funguje?
Základom Sory je difúzny model, podobne ako pri DALL·E. Model začína generovanie videa z „šumu“ a postupne ho krok za krokom premieňa na realistické video – od predikcie jednotlivých častí obrazu až po dynamickú animáciu.
OpenAI využíva techniku recaptioningu známeho z DALL·E 3, ktorá zlepšuje prepojenie medzi textom a vizuálnym výstupom. Vďaka tomu dokáže Sora veľmi presne a detailne prekladať textové inštrukcie do vizuálnych akcií, ktoré sú realisticky zobrazené vo výslednom videu.
Od statického obrazu k plynulej animácii
Sora zvláda omnoho viac než len jednoduché generovanie videí na základe textu. Medzi jej ďalšie schopnosti patrí:
- Animovanie statických obrázkov,
- Plynulé predlžovanie existujúcich videí,
- Dopĺňanie chýbajúcich snímok vo videu,
- Zachovanie detailov, perspektívy a prirodzenej dynamiky.
Tým sa Sora výrazne odlišuje od predchádzajúcich video modelov, ktoré boli často obmedzené na krátke trvanie alebo pevné rozmery výstupov.
Sora ako simulátor sveta
Hoci technická správa neposkytuje detailné informácie o architektúre, ukazuje jasný cieľ: budovať modely, ktoré chápu a simulujú reálny svet. Sora tak predstavuje dôležitý krok na ceste k dosiahnutiu umelej všeobecnej inteligencie (AGI) – AI, ktorá nielen generuje obsah, ale aj porozumie kontextu, priestoru a časovej kontinualite.
Jej schopnosť vytvárať vizuálne scény na základe textu a dopĺňať ich realistickým správaním postáv, pohybom kamery a presnou fyzikou z nej robí mimoriadne silný nástroj pre budúcnosť kreatívneho obsahu, simulácií a virtuálnych svetov.
Záver
Sora nie je len ďalší text-to-video nástroj – je to prvý skutočný krok k tomu, aby sa AI naučila simulovať komplexnú realitu. OpenAI tým ukazuje, že generatívna inteligencia má potenciál zasiahnuť nielen umenie, ale aj filmový priemysel, vzdelávanie, vývoj hier či rozšírenú realitu.
Sledujte AIportal.sk, kde vám prinesieme ďalšie aktuality o vývoji umelej inteligencie a prelomových technológiách ako je Sora.

Zdroj: https://syncedreview.com/



