Tvorcovia ChatGPT predstavili novinku, ktorá generuje videá. Výsledky ťa ohromia

  • Spoločnosť OpenAI uviedla nový model generatívnej AI
  • Sora dokáže vytvárať realistické videá trvajúce až 60 sekúnd
záber z videa vygenerovaného AI umelá inteligencia sora openai
Reprofoto: YouTube/OpenAI
  • Spoločnosť OpenAI uviedla nový model generatívnej AI
  • Sora dokáže vytvárať realistické videá trvajúce až 60 sekúnd

OpenAI, popredný hráč v oblasti umelej inteligencie, predstavila nový AI model s japonským názvom Sora, čo v preklade znamená „obloha“, ktorý vytvára „realistické“ a „imaginatívne“ videá trvajúce až 60 sekúnd pomocou krátkych textových promptov.

Ako sa uvádza v blogovom príspevku, Sora zvláda vygenerovať scény s viacerými postavami, špecifickým typom pohybov a detailne spracovaným pozadím. „Model je schopný pochopiť, čo bolo od neho vo výzve požadované, a zároveň ako tieto prvky existujú v reálnom svete.“

„Učíme AI chápať a simulovať fyzický svet v pohybe s cieľom trénovať modely, ktoré pomáhajú ľuďom riešiť problémy vyžadujúce interakciu v reálnom svete,“ píše sa v príspevku.

Personalizovaný obsah

Medzi prvotné ukážky patrilo video vytvorené na základe príkazu: „Filmový trailer zobrazujúci dobrodružstvá 30-ročného vesmírneho muža s červenou vlnenou motocyklovou prilbou, modrá obloha, soľná púšť, filmový štýl, záber na 35 mm film, živé farby,“ uvádza The Guardian.

OpenAI odmietla zverejniť konkrétne informácie o tom, ako prebiehalo trénovanie nového modelu. Je to pravdepodobne kvôli tomu, že si chce zachovať konkurenčnú výhodu. Spoločnosť však bola niekoľkokrát žalovaná za používanie materiálu chráneného autorskými právami pri školení svojich generatívnych nástrojov AI.

OpenAI tiež uviedla, že Sora je stále vo vývoji s jasnými „slabými stránkami“, najmä čo sa týka priestorových detailov. Nový model zatiaľ nie je prístupný širokej verejnosti, keďže v súčasnosti prebieha vyhodnotenie potenciálnych hrozieb spojených s jej používaním.

Nová technológia je zdieľaná len s obmedzenou skupinou akademikov a externých výskumníkov na posúdenie možných rizík. Prístup dostali aj vizuálni umelci, dizajnéri a filmári za účelom získania spätnej väzby o možnostiach jej využitia v kreatívnom odvetví.

Reece Hayden, senior analytik z ABI Research pre CNN uviedol, že modely umelej inteligencie tohto druhu by mohli významne ovplyvniť trh digitálnej zábavy tým, že prinesú nový personalizovaný obsah, ktorý bude dostupný prostredníctvom streamingových kanálov.

„Jeden zjavný prípad použitia je v rámci TV; vytváranie krátkych scén na podporu príbehov,“ povedal Hayden. „Model je však stále obmedzený, ale ukazuje smerovanie trhu.“

Potencionálne riziká

DALL-E, Midjourney a ďalšie nástroje na generovanie statických obrázkov dosiahli za posledné mesiace úroveň, o ktorej sa mnohým ani len nesnívalo. Tieto modely sa zdokonalili natoľko, že sú schopné generovať obrázky, ktoré len ťažko rozoznať od skutočných fotografií. Pokrok v oblasti AI však komplikuje rozpoznávanie dezinformácií na internete. Mnoho digitálnych umelcov sa tiež vyjadrilo, že majú problém s hľadaním práce.

„Všetci sme si robili žarty v roku 2022, keď sa Midjourney objavilo po prvý raz a povedali sme si, že je to roztomilé,“ hovorí pre The New York Times Reid Southen, tvorca filmových konceptov z Michiganu. „No dnes ľudia pre Midjourney prichádzajú o prácu.“

Aký dopad budú mať nové generatívne video nástroje, či už na trh práce alebo šírenie dezinformácií, zostáva nateraz otázne. OpenAI síce tvrdí, že videá budú označené vodoznakmi, ktoré ich identifikujú ako generované AI, avšak súčasne priznáva, že tieto vodoznaky sa dajú z videí odstrániť alebo môžu byť ťažko rozpoznateľné.

Zdroje: The Guardian, CNN, The New York Times

Najnovšie videá

Teraz najčítanejšie

Aktuálne čítajú

Trendové videá