Google predstavil revolučný model AI. Za pár minút ti vytvorí vysoko realistické video

Alexandra Niková

21. mája 2024 o 06:30

Spoločnosť Google vytvorila model ako odpoveď na OpenAI
Model chcú implementovať aj na YouTube
Vygeneruje prírodnú scenériu aj háčkovaného slona

Alexandra Niková 21. mája 2024 o 06:30

ČLÁNOK POKRAČUJE POD REKLAMOU

Google prichádza s vlastnou AI technológiou, ktorá ti vytvorí realistické videá za pár minút.

Postupne sa má technológia s názvom Veo implementovať do najznámejšej platformy na zdieľanie videí, YouTube.

Implementácia do YouTube

Ako informuje portál Techbox, model Veo je odpoveďou na model podobný model Sora od spoločnosti OpenAI. Veo dokáže aktuálne generovať minútové videá v rôznych štýloch, pričom disponujú vysokou mierou realistickosti. Spoločnosť Google priamo avizuje, že schopnosti modelu Veo bude postupne implementovať do svojich služieb. Konkrétne do YouTube Shorts.

Modely sprostredkujúce realistické AI generované obrázky sú prístupné takmer všetkým. A to aj bez potreby zakúpenia si danej technológie. V oblasti videa sme sa však v rámci umelej inteligencie na túto úroveň ešte nedostali. Ide tak o prelomovú vec, pretože sa to začne vďaka Veo v priebehu tohto roka meniť.

Model Sora predstavila spoločnosť OpenAI vo februári tohto roka. Sora dokáže generovať 60-sekundové videá na základe textových požiadaviek používateľa. Model zatiaľ nie je verejne dostupný. Ukážky jeho práce je preto nutné brať s rezervou. Do takmer identického bodu sa teraz dostáva však aj model Veo od Google.

Google plánuje spustiť revolučné internetové vyhľadávanie. Ušetrí ti čas aj nervy

Realistické, ale stále trocha mimo

Aj napriek tomu, že sa môže zdať vytváranie AI videí rovnako jednoduché ako vytváranie obrázkov, nie je to tak. Generatívna AI má totiž bez dodatočnej korekcie problém s konzistentnosťou v rámci obrázku. Ak jej užívateľ zadá opakovane ten istý pokyn na vytvorenie daného obrázku, vždy vyjde tak trocha iný výsledok. Práve to predstavuje problém pri videách, ktoré sú vo svojej podstate iba zložené obrázky.

Vo videu, ktoré je zložené z minimálne 24 obrázkov zobrazených za sekundu, takéto rozdiely vidieť veľmi rýchlo. Celkový dojem z kvality a uveriteľnosti takéhoto videa potom logicky klesá. Dokonalým, hoci trochu extrémnym príkladom toho, je známe video Willa Smitha, ako si vychutnáva špagety. V rámci videa dochádza k viditeľnej deformácií celkového výjavu, čo je priamym dôsledkom nekonzistentne vygenerovaných AI obrázkov.

V prípade modelu Veo však už AI dokáže rozpoznať obsah, s ktorým pracuje. Pri generovaní obrázkov pre video dokonca simuluje aj jeho vnútornú fyziku. To sa spoločnosti Google podarilo vďaka využitiu rôznych technológií.

Môžeš si to vyskúšať?

Okrem vytvárania videa na základe textového zadanie dokáže Veo pracovať aj s už existujúcimi videami. Vie ich upravovať. Táto možnosť je najmä prínosná pre filmárov, ktorí si môžu v kratšom čase pozrieť rôzne úpravy svojho reálne nakrúteného materiálu.

Na základe tohto si potom môžu vybrať to, čo sa im najviac páči, a posunúť to už reálnym vizuálnym grafikom, ktorí im film upravia podľa ich predstáv.

Samotný Google upozorňuje, že generovanie videí je stále pomerne náročnou úlohou. Je preto nutné počítať s istou miernou nekonzistentnosti či skokmi v obsahu alebo vizuálnymi chybami.

Ako naznačuje článok na portáli Techbox, možno práve to je aj dôvod, prečo sa Google nepýši videami obsahujúcimi ľudskú tvár. Naše oko totiž dokáže na ľudskej tvári spozorovať aj ten najmenší náznak zvláštnosti či anomálie.

Ak by si si chcel Veo vyskúšať sám, nemáme pre teba dobrú správu. K modelu má aktuálne prístup iba úzka skupina tvorcov prostredníctvom platformy VideoFX od Google.

Ak by si však chcel skúsiť túto technológiu a si ochotný čakať, môžeš sa zapísať na čakaciu listinu. Google bude ale prístupy k modelu pravdepodobne sprístupňovať aj na základe regiónov.

Čítaj viac z kategórie: Technológie a internet

Zdroje: Techbox, Youtube//@alby13

Technológie a internet

Viac k téme: ai, AI a práca, AI fotky, AI videá, google, nové technológie, umelá inteligencia, video