keresés

2024. március 4., hétfő

Nagy előrelépést tett az OpenAI a mesterséges intelligenciával generált videók terén

Az év elején bemutatkozott az OpenAI által készített, Sora névre hallgató videók generálásra alkalmas mesterséges intelligencia modell. A rendkívül népszerű ChatGPT-t létrehozó cég új alkotása számunkra még nem elérhető, de már számos videót közzétettek a fejlesztők az interneten. A leírt szöveg alapján megalkotott videók minősége pedig jelentősen javult az eddig látottakhoz képest, a szakértők szerint is.

A videókészítés új módszerei

Az egy évvel ezelőtti "Will Smith spagettit eszik" című mesterséges intelligenciával létrehozott videót nézve a fejlődés egyértelmű: a Sora új videói első pillantásra akár igazinak is tűnhetnek. Ugyanakkor az eddigi MI (mesterséges intelligencia) készítette képekből és videókból már ismert textúrák, a néhol furcsa perspektívák és mozgások még mindig jelen vannak és arról árulkodnak, hogy nem valódi felvételekről van szó. Az elhíresült Will Smith videó mellett jobb minőségű videók eddig is készültek már, de az OpenAI most nagy előrelépést tett az új fejlesztésével. 

A Sora szó japánul eget jelent, a készítők ezzel akartak utalni a végtelen kreatív lehetőségekre, amelyeket az eszköz ad. A videó generátor úgy működik, hogy szöveges formában megadjuk neki, hogy mit, esetleg milyen stílusban, műfajban, milyen kameramozgásokkal, milyen kamerával felvéve akarunk látni. Ezenkívül képes konkrét, már létező képeket mozgóvá tenni, az általunk megadott videókat pedig meg tudja hosszabbítani, vagy akár meg is tudja őket változtatni.

A Sora egyelőre maximum egy perces videókat tud készíteni, melyekben komplex mozgások, terek, karakterek létrehozására is képes. Ennek ellenére, azért akadnak problémák. A nagyon bonyolult parancsok és jelenetek esetében a perspektíva, fizikai törvények betartása és bizonyos mozdulatok még nem működnek kifogástalanul. Az OpenAI azonban jelenleg is dolgozik azon, hogy tökéletesítse a technológiát. 

A Sora versenytársaival ellentétben hosszabb videók készítésére is alkalmas, a képek pedig sokkal realisztikusabbak. Még nincs információ arról, hogy a Sora mikor lesz elérhető az emberek számára, de valószínűleg fizetni kell majd érte, ahogy az OpenAI olyan szolgáltatásaiért is, mint a DALL-E (kép generátor) és a ChatGPT-4 (szöveg generátor).

Ki és mire fogja használni? 

A mesterséges intelligenciát már korábban is alkalmazták az internetes videókészítők és a film stúdiók. A YouTube-on és a Twitch-en az elmúlt években népszerűvé váltak az úgy nevezett VTuber-ek, azaz virtuális youtuber-ek; az internetes platformokon megjelenő különböző content farmok szintén előszeretettel alkalmaznak MI-t; sőt még egy mesterséges intelligenciával készített hírcsatorna is létrejött. A pár kattintással létrehozható videók rossz hatással lehetnek a filmművészetre, de a pozitív módon való felhasználásról szintén elindult már a diskurzus.

A Sora az ilyen és ehhez hasonló területeken nyilván felhasználásra kerül majd. Ugyanakkor az élethű felvételek problémát is jelenthetnek, ha hamis hírek terjesztésére, bűncselekmények elkövetésére vagy pornó készítésére alkalmazzák a deepfake-hez hasonlóan. Ezek megelőzésének érdekében már elindultak a törekvések a törvénykezésben, de az OpenAI jelenleg a szerzői jogok megsértése miatt is bajban van. A szerzői jogok megfelelő használatának kérdése pedig a Sora-t szintén érintheti majd.


Fő források:

Sora: Everything we know about OpenAI’s new video creator - El País, Alonso Martínez, 2024.02.22.

Félelmetesen lenyűgöző videókat generál az OpenAI új modellje - Telex, Bolcsó Dániel, 2024.02.16.


 

Nincsenek megjegyzések:

Megjegyzés küldése