keresés

2024. április 22., hétfő

Voice Engine - A hangklónozó AI technológia



Az OpenAI ChatGPT és Sora projektje bebizonyította, hogy a mesterséges intelligencia rengeteg lehetőséget nyújt a felhasználóknak. A ChatGPT bármely kérdésre tud választ generálni, a Sora által pedig elképesztően élethű tartalmakat lehet létrehozni. A cég célja a társadalom segítése, ennek ellenére számos biztonságot érintő kérdés vetődött fel valamennyi fejlesztés révén. Az OpenAI egyik legújabb alkalmazását, a Voice Engine hanggenerátort a cég is kockázatosnak vélte, mivel az hangklónozásra kifejezetten alkalmas. Az alkalmazást jelenleg csak szűk körben merik tesztelni.

 

Lehetőségek 


Az OpenAI szerint a technológia hasznos lenne az élet számos területén. A Voice Engine elemzi a megadott hangrészletet és az olvasandó szöveget is, és ezekből generál megfelelő hangot. A hanggenerátor segítséget nyújthat olvasáshoz és oktatáshoz. Az Age of Learning, egy oktatási cég például tananyagok létrehozására használja. Az alkalmazás képes lenne szöveget fordítani bármely nyelvre, a hangadó akcentusát megtartva. Ez különösen hasznos tartalomgyártóknak, akik nagyobb közönséget kívánnak megszólítani. Ezt a funkciót használja a HeyGen vizuális történetmesélő platform. A Voice Engine továbbá a beszédre képtelen embereknek hangot adna. Egy agydaganatos beteg hangját már sikerült rekonstruálni egy régebbi hangfelvétel alapján. A megszokott monoton robothang helyett az alkalmazás valósághű beszédstílust biztosít. A Voice Engine hangfelvételek hangsúlya, hanglejtése realisztikus, az érzelmeket is jól közvetíti.

 

Veszélyek

 

Az OpenAI nem véletlen riadt meg új fejlesztésének képességeitől. A Voice Engine csupán 15 másodperces hangfelvétellel képes bárki hangjából szintetikus hangot alakítani. A lemásolt hang később káros felvételek gyártására is felhasználható, ma nagyon gyakori a különböző deepfake tartalmak készítése. A Voice Engine alkalmas lehet hamis politikai beszédek készítésére, a választások idején különösen veszélyes a megtévesztő hamis tartalmak létrehozása. További probléma a hangazonosítás alapú bankszámlák feltörése. Csak a Sora és a Voice Engine segítségével lehetséges lenne létrehozni egy élethű hamisított videót, hozzá pedig egy hamisított hangfelvételt. Komoly gondokat okozhatnak ezek a technológiák, mert akár személyazonosság-lopásra is felhasználhatók.

 

Biztonsági intézkedések

 

A technológia fejlődésével egyre kevésbé lehet megkülönböztetni a valós és a generált felvételeket egymástól. Ebből következik, hogy a Voice Engine-t egyelőre nem jelentetik meg széles körben. A hanggenerátort még csak kevés partnerrel tesztelik. A Voice Engine tesztelői beleegyeztek a felhasználási feltételekbe, mely tiltja más személyek hangjának felhasználását hozzájárulás nélkül. A használóknak tehát kérniük kell a hangadó hozzájárulását, valamint fel kell tüntetni a létrehozott felvételen, hogy az mesterséges intelligencia által jött létre. Ezen kívül az OpenAI a felvételekbe vízjelet is helyez. Az OpenAI az nagy hangsúlyt fektet a biztonsági kérdésekbe, főleg az amerikai választások előtt.
 

Nincsenek megjegyzések:

Megjegyzés küldése