keresés

2024. április 24., szerda

Az MI hatásai és generált problémái az internet világában

Manapság már mindenki tudja, akit kicsit is érdekelnek a tartalomgyártás modern formái, hogy mi is az az MI. Ebből következik, hogy rengeteg vélemény és álláspont keletkezett ezen technológia használatáról az internet világában. Ebben a cikkben a közelmúltban megjelent történésekre próbálok rámutatni, hogy a véleményalkotás folyamata minél fájdalommentes lehessen...



Zene, videó és képgenerálás MI segítségével

    Híres zenészek, többek között: Billie Eilish, Nicky Minaj, Katy Perry, a Jonas Brothers és az Imagine Dragons is aláírták a nyílt levelet, amiben arra szólítják fel a vállalatokat és mesterséges intelligencia-fejlesztőket, hogy ne ássák alá az emberi kreativitást, kifejezett hangsúllyal a zenére. A felháborodásra további okot nyújt az a tény, hogy a szóban forgó algoritmusokat engedély nélkül, jogvédett tartalmakon képezik, ami még egy irány amiből a művészeket és kreatív elméket megkárosítják. Az OpenAi ellen már több feljelentés történt hasonló feltevések miatt.

    Ma már több lehetőség közül is választhatunk, ha csak egy pár szó beírásával szeretnénk rövid videókat generálni az interneten, ilyen például a canva.com-on található AI Video Generator. Már a világ egyik legnagyobb videómegosztó oldalán a YouTube-on is vannak olyan kreátorok, akik nagyon is szeretnék, ha a generált tartalmak lennének az új norma. Egy Kwebbelkop nevezetű fickó azzal szeretne bekerülni a történelem könyvekbe (legalábbis a YouTube-éba biztosan), hogy a tisztán AI generált videótartalmak úttörője lesz.

    Még az Adobe, a cég aki a talán legjobban ismert képszerkesztőért felelős a világon, is szívesen beszáll a képgenerálás tökéletesítésébe. Saját programjukat erre a célra Firefly-nak nevezik, fényes jövővel és érdekes ötletek valóságba való átfektetésével kecsegtetnek. A másik nagy éllovasa a technológiának a DALL-E 3 névre hallgat. Ezt a programot akár a Bing böngészőben is elérhetjük, naponta felhasználható tokeneket kapunk, hogy ne mindenki egész nap foglalja le a programot ingyen.

Az NVIDIA újítása a játékiparban

    Nincs itt másról szó, mint tulajdonképpen a játékokban található NPC-k (Non Player Character=Nem Játékos Karakterek) interaktívabbá és természetesebbé tételéről. Személy szerint én érzek egy kis iróniát abban, hogy generatív mesterséges intelligenciával akarunk valamit "élethűbbé" tenni. A név feloldása az "Avatar Cloud Engine" nevet fedi, ugyanis több modullja van amikkel saját területükön beleszólhatnak egy a játékunkban való személy viselkedésébe:

Az NVIDIA NeMo szolgál arra, hogy nagy mennyiségű szöveget lehessen tárolni a karakterhez, ami alapján majd a válaszait generálja, így a különböző készítők testreszabhatják a karaktereket a saját világaikhoz.
Az NVIDIA Riva feladata az automata beszédfelismerés, valamint a szöveg hanggá alakítása, hogy az előző modullra építkezve létrehozza a beszélgetéseket.
Az NVIDIA Audio2Face pedig mindezekkel együtműködve azonnal reagál a hallotakra és a szituációhoz megfelelő arcmimikát biztosít az éppen velünk társalgó "majdnem" embertársunknak.

    Több újságírót is megvendégeltek, hogy tesztelhesse a technológia jelenlegi képességeit, a reakciók egy-két apróbb bakitól, furcsaságtól eltekintve pozitívak. Ezt a technológiát támogatva a Microsoft leszerződött az NVIDIA-val, hogy ilyen módon generálja egy-két jövőbeli játékában történetet és a küldetéseket. Valamint egy a közeljövőben megjelenő MMO (Massively Multiplayer Online Game) ami Jade Dynasty névre hallgat, arra fogja használni az NVIDIA ACE-t, hogy a karakterek beszédének animációját régiónként hozzáigazítsa a beszélt nyelvhez, legyen az angol vagy mandarin kínai.

Árak, szerzői jogok és védelmük

    Érdekes kérdést vet fel az sg.hu cikke az MI-vel kapcsolatban. Vajon ha a mesterséges intelligencia egy tevékenységet gyorsabban végez el az embernél, akkor az a munka kevesebbet ér? Olcsóbb lesz? Az Otto Group munkatársainak heti 30 perc időnyereséget jelent a mesterséges intelligencia használata, néhány felmérés azt mutatja, hogy az intenzívebb használat akár 3 óra időmegtakarítást is jelenthet. Kérdés, hogy erre hogyan reagálnak a szolgáltatók és hogy a megrendelők? Ugyanannyit számláznak majd? Egyáltalán kell tudnia a megrendelőnek, hogy a szolgáltató (mondjuk egy jogász vagy fordító) mesterséges intelligenciát vett igénybe a munka elvégzéséhez és ezzel jelentős időt takarított meg vagy csak az eredmény számít?

    Ezeket a veszélyeket szeretné csökkenteni az Európai Parlament, a mesterséges intelligenciáról szóló törvénnyel, amely megtiltja az MI "elfogadhatatlan kockázatot jelentő" alkalmazását és a kevésbé kockázatos típusaira is szabályozást ír elő. Négy kockázati kategóriát találunk a törvényben: magas, korlátozott, minimális vagy semmilyen. Magas kockázatúnak számít például a robotok által támogatott sebészet, a bűnüldözés, a vízumkérelmek vizsgálata és a hitelpontozó rendszerek. Olyan esetekben, amelyek az állampolgárok jogait sérthetik meg is tiltják az MI-alkalmazások használatát. Ilyen eset az arcfelismerő adatbázisok létrehozása, olyan módon, hogy internetről vagy zártláncú televíziós hálózatok felvételeiből töltik le a képeket, határozott céllal. Tiltott munkahelyeken, iskolákban gépi érzelemfelismerő rendszerek alkalmazása vagy az állampolgárok kockázati besorolása MI alkalmazásával, társadalmi hovatartozásuk vagy előéletük alapján és szintén tiltott minden olyan rendszer használata, amely az emberi viselkedést befolyásolja vagy sebezhetőségüket használja ki. Tiltják a távoli biometrikus azonosító (RBI) rendszerek alkalmazását, a valós idejű RBI alkalmazása is csak szigorú feltételek mellett lesz lehetséges.

    A törvény 20 nappal a hivatalos lapban való megjelenés után lép hatályba, egyes részei pedig 6 hónap illetve 36 hónap után. Nem okoz meglepetést, hogy a Computer & Communications Industry Association, a technológiai ipar lobbicsoportja ellenezte a törvényt. Azzal érvelnek, hogy lelassítja az innovációt, túl szigorúak a követelmények és ez elriaszthatja Európától az MI-vállalatokat és tehetségeket. Bízzunk benne, hogy nem így lesz és az Európai Parlament döntése védelmet ad az átlagembereknek, nem pedig a fejlődés gátja lesz. Segítségével talán előbb tanulunk meg bánni az AI-val, mielőtt ő tanul meg bánni velünk.
(Holló Beáta szemléjéből)

Hangklónozó technológia és a veszélyei

    Az OpenAI szerint a technológia hasznos lenne az élet számos területén. A Voice Engine elemzi a megadott hangrészletet és az olvasandó szöveget is, és ezekből generál megfelelő hangot. A hanggenerátor segítséget nyújthat olvasáshoz és oktatáshoz. Az Age of Learning, egy oktatási cég például tananyagok létrehozására használja. Az alkalmazás képes lenne szöveget fordítani bármely nyelvre, a hangadó akcentusát megtartva. Ez különösen hasznos tartalomgyártóknak, akik nagyobb közönséget kívánnak megszólítani. Ezt a funkciót használja a HeyGen vizuális történetmesélő platform. A Voice Engine továbbá a beszédre képtelen embereknek hangot adna. Egy agydaganatos beteg hangját már sikerült rekonstruálni egy régebbi hangfelvétel alapján. A megszokott monoton robothang helyett az alkalmazás valósághű beszédstílust biztosít. A Voice Engine hangfelvételek hangsúlya, hanglejtése realisztikus, az érzelmeket is jól közvetíti.

    Az OpenAI nem véletlen riadt meg új fejlesztésének képességeitől. A Voice Engine csupán 15 másodperces hangfelvétellel képes bárki hangjából szintetikus hangot alakítani. A lemásolt hang később káros felvételek gyártására is felhasználható, ma nagyon gyakori a különböző deepfake tartalmak készítése. A Voice Engine alkalmas lehet hamis politikai beszédek készítésére, a választások idején különösen veszélyes a megtévesztő hamis tartalmak létrehozása. További probléma a hangazonosítás alapú bankszámlák feltörése. Csak a Sora és a Voice Engine segítségével lehetséges lenne létrehozni egy élethű hamisított videót, hozzá pedig egy hamisított hangfelvételt. Komoly gondokat okozhatnak ezek a technológiák, mert akár személyazonosság-lopásra is felhasználhatók.
(Dobkowski Letícia szemléjéből)

Jövő a mesterséges intelligenciával

    A technológia világára mindig is jellemző volt egy új technológia megjelenésekor a robbanás-szerű, hirtelen fejlődés, aminek természetesen lesznek pártolói és gátolói egyaránt. Ezzel önmagában nincs is gond. Azonban az olyan mértékű változások, mint amiket az MI elterjedése és bevezetése az eddig taglalt területekre hozna mindenképpen elővigyázatosságra intenek. Nem biztos, hogy csak azért mert képesek vagyunk valamire, annak szabad teret is kell engedni és hagyni minden fejlesztőnek abba az irányba elvinni amerre csak akarja, nem beszélve arról, hogy még a szerzői problémájával sem tudnak a legtöbben megbirkózni. Személy szerint nem hittem volna, hogy lassan olyan problémák adódhatnak még az én életem alatt, mikkel eddig csak a sci-fi regények oldalain találkoztam. Mindenesetre úgy gondolom érdekes évtizedeknek nézünk elébe.

Nincsenek megjegyzések:

Megjegyzés küldése