keresés

2024. április 24., szerda

Az OpenAI továbbra is hasít a Mesterséges Intelligencia fejlesztésében

Az OpenAI a világ egy legnagyobb mesterséges intelligencia kutató vállalata, mely az elmúlt években rendkívüli módon forradalmasította a technológiát. Például létrehozták a ChatGPT-t és a DALL-E-t. Idén, 2024-ben újabb fejlesztéseket jelentettek be. Februárban bemutatták a szövegből videót generáló Sora-t. Márciusban pedig megszületett a Figure 01 nevű mesterséges intelligenciával működő robotjuk.

OpenAI 

Az OpenAI mesterséges intelligencia kutatólaboratóriumot 2015-ben alapította meg San Franciscoban többek között Elon Musk, Sam Altman és Greg Brockman. Céljuk az volt, hogy a barátságos mesterséges intelligenciát az emberiség egészének javára előmozdítsák és fejlesszék. Non-profit szervezetként indult, majd 2019-ben for-profitra váltott, s partnerségre lépett a Microsofttal, akik 1 milliárd dollárt fektettek bele a vállalatba.


ChatGPT 

Az OpenAI 2022-ben robbant be a köztudatba, amikor kiadták a ChatGPT (Generative pre-trained
transformer) nevű chatbotjukat. A chatbot a felhasználókkal való folyamatos kommunikáció automatizálása során értelmezőmodelleket használ, melyek segítségével a bevitt információkat azonnal interaktívan kezeli. Az úgynevezett megerősítő tanulás és a felügyelt tanulás módszerét alkalmazza. A szöveg beviteléhez (input) és kimenetéhez (output) GPT-3.5 AI algoritmust használtak. A ChatGPT egy olyan chatbot, melytől kérhetünk információt egy bizonyos témában, vagy konkrét feladatok megoldására utasíthatjuk. Akár egy szöveg, esszé, cikk megírására is alkalmas, amit tartalomgyártók a mindennapok során alkalmaznak. Vagy meglévő szöveg átfogalmazására is használható. De HTML kódok írására, programozásban is nagy segítség lehet. Fő anyanyelve az angol, de magyarul is jól működik. Ingyenesen használható, de regisztrálni kell a weboldalon. 2023-ban már több mint 100 millió felhasználóval rendelkezett, és a világ 26. leglátogatottabb weboldala volt. Az alap ingyenes verzió mellett meg lehet vásárolni a fizetős ChatGPT Plust. Valamint 2023 márciusában az OpenAI bemutatta a GPT-4 nevű multimodális nagy nyelvi modelljét. A multimodalitás azt jelenti, hogy a GPT-4 esetében már nem csak szöveges parancsokkal, de képekkel is lehet tartalmat generálni. Fenntartásokkal kell kezelni, mert nem biztos hogy minden információt helyesen ad meg, és előfordulhat, hogy hamis hivatkozásokat, kitalált dokumentumokat ír le. Valamint sokszor olyan, mintha törné a magyart, ezért érdemes tüzetesen átvizsgálni a szöveget és nem egy az egyben bemásolni.Problémás, hogy az ingyenes verzió csak 2022 januárjáig dolgozta fel eddig az információkat, így nem naprakész.
Több kihívója is akadt a ChatGPT-nek, például a Google Geminije, vagy a Microsoft Bingje, ami jelenleg Microsoft CoPilot néven fut.  Idén márciusban megjelent az Anthropic új Claude modellje, a Claude 3 Opus, ami a készítők szerint felülmúlja a GPT-4 fejlettségét is.
Nemrég az OpenAI bejelentette, hogy hamarosan, talán már nyáron megjelenik a GPT-5, ami állítólag lényegesen jobb lesz, mint a GPT-4.


Dall-E 

Az OpenAI a képgenerálás terén is forradalmi újításokat hozott. 2021-ben hozta létre a Dall-E-t, ami egy szövegből-kép (text-to-image) generáló modell. Egy olyan gépi tanulási modell, amely természetes nyelvű bemeneti leírást vesz fel (prompt), és a leírásnak megfelelő képet állít elő. Jelenleg már a DALL-E 3-nál tartanak. Az OpenAI célja, az volt, hogy minél valóságszerűbb képeket tudjanak generálni, minél jobb felbontásban. A szoftver neve a WALL-E Pixar-karakter és Salvador Dalí spanyol művész nevén alapuló szóösszerántás. Sajnos egyenlőre a DALL-E 3 csak a ChatGPT fizetős felhasználói számára érhető el. Nagy vetélytársa a Midjourney, melyet 2022-ben hoztak létre San Franciscoban. Jelenleg a 6. verziónál tart, és gyönyörű, fotórealisztikus képek generálására képes. Jelenleg a hivatalos Discord-szerveren lehet elérni. Miközben a Midjourney folyamatosan fejlődik, addig úgy gondolják a felhasználók, hogy a DALL-E 3 egyre gyengébb minőségű képeket generál, és lemarad a többi AI képgenerátortól. Például az Adobe már beépíti a Firefly 3 nevű generatív AI modellt a Photoshop új bétájába. 
2024 februárjától az OpenAI "vízjelekkel" látja el a DALL-E által generált képeket, azért, hogy visszaszorítsák az AI által generált képekkel való visszaéléseket.


Sora 

A világ tekintete most az OpenAI által létrehozott Sora-ra irányul. 2024 februárban bemutattak néhány text-to-video generált videót, de egyenlőre teszt üzemmódban működik. Rendkívül látványos, egy perces mozgóképeket készítettek promptokból, melyek szinte már teljesen valósághűek.
A program főbb képességei, például hogy képekből rövid videókat generálni. Parancsba adhatjuk, hogy úgy bővítsen egy videót, hogy átmenet nélküli, végtelen ismétlődést hozzon létre. Feljavíthat rossz minőségű képeket és videókat. Valamint képes digitális világokat szimulálni.
Hogyan működik a Sora? A szövegen alapuló videógenerátorok működése egy bonyolult folyamat. Az OpenAI így magyarázta a működését:  „A program olyan hálózatot képez, amely csökkenti a vizuális adatok dimenzióit. Ez a hálózat nyers videót vesz bemenetként, majd egy térben és időben tömörített, latens reprezentációt ad ki. A Sorát ebben a latens tömörített térben képzik, és ugyanitt generálja a videókat is. Képzünk egy megfelelő dekódoló modellt is, mely a generált latenseket visszaképezi a pixeltérre” – írja a cég a technológiáról.
A Sora-ban annyira valóságosan ábrázolják az embereket, hogy már állítólag az Uncanny Valley hatás sem jön elő. Az Uncanny Valley hatás azt jelenti, hogy egy mesterségesen ábrázolt karakter minél jobban hasonlít az emberre, annál szimpatikusabb. De amikor eléri azt a pontot, hogy már csak nagyon minimálisan tér el a valódi embertől, akkor nyugtalanságot, sőt félelmet vált ki a nézőből. Ezt egyébként horrorfilmek készítésénél előszeretettel alkalmazzák. 

A bemutatott videók alapján azt lehet elmondani, hogy valóban nagyon szép, valósághű videókat tudnak készíteni, de azért még a fizika törvényeivel harcolnak.

Áprilisban már videóklippet is készített a Sora August Kamp „Worldweight’ című dalához. A 2 perc 19 másodperces videó leginkább egy pszichedelikus utazásra hasonlít, de mindenképpen van benne potenciál.


Figure 01

Idén márciusban a vállalat bemutatta a Figure AI céggel együttműködve létrehozott mesterséges-intelligenciával rendelkező humanoid robotjukat. A Figure 01 modell azért különleges, mert nem irányítják őt, hanem saját maga dolgozza fel a kéréseket, lefuttat egy keresést az adatbázisában, mérlegel, és kiválasztja a legoptimálisabb választ. Mesterséges intelligenciával rendelkezik, pontosabban az OpenAI GPT-jével van ellátva. A robot tehát nem elég, hogy finom motorikus mozdulatokra képes, beszél, de még logikusan „gondolkodik” is.  A Figure 01 robot 167 cm magas, 60 kg a súlya, teherbírása 20 kg, 1,2 méter/szekundum a sebessége és 5 órán keresztül működik a feltöltéssel.
A Figure által feltöltött YouTube videóban látható férfi megkérdezte a robottól, hogy mit lát. Az felsorolta az asztalon látható tárgyakat. Majd a férfi megkérte arra, hogy adjon neki valamit enni, erre a robot odanyújtotta neki az almát. Ezután a férfi szemetet borított az asztalra, és azt kérte a 01-től, hogy amíg összeszedi a szemetet, addig magyarázza el, hogy miért pont az almát adta oda neki. Ezt is tökéletesen teljesítette a robot, majd még ezután elpakolta az asztalon látható tányért és poharat a helyére. Mikor megkérdezte a férfi, hogy szerinte hogyan teljesített, ő egy kis dadogással megtoldva azt válaszolta, hogy szerinte egészen jól. 


Ebben a videóban pedig az látható, hogy ugyan egyenletesen, de kissé óvatosan, lassacskán lépdel a Figure 01.


Kell-e attól félni, hogy a robotok elveszik az emberek munkáját? Sajnos a válasz az, hogy igen. Legalábbis valamennyi munkaterületen. A BMW megállapodást kötött a Figure vállalattal, hogy a Figure 01 robotokat hamarosan munkába állítják a BMW autógyártó cég dél-karolinai gyáregységében. A robotokat valószínűleg a nehéz fizikai munkákra vagy a monoton feladatoknál fogják alkalmazni. Ez mindenképpen elgondolkodtató, és valamilyen szinten félelmetes a jövőre nézve. Egyébként Elon Musk is mesterséges intelligencia humanoid robottal kísérletezik. A Tesla által kifejlesztett Optimus robotok Musk elmondása szerint már az idei év végén gyárakban dolgozhatnak


Sötét felhők az OpenAI felett

Tehát látható, hogy az OpenAI folyamatosan fejlődik, és újdonságokkal rukkol elő. De nem csak
pozitív hírekről lehetett olvasni a vállalattal kapcsolatban a közelmúltban. Novemberben Sam Altman alapítótagot és egyben vezérigazgatót eltávolította a vállalat éléről az igazgatótanács. Az oka az volt, hogy állítólag Altman a mesterséges intelligencia biztonságát veszélyeztette, valamint a férfi abuzív viselkedésére hivatkoztak. Ezután a vállalat több száz alkalmazottja fenyegetőzött, hogy felmondanak, így kénytelen volt az igazgatóság visszaállítani a vállalat élére Altmant.
Idén márciusban pedig Elon Musk (aki azután hagyta el a vállalatot, hogy 2019-ben for-profittá vált) perelte be az OpenAI-t. Úgy tűnik ez még mindig szúrja a szemét, mert úgy gondolja, hogy a vállalatnak „nyílt forráskódúvá és újra nonprofit szervezetté kellene válnia”. Muskot aggasztja, hogy az OpenAI nyílt forráskódú AGI-t (általános mesterséges intelligenciát) fejleszt, ami veszélyt jelenthet az emberiségre.

Mindenesetre az OpenAI tovább terjeszkedik, és hamarosan Japánban jön létre legújabb irodája. Korábban Londonban és Dublinban nyitott meg irodákat a San Francisco-i központ mellett. Így Tokióban már a negyedik irodájuk jön létre. 

Érdemes az OpenAI általi fejlesztéseket figyelemmel követni, hiszen folyamatosan újításokat hoznak. Sőt, azt is el lehet mondani, hogy valamilyen szinten az emberiség jövője van a vállalat kezében, hiszen már most is olyan fejlesztéseket végeztek, melyek a feje tetejére állították a világot.

Felhasznált források: 


Felhasznált képek: 


Nincsenek megjegyzések:

Megjegyzés küldése