keresés

2024. május 14., kedd

Schrödinger AI-a, avagy nyisd ki és megtudod, él-e még

Ha a nyelvészeket kérdezzük, bizonyára az év leggyakrabban használt szava lenne a "mesterséges intelligencia". Ha egy tech-újságírónál érdeklődünk, szinte kötelező eleme a cikkeknek. Van, akinek segítség a házi feladatban, van aki fenyegetésnek érzi. S bizonyára akad olyan is, aki gondolkodás nélkül oszt meg a beszélgetőprogramokkal minden személyes információt anélkül, hogy a legkisebb aggályai is felmerülnének. De voltaképp mi is ez az egész "MI"-mizéria? Újabb társadalmi-technológiai szappanbuborék, vagy csakugyan hasznos is lehet, és ha igen, mire?
Ahhoz, hogy a kérdést megválaszolhassuk, nem árt tisztában lenni néhány alapvető fogalommal. Először is: mit nevezünk mesterséges intelligenciának? A sajtó és a közvélemény ezt a kifejezést a chatbotokra és GPT-kre használja, tehát először ezek lényegével kell megismerkedni.

Hogyan működik a GPT?


A szó jelentése Generative Pre-trained Transformer, ha pedig például chatfunkcióra van programozva, akkor pre-prompted GPT-ről van szó. A rendszer nem más, mint egy hatalmas nyelvi mátrix. Az algoritmussal "megetetnek" hatalmas szöveggyűjteményeket bármilyen nyelven. Ilyen lehet a teljes Wikipédia, könyvek, cikkek, facebook-bejegyzések, weboldalak, blogok és lényegében bármi ami szöveges tartalommal bír. Ezekből fog összeállni a gyakran emlegetett több százmilliárdos nagyságrendű szókészlet, amelyben természetesen igen magas a redundancia, előfordulnak benne elírások, ékezethibák, stb. A betáplálás után a program ezeket a szövegeket alkotóelemeire szedi. A mondatok, szavak, de még a szótagok sem alkotnak többé egységet, hanem betűkre, karaktercsoportokra tördeli őket és létrehozza a töredékek kapcsolati mátrixát. Ezt leginkább egy hatalmas virtuális térbeli hálóként lehet elképzelni, ahol az egyes nyelvi elemek összeköttetésben állnak egymással. Ez a kapcsolat annál erősebb lesz, minél többször fordulnak elő az adott elemek egymáshoz közel a betáplált nyelvi szöveghalmazban.


GPT a gyakorlatban

Ezt követően lesz képes arra, hogy megadott szempontok alapján (promptolás) szöveget generáljon számunkra, azalapján, hogy az adott kontextusban (szókörnyezetben) milyen szavak fordulnak elő, követik egymást nagy valószínűséggel. A chatGPT-ket tehát arra programozzák, hogy a felhasználók által beírt kérdésekre nyelvileg minél relevánsabb választ adjanak. Ez jól példázható azzal, hogy a PULI magyar fejlesztésű GPT a megkezdett felsorolásra hogyan folytatja a sort további fűszerekkel, noha nincs tudomása arról, hogy mi az a fűszer. Azt azonban képes megállapítani, hogy ezek a szavak hasonló mondatokban hasonló szerepet szoktak betölteni.

Mythbusting


Hogy mi ebben a lényeges? A GPT tehát nem egy "tudásbázis", nem egy végtelenül okos valami, ami a világ minden kérdésére képes lesz válaszolni. Illetve nyelvtanilag talán igen ─de nem tényszerűen. A mélytanuló programok, ahogy Prószéky Gábor fogalmaz, nem "tudnak" mást, mint a külöböző szemléletű emberek gondolkodásában a világunkról alkotott szubjektív kép még szubjektívebb lecsapódásának (könyv, blog, cikk, facebook, stb formájában) erősen szűrt halmazát, ezeket pedig arra programozzák, hogy igyekezzenek a kérdéseinkre nyelvi és tematikus szempontok szerint odaillő szövegeket generálni. nem csoda hát, ha a kérdésemre adott válasza (példámban: javasoljon három, a bizánci könyvkötészettel foglalkozó könyvet) igen kielégítőnek tűnik, azonban az általa generált könyvcímek a valóságban természetesen nem léteznek.

Mire is jó ez az egész?

De vajon mit jelent ez a GPT-kre nézve? van egyáltalán értelmük, jelentőségük ezek után? Nos, a válasz igen, de mindenképp kisebb, mint amekkorára a köré épített buborék épp fúvódik. A félév során több cikket is írtam már olyan alkalmazási területekről, ahol ezek a modell nagyon jól használhatók. Most kiemelném egyrészt a nyelvi modellként való csakugyan úttörő fontosságát. Mivel nem egyes szavakon és a belé táplált szinonima-kapcsolatokon, nyelvtani szabályokon alapul, sokkal jobban működik például fordítóként (különösen azon nyelvek esetében, melyekből milliárdos nagyságrendű szóhalmazt tanítottak meg neki, a magyar ilyen szempontból sokkal kisebb állományú), mint hagyományos társai. Másik példámban kitértem arra is, hogy egy jól betanított modell képes lehet bizonyos sémák felismerésére például a Herculaneumi tekercsek olvasása kapcsán ilyen a tinta azonosítása (világos és sötét területek megkülönböztetése) az egyes scan-rétegeken, ami máskülönben kézzel, egyenként végzendő munka lenne. Vagy ilyen a rengeteg felvétel betanításán alapuló madárdal-felismerő alkalmazás, amely esetében szintén hasznosak lehetnek a gépi tanulófolyamatok.

Konklúzió, avagy itt van a macska elásva

Összegezve tehát a napjainkra felfutott "mesterséges intelligencia" túlságosan is magas elvárásokkal szembesül azok részéről, akik még nem látnak át az ezt övező túlzó ígéreteken és hírverésen. Azonban mint az internet korábbi hasonló buborékjai, ez is ki fog pukkanni, hogy elfoglalja valós, hasznos helyét az alkalmazások hosszú sorában és átadja a stafétát a következő nagy fellángolásnak. És hogy mit tehetünk addig? Legfontosabb mindig józan ítélőképességgel, a bulvársajtón túllátó tájékozottsággal és megértéssel, de nem kritika és felülvizsgálat nélkül alkalmazni a hétköznapi élet olyan területein, melyeken valóban segítségükre van.

Forrás: https://hirado.hu/belfold/cikk/2024/03/28/a-mesterseges-intelligencia-es-a-nyelvhasznalat-kozotti-kapcsolat-volt-az-elso-montagh-szalon-temaja/

Nincsenek megjegyzések:

Megjegyzés küldése