keresés

2024. február 29., csütörtök

Lila kagylók, nyaraló rómaiak és a gépi tanulás

Bármily érdekesen hangzik is a cím, rögtön némi igazításra szorul: lila színű kagylókról ugyanis nem lesz szó, legfeljebb azokat a fajokat említhetjük meg, melyekből az ókorban a lila festéket nyerték. És hogy ez miért érdekes? πορφύ̣ρ̣ας̣ vagy πορφυ̣ρ̣ας̣, (porphyras), vagyis lila (festék, amit anyagok színezésére használtak)  ez az a szó, amelyet elsőként sikerült kiolvasni a legújabb, gépi tanulást is felhasználó módszerekkel a PHerc Paris 4-es számú herculaneumi papirusztekercsről.


Villa dei papiri, azaz papirusz-villa és Herculaneum

A PHerc Paris 4-es tekercs
A település már a Kr. e. VI. században létezett, ám csak Kr. e. 89-ben lett a Római Birodalom részévé, innentől az elit kedvelt nyaralóhelyének számította kis falu. 79-ben Pompeiivel együtt pusztította el a Vezúv kitörése. Később Resina városa települt a helyére, a római kori romokat csak a XVIII. században fedezték fel. Először a találomra ásott alagutak segítségével kezdődött meg az épületek kincseinek fosztogatása, ezt hamar felváltották a III. Károly spanyol király által is támogatott régészeti feltárások. Így találtak rá 1752-ben a később Papirusz-villának elnevezett épületre. A ház Lucius Calpurnius Pisoé, Julius Caesar apósáé volt, aki közel 1800 tekercses könyvtárát is itt őrizte. A papirusztekercsek teljesen elszenesedve vártak sorukra közel 1700 éven át a föld alatt. A sors iróniája, hogy a felbecsülhetetlen értékű szénrudakat a parasztok első megtalálásukkor fáklyának vélték és a kincsek utáni keresgéléshez világításként használták őket.

A tekercsek olvasása

A tudósokat, műkedvelőket, kutatókat természetesen már a kezdetektől foglalkoztatta a tekercsek elolvasása. A cél érdekében számos módszerrel próbálkoztak, mint például a tekercs félbevágása, és a belső rétegek elolvasása majd lekaparása, vagy a széttekerés. Ezen módszerek azonban gyakran erősen rongálták, vagy teljesen megsemmisítették az egyébként is rendkívül törékeny tekercseket. Néhány évtizeddel ezelőtt azonban sikerült új, érintésmentes módszereket kidolgozni. 

Ilyen volt a máshol már bevált CT-szkennelés, azonban ezesetben nem jártak sikerrel, a tinta ugyanis szénalapú, nem tartalmaz fémet (vasat vagy ólmot) mint az Ein Gedi-tekercs tintája. Egyre nagyobb felbontású CT, röntgen- és lézerszkeneléssel azonban sikerült két tekercs 3D-s képét is elkészíteni.

Vesuvius Challenge

Porphyras, az első elolvasott szó
az 1-es tekercsen
Az így készült képeken a betűket a papiruszrostok benyomódásából és torzulásából fejtik vissza, a legújabb fejlemények szerint pedig már tintalenyomatokat is sikerült detektálni. A folyamat emberi munkával nagyon lassú és nehéz, a kutatócsoport ezért fordult a nagyközönség és az érdeklődő amatőrök felé. Két kiválasztott tekercsről (PHerc Paris 4 és PHerc Paris 3) készített többezer képet és egy a betűk felismerésére programozott gépi tanuló algoritmust tettek közzé, pénzjutalmak kitűzésével is ösztönözve az érdeklődőket. A három eddigi legsikeresebb résztvevő több mint 140 karaktert azonosított, köztük az első szót: porphyras. A projektben számos kutató, egyetemista, programozó és laikus is részt vesz, a lehetőség pedig bárki számára nyitva áll. A projekt honlapján a vállalkozó szelleműek minden eddig elkészült 3D szkennelést, programot, magyarázatot és segítséget megkapnak, hogy ők is részt vehessenek a közösségi munkában. 

A projekt két kategóriára oszlik: a rétegek elkülönítésére és a tintadetektálásra (ez fogja lehetővé tenni a betűk felismerését). Az eddigi eredmények alapján sejthető, hogy az 1-es számú vizsgált tekercs Philodémosz egy eddig ismeretlen művét tartalmazza.

A 2024-es cél nem kisebb, minthogy a jelenleg digitalizált négy tekercs mindegyikét legalább 90%-ban elolvassák. Izgalmas és hasznos kihívás ez mind a programozóknak, kutatóknak mind pedig az épp felfutó gépi tanulási algoritmusoknak és azok szakértőinek is.

Nincsenek megjegyzések:

Megjegyzés küldése