keresés

2020. szeptember 29., kedd

Az Internet Archive és a Wayback Machine

A technika fejlődése és az internet használat mindennapossá válása sok változást hozott az életünkbe. 
Egyre több tartalmat publikálunk és fogyasztunk különböző online felületeken, használjuk a közösségi oldalakat, blogokat olvasunk, esetleg írunk, de még a nyomtatott sajtót is kiegészíti, lassan talán kiváltja az internetes hírportálok megjelenése. 
Míg a kézzel írt vagy nyomtatott dokumentumokat megőrzik a könyvtárak, levéltárak és múzeumok, addig az interneten fellelhető információk könnyen törlődnek, módosulnak, elvesznek. Erre a problémára kíván megoldást nyújtani az Internet Archive.


Az Internet Archive egy olyan non profit archívum, amely 1996 óta folyamatosan gyűjti a w
eblapokat, illetve más, digitális formátumú adatokat, videókat, könyveket, egyebeket. Bárki hozzáférhet, bővítheti az archívumot, önkéntesek és szakértők is dolgoznak rajta. Céljuk, hogy összegyűjtsék az összes elérhető információt, illetve tudást, és azt mindenki számára elérhetővé tegyék.


A Wayback Machine
Az Internet Archive honlapjának felépítése egészen egyszerű, könnyen átlátható, így nem kell sokáig keresgélni, hogy mit hol találunk. Felül, középen rögtön a Wayback Machine keresője van, ahova url-t, vagy kulcsszavakat írhatunk be. Wayback Machine által megnézhetjük egy-egy weboldal korábbi verzióját, vagy akár törölt oldalakat is elérhetünk. 
Így az egyébként könnyen eltüntethető információk nem vesznek el, régi cikkeket, blogbejegyzéseket is megtekinthetünk, tanulmányozhatjuk a trendeket, változásokat. 
Ez mind kutatási szempontból, mind csak egyfajta szórakozásként érdekes és hasznos lehetőség. Ha például a Facebook bejelentkezési felületét nézzük, akkor látható, hogy az alapszínek és a tartalom is állandó, csak apró változtatások történtek, az utóbbi egy-két évben történtek látványosabb módosítások. 
Ennél érdekesebb lehet az Index, vagy más, akár külföldi hírportál például The New York Times oldalának megtekintése, ahol látható, hogy adott év adott napján mik voltak a fő témák, milyen jellegű cikkek jelentek meg. Mint egy újság, ez is sokat elárul az adott időszakról, hogy mi érdekelte az embereket, illetve mire szerették volna felhívni a figyelmet. Továbbá látható az esetleges fejlődés, a megfogalmazási stílus változása, illetve, hogy mik az aktuálisan érzékeny témák, miről és hogyan írtak.

Az Internet Archive további részei
Az Internet Archive felületén jelenleg elérhető a weboldalakon kívül 6,2 millió videó, 15 millió hanganyag, 2,1 millió TV műsor, 3,6 millió kép, 222 ezer koncertfelvétel, 594 ezer szoftver, valamint 28 millió könyv, illetve szöveg. 
A képek között található például a Brooklyn és a Metropolitan Museum válogatása is, ahol elég sok különböző alkotást tekinthetünk meg, illetve elérhető egy NASA gyűjtemény is. 
A TV műsorok között főleg hírműsorok vannak, itt van például külön Trump-archívum, naprakész információkkal az elnökkel kapcsolatos hírekről.
A könyvek, szövegek között főként klasszikusokat találhatunk meg, de jelen vannak magazinok, hivatalos dokumentumok is. Különböző amerikai könyvtárak gyűjteményében is böngészhetünk, mint például a Library of Congress vagy Boston Public Library, illetve egyetemek válogatása is elérhető: Columbia University, Kansas State University.
   
A "National Emergency Library" probléma
Ahogy a Könyves Magazin, The Verge és The Washington Post cikkében is olvashatjuk a világjárvány miatt bekövetkezett korlátozások alatt az Internet Archive csapata létrehozta a National Emergency Library-t. Alapvetően az volt ezzel a cél, hogy a könyvesboltok, könyvtárak, iskolák bezárása miatt senki se szenvedjen hiányt olvasnivalóban, így tulajdonképpen mindenféle hozzáférhető könyvet beszkenneltek és ingyenesen elérhetővé tettek bárki számára. Ha felhasználóként tekintünk erre, akkor azt gondolhatjuk, hogy ez egy nagyon jó dolog, és örömmel fogadjuk a hírt, hogy rengeteg kortárs, népszerű könyv gyakorlatilag ingyen elérhető számunkra.
Viszont ez nem ennyire egyszerű, hiszen gondolni kell a szerzői jogokra, az írókra és kiadókra, akik nem adtak engedélyt a könyvek szkennelésére és megosztására. Emiatt fogott össze  négy jelentős kiadó, hogy  perre vigyék az ügyet, ezek a Hachette, Penguin Random House, Wiley, és a  HarperCollins. A kiadók összefogására reagálva az Internet Archive úgy döntött, hogy módosít korábbi tervén és a teljes, korlátlan hozzáférést nem biztosítja tovább, a National Emergency Library 2020. június 16-án megszűnt. Ehelyett az Open Library felületén regisztrálva "kölcsönözhetünk" könyveket megadott időintervallumra. Főleg újabb, ma is népszerű könyveket érhetünk el, mint például Dan Brown: Inferno című kötete. Ez továbbra is ingyenes, de időben korlátozott a hozzáférés, ami kevésbé "kényelmes" lehetőség a folyamatos elérhetőséggel szemben. Jogilag talán ez sem teljesen megfelelő megoldás, viszont valamivel jobb, mint a korábbi koncepció, így ez jelenleg is működik.

Úgy gondolom, az Internet Archive küldetése, miszerint megőrzi és elérhetővé teszi az interneten, illetve máshol létrejött információkat, alapvetően jó koncepció lehet. A megvalósítás sem rossz, de a továbbiakban nagyobb figyelmet kell szánni a szabályokra, mint ahogy a szerzői jog esetében láthatjuk is.
Hiszen bármennyire is szép egy "egyetemes tudásbázis, információtár" létrehozásának gondolata, valamint biztosan örülnek az írók, művészek, egyéb alkotók, hogy minél több emberhez eljut a munkájuk, de így ezek az emberek nem kapják meg a bevételt, amit egy-egy termék eladása jelentene számukra. Ezt pedig nem hagyhatjuk csak úgy figyelmen kívül, hiába hisszük azt, hogy ami az interneten elérhető, az mind a miénk, mert ez hivatalosan nem így működik.

Hazai internet archiválási törekvések
Ahogy ebben a cikkben hosszan olvasható, hazánkban is megkísérlik a weblapok archiválását. Ez pontosabban a .hu végződésű domain nevekre vonatkozik, és egy nemzeti webtér létrahozása a cél. A projekt saját honlapján olvashatunk az eddigi eredményekről, illetve a demó verzió is elérhető. Az OSZK munkatársai 2017 tavaszán kezdték meg az előkészületeket. Sok kérdés, kétely felmerül a projekttel kapcsolatban, például, hogy mi alapján döntik el, mit érdemes elmenteni, vagy ha ez elkészül, akkor milyen módon, kik számára lesz elérhető. 
Az Internet Archive gyűjti a magyar oldalakat is, ám Drótos László szerint ez nem felel meg az elvárásoknak,  a mentett oldalakat nem ellenőrzik megfelelően. Hiszen az Internet Archive csapata számára nem a magyar web a prioritás, így biztosabb, pontosabb eredményt kaphatunk, ha hazai archiválás is folyik.

Nincsenek megjegyzések:

Megjegyzés küldése