keresés

2023. november 12., vasárnap

Az Internet Archive története és szolgáltatásai

Az Internet Archive egy nonprofit digitális könyvtár, mely több millió könyvhöz, filmhez, szoftverhez, hanganyaghoz, archivált weboldalhoz, illetve egyéb tartalmakhoz nyújt ingyenes és legális hozzáférést. 1996-ban jött létre Brewster Kahle által, aki az Archívumon felül az Alexa Internet elnevezésű kezdeményezését is létrehozta akkoriban. Ez utóbbi - mely 1999-ben már az Amazon tulajdonát képezte - az internetes oldalak forgalmát volt hivatott megbecsülni és rangsorolni, 2022-es megszűnéséig.

Az Internet Archive kezdetben csak magát az internetet archiválta, ami a terjeszkedése első szakaszaiban járt a 90-es években. Mint az újságok esetében, az interneten megjelenő tartalmak is hamar elavulónak számítottak, de – ellentétben az újságokkal – senki nem „gyűjtötte” őket. Az archiválás 1996 októberében kezdődött meg nagyobb mértékben, egyes weblapok azonban már májusban elmentésre kerültek. Ezeket az archivált oldalakat először 2001-ben láthatták az internetezők, ekkor vált nyilvánosan hozzáférhetővé a Wayback Machine.

Wayback Machine

Nyilvánossá tétele előtt Kahle kutatókkal, tudósokkal osztotta meg az adatbázist. 2001-es nyilvánosságra bocsátása mögött az a motiváció állt, hogy „univerzális hozzáférést biztosítsanak minden tudáshoz.” Ekkor már több, mint tízmilliárd archivált oldalt tartalmazott. Ez a weboldal elsősorban azt a célt szolgálja, hogy a weblapok tartalma ne vesszen el felülírás vagy törlés esetén. Ugyanaz a weblap többször is archiválásra kerülhet, ilyenkor a felhasználók az összes különböző verziót megtekinthetik. Az oldal elnevezése egy, a Rocky és Bakacsin kalandjai című animációs rajzfilmsorozatban felbukkanó, azonos nevű, fiktív időutazó és fordító eszközre utal.

Működését tekintve a Wayback Machine rendszere bizonyos időközönként önállóan elvégzi az archiválást, de a folyamat felgyorsítása érdekében manuálisan is rögzíthetők a weboldalak, feltéve, ha az adott oldalon nincs tiltás arra vonatkozóan, hogy a Wayback Machine elmentheti-e. A publikus tartalom beolvasását végző ún. keresőcrawlerek (keresőrobotok) alapjáraton tiszteletben tartják a robots.txt-t, vagyis a Robots Exclusion Protocolt, amelyben a weboldal üzemeltetője meghatározhatja a keresés korlátait, illetve kizárhatja a találatok közül az oldal bizonyos elemeit.
A Wayback Machine előfizetéshez kötött „párja” a 2005-ben debütált Archive-It.org, melyet kifejezetten az intézmények és tartalomkészítők számára hoztak létre, hogy saját maguk gyűjthessék össze és archiválják tartalmaikat.

Könyvek

Mivel az Internet Archive alapjáraton digitális könyvtárként hivatkozik magára, a webarchiválás mellett kiemelt hangsúlyt fektetnek a könyvekre is. Könyvdigitalizálási programjuk 2005-ben kezdődött, manapság pedig már 4300 könyvet digitalizálnak naponta, 18 helyszínen szerte a világon. Az 1927 előtt megjelent könyvek letölthetők, míg többszázezer újabb könyv az Open Library oldalán keresztül kölcsönözhető. A kölcsönzési idő egy óra vagy akár két hét is lehet, ennek letelte után rögtön megújítható, feltéve, ha más közben nem kölcsönözte ki az adott könyvet. Az Archívum a fogyatékossággal élők segítését is kiemelkedően fontosnak tartja, ezért alternatív kölcsönzési lehetőségeket is biztosít a látássérült és egyéb olvasási nehézséggel küzdő személyek számára, amennyiben az érintettek egy, az Internet Archive ezen programjában részt vevő szervezeten keresztül igazolják személyazonosságukat.

Egyéb média

Az évek múlásával az Internet Archive tovább bővítette szolgáltatásainak körét egyéb médiumok archiválásával, ezek igen színessé teszik a kínálatot.

Az Audio Archive oldalán zenékhez, hangoskönyvekhez, híradásokhoz, régi rádióadásokhoz, podcastekhez és egyéb hanganyagokhoz nyerhetünk hozzáférést. 2023 januárjában már 15 millió ingyenesen hozzáférhető digitális hangfelvételt számlát az archívum. Az Audio Archive alárendelt gyűjteményét képezi a Live Music Archive, amely kifejezetten koncertfelvételek archiválására specializálódott. A szintén ide tartozó The Great 78 Project 78-as percenkénti fordulatszámú gramofonlemezek digitalizálását tűzte ki céljául, jelenleg 400 000 felvételnél tartanak. A Netlabels szolgáltatás szabadon terjeszthető, többnyire Creative Commons License alá tartozó zenéket gyűjt.

Az Image Archive kiemelkedő gyűjteményei közé tartozik például a NASA Images Archive és a Metropolitan Museum of Art images archívumok.
A mozgóképek archívumában számos film érhető el, valamint a TV News Search & Borrow szolgáltatás keretében az Egyesült Államok híradásai között is böngészhetnek az oldal látogatói.
Említésre méltó az oldal szoftvergyűjteménye is.

Megosztó tartalmak és jogviták

Az Internet Archive időről időre a hírekbe kerül annak okán, hogy szélsőséges, például terrorista vagy neonáci ideológiájú tartalmakat is megőriz. Az elmúlt években számos tanulmány született arról, hogy az oldalt előszeretettel használják a dzsihádista szervezetek, például az Iszlám Állam különböző jellegű dokumentumaik tárolására. 2021 júniusában a szélsőséges csoportok ellen küzdő Counter Extremism kutatói robbanóanyagokról szóló kézikönyvek egész gyűjteményét fedezték fel az oldalon, 37 kötetben és összesen több, mint ezer oldalon. A gyűjtemény öt évig volt hozzáférhető, és több, mint 10 ezer megtekintés érkezett rá, mielőtt az Internet Archive eltávolította volna. Más kutatásokban robbanószer-készítésről szóló, vagy sokkoló, grafikus (például akár lefejezést bemutató) videókról is szó esett, illetve terrorcselekményre való buzdítás és toborzás is jellemző. Több kutató „a szélsőjobboldali digitális ökoszisztéma meghatározó elemeként” írja le az oldalt, mivel számos olyan, szélsőjobboldali ideológiát valló szerző tollából származó könyv található meg rajta, melyeket más platformokról kitiltottak.
Az Internet Archive munkatársai többször nyilatkoztak ezügyben. 2018-ban Chris Butler, az oldal egyik szóvivője kijelentette, hogy rendszeresen értekeznek az Egyesült Államok és az EU kormányaival a terrorizmushoz kapcsolódó információk megosztásának ügyében. Brewster Kahle, az Archívum létrehozója 2022-ben úgy nyilatkozott, hogy számos tényező játszik közre abban, hogy eldöntsék, mely tartalmak őrizhetők meg, az Oakland Archive Policy szabályzatát nevezve meg mérvadóként. Mint fogalmazott, „az Internet Archive nem kiadó és nem is próbál úgy tenni, mintha az lenne, sokkal inkább akar annak látszani, ami valójában is: egy könyvtár, mely a kutatókat, a tudósokat és a társadalmat szolgálja.”

Az oldal néha a kevésbé megosztó tartalmai és szolgáltatásai miatt is problémák forrásává vált, ezek többnyire szerzői jogokkal kapcsolatos esetek. Az idők során sok, a szerzői jogok megsértését vélelmező vád érte az oldalt. Az egyik legnagyobb visszhangot kiváltó szolgáltatás a Covid19-pandémia idején létrehozott ideiglenes National Emergency Library (Nemzetközi Vészhelyzeti Könyvár) bevezetése volt, mely, 1,4 millió, az Open Library-ben megtalálható könyv kölcsönzési szabályait módosította a várólisták felfüggesztésével, amivel a „kontrollált kiadást” kontrollálatlanná tették. A szolgáltatás 2020 március 24-én indult és június 30-ig tervezték működtetni. Az Internet Archive biztosította a szerzőkét és a jogtulajdonosokat afelől, hogy eltávolítják műveiket ezen könyvek közül, amennyiben felveszik a kapcsolatot az oldallal és kérelmezik az eltávolításukat. Ennek ellenére az intézkedés botrányt szült, a szerzők, kiadók és az őket képviselő szervezetek szerint ez a fajta hozzáférés megsérti a szerzői jogokat és az internetes kalózkodással egyenértékű. Véleményük szerint az Internet Archive kifejezetten kihasználta a világjárványt annak érdekében, hogy a szerzői jogok határait feszegesse.
Négy könyvkiadó, a Hachette, a HarperCollins, a John Wiley & Sons és a Pengiun Random House 2020 júniusában pert indítottak az Archívum ellen, melynek következtében a tervezett június 30. helyett június 16-án kapcsolták le a szolgáltatást. Később megállapodás született arról, hogy az Internet Archive egy meg nem nevezett összeget köteles fizetni a kiadóknak. Az oldal 2023 szeptemberében fellebbezést nyújtott be az ítélet ellen.

2023 augusztusában a Great 78 Project következtében a Sony Music Entertainment és öt másik zenei kiadó is beperelte az oldalt, a szerzői jogok megsértésének és lopásnak minősítve a kezdeményezést. Tagadták a kutatási célokról szóló állítást, mondván az érintett hanganyagok már ezt megelőzően is elérhetőek voltak az illetőleges digitális zenei és streaming platformokon. A társulatok a perben megnevezett közel 2500 dalért követelnek kártérítést, összesen 347 millió dollár (átszámítva 122 536 110 000 forint) értékben.

A vitatott esetek ellenére tagadhatatlan, hogy az Internet Archive eltökélten igyekszik mindenki számára lehetővé tenni az információ szabad áramlását, ami létfontosságú a működő demokrácia és szabad társadalom fenntartása érdekében, így mindannyiunk érdeke, hogy továbbra is elérhető maradjon.

Nincsenek megjegyzések:

Megjegyzés küldése