Az Internet Archive:
Brewster Kahle amerikai programozó, internet-aktivista hozta létre Bruce Gilliat internetes vállalkozóval az Internet Archive-t, amely, ahogy a neve is mutatja, egy hatalmas archívum. Ez az archívum régi weboldalakat tárol. Ha esetlegesen rá akarunk keresni egy régi weblapra, akkor ezt a ,,The Internet Archive’’ nevű oldalon megtehetjük. Az Internet Archive nevű oldal, amelynek segítségével több mint háromszázmilliárd oldal korábbi változata kereshető vissza. Ez a weboldal 1996 óta létezik, és folyamatosan bővítik többek között rengeteg tudományos tartalommal. A szolgáltatások, amiket nyújt, ingyenesek, bárki regisztrálhat, és feltölthet dolgokat. Azt a célt tűzték ki maguknak, hogy a világ összes tudását összegyűjtsék egy helyre. Kutatók (mind fizetettek, mind hobbiszerűek), tudósok, újságírók és Wikipédia szerkesztők használják gyakran a munkájukhoz.
Az Internet Archive főoldala |
A weboldal jelenleg tartalmaz:
- 330 milliárd weboldalt
- 20 millió könyvet és szöveget
- 4.5 millió hangfelvételt (beleértve 180 000 élő koncertet)
- 4 millió videót (köztük 1.6 millió televíziós hírműsort)
- 3 millió képet
- 200 000 szoftvert.
A Wayback Machine
A Wayback Machine oldala |
Idéntől kezdve az Internet Archive digitális könyvtár önkéntesei és automatizált algoritmusai segítségével, a Wikipédia szócikkekben felkutatják a könyves hivatkozásokat, és a digitális gyűjteményből elérhető példányokra irányítják a forrás linkeket.
Tehát mostantól az Internet Archive már a Wayback Machine archívum könyv gyűjteményéhez is hozzáférést nyújt, hogy a Wikipédia szócikkek hivatkozásait pontosabban alátámassza, és ezzel növelje a Wikipédia szócikkeinek hitelességét.
Azaz ha egy könyves hivatkozáshoz az Internet Archive saját gyűjteményében meglévő digitális vagy digitalizált könyv kapcsolódik, akkor annak hivatkozása is automatikusan megjelenik a külsős források közt a Wikipédiánál.
Hátrányok
A régi weboldalak "crawling"-ja - ún. aratógép szoftver által - és publikálása közti idő jelenleg három és tíz óra között mozog, de 2014-ben még hat hónapig is elhúzódott egyszer a "crawling" kezdetétől az oldal megtekinthetősége. A Wayback Machine kereshetősége is korlátozott.
Ezen kívül, a Wayback Machine-nak a web "crawler"-jének nehézsége van kibányászni bármit ami nem HTML nyelven, illetve annak valamelyik változatában van kódólva. Ezáltal, gyakran törött hiperlinkeket és hiányzó képeket eredményez, és nem tud archiválni ún. „árva oldalakat" amelyek nem tartalmaznak linkeket más oldalakra.
Továbbá, több pert is indítottak már az Internet Archive ellen a Wayback Machine-féle archiválási törekvései kapcsán. Ráadásul, Kínában jelenleg blokkolva van az Internet Archive weboldala és Oroszországban is teljesen blokkolták az Internet Archive-t 2015-ben.
A technika fejlődése könyvtáros szemmel
A technika rohamos fejlődésével - például az aratógépek megjelenésével - megnőtt a feldolgozásra, és raktározásra váró dokumentumok mennyisége könyvtárosok számára. Az interneten azonban nem csak dokumentumokat tárolnak, hanem megszámlálhatatlan weblap is létezik. Ezek viszont sok esetben elfelejtődnek, elavulnak, ezért ezeket nekiálltak összegyűjteni, egy óriási adatbázisba - a Wayback Machine-ben, ahol minden weblapot igyekeznek megőrizni, és hozzáférhetővé tenni az Internet Archive. Ez önmagában is embert próbáló feladat, de amellett, hogy gyűjtik a weblapokat, még ezen oldalak korábbi verzióit, és tartalmait napra pontosan is hozzáférhetővé teszik (angolul: version control).
Összegzés
Összesítve, a Wayback Machine sikerének titka látszólag a régi internetes tartalmak visszakereshetőségének fontossága több szakma és foglalkozás számára. Továbbá, az Internet Archive önkénteseinek kitartó munkája mondható elengedhetetlennek a Wayback Machine sikeréhez.
Források:
Nincsenek megjegyzések:
Megjegyzés küldése