keresés

2018. december 11., kedd

Internet Archive, és Wayback Machine


Néhány felvezető gondolat az archívumokról

Legyen szó bármilyen információgyűjteményről, idővel az összegyűjtött dokumentumok információi egy idő után avulnak, bővülnek, esetlegesen teljesen hiteltelenné válnak. Később azonban szükségessé válhat, hogy egyes kutatásokhoz például újra megkerüljenek ezek az információk, és ilyenkor jönnek jól az úgynevezett archívumok. A köztudatból kikerült információk itt fellelhetőek.

Kép: Magyar Nemzeti Digitális Archívum

A technika fejlődése

A technika rohamos fejlődésével megnőtt a feldolgozásra, és raktározásra dokumentumok mennyisége. Manapság már teljesen természetes az okos telefonok, a számítógépek, táblagépek, e-bookok és az internet jelenléte. Már ki sem kell mozdulni kényelmes otthonunkból ahhoz, hogy információkat gyűjtsünk egy adott témával kapcsolatban. 

Az interneten azonban nem csak dokumentumokat tárolnak, hanem megszámlálhatatlan weblap is 

fellelhető. Ezek viszont sok esetben elfelejtődnek, elavulnak (akárcsak a papír alapú dokumentumok), ezért ezeket is elkezdték összegyűjteni, egy hatalmas adatbázisba, ahol minden weblapot igyekeznek megőrizni, és hozzáférhetővé tenni. Ez önmagában is igencsak embert próbáló feladat, de amellett, hogy gyűjtik a weblapokat, még ezen oldalak korábbi verzióit, és tartalmait napra pontosan hozzáférhetővé teszik. 
Érdekesség a webarchiválásról: http://kepzesevolucioja.hu/dmdocuments/4ap/7_1168_025_101030.pdf


Internet Archive:

Az Internet Archive  ahogy a neve is mutatja, egy hatalmas archívum. Ez az archívum régi weboldalakat tárol. Ha esetlegesen rá akarunk keresni egy régi weblapra, akkor ezt a  ,,The Internet Archive’’ nevű oldalon megtehetjük.  a The Internet Archive nevű oldal, amelynek segítségével közel háromszázmilliárd oldal korábbi változata kereshető vissza. Ezt a weboldal 1996. óta létezik, és folyamatosan bővítik többek között rengeteg tudományos tartalommal.A szolgáltatások, amiket nyújt, ingyenesek, bárki regisztrálhat, és feltölthet dolgokat. Azt a célt tűzték ki maguknak, hogy a világ összes tudását összegyűjtsék egy helyre Kutatók, újságírók használják gyakran a munkájukhoz. A szervezet ami üzemelteti, nonprofit, de van lehetőség anyagi támogatást küldeni nekik, a munkájukért. Székhelye The Presidio of San Francisco. Brewster Kahle amerikai programozó, internet-aktivista hozta létre.
Az oldal kezelőfelülete rendkívül egyszerű, ahogy az alábbi képen is látható, így az átlag felhasználók mellett még azok számára is átláthatónak minősül az oldal, akik számára még idegennek számít az internet világa, vagy egyszerűen csak egyszeri felhasználók.

A weboldal jelenleg tartalmaz:
279 milliárd weboldalt
11 millió könyv és szöveg
4 millió hangfelvétel (beleértve 160 000 élő koncertet)3 millió videó (köztük 1 millió televíziós hírműsor)
1 millió képet
100 000 szoftvert




Magyar webarchiválás:
2018. november 15-én második alkalommal tartottak workshop-szerű szakmai napot 404 Not Found – Ki őrzi meg az internetet? címmel, ami a webes és egyéb internetes tartalmak archiválásával kapcsolatos közgyűjteményi feladatokkal foglalkozott. Drótos László, az OSZK webarchiválási projektjének témafelelőse beszámolt arról, hogy szelektív módszerrel eddig mintegy hatezer magyar webhelyet mentettek le, ezek között vannak a múzeumok, könyvtárak, galériák, egyetemek és kutatóintézetek oldalai is. 1995 óta hétszázharmincnégyezer nevet jegyeztek be a .hu országdomén alá, ezek közül szeptemberben kétszázkilencvenegyezerről töltöttek le weboldalakat az "aratógépnek" nevezett szoftverrel. Ez az anyag tömörítve jelenleg 5 terabájtnyi helyet foglal el.

Wayback Machine: A Wayback Machine egy felület, amin keresztül elérhetőek a régi weblapok. Csak be kell másolni a weblap URL címét, és máris kiad találatot/találatokat. Ekkor megjelenik egy idődiagram, amin rajta van, hogy melyik évben, mennyire volt aktív az oldal, és ezt követően kell kiválasztani azt az hónapot, és napot amelyre szeretnénk rákeresni.
A Wayback Machine felülete

Nincsenek megjegyzések:

Megjegyzés küldése