keresés

2017. november 14., kedd

ADT - Arcanum Digitális Tudománytár

Digitális gyűjtemények - Arcanum Adatbázis Kft.



Bemutatkozik az Arcanum


„A kultúránk akkor fejlődhet, ha a múltunkat, közös tudásunkat és identitásunkat hordozó emlékeinkből minél többet tudunk eljuttatni a lehető legtöbb emberhez; s mindezt úgy, hogy a befogadókban a továbbgondolkozás igényét is elősegítjük.ˮ (Biszak Sándor, Alapító)

Biszak Sándor - Arcanum digitális adatbázisának bemutatása

Arcanumban a legfontosabb magyar nyelvű szakmai folyóiratok, 2. világháború előtti napilapok, hetilapok, lexikonok és egyéb dokumentumok (I. világháborús könyvek, ezredtörténetek, családtörténeti könyvek) érhetők el. Folyamatosan épül, bővül, 3 éve mintegy 6 millió oldalnyi dokumentumot tartalmazot. A kötetek tartalomjegyzéke ingyenesen megtekinthető, sőt a teljes szövegű keresés is szabadon hozzáférhető.

2014. szeptember 15-től intézmények számára is lehetővé válik az Arcanum Digitális Tudománytár Plus szolgáltatás (ADT+) előfizetése.

Arcanum Digitális Tudománytár keresési útmutatója


  1. Hivatalosan is útjára indult a Hungaricana a Közgyűjteményi Portál szolgáltatás
  2. (hungaricana.hu)

2014-ben az Arcanum az eFestival nagydíjasa lett.


Legfrissebb - Hírek - lásd ->

November 3-án már 14 millió oldal volt elérhető az Arcanum-on.


Technológia

Nyomtatott dokumentumok digitalizálása

Folyóiratok, könyvek digitalizálása során a kötetek minősége, mérete alapján különböző szkennereket használnak. Különösen értékes, egyedi példányok digitalizálása ún. robotszkennerrel történik, mely lehetővé teszi, hogy csak 90 fokig kelljen a könyvet kinyitni, így elkerülhető a kötés sérülése. A robotszkenneren 2 nagyfelbontású fényképezőgép készít igen jó minőségű képet, akár 400 DPI felbontásban TIFF vagy JPG formátumban. A leszorítóprizma igen kíméletes, a lapozás jellemzően szemiautomatikus módban történik.
Az A3-nál nagyobb dokumentumokat ún. könyvszkennerrel digitalizálnak, itt akár A2-es is lehet egy oldal mérete. A pásztázó megvilágítás és szkennelés igen jó minőségű képet eredményez, és egyre elterjedtebb az a verzió, amelyben nem kell 180 fokig kinyitni a köteteket. 



A leghatékonyabb, leggyorsabb és a legjobb minőségű digitalizálás dokumentumszkennerek segítségével történik, amennyiben a feldolgozandó állomány lapokból áll vagy lapra szedhető. A szkennerek A3+ (max.  30,7 cm széles) méretű dokumentumok mindkét oldalát képesek nagy sebességgel egy időben szkennelni, jó minőségű képet készíteni.  A szkennerek görgőrendszere, lapbehúzási technikája rendkívül kíméletes, így akár rossz minőségű, töredezett, szakadt, de akár erősen savas lapokat is nagy biztonsággal feldolgozhatunk, és nem okoz gondot a hártyavékony átütő papírok szkennelése sem. A kimeneti formátumok is rugalmasan alakíthatóak, a 200 DPI fekete-fehér szkenneléstől a 600 DPI-s tömörítetlen TIFF formátumig bármi beállítható. A dokumentumok hosszúsága sem limitált, akár 1 méter hosszúságú is lehet egy dokumentum.
Gyakran előfordul, hogy mellékletként igen nagy méretű dokumentumokkal találkozunk (térképek, táblázatok, művészi reprodukciók). Ezeket a dokumentumokhoz nagy formátumú szkenner szükséges, amely igen kíméletes görgőrendszerrel és roncsolás mentes megvilágító rendszerrel rendelkezik.

A nyomtatott dokumentumok feldolgozásának következő lépése az ún. szövegfelismerés (angol rövidítéssel OCR), amelynek keretében a képből szöveg lesz. A ma használt szoftverek hatékonysága, pontossága nagyon jó, még a 19. századi nyomtatványok is 98-99%-os pontossággal ismerik fel a szöveget, jó minőségű nyomatok esetén ez a 99,5%-ot is elérheti. Az automatikus szövegfelismerés eredménye az ún. kétrétegű PDF, amelynek a felső rétege a szkennelt kép, az alsó rétege pedig a szöveg. Így a felhasználó a hiteles képet látja, míg a keresés a szövegen történik.


A kétrétegű PDF-ben könyvjelzők kerülnek elhelyezésre, mely lehet a cikkek címe, szerzője, az adott szám dátuma, évfolyama, vagy akár egy könyv fejezeteinek a címe. Az így létrejött szabványos kétrétegű PDF alkalmas az Interneten történő publikálásra.

A kétrétegű PDF-ek publikálásához saját fejlesztésű szoftvert használunk, mely lehetővé teszi a kifinomult, nagy sebességű, teljes szövegű keresést, a keresőszavak közötti böngészést, a találatok megjelenítését, kivilágítását. A keresés során a logikai operátorok (AND, OR, NOT) mellett ún. közelségi operátorokat is használhatunk (két vagy több szó legyen egymás mellett), illetve csonkolhatjuk a keresőszavunkat, akár jobbról, akár balról, akár a szó belsejében. A PDF oldalak megjelenítéséhez saját fejlesztésű programot használunk. Ez képes a PDF oldalakat gyorsan, hatékonyan prezentálni, a találatokat kivilágítani, az oldalakat méretezni, letölteni.

Az általunk kialakított gyártástechnológia és eszközrendszer képes tetszőleges típusú, méretű, minőségű dokumentum digitalizálására, szövegfelismerésére és az így létrehozott kétrétegű PDF-ek internetes publikálására gyors és kifinomult kereső és megjelenítő rendszer segítségével.

Alkalmazások: 

Digitalizálásukhoz speciális nagy formátumú szkenner szükséges, amely igen kíméletes görgőrendszerrel és minden állományvédelmi igényt kielégítő megvilágítással rendelkezik, a maximális szélesség 110 cm, a hosszúság tetszőleges lehet. A szkennelés során ajánlott a 300 DPI felbontás és tömörítetlen TIFF állomány készítése. A feldolgozás, publikálás során olyan speciális formátumot használunk (JPEG2000, ECW), amely kifejezetten térképekre lett optimalizálva és így Interneten is kompromisszumok nélkül biztosítja a gyors megjelenítést.


Művészi reprodukció

Az egyik legnagyobb kihívás a nagyméretű, keretben lévő művészi alkotások, elsősorban festmények nagy felbontású, színhű digitalizálása. Az általunk kidolgozott módszer lényege, hogy hidegfényű, maximum 150 lux, egyenletes megvilágítás mellett egy professzionális automata panoráma fejjel akár több száz nagyfelbontású felvételt készül. Az egy pontból készült felvételek torzítását matematikai módszerekkel torzításmentessé alakítjuk, majd a képeket pixelhelyesen összeillesztjük. Ezzel a módszerrel akár 4-5 méter széles és 2-4 méter magas festményről is készíthető akár 300-400 DPI felbontású felvétel. Bátran mondhatjuk, hogy a szokásos élő megtekintésnél is jobb eredményt érünk el, hiszen egy kiállításon 2-3 méterről tekinthetjük meg az alkotásokat, így viszont testközelből, képletesen szólva, kezünkben nagyítóval vizsgálhatjuk a képet.

1 megjegyzés: