Az Arcanum a magyar csoda
Megszólalt a héten az Élet és irodalomban Biszak Sándor, a fogalommá vált Arcanum Adatbázis alapító-tulajdonosa, akinek bár a digitális világ határozza meg a mindennapjait, de számára mégis fontos a papír, és a Várkonyi Bencének adott interjújából megtudtuk tőle, hogy „mániákusan dolgozik azon, hogy a múlt minél teljesebb legyen, hogy a régi újságokat bárhol tudjuk olvasni.”
Arra is választ kaptunk, miért lett mára az Arcanum archívum annyira közkedvelt, hogy amatőrök és hivatásos kutatók rajonganak érte, és sokan fél életeket töltenek el benne. A most negyedszázadossá lett adatbank létrehozója többek közt arról is beszámolt: „legutóbb Nagyszebenben járt, ezért az Arcanum raktárpolca tele van olyan újságokkal, amelyek Magyarországon még nem olvashatók, de nemsokára igen.”
Biszak Sándort, az Arcanum cégvezetőjét a márciusi nemzeti ünnepen a Magyar Érdemrend tisztikeresztjével tüntette ki Sulyok Tamás köztársasági elnök. A kitüntetéshez járó oklevélen az áll, hogy azt „a közgyűjteményi digitalizáció területén végzett hiánypótló szakmai tevékenysége, különösen a legjelentősebb hazai folyóiratbázis létrehozása érdekében végzett odaadó munkája elismeréseként” ítélték neki oda.
Az indoklás nyilván nem térhetett ki a kulturális hagyatékunk megmentői közül az egyik legjelesebbnek a tevékenysége minden vonatkozására. Viszont sokan vagyunk, akik számára az Arcanum nevet viselő magyar csoda, és vele együtt Biszak Sándor neve sok esztendeje nagyon sokat mond. Hisz neki és az általa 1989-ben létrehozott Arcanum adatbázisnak nemcsak az újságok és folyóiratok digitalizált és kereshető, több tízmillió oldalnyi gyűjteményét magába foglaló, előfizetős Arcanum Digitális Tudománytárat köszönhetjük, melyben, – hála a mesterséges intelligenciával felvértezett arcfelismerésnek – egy fotó feltöltésével bárki megtalálhat bárkit a sokmillió sajtófotó és könyvillusztráció között.
Az ő és munkatársainak érdeme az ingyen hozzáférhető Hungaricana is, amely 150 közgyűjtemény közös adattára és a szintén ingyen elérhető Térkép gyűjtemény. Ezek mellett van egy másik bravúrjuk is, az Arcanum Kézikönyvtár, ami 50 költőnk összes versét tartalmazza Tinóditól Dsidáig, Jókai, Mikszáth és mások összes művét, a legfontosabb lexikonjainkat, meg olyan alapműveket is, mint a Malonyai-féle A magyar nép művészete, a három kötetes Erdély története vagy a 21 kötetben kiadott monográfia, Az Osztrák–Magyar Monarchia Írásban és Képben.
Ehhez a negyedszázados kitartó munkához az ihletet Biszak Sándornak az adta, hogy a vegyész fiatalember negyven évvel ezelőtt bekerült a Richter Gyógyszergyár könyvtárába, ami azonnal rabul ejtette. „Százötven ország harmincezer lapjával találkoztam ott, köztük a nagy múltú, több mint 100 éve megjelenő Chemical Abstracts-szel is, amely a magyar Beton című folyóiratot is szemlézte” – emlékezett vissza egy interjúban a kezdetekre. Ott nem akart beletörődni abba, hogy ha egy magyar szabadalmat akart megkeresni, akkor Amerikából kellett segítséget kérnie, mert a Szilicium völgyében jobban feldolgozták az elmúlt évtizedek adatait, mint Magyarországon. Mint mondta: „»Gyerekek, ilyet azért mi is tudunk csinálni!«, és így készítettünk először egy magyar szabadalmi adatbázist, ami 20 db floppy lemezen elfért. Erre figyelt fel a Szabadalmi Hivatal, és jelezte, hogy ezt ki kellene adni CD-n, és emiatt alapítottuk a céget.”
Így indult el 1989-ben az a vállalkozás, amely apró lépésekkel jutott el végül a mára nélkülözhetetlen Arcanum Adatbázis létrehozásához, és amely az elmúlt 25 év alatt folyamatosan bővült, miközben korunk gyorsan változó kihívásaival is mindig lépést tudott tartani.
Előrebocsátva azt is, hogy az interjút terjedelme miatt minden részletre kiterjedően nem mutathatom be, az elkövetkezendőkben arra törekszem, hogy az olvasó mégis a lehető leghitelesebb képet kaphassa arról az értékes kultúrmisszióról, amit Biszak magára vállalt, és amiről csak a legekben lehet beszélni. És még valami, ami szintén jelzi, itt hangsúlyosan küldetésvállalásról is szó van: bár a jelenleg 5250 címet tartalmazó sajtóadatbázis csak előfizetéses alapon hozzáférhető, ami természetes egy Kft. esetében, 191 magyarországi és szomszédországi könyvtár olvasói számára ezek a lapok ingyenesen olvashatók. (Jut eszembe: rendkívül hasznos fegyverténye lenne a nemzetpolitikának az, ha a bárhol élő magyar egyetemisták és főiskolások számára biztosítanák egyénileg is az Arcanum adatbázisához való előfizetést.)
„Az Arcanum vállalkozás, de nagyon komoly eszmei érték áll mögötte.” E megállapítással indul a „Megváltás, ha digitális állapotba kerül” című beszélgetés, amelyből hamar kiderül, az adatbank megteremtőjének a startnál nemcsak az üzleti szempontok voltak a mérvadóak, hanem volt a kezdeményezésének „egy magasztosabb oldala is”: a közjót szolgálva kulturális örökségünket gazdagítani. Hogy mennyire volt ez sziszifuszi munka, erről így számol be:
„Lassú, és nagyon drága. A Vasárnapi Újsággal kezdtük, az első néhány évét legépeltük, és akkor nagyon gyorsan kiderült, hogy az emberek imádják a Vasárnapi Újságot. A technológia azóta megváltozott, azt mondja a Google és a világ, hogy mindent digitalizálni kell, de így nem lehet. Léteznek olyan programok, amelyek a szkennelt képből szöveget csinálnak. Nemcsak azért digitalizáljuk az újságot, hogy olvassuk, hanem hogy keresni is tudjunk benne. Mi ezt már akkor tudtuk, és saját fejlesztésű szoftverünk volt.”
Hogy mindezekhez saját kútfőből merítettek, vagy inkább a világot figyelték-e és onnan tanultak, a válasz az is-is: „Egy évig dolgoztam a Richter Gyógyszergyárban, ott szinte mindent megtanultam. Visszanézve ósdi világ volt, de azért nagyon sokat nem változott a számítástechnika. Persze rengeteg minden történt azóta, de az adatbázis-kezelésben nagy újdonság nem történt. Amikor a maszekvilágba kerültem, programozó lettem. A Google videójából lenéztük az eszközök nevét, elmentünk Svájcba egy kis családi céghez, és azt mondtuk, ilyet szeretnénk venni, mert a Google is ezt használja. Lopjuk is az ötleteket, de van, amiben megelőzzük a világot. A térképekben biztosan jobbak vagyunk. A történelmi térképeink sokkal részletesebbek.”
Ma már százezrek használják az Arcanumot, de néhány éve ez még nem volt így. Óhatatlanul adódik a kérdés: miként érték el, hogy robbanásszerűen váltak népszerűvé? „Ma már tudom erre a választ” – feleli Biszak, majd így folytatja: „Elvesztettünk egy közbeszerzést, amire nagy kapacitással, nagyon készültünk. Vettünk gépeket, ott álltak az emberek, és azt kérdeztük, most mit fogunk csinálni. Kínunkban nekiálltunk a Századok folyóirat digitalizálásának. Akkor még DVD-ben gondolkodtunk, nagyon későn mentünk az internetre. Utólag is szégyellem, hogy ez egyszerűen nem ugrott be nekem. Imádtam a CD-ket, szóval megmagyarázhatatlan. És akkor a tudományos folyóiratokon kezdtünk el dolgozni.”
Rácáfolva a természettudományos képzettségére, bevallja, miért fordul az érdeklődése egy egész más világ felé: „A kémiai folyóiratokat nem szívesen digitalizáltam volna, mert ezt Amerikában sokkal jobban csinálják. Azzal nem lehetett versenyezni, magyar dologgal kellett. A Századok csak Magyarországon piacképes, ezért kezdtük azzal. Az átbillenés akkor történt, amikor a Politikatörténeti Intézet pincéjében rátaláltunk egy Népszava-sorozatra. Nekik rossz volt, hogy ott van, nem tudták kitakarítani a pincét.”
A százötven éves magyar újság, az 1873-ban Munkás Heti-Krónika címmel indult Népszava azóta is az Arcanum legnagyobb terjedelmű újságsorozata, 520 ezer oldal. Annak is megvolt a veszélye is, hogy netán túl nagy falatnak bizonyul, de szerencsére nem így lett. A kezdetekről ekképp vall intézményemberünk:
„Akkor már voltak előfizetőink, piacképes volt a vállalkozás. De még nem gondoltuk igazán, hogy képesek vagyunk egy teljes napilapot digitalizálni. Nem volt hozzá elég tudásunk, nem voltak jó szkennereink. A Századok iránt többnyire történészek érdeklődnek, de a napilapokat mindenki szívesen olvassa. Jól döntöttünk, hogy nem könyvekkel kezdtük, ahogyan a Google Books, hanem folyóiratokkal. De ezt akkor még nem tudtam, ahogyan azt sem, hogy a sport a legnépszerűbb téma. Romániában is elkezdtünk digitalizálni, legelsőként, sportnapilapot. A másik kérdés a mennyiség: akkor lettünk megkerülhetetlenek, amikor 15 millió oldalunk lett. Ahogyan a marxista órákon tanultuk, a mennyiség átcsapott minőségbe. Olyan kritikus tömeget léptünk át, amely megkerülhetetlenné tett bennünket.”
Az eddig elmondottak tükrében adódik egy kulcskérdés: mi a gyarapítás fő szempontja? A motivációt az olvasói igény, a lapok igényessége, a személyes szimpátia határozza meg vagy az, hogy mihez tud hozzáférni az Arcanum csapata?
„Az, hogy mihez férünk hozzá, most is meghatározza az irányt.” – feleli Biszak. Amit ehhez hozzátesz, abból az is kiderül: ő miért van jelen mindegyre a mi tájainkon: „Ma havonta körülbelül egymillió oldalt digitalizálunk. Ezt csak úgy lehet összegyűjteni, hogy elmegyek például Nagyszebenbe, és azt mondom, innentől idáig elhozom az anyagot.”
Ezután elmondja, Magyarországon a legtöbb nagy könyvtár és múzeum segíti a munkájukat, majd arról szól, hogy a külföldi Arcanum-szerű archívumokra is figyelnek, sőt van, akikkel már élő az együttműködés:
„A legközelebbi Bécsben van, az osztrák nemzeti könyvtár Anno nevű rendszere elég szép, „csak” huszonhétmillió oldaluk van, mondom nagyképűen, nekünk hatvanmilliónk van. Szerintem a technológiánk, a keresőnk jobb. Figyeljük, hogy hol mi van, de csak érdeklődésből. Az utóbbi két évben nagyot fejlődtünk a mesterséges intelligencia terén. A newspaperarchive.com archívumnak el is adtuk a technológiánkat.”
Az amerikai archívumóriás számára az volt a vonzó, hogy olyan eljárást fejlesztettek ki az arckeresésben, ami a világon egyedülálló, amivel például „föl lehet tölteni, mondjuk a nagypapa arcképét, és az alapján keresni.” Viszont ez a sikeres üzletkötés bizonyítja, hogy az Arcanum túl azon, hogy adatbázist készít, eljárásokat is fejleszt.
Erről szól az interjúalany a folytatásban:
„Igen, technológiát is fejlesztünk. Előd fiam elméleti matematikus, itt dolgozik. Harminc éve fejlesztjük a szoftvereinket, de ahhoz, hogy azok jól, látványosan, villámgyorsan működjenek hatvanmillió oldalon, az ő munkája is kellett. Az Amazonnal is dolgoztunk, egy hónapra küldtek két embert, most az Amazon Marketplace-en árulhatjuk a fejlesztésünket. Írtak is az Arcanum arcfelismeréséről. Tehát olyan dolgot csinálunk, amit a világon senki más. A Newspaper Archive embere éppen Magyarországra jött, hozzánk is ellátogatott, és azt mondta, az nem lehet, hogy ti arcfelismeréssel is dolgoztok. Itt ült, megmutattuk neki, hogy lehet. Végül a teljes technológiánkat megvették. Nekik több mint háromszázmillió oldaluk van. Érezzük a kicsinységünket, de őnáluk addig nem volt arckeresés.”
Jeleztem már, hogy a terjedelmi korlátok nem teszik lehetővé az interjú ismertetését minden részletre kiterjedően. Viszont úgy vélem, nem hagyhatom ki azokat a vonatkozásokat, melyekből kiderül: Erdély, illetve Románia valóságos kincsesbánya az Arcanum számára. Ez magyarázatot ad Biszaknak arra a kijelentésére is, miszerint: „Nagyon sok magyar lapot Romániából hozunk el, és látom, hogy a mi anyagunk gyakran gazdagabb, mint a hazai könyvtárak anyaga.”
Ennek a magyarázata egyszerű: Trianon után törvény már nem kötelezte a kiadókat Erdélyben, hogy a Széchényi Könyvtárnak elküldjék a kötelespéldányokat, ezért nem biztos, hogy 1930-ban egy magyar nyelvű lap eljutott Budapestre. Ehhez kapcsolódóan mondja el Biszak: „A múlt hónapban Bukarestben jártam, az Akadémiai Könyvtárban, és elájultam, hogy ott mekkora magyar anyag van. Nagyváradi, aradi 1930-as évekbeli lapok. Most azért küzdünk, hogy sikerüljön ezeket elhozni digitalizálásra.”
E látogatásának egy másik epizódját is fontosnak tartotta felidézni, mert abból kitűnik, a missziós munka nagy ellensége a bürokrácia. Íme, a hivatkozott mozzanat: „Egy másik ügyben a bukaresti Nemzeti Könyvtár igazgatója azt mondta, Biszak úr, csak nem képzeli, hogy a Román Nemzeti Könyvtár egy magyar magáncéggel szerződést köt? És itt nem a magyaron van a hangsúly, mert ha japán lettem volna, akkor sem kötött volna velem szerződést. Egy magáncéggel nem szerződhet. Azt javasolta, hogy ezt beszéljék meg az illetékes állami szervek egymással, ő csak utána cselekedhet. Most keressük erre is a megoldást.”
CSAK SAJÁT