Digiteeritud Eesti Ajalehed (DEA)
DEA on üks esimesi suuremaid ja mahukamaid kollektsioonipõhiseid digiteerimisprojekte Eestis, sisaldades valikut aastatel 1821-1944 ilmunud Eesti ajalehtedest ja valikut väliseesti ajalehtedest alates 1944. aastast. DEA kajastab sealhulgas artikleid aastatel 1857-1920 ilmunud ajalehtedest “Perno Postimees ehk Näddalileht”, “Postimees”, “Päewaleht”, “Sakala”, “Tallinna Teataja”, “Vaba Maa” jm. ning nende kaasannetest.
PROJEKTI EESMÄRK
Vanadele digiteeritud eestikeelsete ajalehtedele juurdepääsu loomine veebis.
PROJEKTI TAUST JA KIRJELDUS
Raamatukogudes säilitatavate eesti ajalehtede ja ajakirjade paberoriginaalid aastatest 1766-1945 on hapra paberi ja intensiivse kasutuse tõttu hävimisohtlikus seisundis, kuid nende kasutamine on olnud alati intensiivne. Sellest tulenes vajadus originaalide säilitamise eesmärgil piirata vanade paberajalehtede laenutamist lugejatele. Selleks, et tagada ajalehtedes sisalduva informatsiooni pikaajaline säilimine, asusid raamatukogud ajalehti 1993. aastal mikrofilmima. Ülevaate mikrofilmitud väljaannetest annavad nimestikud:
– Eesti ajalehtede mikrofilmid. 1. : [nimestik] : [1918-1940 ilmunud ajalehed] : pildistatud 1993-1995 I poolaastal https://www.ester.ee/record=b1068250*est
– Eesti ajalehtede mikrofilmid. 2 : [nimestik] : [1918-1940 ilmunud ajalehed] : pildistatud 1995 II poolaastast – 1998 II poolaastani: https://www.ester.ee/record=b1055345*est
Lugejate jaoks oli mikrofilmide kasutamine ebamugav, nõudis palju tähelepanu ja kannatlikkust. Lisaks sellele olid mikrofilmid kättesaadavad vaid mõnes raamatukogus. Probleemi lahenduseks mikrofilmid digiteeriti ja vanad ajalehed olid mugavamalt kasutatavad arvutivõrgu kaudu. Digiteeritud ajalehe eelis on ka selle kvaliteedi säilimine, sõltumata kasutamise sagedusest.
ETAPID
– 2001/2002 ettevalmistav etapp (teostaja RR). ELNET Konsortsiumi projekti MIDAS käigus töötati välja ajalehtede mikrofilmide skaneerimise tehnoloogia ja pildifailide salvestamise ning kirjeldamise vorm.
– 2002/2003 ajalehe “Postimees” digiteerimine (teostaja RR). Koostöös tarkvarabürooga Sirvi (hilisem OÜ Tarkvarastuudio) töötati välja pildifailide indekseerimise ja digiteeritud ajalehtede võrgus esitlemise süsteem.
– 2004. aastal projekt DEA (digiteeritud eesti ajalehed). Tegevus oli suunatud avaliku teenuse arendamisele eesmärgiga oluliselt suurendada digiteeritud ajalehtede üldmahtu veebis. Sõlmiti koostööleping Eesti Rahvusraamatukogu, Eesti Kirjandusmuuseumi Arhiivraamatukogu ja Tallinna Pedagoogikaülikooli Akadeemilise Raamatukogu vahel. Avati veebikeskkond DEA – digiteeritud eesti ajalehed.
Aastatega täienes väljaannete nimekiri, projekti lõpuks oli kättesaadav üle 300 ajalehe nimetuse koos lisadega. 2004. aastal, kui DEA veebikeskkond lugejatele avati, laadisid kasutajad aasta jooksul alla 200 000 ajalehe lehekülge.
Kaugemaks plaaniks oli digiteerida ja siduda DEAga eesti ajakirjandust kajastav analüütiline kaartkartoteek. Selle tulemusel tekiks lugejal võimalus veebikeskkonnas otsida artiklit kas teema, isikunime või Eesti kohanime järgi ja jõuda nii digiteeritud ajaleheni. See osa projektist kahjuks ei realiseerunud.
(PS! Ajalehtedes ilmunud artiklite bibliografeerimisega alustati juba 1921. aastal ja kokku sisaldavad kartoteegid raamatukogudes üle 3 miljoni kirje. Suures osas on see mahukas andmestu kasutatav vaid Eesti Rahvusraamatukogus ja Kirjandusmuuseumi arhiivraamatukogus kohapeal, kus kaartkartoteekidest võib leida artikleid ja sõnumeid teemade, isikunimede ja Eesti kohanimede järgi.
Kuid on ka elektroonilisi andmebaase, kust tasub artikleid otsida: Kirjandusmuuseumi Arhiivraamatukogu Eesti ajakirjanduse analüütiline bibliograafia ja Eesti artiklite andebaas ISE.)
OSALEJAD
– Eesti Rahvusraamatukogu (RR), koordinaator. Projektijuht Krista Kiisa.
– Eesti Kirjandusmuuseumi Arhiivraamatukogu (EKMAR).
– Tallinna Pedagoogikaülikooli Akadeemiline Raamatukogu (TPÜAR).
RAHASTAMINE
Projekt sai teoks tänu Kultuuriministeeriumi toetusele ja raamatukogude koostööle. Suur panus projekti õnnestumisse oli ELNET Konsortsiumil, kelle kaudu rahastas Sorose Fond projekti riist-ja tarkvarahanget.
TEHNILINE KIRJELDUS
Digiteerimiseks kasutati mikrofilme:
– sellega säästeti paberoriginaale digiteerimisega kaasnevatest kahjustustest,
– samuti on failide mahud mikrofilmilt skaneerituna oluliselt väiksemad võrreldes digiteerimisega suureformaadiliselt originaalilt.
Projekt kasutas ELNET Konsortsiumi riist- ja tarkvara. Filmid skaneeriti konsortsiumi digiteerimiskeskuses ja Helsingi Ülikooli Raamatukogu Mikkeli digiteerimiskeskuses.
Töö käik:
– Skaneerimise tulemusel saadud kõrge kvaliteediga originaalfailid salvestati TIFF-vormingus.
– Nendest konverteeriti indekseerimise ja lugejateeninduse tarbeks madalama kvaliteediga kasutusfailid PNG-vormingus.
– Digiteeritud pildifailide indekseerimine ja konverteerimine kasutusfailideks toimus Sirvi (hilisem OÜ Tarkvarastuudio) tarkvara baasil.
– Digitaalsed pildifailid indekseeriti lehekülje kaupa, mis tegi võimalikuks ajalehekomplektide sidumise ja edasise otsingu kuupäeva alusel. Puudub sõnaotsingu võimalus tekstist.
Et tegemist oli formaadilt väga suurte paberajalehtedega, kujunes nende esitlusprogrammi loomine eeldatust märksa keerulisemaks. Ülevaatlikkuse huvides on lugejal sageli vaja näha ekraanil korraga ajalehe terviklehekülge ja infot kogu numbri kohta. Lugemiseks on vajalik teksti suurendatud kujutis. Tavakasutaja monitor oli 2000ndade aastate keskel paraku enamjaolt väike (15″) ja keskmise kasutaja koduarvuti suhteliselt väheste võimalustega. Et rahuldada kõigi arvutiomanike lugemishuvi, koostati kaks lugejamooduli versiooni:
– Moodsama riist- ja tarkvara omanik sai ise punase kastikese abil valida lõigu suurust ja asukohta lehekülje ikoonil. Selleks oli vajalik Java Runtime Environment JRE™ olemasolu arvutis, mille sai alla laadida Java koduleheküljelt (www.java.com/en/download/). Loe ka “tarkvara nõudeid“.
– Tagasihoidlikumate võimalustega arvuti tarbeks suurendati eelnevalt keskmised (1000 pikselit) ja suured (2000 pikselit) pildifailid. Neil sai liikuda kerimisriba kasutades.
Hiljem lisandus ka pildifaili trükkimise ja salvestamise võimalus.
PROJEKTI JÄTK
2014. aastal avas Rahvusraamatukogu portaali DIGAR-i Eesti ajalehed. Uus portaal on loodud selleks, et pakkuda otsitavaid täistekste Eesti ja Välis-Eesti ajalehtedest alates nende ilmumisest. DEA väljaanded kantakse üle Digari portaali.
DEA-s oli 2018. a. lõpu seisuga avalikult kättesaadavana 474 nimetust (1 329 404 lehekülge, koos varukoopiatega kokku ligi 4,3 TB). Töötaja poolel on DEA maht 554 nimetust ja 1 455 324 lehekülge. Vahe põhjuseks on peamiselt lühiajaliselt (1-2 numbrit) ilmunud ajalehed. Nende lisamine väljaannete nimekirja oleks muutnud nimekirja lugejale raskesti hallatavaks.
Kuigi andmebaasi ei täiendata, on sel kindel kasutajaskond. Peale seda, kui kogu andmestu on uues keskkonnas kättesaadavaks tehtud, senine DEA suletakse.