Lain kulttuuriaineistojen tallettamisesta ja säilyttämisestä (1433/2007, 9 §) mukainen suunnitelma verkkoaineistojen hakemisen ja tallentamisen laajuudesta sekä verkkoaineistojen luovuttamiskäytännöistä.

Kehittämiskohteet ja painopisteet

  • teknisen osaamisen ja tallennusvälineiden jatkuva kehittäminen verkkojulkaisemisen moninaistuessa
  • luovutusinfrastruktuurin uudistaminen kattamaan laajemmin luovutuksen piiriin kuuluvat aineistot
  • yhteistyön lisääminen tutkijoiden ja asiantuntijoiden kanssa verkkoarkistoon tallennettavien sisältöjen kartoittamisessa
  • arkistoitujen aineistojen tutkimuskäytön edistäminen

1 Aluksi

Kansalliskirjaston tehtävänä on arkistoida kotimainen julkaisutuotanto lain kulttuuriaineistojen tallettamisesta ja säilyttämisestä (1433/2007, jatkossa kulttuuriaineistolaki) mukaisesti. Kansalliskirjaston tulee esittää opetus- ja kulttuuriministeriön hyväksyttäväksi suunnitelma verkkoaineistojen hakemisen ja tallentamisen laajuudesta sekä luovuttamiskäytännöistä (KultAinL 9 §).

Tämä verkkoaineistojen keräyssuunnitelma on vuosille 2017–2020. Suunnitelmassa on huomioitu lain tarkoituksenmukaisen tutkimuksen ja kulttuurihistoriallisen arkistoinnin tarpeet samoin kuin verkkojulkaisijoiden tasapuolinen kohtelu (9 §). Suunnitelmaa voidaan tarkistaa kesken kauden kotimaisen julkaisutoiminnan tai Kansalliskirjaston käytettävissä olevien teknisten tai taloudellisten resurssien muuttuessa merkittävästi.

Kulttuuriperinnön arkistointia ohjeistaa kulttuuriaineistolain lisäksi Unesco. Kansainvälisen yhteistyön rooli, esimerkiksi IIPC:n ja muiden verkkoaineistoja arkistoivien tahojen kanssa, tallennettavien aineistojen valinnassa, tallennus- ja säilyttämistekniikan kehittämisessä ja toteutuksessa korostuu jatkuvasti erityisesti verkkojulkaisemisen kehittymisen ja kansainvälistymisen myötä.

Strategiakaudella 2017–2020 keskeisiä kysymyksiä ovat toimintaa ohjaavan lainsäädännön kehittäminen niin aineistojen arkistointia kuin arkistoitujen aineistojen tutkimuskäyttöä ohjeistavan lainsäädännön osalta. Digitaalisten aineistojen räjähdysmäisen kasvun myötä huomiota täytyy entistä enemmän kiinnittää siihen, mitä sisältöjä tallennetaan ja miten aineistojen tallentamiseen liittyvää tekniikka kehitetään. Myös arkistoitujen aineistojen tutkimuskäytön mahdollisuuksien kehittäminen nousee keskiöön.

2 Tallennettavat aineistot ja tallennustavat

Avoimesti yleisön saatavilla olevien verkkosivustojen lisäksi aineistoa suomalaiseen verkkoarkistoon tallennetaan erityisesti uutissisältöjä myös maksumuurin takaa. Lisäksi tallennetaan sosiaalisen median sisältöjä (kuten Twitter, Facebook, YouTube) erityisesti teemakeräysten yhteydessä.

Muita verkkojulkaisuja, kuten e-kirjoja, e-musiikkia ja e-lehtiä, tallennetaan luovutuspyynnöin.

3 Verkkosivustojen tallentaminen

Tietoverkoissa yleisön saatavilla olevia aineistoja haetaan ja tallennetaan

  1. vuosittain tehtävässä Suomi-keräyksessä
  2. erityiseen aiheeseen tai tapahtumaan kohdistuvilla teemakeräyksillä
  3. sanomalehtiin, aikakauslehtiin ja uutissivustoihin kohdistuvilla jatkuvasti päivittyvien sisältöjen keräyksillä

Suomi-keräyksessä arkistoidaan läpileikkaus suomalaisesta verkkojulkaisemisesta. Tässä vähintään kerran vuodessa tehtävässä keräyksessä talletetaan .fi- ja -.ax -päätteisiä sivustoja sekä muiden domainien suomalaisia sivustoja kieli- ja maatunnistuksia hyödyntämällä. Suomi-keräyksiä täydennetään tallentamalla sosiaalisen median sisältöjä.

Teemakeräyksissä tallennetaan Suomi-keräystä laajemmin ja perusteellisemmin tiettyyn aiheeseen tai aineistotyyppiin rajattuja verkkoaineistoja myös sosiaalisesta mediasta. Teemakeräyksiä tehdään seuraavista aihepiireistä:

  1. kansalliset tai kansainväliset tapahtumat, esim. vaalit
  2. muut tapahtumat ja ilmiöt, esim. festivaalit, urheilutapahtumat, luonnonkatastrofit
  3. ajankohtaiset yhteiskunnalliset tilanteet
  4. muut tiettyyn aiheeseen tai aineistotyyppiin rajatut keräykset.

Kansalliskirjasto kartoittaa teemakeräyksissä tallennettavia verkkoaineistoja myös yhteistyössä tutkijoiden, muiden asiantuntijoiden ja yleisön kanssa. Kansainvälisiin aiheisiin ja ilmiöihin liittyen tehdään tarvittaessa teemakeräyksiä yhteistyössä esimerkiksi IIPC:n ja eri maiden verkkoarkistoinnista vastaavien tahojen kanssa.

Jatkuvasti päivittyvien sisältöjen keräyksessä tallennetaan verkossa ilmestyviä artikkeleita päivittäin, viikoittain tai kuukausittain riippuen sivustojen ilmestymis- /päivittymistiheydestä.

Keräys-/tallennustavat

Verkkoaineiston automaattisen tallentamisen tekniikka on muuttunut tallennettavien aineistojen monimuotoisuuden vuoksi yhdestä vakiintuneesta menetelmästä (Heritrix-keruuohjelmisto) useisiin menetelmiin, joiden sovittaminen ja kehittäminen vaatii jatkuvaa työtä. Esimerkiksi maksumuurien estämien verkkosivujen ja sosiaalisen median aineistojen kerääminen ei välttämättä onnistu Heritrix-ohjelmistolla. Näiden aineistojen keräämiseksi on jo otettu käyttöön ja jatkuvasti kehitetään avoimen koodin ohjelmistoja, joita käytetään sivustoille tunnistautumiseen ja aineistojen tallentamiseen suoraan tai palveluiden tarjoamien rajapintojen avulla. Uudentyyppinen aineisto vaatii uusia käsittelyratkaisuja pitkäaikaissäilyvyyden takaamiseksi. Kansalliskirjasto osallistuu kansainväliseen yhteistyöhön tallennusvälineiden kehittämisessä.

4 Muiden digitaalisten julkaisujen tallentaminen (esim. e-kirjat, e-lehdet, verkkomusiikki)

Verkkoaineistoja, joita ei voida kerätä automaattisesti, pyydetään luovutuksina Kansalliskirjastoon (HE 68/2007). Tällaisia julkaisuja ovat tyypillisesti esimerkiksi

  1. e-kirjat ja -lehdet sekä lehtiarkistot,
  2. verkkomusiikki ja -pelit ja
  3. korkeakoulujen, julkishallinnon, kansalaisjärjestöjen ja muiden organisaatioiden verkkojulkaisut

Verkkojulkaisemisen kehityksen mukanaan tuomat uudet julkaisumuodot kuuluvat myös luovutuspyyntöjen kautta saataviin aineistoihin, mikäli niitä ei pystytä tallentamaan automaattisesti.

Luovutusvelvollisuuden piiriin kuuluvista julkaisuista pyydetään luovuttamaan myös niihin liittyvä metadata ensisijaisesti julkaisualalla käytössä olevissa metadataformaateissa (esim. Dublin Core, ONIX, NewsML, Marc21). Mikäli julkaisu itsessään sisältää hyvälaatuista metadataa, voidaan myös sitä hyödyntää aineistojen asiakaskäyttöön tarjoamisessa. Kansalliskirjaston ylläpitämissä julkaisuarkistoissa olevista julkaisuista tallennetaan vapaakappaleet suoraan kyseisistä julkaisuarkistoista, Julkaisuarkistoissa on julkishallinnon, yliopistojen ja ammattikorkeakoulujen julkaisuja. Samalla tavalla tallennetaan myös muita julkaisuarkistoja ja muita avoimien rajapintojen kautta saatavilla olevia aineistoja, kuten tieteellisiä verkkolehtiä. Näin mm. julkaisuarkistoissa olevat julkaisut saadaan osaksi vapaakappalearkistoa ja niissä olevaa metadataa voidaan konversioiden kautta hyödyntää aineistojen kuvailussa kansallisbibliografiaan ja muihin kirjastotietokantoihin. Näin toiminta palvelee verkkojulkaisujen arkistoinnin ja pitkäaikaissäilytyksen lisäksi myös avoimen tieteen saatavuutta.

Luovutusvelvollisuuden piiriin kuuluvia aineistoja pyydetään Kansalliskirjastoon luovutuksina, koska mahdollistetut haravoinnit eivät käytettävissä olevalla tekniikalla ole onnistuneet. Luovutusprosessit edellyttävät Kansalliskirjaston ja verkkojulkaisijoiden yhteistyötä, ja ne toteutetaan molempien osapuolten kannalta mahdollisimman vaivattomasti. Luovutuskäytäntöjä ja -infrastruktuuria yhdenmukaistetaan ja laajennetaan kattamaan paremmin luovutusvelvollisuuden piiriin kuuluvat aineistot.

Suuret aineistomäärät luovutetaan joko tallenteella, SFTP-tiedonsiirrolla tai verkkoluovutuslomakkeella. Kaikilla tavoilla on mahdollista luovuttaa myös aineistoihin liittyvä metadata. Yksittäisten julkaisujen luovuttaminen tapahtuu aina verkkoluovutuslomakkeella.

Aineistojen ja niihin liittyvän metadatan luovutukset hoidetaan ensisijaisesti verkkokirjakauppojen, verkkomusiikkikauppojen tai välittäjien kanssa, jotka luovuttavat säännöllisesti palvelunsa kautta saatavana olevien kustantajien tai julkaisijoiden verkkoaineistot. Julkaisija tai kustantaja luovuttaa aineiston, jos aineistoa ei ole saatavissa muuta kautta. Julkaisuarkistopalvelujen ulkopuolella olevat julkishallinnon toimijat luovuttavat Kansalliskirjaston pyynnöstä itse aineistonsa.

Luovutettavat aineistot tulee ensisijaisesti toimittaa kansallisen digitaalisen kirjaston pitkäaikaissäilytyspalvelun määrittelemissä aineistotyyppikohtaisissa säilytys- tai siirtokelpoisissa tiedostomuodoissa

[http://www.kdk.fi/index.php/fi/pitkaaikaissailytys/maeaerittely-ja-dokumentit/5-suomi/pitkaeaikaissaeilytys/141-kdkn-saeilytys-ja-siirtokelpoiset-tiedostomuodot].
Aineistotyyppi määräytyy aineiston pääasiallisen sisällön mukaan.

Arkistoinnin kannalta erityisen ongelmallisten aineistojen, kuten tietokantojen, verkko-opetusmateriaalien ja verkkopelien tallennuksessa pyritään seuraamaan kansainvälistä kehitystä ja mahdollisuuksien mukaan osallistumaan alan kansallisiin ja kansainvälisiin yhteistyöprojekteihin.

5 Verkkoaineistojen käyttö ja pitkäaikaissäilytys

Kansalliskirjasto huolehtii aineistojen tallentamisesta ja toimittamisesta pitkäaikaissäilytykseen. Tallennetut aineistot ovat käytettävissä Kansalliskirjaston ylläpitämillä vapaakappaletyöasemilla tekijänoikeuslain mukaisesti (404/1961 16 b).

Verkkoarkiston siirtäminen Kansallisen digitaalisen kirjaston pitkäaikaissäilytyspalveluun alkoi marraskuussa 2015. Seuraavaksi palveluun siirretään luovutuksina saadut verkkoaineistot. Pitkäaikaissäilytys ei poista Kansalliskirjaston velvoitetta säilyttää ja tarjota käyttökopiot kaikista tallennetuista aineistoista.

6 Yhteenveto

Kotimaisen julkaisutuotannon kulttuuriaineistolain mukainen tallentaminen muuttuu koko ajan haasteellisemmaksi tehtäväksi verkkojulkaisemisen monimuotoistumisen myötä. Uudet julkaisukäytännöt tarkoittavat usein monia rinnakkaisia teknologioita ennen kuin mallit alkavat vakiintua ja käytössä olevat tekniikat kehittyvät koko ajan. Yhteistyö julkaisualan toimijoiden ja verkkoarkistointia tekevien tahojen kanssa sekä henkilöstön osaamisen jatkuva kehittäminen ovat arkistoinnin ehdottomia edellytyksiä.

Yhteistyö tutkijoiden ja muiden asiantuntijoiden kanssa korostuu verkkoaineistojen tallennuksessa sekä tallennettavien aineistojen kartoittamisessa että verkkoaineistojen tutkimuskäytön pilotoinnissa. Digitaalisten ihmistieteiden tutkimusmenetelmien yleistymisen myötä kasvaa myös tarve arkistoitujen verkkoaineistojen käyttöä ohjaavan lainsäädännön uudistamiselle.