Pitkäaikaissäilytys

Pitkäaikaissäilytys on digitaalisten aineistojen käytettävyyden takaamista sukupolvelta toiselle.

Pitkäaikaissäilytyksellä (PAS) tarkoitetaan digitaalisen informaation säilyttämistä ymmärrettävänä ja käytettävänä useiden kymmenien ja jopa satojen vuosien ajan. Informaation säilyminen täytyy turvata, vaikka laitteet, ohjelmistot ja tiedostomuodot vanhenevatkin ajan myötä. Säilyvyyden näkökulmasta julkaisujen elinkaari on hyvin tärkeää huomioida jo julkaisun syntyvaiheessa.  

Kansalliskirjaston tallentamien verkkoaineistojen ja digitoimien kulttuuriperintöaineistojen pitkäaikaissäilytys toteutetaan yhteistyössä CSC – Tieteen Tietotekniikan Keskus OY:n kanssa, heidän tarjoamassaan kulttuuriperintö-PAS -palvelussa. Kulttuuriperintö-PAS-palvelu on opetus- ja kulttuuriministeriön kulttuuriperintöorganisaatioille tarjoama digitaalisten aineistojen pitkäaikaissäilytyksen mahdollistava palvelukokonaisuus. Palvelu takaa kirjastojen, arkistojen ja museoiden keskeisten kansallisten digitaalisten tietovarantojen pitkäaikaissäilyttämisen.

Pitkäaikaissäilyttäminen jakautuu karkeasti ottaen kolmeen eri tasoon: bittitason, loogiseen ja semanttiseen säilyttämiseen. 

Bittitason säilyttämisessä turvataan ajasta ja paikasta riippumaton tiedostojen muuttumattomuus. Tämä edellyttää aktiivista tiedostojen eheyden seurantaa vertailemalla PAS-palveluun tallennettuja tiedostokopioita, tiedostoihin tulleiden virheiden korjaamista, tallennusteknologioiden virkistämistä (kuten levyjärjestelmien uudistamista tarpeen mukaan) sekä aineistokopioiden maantieteellistä hajauttamista. Bittitason säilyttäminen on pitkäaikaissäilyttämisen perusta. PAS-palvelussa se varmistetaan tallentamalla kaikki aineistot useina kopiona erilaisiin tallennusjärjestelmiin.

Loogisen tason säilyttämisen tavoitteena on mahdollistaa aineistojen hyödyntäminen myös tulevaisuudessa, eli mahdollistaa tiedostojen avaaminen ja tulkinta myös tulevaisuuden ohjelmistoilla. PAS-palveluun otetaan siksi vain tiedostomuotoja, joita voidaan loogisen säilyttämisen toimin migroida, eli muuntaa toiseen tiedostomuotoon. Ohjelmistojen säilytyksessä ensisijainen menetelmä on emulaatio, eli alkuperäisen käyttöympäristön jäljittely modernimmassa laitteistoympäristössä. PAS-palvelu ei tällä hetkellä tarjoa emulaatiota menetelmänä.

Jos säilytyksessä oleva aineisto on vaarassa vanhentua teknisesti, pyritään aineisto ensisijaisesti migroimaan. Migraatiot suunnitellaan Kansalliskirjaston ja CSC:n yhteistyönä, ja niissä pyritään siihen, etteivät säilytyssuunnitelmaan kokoelmatasolla dokumentoidun aineiston keskeiset piirteet muutu ratkaisevasti. Näiden piirteiden määrittely perustuu kokoelman kohdeyleisön esittämiin toiveisiin ja vaatimuksiin. Ne voivat muuttua sekä ajan myötä että kohdeyleisön itsensä muuttuessa.

Semanttisen tason säilyttämisessä keskitytään erityisesti aineistojen ymmärrettävyyden säilyttämiseen, mikä edellyttää kohdeyhteisön sekä aineistojen syvällistä tuntemusta ja ymmärtämistä. Vaikka aineistot voidaan säilyttää eheinä ja muutoin käyttökelpoisina, niiden hyödyntäminen tulevaisuudessa voi olla mahdotonta, jos aineistojen sisältöä ei ymmärretä.

Esimerkki semanttisen tason säilytyksen haasteista on Turun akatemian latinankielisten väitoskirjojen suomentaminen: alkuperäinen kohdeyleisö ymmärsi latinaa, mutta nykyinen kohdeyleisö ei yleensä sitä enää hallitse. Tämän aineiston säilyttäminen semanttisella tasolla edellyttäisi latinan kieliopin ja sanaston tarjoamista tutkijoille aineiston ohella.

Pitkäaikaissäilytystä varten verkkoaineistojen ja e-julkaisujen tulee olla siirto- tai säilytyskelpoisessa tiedostomuodossa. Lisätietoa näistä löytyy CSC:n PAS-palvelun määrittelydokumentista: https://digitalpreservation.fi/specifications/fileformats. Lisäksi aineistojen tulee olla pitkäaikaissäilytystä varten kuvailtuna kansallisbibliografiaan tai Kansalliskirjaston Fikka-tietokantaan.