Tietolinja

Tietolinja
02/2003

DOMS : digitaalisten aineistojen hallinta yliopistokirjastoissa

Esa-Pekka Keskitalo
Helsingin yliopiston kirjasto

URN:NBN:fi-fe20031962


Pääkirjoitus
Artikkelit
Uutisia,
ajankohtaista


Mikä on DOMS?

Kansalliskirjaston tekninen palveluydin muodostuu integroidusta kirjastojärjestelmästä, tieteellisen tiedonhalun NELLI-portaalista ja digitaalisen aineiston hallintajärjestelmästä eli DOMSista. Tarkemmin asiaa on selostanut Juha Hakala artikkelissaan Kirjastoverkko 2003 Tietolinjan numerossa 1/2003. Integroitu kirjastojärjestelmä on jo vuosien ajan ollut osa kirjastojen arkea. NELLI-portaalin on käyttöönottokunnossa vuoden 2004 alussa, ja samalla otetaan käyttöön SFX-linkityspalvelin. Tässä artikkelissa tarkastellaan kolmatta, vielä rakennusvaiheessa olevaa peruspilaria, DOMSia.

 

Mihin DOMSia tarvitaan?

Verkon kautta käytettävät digitaaliset aineistot muodostavat jo merkittävän osan tieteellisten kirjastojen kokoelmista, etenkin kausijulkaisuista. Suurin osa digitaalisista kokoelmista on hankittu kaupallisia kanavia pitkin. Tavallinen hankintamalli on, että kirjastot hankkivat käyttöoikeuden verkkoaineistoon, jonka kaikinpuolisesta ylläpidosta vastaa kustantaja tai muu palveluntarjoaja. Keskitetysti tällaista aineiston hankintaa hoitaa FinELib, jonka tarjontaa täydennetään paikallisilla hankinnoilla. Se palvelu, josta kirjastojen kuitenkin täytyy huolehtia itse, on eri puolilta lisensoitujen aineistojen muuttaminen järkeväksi, asiakkaita palvelevaksi kokoelmaksi.

Kaikkea ei kuitenkaan saa valmiina. Yliopistojen täytyy itse huolehtia eräiden digitaalisten aineistojen tuottamisesta, säilytyksestä ja/tai jakelusta. Tyypillisiä julkaisutapauksia ovat opinnäytteet sekä yliopistojen julkaisusarjat. Tieteellisen tiedon tunnettuuden ja saatavuuden edistämisessä yliopistoilla onkin tärkeä tehtävä. Erityisesti kotimaisesta ja suomenkielisestä julkaisemisesta on pidettävä huolta. Julkaisualalla tapahtuukin paljon mielenkiintoista liittyen mm. dokumenttien vapaaseen saatavuuteen (Open Access, http://www.lib.helsinki.fi/finnoa/) ja metadatan vapaaseen haravointiin (Open Archives Initiative, http://www.openarchives.org/).Yliopistojen digitaalisesta julkaisutoimintaa on Désirée Räsänen kartoittanut, ks. Tietolinja 1/2003.

Tieteellisten julkaisujen ohella yliopistoissa syntyy paljon muuta digitaalista aineistoa, jonka säilyttäminen ja saatavilla pitäminen on järkevää. Oppimateriaalien, erilaisten kuva-arkistojen, tutkimusdatan sekä painettujen kokoelmien digitaalisten kopioiden verkkojakelu on vielä ollut pienimuotoista, mutta tarve on ilmeinen. Tärkeä näkökohta on etäopiskelun lisääntyminen ja yliopistojen välisen yhteistyön lisääntyminen ja siten lisääntyvät vaatimukset oppimateriaalien saatavuudelle.

Helsingin yliopiston kirjastolle on kansalliskirjastona tärkeää arvokkaan ja kiinnostavan kulttuuriperinnön digitointi. Kopioiden avulla aineiston tunnettuutta voidaan lisätä rasittamatta alkuperäiskappaleita. Tästä hyvänä esimerkkinä on kansallisen äänitearkiston digitointi, joka muuttaa perusteellisesti äänitteiden tutkimuskäytön edellytyksiä. Mikkelin mikrokuvaus- ja konservointilaitoksen kausijulkaisujen digitointiprojektit tuovat esim. historialliset sanomalehdet kaikkien suomalaisten saataville. Parhaillaan kirjastossa on menossa myös Urho Kekkosen koko julkisen kirjallisen tuotannon sisältävän tietokannan valmistelu julkaisukuntoon.

Jos missä on tässä kuvatun laisia digitaalisia aineistoja, niillä on myös hallintajärjestelmä - vaikkapa sitten kenkälaatikko, jossa säilytetään diskettejä. Niiden avulla ei kuitenkaan vielä synny kestäviä arkistoja eikä hyvää asiakaspalvelua.

 

Hyvää DOMSia rakentamassa

Digitaalisia kokoelmia on tähän asti usein lähestytty yksittäistapauksina, ja erilaisia hankkeita ja järjestelmiä on syntynyt erilaisten aineistojen ympärille. Jo HYK:ssa voi mainita Ethesiksen, Elektran, Helmin, digitoidut äänitteet jne. Toiminnan laajentuessa on välttämätöntä, että teknisiä ratkaisuja yhtenäistetään ja arkistetaan. Rinnakkaisten pienten järjestelmien kehitys ja ylläpito käy raskaaksi. Helsingin yliopiston kirjasto on siksi ryhtynyt perustamaan digitaalisen aineiston hallintajärjestelmää eli DOMSia. Lyhenne DOMS tulee sanoista "Digital Object Management System". Nimitys ei viittaa mihinkään tiettyyn teknologiaan, vaan valmiuteen omassa hallussa olevien digitaalisten kokoelmien hoitoon. Se ei myöskään tarkoita pelkästään ohjelmistoa tai laitteistoa vaan koko sitä tehtävien, tekijöiden ja välineiden kokonaisuutta, jonka tehtävänä on digitaalisten dokumenttien säilyttäminen, hallinnointi ja käyttöön asettaminen. Kokonaisuudelle asetettavat vaatimukset on määritelty ISO-standardissa ISO 14721:2002, Reference Model for an Open Archival Information System (OAIS) (http://wwwclassic.ccsds.org/documents/pdf/CCSDS-650.0-B-1.pdf).

OAIS-standardi pyrkii kuvaamaan järjestelmälle asetettavat vaatimukset. Se määrittelee digitaalisen aineiston hallintajärjestelmän pakolliset piirteet seuraavasti:

  • Informaation vastaanottaminen aineiston tuottajilta (termi tuottaja hyvin laajasti käsitettynä).
  • Informaation kontrolli niin, että pitkäaikaissäilytys voidaan toteuttaa
  • Kohdekäyttäjäkunnan määrittely.
  • Informaation säilyttäminen siten, että se on kohdekäyttäjäkunnan itsenäisesti käytettävissä ja ymmärrettävissä
  • Periaatteiden ja toimintatapojen dokumentointi ja noudattaminen niin, että informaation säilyminen kaikissa tilanteissa on varmistettu, ja niin, että informaatiosisällöstä voi levittää luotettavia kopioita.
  • Informaation asettaminen kohdekäyttäjäkunnan saataville.

Funktionaaliset oliot OAIS-mallissa ovat seuraavat:

  • Dokumenttien vastaanotto (vastaanotto tuottajalta, aineiston ja metadatan tallennus)
  • Metadatan hallinta (tietokannan ylläpito, hakukyselyihin vastaaminen, raportointi)
  • Aineiston säilytys (säilytysjärjestelmän ylläpito, varmuuskopiointi, kopiointi)
  • Pitkäaikaissäilytyksen suunnittelu (strategiat ja standardit, ympäristön muutosten seuranta, säilytyssuunnitelmat)
  • Hallinto (standardit ja menettelytavat, järjestelmien administrointi, yhteydenpito tuottajiin, asiakaspalvelu)
  • Kohdekäyttäjäkunnan käyttöön asettaminen (hakutulosten ja aineistojen välitys, käyttöliittymä)

Kuten helposti huomaa, OAIS ei tässä eikä yksityiskohtaisemmissakaan määrittelyissä pyri ohjaamaan teknisiä ratkaisuja. OAIS kuvaa ideatason järjestelmän, johon olemassa olevia järjestelmien toiminnallisuuksia ja ominaisuuksia voi peilata: OAIS ei myöskään käsittele ainoastaan digitaalisen aineiston teknistä säilyttämistä ja jakelua, vaan järjestelmän toiminnallista kokonaisuutta, siis ennen kaikkea ihmisten tekemää työtä, suunnittelua ja poliittista päätöksentekoa.

 

Hallintaohjelmiston hankinta

DOMSia varten tarvittavan ohjelmistosovelluksen hankkiminen aloitettiin syksyllä 2002 Linnea-konsortion puitteissa. Hankinta liittyi läheisesti NELLI-portaalin ohjelmistohankintaan. Hankintapäätös tehtiin yliopistokirjastojen neuvostossa keväällä 2003, jolloin päätettiin aloittaa sopimusneuvottelut Endeavor Information Systems -yhtiön kanssa ENCompass for Digital Collections -nimisen sovelluksen hankkimiseksi (http://encompass.endinfosys.com). Kaikilla Linnea-kirjastoilla on mahdollisuus ryhtyä ohjelmiston käyttäjiksi, ja muutamat ovat HYK:n ohella jo ilmaisseet aikomuksensa niin tehdä. Hankinnassa on lähdetty siitä, että kirjastot voivat päättää mukaan tulostaan itse, sen mukaan kuin tarvetta ilmenee ja rahoitus järjestyy.

Digitaalisen aineiston hallintajärjestelmän suunnittelussa lähdettiin siitä, että ratkaisut ovat yhteensopivia kirjastojen muiden teknisten järjestelmien kanssa. Digitaalisen aineiston on oltava haettavissa NELLI-portaalin kautta, ja kirjastojärjestelmän tietueista on voitava siirtyä vastaavaan digitaaliseen aineistoon, pari järjestelmärajat ylittävää käyttötilannetta mainitaksemme. Toinen vaatimus, jonka täyttäminen ei ole aivan yksinkertaista, on erilaisten käyttöoikeus- ja tekijänoikeuskysymysten ottaminen huomioon aineistojen jakelussa.

Valinnassa tuli ottaa huomioon myös se, että digitaalisen aineiston kuvailu on nopeasti kehittyvä ja vielä muotojaan hakeva ala. Esim. suosituksia pitkäaikaissäilytyksen vaatimaksi metadataksi ("preservation metadata") ollaan parhaillaan laatimassa (PREMIS-hanke, ks. http://www.oclc.org/research/projects/pmwg/). Joka tapauksessa järjestelmää ei voi sitoa mihinkään yhteen metadataformaattiin, koska mitään kaiken kattavaa superformaattia ei ole. Tulevaisuudessakin tarvitaan erilaisia formaatteja että niiden välisiä konversioita sekä niiden rinnakkaista käyttöä. Tässäkin suhteessa standardien käyttö - ja etenkin standardien oikea käyttö - on tärkeää.

Tilannetta, jossa kaikki IT-ratkaisut voisivat kytkeytyä toisiinsa helposti kuin legopalikat, ei ole näköpiirissä. Standardinmukaisuuden ja yhteensopivuuden saavuttaminen vaatii suunnittelua, osaamista ja pitkäjänteistä, järjestelmiä kehittävää ylläpitoa. Yhtenäisyydellä ja yhteistyöllä se voidaan toteuttaa suhteellisen edullisesti. Yhtenäiset järjestelmät ja myös toimintatavat luovat edellytyksiä luotettavalle pitkäaikaissäilytykselle. Kaikkein tärkeintä on kuitenkin hyvä asiakaspalvelu: asiakkaan työympäristön tulee olla tuttu, yhtenäinen ja toimiva.

Kuten aiemmin todettiin, DOMSiin sisältyy paljon muutakin kuin ohjelmisto - laitteistot, säilytysjärjestelmät, työnkulkujen suunnittelu, toimintaperiaatteiden luominen jne. Näissä asioissa on paljon kirjastoille yhteistä, paljon myös sellaista, mikä pitää sovittaa paikallisiin tarpeisiin. HYK on esim. tutkimassa erilaisia vaihtoehtoja elektronisten vapaakappaleiden vastaanottamiseen liittyvien työnkulkujen järjestämiseksi. Tätä haluaisin lopuksi korostaa: onnistuneessa digitaalisten aineistojen hallintajärjestelmässä on kyse ennen kaikkea muusta kuin tekniikasta sinänsä. OAIS-standardikin pitää hyvän digitaalisen arkiston tunnusmerkkinä määritellyn kohdekäyttäjäkunnan palvelemisesta - käyttäjien ehdoilla.

 


Tietolinja 02/2003

Esa-Pekka Keskitalo, sovellussuunnittelija
Helsingin yliopiston kirjasto, Tietokantapalvelut
PL 26, 00140 Helsingin yliopisto
Email: muotoa etunimi.sukunimi@helsinki.fi