Tietolinja

Tietolinja
01/2005

Millaista on tietokantahuolto?

Arne Hedman
Helsingin yliopiston kirjasto

URN:NBN:fi-fe20051517


Pääkirjoitus
Artikkelit
Uutisia,
ajankohtaista


Yhteistietokanta on kuin omakotitalo, joka alkaa pian repsottaa jostakin kulmasta, jollei sitä koko ajan huolleta. Helsingin yliopiston kirjaston tietokantapalveluissa on kuusi ihmistä huolehtimassa päätoimisesti LINDAn ja ARTOn hyvinvoinnista tietokantavastaavien lisäksi.

Tämä artikkeli pohjautuu tietokantahuoltajien kanssa huhtikuun alussa käytyihin keskusteluihin ja omiin kokemuksiini LINDAsta noin kymmenen vuoden ajalta. Tietokannan tilaa ei voi luotettavasti arvioida, ellei itse tee jatkuvaa kuntokartoitusta. Se onnistuu parhaiten osallistumalla mahdollisimman monipuolisesti jokapäiväiseen tietokantahuoltoon.

Tietokantahuollon tavoitteena on pitää tietokanta mahdollisimman ajantasaisena, tuplattomana ja tärkeimpien tietoelementtien eli tekijöiden ja nimekkeiden osalta virheettömänä.

Tietokantahuoltoa tarvitaan, koska kirjastojärjestelmien tekniikka ei joka tilanteessa riitä takaamaan tallennuksen virheettömyyttä tai tuplakontrolli ei ole teknisesti yhteisjärjestelmän edellyttämällä tasolla. Kirjastojen erilaiset käytänteet voivat tuoda yhteisjärjestelmään kirjavuutta ja inhimilliset näppisvirheet ovat myös mahdollisia.

Tietokantahuoltajina on sekä kokenutta väkeä että uusia tulokkaita: Airi Salin on tullut tietokantapalveluihin 1997, Silja Ojala 1999, Victoria Salomaa 2000, Tiina Lipsanen 2003 ja Hille Ruotsalainen 2004. Pirkko-Liisa Nurminen on aloittanut huhtikuussa tänä vuonna. Tällä hetkellä heidän työviikkonsa on jaettu niin, että LINDAlle on varattu neljä päivää ja ARTOlle yksi .

Huolto koostuu monenlaisista tehtävistä: Mahdollisten tuplatietueiden tarkastamista, tietokannassa jo olevien tuplatietueiden yhdistämistä, LINDAsta poistettavien tietueiden manipulointia, Linnea-verkon ulkopuolisten kirjastojen varastotietueiden editointia ja edellisen kirjastojärjestelmävaihdoksen aikaisen tiedostokonversion virhelistojen läpikäyntiä. Tietokantahuoltajien työ on Voyager-LINDAn aikana toistaiseksi ollut lähes pelkästään kirjastoista LINDAan tulevien mahdollisten tuplatietueiden vertailua LINDAn tietueisiin. Työ vaatii väsymättömiä silmiä ja vakaata hiirikättä, sääntöjen ja formaatin tuntemusta, kielitaitoa ja hyviä sosiaalisia taitoja.

Työnkuva on muuttunut, kun järjestelmä on vaihtunut VTLS:stä Voyageriin. LINDAn joka-aamuiset paperilistat ovat hävinneet, työ on teknisesti helpottunut, webiä voi työssä hyödyntää ja jokaisella on nykyään omat vastuukirjastot. Toisaalta työmäärä on kasvanut. ARTOn huolto, joka on takautuvaa Aikakauslehti-indeksin tallennusta, tuo työhön virkistystä erilaisuutensa vuoksi.

Kirjastoista tulee LINDAan päivittäin 2000-4000 bibliografista tietuetta. Niistä on uusia n. 30 % ja huoltohenkilöstön käsiteltäväksi tulevia mahdollisia tuplia tällä hetkellä 5-10% eli n. 100-400 tietuetta. Tuplakontrolliin HYK:ssä tehtyjen sekä uuden tulevan ohjelmaversion (UNICODE-versio) parannusten ansiosta sekä kolmessa suuressa tietokannassa tehtyjen tallennustapojen uudistusten jälkeen uskomme pääsevämme loppuvuonna alle 4 %:n tasoon. Silloin voisimme käydä käsiksi sekä Voyager-LINDAn perustamisen aikoina syntyneisiin mahdollisten tuplien rästeihin (n. 45 000) että monipuolistaa työnkuvaa muilla huoltohommilla.

Tuplakontrollin mahdolliseksi tuplaksi arvioiman tietueen käsittelyssa otetaan kirjastosta tuleva tietue ja LINDAsta löytyvä(t) tietue(et) yhtaikaa kuvaruudulle ja yritetään selvittää ensimmäiseksi, koskeeko kuvailu samaa teosta. Jos LINDAssa ei ole lainkaan ko. teosta , tuleva tietue tallennetaan LINDAan ja sinne luodaan varastotietue, jossa näkyy tietokanta, josta tietue saapui.

Jos tuleva tietue ja LINDAssa jo oleva tietue kuvailevat samaa teosta, ne sulautetaan yhteen. Jos LINDAssa on jo ennestään tuplatietue(ita), yhdistetään ne ensin yhdeksi jättämällä paras/sopivin tietue pohjaksi. Lopuksi yhdistetään tuleva tietue ja LINDAn tietue siten, että LINDAn tietuetta rikastetaan kaikilla hakuun tai tuplakontrolliin vaikuttavilla tulevan tietueen kentillä, esim. asiasana- ja luokituskentillä tai Fennica-tietokannan kansallisbibliografiatunnuksella (kenttä 015). Tämä tapahtuu leikkaa-liimaa menetelmällä. Lopuksi tarkastetaan, että tietueen tasokoodi vastaa tietueen todellista tasoa. Aina tietueita yhdistettäessä pitää kaikki varastotietueet yksitellen siirtää LINDAan jäävään tietueeseen. Tästä kömpelöstä menetelmästä johtuen jokaisen (mahdollisen) tuplatietueen käsittely vie 1-5 minuuttia.

Huoltotyön hyvinä puolina huoltajat pitivät sen itsenäisyyttä, tietueiden tarjoamaa uuden oppimisen mahdollisuutta ja tavoitteiden saavuttamisen tuottamaa tyydytystä. Piristystä tuovat ARTOn vanhoista tietueista kumpuavat hauskat assosiaatiot (ns. lentävät nimekkeet). Työssä ärsyttävät ajoittaiset atk-ongelmat, aikapaine ja siihen liittyvä ainainen riittämättömyyden tunne ja työn yksitoikkoisuus eli se, että toistaiseksi on ollut pakko keskittyä lähes pelkästään tuplatietue-ehdokkaisiin. Taukojen oikealla jaksotuksella kahvin, jumpan tai lehden kera on tärkeä merkitys yksitoikkoisuuden torjunnassa.

Työn ongelmatilanteet liittyvät erilaisiin luettelointitapoihin, ristiriitaisuuksiin esimerkiksi sarjanumeroinnissa, nimekkeiden kirjoitusvirheisiin tai eksoottisiin kieliin, kreikkaan, vietnamiin tai islantilaisiin nimiin. Näihin törmää viikoittain. Suurin ongelma on kuitenkin se, ettei tietuevertailussa tietueen pohjana oleva kirja ole käden ulottuvilla. Fennica-tietokannasta on tietenkin paljon apua kotimaisen aineiston käsittelyssä. Tietokantahuoltajien terveiset kirjastoille ovat: "Tuplat pois omasta tietokannasta ja oikea LINDAn bib-id kirjaston tietueen kenttään 035."

Tarkkuutta vaativan pitkäjännitteisen ja puuduttavan istumatyön vastapainoksi tarvitaan tietokantahuoltajien mielestä ulkoilua, uintia, joogaa, hydrobiciä, musiikkia, elokuvia, italiaa ja nukkumista.

Millaisia ominaisuuksia vaaditaan hyvältä tietokantahuoltajalta eli millaisia ovat meidän huoltajamme: pitkäjänteisiä, täsmällisiä, huumorintajuisia, asiallisia, auttavaisia ja lisäksi ammattitaitoisia.

 


Tietolinja 01/2005

Arne Hedman
Helsingin yliopiston kirjasto / Linnea-palvelut
PL 26, 00014 HELSINGIN YLIOPISTO
Email: arne.hedman(at)helsinki.fi