Tietolinja

Tietolinja
02/2004

Metadataväen Shanghaijaus:
lyhyt raportti DC2004 –konferenssista ja muutakin Dublin Coresta

Jani Stenvall
Helsingin yliopiston kirjasto

URN:NBN:fi-fe20042326


Pääkirjoitus
Artikkelit
Uutisia,
ajankohtaista


Pudong, Shanghai (kuva: Jani Stenvall)

Jokavuotinen metadataan ja Dublin Core -metadataformaattiin keskittyvä konferenssi (DC2004) pidettiin tänä vuonna Shanghaissa, Kiinassa. Normaalien konferenssiesitysten lisäksi järjestettiin vanhaan tapaan Dublin Core –työryhmien kokouksia.

 

Konferenssista

Konferenssi pidettiin Shanghain yleisessä kirjastossa, joka palvelee erityisesti myös tekniikan alan tutkimusta. Kirjasto mainostaa olevansa yksi Aasian suurimmista ja moderneimmista ja sen kyllä uskoo kun käy paikan päällä. Varsinaisia avokokoelmia on aika vähän ja ala-aulassa toimii moderni kirjankuljetusjärjestely web-pohjaisine tilauslomakkeineen ja odotustauluineen. DC2004 –konferenssi pidettiin tyylikkäässä auditoriossa, joka toimii myös konserttisalina. Lisäksi kirjaston yhdessä siivessä oli viihtyisä hotelli ja ravintola, joka kestitsi myös konferenssivieraita.

Dublin Core Metadata Iniative on ottanut periaatteekseen järjestää konferenssinsa vuoron perään eri mantereilla. Tämän ideana on, että paikallisia metadata-alan ja semanttisen webin soveltajia saadaan mukaan konferenssiin. Shanghaissa aasialaisia hankkeita esiteltiinkin melko paljon ja paikalla oli lähes 70 kiinalaista kirjasto- ja metadata-alan ihmistä. Esitykset olivat vaihtelevia ja referoin tässä vain muutamia. Esitykset ovat saatavilla verkosta (http://dc2004.library.sh.cn/english/prog/ tai jos yhteys tuohon palvelimeen on hidas, niin esityksiä voi etsiä osoitteesta http://purl.org/metadataresearch/search.jsp).

Ainakaan allekirjoittanut ei ollut tietoinen Kiinan digitaalisen kirjaston nykytilasta, joten Zhang Xiaolinin pitämä keynote-esitys valaisi kattavasti mitä tuossa suuressa maassa on tekeillä. Digitaaliseen kirjastoon panostetaan tosissaan ja kirjastojen välinen yhteistyö on selvästi nostettu korkealle tasolle. Palveluja pyritään rakentamaan digitaalisen tiedon elinkaareen pohjautuvan ajattelun perusteella. CDLS-projekti (Chinese Digital Library Standards) on Zhangin mielestä keskeinen toimija, sillä standardien merkitys nähdään olennaisena digitaalisen kirjaston rakentamisessa. CDLS ohjeistaa ja neuvoo kirjastoja ja kirjastoryhmiä hyödyntämään heidän suosituksiaan ja standardeja digitaalisen kirjaston prosesseissa, tunnisteissa, metadatassa, hakuprotokollissa (mm. z39.50, OAI-PMH) sekä kokoelmien kuvailussa. Metadatan osalta ideana on hyödyntää ydinformaattina Dublin Corea, mutta CDLS ohjeistaa miten laajennus kannattaa toteuttaa erilaisille aineistoille ja muihin tarpeisiin. Zhang Xiaoling esitteli erityisen kerrosmallin, missä kullekin kerrokselle tarvitaan (standardoitua) metadataa:

  • Metadata for Content Objects
  • Metadata for Collection Objects
  • Metadata for KOS Objects (OWL, XTM, SKOS)
  • Metadata for System/Service Objects (WSDL, OWL-S)
  • Metadata for Service/Process management objects (P3P, Pics, XrXML)

Metatietoa tullaan käyttämään Kiinassa siis monenlaisilla tasoilla. Meillä ajatus on ehkä kuitenkin vielä vain dokumenttien ja kokoelmien tasolla.

Konferenssissa kuultiin melko paljon asiaa kokoelmien kuvailusta. Ann Appsin esittelemä brittien hanke (http://www.iesr.ac.uk/) on mielenkiintoinen ja vertautuu meidän kotoiseen Tietokartta-hankkeeseemme. Kokoelmien kuvailua käsiteltiin Ann Appsin esityksen (saatavissa http://epub.mimas.ac.uk/papers/appsdc2004.html) lisäksi myös Dublin Core Collection Description työryhmässä sekä NISO MetaSearch Iniativea (http://www.niso.org/committees/MetaSearch-info.html) käsitelleessä tilaisuudessa. Dublin Coren CD työryhmän rakentama sovellusprofiili näyttäisi olevan ensimmäinen Dublin Core työryhmä, jonka rakentamaa sovellusprofiilia ollaan virallisesti standardoimassa: NISO MetaSearch Iniativessä tullaan määrittelemään kokoelman kuvailun standardoitu formaatti juuri työryhmän sovelluprofiilin mukaan. Myös Suomessa Tietokartta-hankkeen metadataformaatti pohjautuu DC CD sovellusprofiiliin.

Mielenkiintoinen oli myös Douglas Campbellin esitys Uuden-Seelannin kansalliskirjaston mallista digitaalisten dokumenttien hallinnalle ja metadatalle. Heilläkin on käytössä Endeavorin ENCompass-ohjelmisto, jolla on toteutettu mm. Matapihi-kokoelma (http://www.matapihi.org.nz/). Suomessahan muutama yliopistokirjasto on ottamassa ENCompassia käyttöön lähikuukausina (ks. DOMS-hanke). Uudessa-Seelannissa digitaalista arkistoa ja sen eri prosesseja on suunniteltu huolella jo lähes viisi vuotta. Heillä on kehitelty mm. Metadata-Conversion Engine ideaa, missä on tarkoituksena yhdistää olemassa olevaa metadataa eri lähteistä ja konvertoida niitä eri muotoihin eri palveluja varten.

Pitkäaikaissäilytyksen metadata oli käsittelyn alla erityisesti DC-Preservation työryhmässä. Rebecca Guenther Kongressin kirjastosta esitteli kattavasti PREMIS-työryhmän (Preservation Metadata – Implementation Strategies) työtä. Tämän kansainvälisen ryhmän on tarkoitus julkaista kattava raportti (ja toivon mukaan myös yleinen suositus) pitkäaikaissäilytyksen metadatasta vuoden 2004 loppuun mennessä. Ryhmältä on jo ilmestynyt raportti kyselystä, missä eri kirjastoilta, arkistoilta ja muilta organisaatioilta kysyttiin keskeisiä asioita digitaalisesta arkistoinnista. Raportti on saatavissa työryhmän sivuilta http://www.oclc.org/research/projects/pmwg/. Digitaalisen aineiston säilyvyys on ongelma ja tässä PREMIS-kyselyn raportissa todetaan karusti että organisaatioilla on käytännössä vielä liian vähän kokemusta aineistojen säilyttämisestä digitaalisessa muodossa. Joitakin suosituksia siinä on jo mainittu: METS-standardia olisi hyvä käyttää pitkäaikaissäilytyksen metadatan rakenteena, MIX-standardia tulisi käyttää digitaalisten kuvien teknisen metadatan formaattina, ja metadata tulisi tallentaa sekä tietokantaan että itse digitaalisen objektin "kylkeen".

Seuraava DC-konferenssi on todennäköisesti Madridissa 2005.

 

DCMI: metadatatermit

DCMI:n eri hallintoelimet (Board of Trustees, Advisory Board ja Usage Board) kokoontuivat myös Shanghaissa. Usage Board on se toimielin, joka tekee formaattiin liittyvät tärkeimmät päätökset. Dublin Core on metadataformaattina ollut olemassa noin 9 vuotta. Vuonna 2001 standardoitiin ns. simple Dublin Core eli 15 pääelementtiä. Kuitenkin on ollut aina selvää että Dublin Core ei riitä kaikille ja että laajennettavuutta on tarkoitus edistää. Tilanne on ollut laajennettavuuden osalta sekava ja yritän tässä tilannetta hieman selventää.

DCMI on formalisoinut Dublin Corea rakentamalla sille kuvailun datamallin. Malli määritellään semanttisesta webistä tuttujen rakenteiden avulla. Kaikki Dublin Coren kentät, tarkenteet ja virallisesti hyväksytyt merkintäjärjestelmät kuuluvat DCMI:n ylläpitämään nimiavaruuteen (dcmi-terms). Yhteenlaskettuna näitä nimiavaruuteen kuuluvia termejä on yli 70, paljon enemmän siis kuin virallisesti standardoidut 15 pääelementtiä (ks. http://dublincore.org/documents/dcmi-terms/). Dublin Core –formaatti siis laajenee. Usage Board voi hyväksyä uusia kuvailutermejä liitettäväksi formaattiin, jos ne ovat jollain tapaa monen eri alan käytettävissä (cross-domain) ja ne eivät riko Dublin Coren periaatteita tai datamallia.

Eri Dublin Coren työryhmät ovat rakentaneet ns. sovellusprofiileja, joiden tarkoituksena on kertoa miten jollakin tietyllä alueella Dublin Corea voi soveltaa: mitä kenttiä käytetään, mitkä ovat pakollisia ja mitä lisäkenttiä voi käyttää. Dublin Core -sovellusprofiilit ovat jo pitkällä esimerkiksi kirjastoalalla (DC Library Application Profile) sekä kokoelmien kuvailussa (DC Collection Description Application Profile). Usein näissä sovellusprofiileissa olevia uusia termejä on ehdotettu hyväksyttäväksi viralliseen Dublin Core nimiavaruuteen. Esimerkiksi Usage Board on hyväksynyt ns. 16. ja 17. kentän (Audience, Provenance) Dublin Coren nimiavaruuteen. Nämä kentät eivät kuulu alkuperäiseen 15 standardoituun kenttään, mutta ne eivät myöskään riko Dublin Core rakennetta tai ole formaatin filosofian vastaisia. Tästä syystä Usage Board antaa näille uusille termeille statuksen "conforming".

Shanghaissa Usage Board hyväksyi mm. uusiksi DC-termeiksi kokoelmien kuvailuun liittyvät kolme kenttää: accrualPolicy, accrualMethod ja accrualPeriodicity. Ne siis täyttivät Usage Boardin mielestä laajan sovellettavuuden (cross-domain) tuntomerkit.

 

Dublin Coren Affiliate-ohjelma

Helsingin yliopiston kirjasto allekirjoitti vuonna 2003 sopimuksen DCMI:n kanssa ns. kansallisen tukiorganisaation asemasta. HYK oli ensimmäinen tähän affiliate-ohjelmaan sovitettu tukiorganisaatio. Tänä vuonna, muutama viikko ennen Shanghain konferenssia, joukkoon liittyivät brittiläiset MLA (Museums, Libraries and Archives Council) ja JISC (Joint Information Systems Committee). Lisäksi Saksasta on mukaan tulossa Göttingenin yliopisto, joka alkaa toimia tukiorganisaationa kaikille saksankielisille Dublin Coren soveltajille.

Mitä tämä "affiliatena" olo sitten käytännössä tarkoittaa? DCMI on Dublin Core –metadataformaattia ylläpitävä organisaatio, missä eri alan ihmiset toimivat oman työnsä ohessa periaatteessa vapaaehtoisesti. Toiminnan rahoitus on hieman paremmalla pohjalla, kun affialiate-jäsenet tukevat organisaation toimintaa. HYK on nähnyt tärkeäksi tukea Dublin Coren kehitystä ja standardointia, sillä sen merkitys digitaalisten kirjastopalveluiden metadataformaattina kasvaa. Dublin Coren painopiste on siirtynyt alkuperäisestä ideasta, verkossa olevien html-tiedostojen kuvailusta, kontrolloitujen kokoelmien kuvailuperustaksi. Affiliate-jäsenenä saamme äänemme kuuluviin DCMI-kehitystyössä ja sen päätösprosesseissa. Tärkeimpänä toimena koitamme tukea suomalaisia digitaalisen aineiston hankkeita, missä kuvailu ja Dublin Core –formaatin käyttö olisi tarkoituksenmukaista. Myös kansallinen standardointi kytkeytyy affiliate-asemaan – Suomessa tosin standardointi saatiin aikaan jo ennen affiliate-aikaa vuonna 2001.

Kansan aukio, Shanghai (kuva: Jani Stenvall) 

Kuvat: Jani Stenvall (klikkaa suuremmiksi)

Lisää kuvia »


Tietolinja 02/2004

Jani Stenvall (DCMI Advisory Board)
Juha Hakala (DCMI Board of Trustees)

Helsingin yliopiston kirjasto / Tietokantapalvelut
PL 26, 00014 HELSINGIN YLIOPISTO
Email: etunimi.sukunimi(at)helsinki.fi