Dublin Core-kotisivu

Dublin Core apple

Dublin Core Metadata Element Set:
Internet-tiedonhaun hakuelementit

Juha Hakala
Helsingin yliopiston kirjasto - Suomen kansalliskirjasto

Versio 1.0
Päivitetty: 1998-09-07

Tämä teksti on Suomen oloihin mukautettu versio Internet-standardista RFC2413 (Weibel, S. et al.: Dublin Core Metadata for Resource Discovery ( ftp://ftp.isi.edu/in-notes/rfc2413.txt).

Johdanto

Tämä teksti määrittelee Dublin Core -formaatin 15 kenttää eli elementtiä.

Kolmen elementin (Päivämäärä, Suhde ja Kate) määrityksessä on hyödynnetty niille de facto sovittuja tarkenteita, koska ilman niitä näiden kenttien käyttö on ongelmallista.

Yleistä

Dublin Coren kehitystyö alkoi 1995 kirjastonhoitajien, atk-asiantuntijoiden ja SGML-eksperttien yhteistyönä. Tavoitteena oli tehostaa elektronisten julkaisujen hakua luomalla helppokäyttöinen väline verkkojulkaisujen kuvailuun. Työhön osallistuu tätä kirjoitettaessa aktiivisesti useita kymmeniä vapaaehtoisia eri alojen asiantuntijoita, jotka kokoontuvat 1-2 kertaa vuodessa Dublin Core Metadata Workshop kokouksissa.

Dublin Core -kehittäjien keskeisiä tavoitteita ovat:

Työryhmä on päässyt yksimielisyyteen julkaisujen kuvailun keskeisistä elementeistä. Nämä 15 elementtiä määritellään tässä dokumentissa. Ryhmä on lisäksi kehittänyt syntaksin tietojen tallentamiseksi HTML-dokumenttien META-kenttään. Syntaksin määritys HTML 3.2 ja 4.0 -versioille ilmestynee RFC-standardina vielä vuonna 1998. RFC:nä julkaistaan pikapuoliin myös Dublin Coren käyttöohje, josta laaditaan samanaikaisesti englanninkielisen alkuperäistekstin kanssa suomenkielistä versiota.

Helsingin yliopiston kirjasto julkisti jo vuonna 1997 Dublin Core -tallennusalustan (http://www.lib.helsinki.fi/cgi-bin/dc.pl). Se tuottaa tätä kirjoitettaessa Dublin Core -tietueita HTML 3.2 ja 4.0 -muodossa (katso tämän tekstin Source). Vuoden 1999 aikana ohjelmaa muokataan niin, että se pystyy rakentamaaan XML/RDF-muodossa olevia tietueita, ja mahdollisesti myös yksinkertaisia tietueita, jotka Alta Vista ja muut yleiset WWW-indeksit pystyvät käsittelemään. Lisäksi sovellusta laajennetaan siten, että se tukee kaikkien yhteisesti sovittujen Dublin Core -tarkenteiden tallennusta.

Dublin Coren laajennettavuus tarkoittaa käytännössä kahta asiaa:

Toisin kuin useimpia muita kuvailujärjestelmiä, Dublin Corea ei kehitetty millekään tietylle tieteen- tai toimialalle, vaan se on tarkoituksella yleinen ja sopii laajennettavuutensa ansiosta kaikentyyppisten aineistojen kuvailuun. Vaikka kehitystyön päätavoitteena on ollut Internet-julkaisujen kuvailuun soveltuva järjestelmä, formaattia käytetään jo tätä kirjoitettaessa esimerkiksi museoissa olevien esineiden kuvailuun.

Lisätietoja Dublin Coresta saa formaatin kotisivulta (http://purl.org/metadata/dublin_core). Tätä julkaisua koskevat kommentit voi lähettää Juha Hakalalle Helsingin yliopiston kirjastoon ( juha.hakala@helsinki.fi).


Elementtien kuvaukset

  1. Nimeke

    Tunniste: title

    Tekijän tai julkaisijan antama tallenteen nimi.

  2. Tekijä

    Tunniste: creator

    Henkilö tai yhteisö joka on ensisijaisesti vastuussa tallenteen intellektuaalisesta sisällöstä. Esimerkiksi kirjoitetun dokumentin kyseessä ollen kirjoittaja, kuvadokumentin kyseessä ollen taiteilija, valokuvaaja tai kuvittaja.

  3. Aihe

    Tunniste: subject

    Tallenteen aihealueen kuvaus, yleensä asiasanoilla tai fraaseilla. Kontrolloitujen sanastojen kuten Helsingin yliopiston kirjaston ylläpitämän Yleisen suomalaisen asiasanaston tai luokitusten käyttäminen on suositeltavaa, koska yhteinen terminologia parantaa hakutulosta oleellisesti. Kuvailussa käytetty järjestelmä voidaan identifioida Scheme-tarkenteella.

    Lisätietoja katso http://www.lib.helsinki.fi/meta/dc-opasteet/aihe.html

  4. Kuvaus

    Tunniste: description

    Tallenteen sisällön kuvaus vapaatekstinä, esimerkiksi tekstidokumentin abstrakti.

  5. Julkaisija

    Tunniste: publisher

    Organisaatio joka on julkaissut tai asettanut verkossa käytettäväksi tallenteen kuvailtavan version. Esimerkiksi kustannusyhtiö, yliopiston laitos tai muu yhteisö.

  6. Muu tekijä

    Tunniste: contributors

    Henkilö tai organisaatio joka Tekijä-kentässä mainittujen henkilöiden (organisaatioiden) lisäksi on osallistunut merkittävästi tallenteen luomiseen, mutta jonka panos on ollut toissijainen verrattuna ns. päävastuullisen tekijän osuuteen (esimerkiksi toimittaja, kuvittaja, kääntäjä).

  7. Päivämäärä

    Tunniste: date

    Päivämäärä jolloin dokumentti on julkistettu ao. versiona. Tieto tulee tallentaa ISO 8601 -standardissa määritellyllä tavalla (katso http://www.w3.org/TR/NOTE-datetime), eli esimerkiksi muodossa VVVV-KK-PP tai VVVV. 1997-11-05 tarkoittaa marraskuun viidettä 1997.

    Elektronisten tallenteiden julkaisuaikatietojen antaminen voi olla vaikeaa. Ohessa alustava listan Päivämäärä-elementin tarkenteista. Niistä vallitsee tätä kirjoitettaessa varsin suuri yksimielisyys Dublin Core -kehittäjien keskuudessa.

    1. Created
      Tallenteen luontiaika. Esimerkiksi Kurt Vonnegutin Slaughterhouse-five ilmestyi alunperin vuonna 1969.
    2. Issued
      Tallenteen julkistamisaika (oletusarvo, ellei tarkennetta ole annettu). Esimerkiksi Slaughterhouse-fiven CD ROM -versio ilmestyi 1996.
    3. Accepted
      Päivämäärä, jolloin tallenne (esimerkiksi väitöskirja tai sopimus) on hyväksytty.
    4. Available
      Aika - usein ajanjakso - jolloin tallenne on tai tulee olemaan käytettävissä.
    5. Acquired
      Päivämäärä jolloin tallenne on hankittu kuvailijaorganisaation kokoelmiin.
    6. DataGathered
      Aika jolloin tallenteen sisältämät tiedot on koottu.
    7. Valid
      Tallenteen voimassaoloaika; yleensä ajanjakso. Esimerkiksi Vantaan joukkoliikenteen elokuussa 1998 julkaistu aikataulu on voimassa 1998-08-17/1999-06-06.

    Ajanjakson koodaustapaa ei ole vielä sovittu. Date-kentän käyttöä selvittänyt työryhmä suosittaa seuraavaa:

  8. Laji

    Tunniste: type

    Tallenteen kirjallisuuslaji; esimerkiksi kotisivu, romaani, runo, tekninen raportti, essee tai sanakirja. Kuvailun yhteismitallisuuden varmistamiseksi tyyppi tulisi valita Dublin Core -yhteisön ylläpitämästä listasta (http://sunsite.berkeley.edu/Metadata/types.html), joka on toistaiseksi kehitteillä (katso http://www.agcrc.csiro.au/projects/3018CO/metadata/dc_tf/type_3.html. Jos valmiit vaihtoehdot eivät riitä omia voi lisätä, mutta kirjallisuuslajin nimessä on laajennuskohdassa käytettävä merkkejä X- (esimerkiksi Text.Article.X-Refereed).

  9. Formaatti

    Tunniste: format

    Tallenteen tiedostoformaatti, jota voidaan käyttää sen selvittämiseen, mitä laitteisto- ja ohjelmistoympäristöä tallenteen hyödyntäminen edellyttää.

    Atk-tallenteille pitää toistaiseksi käyttää ns. MIME-tyyppiä (RFC 2046, http://ds.internic.net/rfc/rfc2046.txt). Dublin Core -yhteisö on rakentamassa omaa tiedostoformaattien luetteloa.

    Formaatti-kenttään voidaan vaihtoehtoisesti syöttää myös tallenteen kokotietoja (esimerkiksi kesto minuutteina tai koko kilo- tai megatavuina).

  10. Identifikaatiotunnus

    Tunniste: identifier

    Tunnus joka identifioi tallenteen yksiselitteisesti, verkkojulkaisuille esimerkiksi URN tai URL. URL:n eli sijaintitiedon käyttöä ainoana ID-tunnuksena ei suositella. Jotkin Dublin Core -sovellukset edellyttävät URL-tunnuksen tallentamista, koska ne käyttävät sijaintitietoa tallennetun Dublin Core -tiedon keräämiseen.

    Monia perinteisiä ID-tunnuksia kuten esimerkiksi ISBN:ää tai kansallisbibliografian ID-numeroita voidaan käyttää sekä verkkoaineiston että painetun aineiston kuvailussa. Helsingin yliopiston kirjaston URN-jakeluohjelma on käytettävissä osoitteessa http://www.lib.helsinki.fi/cgi-bin/urn.pl. Sovellus rakentaa kansallisbibliografian ID-numeroon perustuvia URN-tunnuksia.

    Lisätietoja saa Helsingin yliopiston kirjaston julkistamasta ja ylläpitämästä raportista Elektronisten julkaisujen identifiointi ( http://www.lib.helsinki.fi/meta/id.html).

  11. Lähde

    Tunniste: source

    Tunnus joka identifioi yksiselitteisesti tallenteen, johon kuvailtava tallenne perustuu. Yleisesti Dublin Core -kuvailu saa sisältää tietoa vain kuvailtavasta tallenteesta, mutta Lähde-kenttään voidaan syöttää toista tallennetta koskevaa informaatiota silloin kun tästä on hyötyä kuvailtavana olevan julkaisun löytämisen kannalta.

  12. Kieli

    Tunniste: language

    Julkaisun kieli. Tallennetaan koodina siten kuin Internet-standardissa RFC 1766 (http://ds.internic.net/rfc/rfc1766.txt) on määritelty.

    Julkaisun kuvailun kielen, esimerkiksi nimekkeen erikielisten versioiden, erottamiseen voidaan käyttää Lang-tarkennetta.

  13. Suhde

    Tunniste: relation

    Tässä kentässä voidaan ilmaista jonkin muun tallenteen ID-tunnus sekä osoittaa tämän ja kuvailtavana olevan dokumentin suhteen luonne. Tarkoituksena on mahdollistaa dokumenttien välisten suhteiden ilmaiseminen. Dublin Core -yhteisö on määritellyt joukon suhteita, joita tallennuksessa tulisi hyödyntää. Vaikka niitä ei ole vielä lopullisesti hyväksytty, listan oikeellisuudesta vallitsee laaja yksimielisyys.

  14. Kate

    Tunniste: coverage

    Tallenteen sisällön ajallinen tai maantieteellinen kate. Maantieteellinen kate voidaan määritellä paikan nimellä tai koordinaateilla. Ajallinen kate viittaa aikakauteen jota teoksen sisältö käsittelee, eikä siihen milloin teos on julkaistu. Aikamääritys tehdään joko aikakauden nimeä (esimerkiksi rauta-aika) käyttäen tai Päivämäärä-elementissä määritellyllä tavalla.

    Kate-elementtiä tallennettaessa on pakko määritellä, onko kyse ajallisesta vai maantieteellisestä katteesta. Tarkenteet ovat PlaceName ja PeriodName. Elementille on alustavasti määritelty myös joukko muita tarkenteita, jotka mahdollistavat esimerkiksi koordinaattien määrittelyn. Lisätietoja katso ( http://www.sdc.ucsb.edu/~mary/coverage.htm).

  15. Tekijänoikeudet

    Tunniste: rights

    Tekijänoikeudet -kenttään voidaan tallentaa lyhyt maininta tallenteen käyttöoikeuksista tai ID-tunnus (esimerkiksi URL) tarkempiin tekijänoikeustietoihin, tai palveluun joka antaa tietoja tallenteen käyttömahdollisuuksista. Jos tallenne on vapaasti käytettävissä, kenttään tallennetaan teksti "Public domain".

Lisätietoja

Cox, Simon [et al.]: Resource Type Position Paper. Elektroninen julkaisu, URL: http://www.agcrc.csiro.au/projects/3018CO/metadata/dc_tf/type_3.html. Date Ranges and DC.Date Subelement Definitions. Elektroninen julkaisu, URL: http://purl.oclc.org/metadata/dublin_core/wdatedraft.html. Päivämäärä-kentän käyttöä koskeva työryhmäraportti.

Guenther, Rebecca: Dublin Core Qualifiers/Substructure. Elektroninen julkaisu, URL: http://www.loc.gov/marc/dcqualif.html. Vanhentunut, nutta edelleen hyödyllinen pohjateksti Dublin Core -tarkenteista.

Hakala, Juha [et al.]: The Nordic metadata project: final report. Elektroninen julkaisu, URL: http://www.lib.helsinki.fi/meta/nmfinal.htm. Kokemuksia Dublin Coren käytännön soveltamisesta.

Larsgaard, Mary [et al.]: Dublin Core element: Coverage. Elektroninen julkaisu, URL: http://www.sdc.ucsb.edu/~mary/coverage.htm. Coverage-kentän käyttöä koskeva työryhmäraportti.

Relations Working Group [report]. Elektroninen julkaisu, URL: http://purl.oclc.org/metadata/dublin_core/wrelationdraft.html. Suhde-kentän käyttöä koskeva työryhmäraportti.

Tennant, Roy: Dublin Core Resource Types. Elektroninen julkaisu, URL: http://sunsite.berkeley.edu/Metadata/types.html.

Weibel, S. et al.: Dublin Core Metadata for Resource Discovery (RFC2413). Elektroninen julkaisu, URL: ftp://ftp.isi.edu/in-notes/rfc2413.txt.

Dublin Core-kotisivu