Dublin Core-kotisivu
 |
Dublin Core Metadata Element Set, Versio 1.1
Tallenteiden kuvailuformaatti |
Helsingin yliopiston kirjasto - Suomen kansalliskirjasto
Päivitetty: 1999-08-16
Teksti pohjautuu Dublin Core yhteisön Proposed Recommendation tekstiin: Dublin Core Metadata Element Set, Version 1.1. 1999-07-02. (http://purl.org/dc/documents/rec-dces-19990702.htm).
Johdanto
Tämä dokumentti määrittelee Dublin Core -formaatin version 1.1 mukaiset metadatakentät.
Alunperin Dublin Coren 15 kenttää on määritelty Internet-standardissa RFC2413, joka tunnetaan versiona 1.0. Tekstistä on olemassa myös Suomen oloihin mukautettu versio (Hakala, Juha: Dublin Core Metadata Element Set: Internet-tiedonhaun hakuelementit. http://www.lib.helsinki.fi/meta/dcref-fin-old.html)
Uudet kenttämääritykset täsmentävät Dublin Coren versiota 1.0. Version 1.1 sisältämät kenttien kuvaukset korvaavat versiossa 1.0 esitetyt.
Yleistä
Tämä dokumentti esittelee päivitetyt kuvaukset vuonna 1998 hyväksytyille 15 kuvailukentälle. Kuvausten ja määritelmien päivityksellä on tarkoitus selkeyttää metadatakenttien semantiikkaa ja parantaa kenttien käytön yhdenmukaisuutta.
Jokainen Dublin Core -kenttä on määritelty ISO11179-standardin (standardi tietoelementtien kuvailulle) mukaisesti kymmenen attribuutin avulla:
- Name - The label assigned to the data element
- Identifier - The unique identifier assigned to the data element
- Version - The version of the data element
- Registration Authority - The entity authorised to register the data element
- Language - The language in which the data element is specified
- Definition - A statement that clearly represents the concept and essential nature of the data
element
- Obligation - Indicates if the data element is required to always or sometimes be present (contain
a value)
- Datatype - Indicates the type of data that can be represented in the value of the data element
- Maximum Occurrence - Indicates any limit to the repeatability of the data element
- Comment - A remark concerning the application of the data element
Dublin Core -formaatin suomenkielisessä versiossa 1.1 kuusi yllämainituista attribuuteista ovat samat jokaisen kentän kohdalla:
| Version: | 1.1 |
| Registration Authority: | Helsinki University Library |
| Language: | fi |
| Obligation: | Optional |
| Datatype: | Character String |
| Maximum Occurrence: | Unlimited |
Näitä attribuutteja ei toisteta kenttien kuvauksen yhteydessä.
Dublin Core kehitystyön yhtenä tavoitteena on ollut laajennettavuus, joka tarkoittaa käytännössä kahta asiaa:
- Jokaiselle kentälle voidaan antaa sen sisältöä täsmentäviä tarkenteita. Tarkenteiden standardointi
valmistunee vuoden 2000 alkuun mennessä, jolloin niistä julkaistaan uusi RFC-standardi.
- Formaatin soveltaja voi käyttää omia kenttiä ja tarkenteita. Oman kentän tai tarkenteen
tunnisteen (Label) on alettava merkeillä X-.
Englanninkielinen versio 1.1 ei sisällä määrittelyjä tarkenteille. Kuitenkin kolmen kentän (päivämäärä, suhde ja kate) suomenkielisissä määrityksissä on hyödynnetty niille de facto sovittuja tarkenteita (subelement), koska ilman niitä näiden kenttien käyttö on ongelmallista.
Dublin Core -työryhmä on kehittänyt Dublin Core -syntaksin tietojen tallentamiseksi HTML-dokumenttien META-kenttään. Syntaksin virallinen määritys HTML 3.2 ja 4.0 -versioille samoin kuin XML/RDF:lle ilmestynee RFC-standardina lähitulevaisuudessa. Syntaksit on esitelty dokumenteissa Recording qualified Dublin Core metadata in HTML (http://www.agcrc.csiro.au/projects/3018CO/metadata/qdchtml/) ja Guidance on expressing the Dublin Core within the Resource Description Framework (RDF) (http://www.ukoln.ac.uk/metadata/resources/dc/datamodel/WD-dc-rdf/). Kyseiset syntaksit tullaan esittämään myös suomenkielisinä määrityksinä. Määritykset julkaistaan myöhemmin.
Helsingin yliopiston kirjaston ylläpitämää Dublin Core -tallennusalustaa
(http://www.lib.helsinki.fi/cgi-bin/dc.pl) pyritään muokkaamaan niin, että se toimii aina standardoitujen tai yleisesti hyväksyttyjen Dublin Core -periaatteiden mukaisesti. Sovelluksen lähdekoodi on vapaasti käytettävissä.
Lisätietoja Dublin Coresta saa formaatin suomenkieliseltä tai kansainväliseltä kotisivulta:
(http://www.lib.helsinki.fi/dublin_core/index.html)
(http://purl.org/dc/)
Kenttien kuvaukset
-
Nimeke
Name: Nimeke
Identifier: title
Definition: Tekijän tai julkaisijan antama tallenteen nimi.
Comment:
-
Tekijä
Name: Tekijä
Identifier: creator
Definition: Henkilö tai yhteisö joka on ensisijaisesti vastuussa tallenteen intellektuaalisesta sisällöstä.
Comment: Esimerkiksi tekstidokumentin kirjoittaja, kuvadokumentin kyseessä ollen taiteilija, valokuvaaja tai kuvittaja.
-
Aihe
Name: Aihe
Identifier: subject
Definition: Tallenteen sisällön aihealueen kuvaus, yleensä asiasanoilla tai fraaseilla esitettynä.
Comment: Kontrolloitujen sanastojen kuten Helsingin yliopiston kirjaston ylläpitämän Yleisen suomalaisen asiasanaston (YSA, http://www.lib.helsinki.fi/ysa) tai luokitusten käyttäminen on suositeltavaa, koska yhteinen terminologia parantaa hakutulosta oleellisesti.
Kuvailussa käytetty järjestelmä voidaan identifioida Scheme-tarkenteella.
Lisätietoja katso http://www.lib.helsinki.fi/meta/dc-opasteet/aihe.html
-
Kuvaus
Name: Kuvaus
Identifier: description
Definition: Tallenteen sisällön vapaamuotoinen kuvaus.
Comment: Kuvaus voi sisältää esimerkiksi tekstidokumentin tiivistelmän tai sisällysluettelon.
-
Julkaisija
Name: Julkaisija
Identifier: publisher
Definition: Organisaatio, henkilö tai palvelu, joka on julkaissut tai asettanut tallenteen käytettäväksi.
Comment: Julkaisija voi olla esimerkiksi kustannusyhtiö, yliopiston laitos tai muu yhteisö.
-
Muu tekijä
Name: Muu tekijä
Identifier: contributor
Definition: Henkilö, organisaatio tai palvelu, joka Tekijä-kentässä mainittujen tekijöiden lisäksi on osallistunut merkittävästi tallenteen luomiseen, mutta jonka panos on ollut toissijainen verrattuna ns. päävastuullisen tekijän osuuteen.
Comment: Muu tekijä voi olla esimerkiksi toimittaja, kuvittaja, kääntäjä, sisällöntuotantopalvelu.
-
Päivämäärä
Name: Päivämäärä
Identifier: date
Definition: Päivämäärä, joka liittyy tallenteen johonkin elinkaaren vaiheeseen.
Comment: Yleensä Päivämäärä ilmaisee tallenteen julkistamisajan, luontiajan, voimassaoloajan tai ajanjakson, jolloin tallenne on käytettävissä. Tieto tulee tallentaa ISO 8601 -standardissa määritellyllä tavalla (katso http://www.w3.org/TR/NOTE-datetime), esimerkiksi muodossa VVVV-KK-PP tai VVVV. 1997-11-05 tarkoittaa marraskuun viidettä 1997.
Ellei tarkennetta ole annettu, oletusarvona on tallenteen julkistamisaika. Ohessa alustava luettelo Päivämäärä-kentän tarkenteista.
- Created
Tallenteen luontiaika. Esimerkiksi Kurt Vonnegutin Slaughterhouse-five ilmestyi alunperin vuonna 1969.
- Issued
Tallenteen julkistamisaika (oletusarvo, ellei tarkennetta ole annettu). Esimerkiksi Slaughterhouse-fiven CD ROM -versio ilmestyi 1996.
- Accepted
Päivämäärä, jolloin tallenne (esimerkiksi väitöskirja tai sopimus) on hyväksytty.
- Available
Aika - usein ajanjakso - jolloin tallenne on tai tulee olemaan käytettävissä.
- Acquired
Päivämäärä jolloin tallenne on hankittu kuvailijaorganisaation kokoelmiin.
- DataGathered
Aika jolloin tallenteen sisältämät tiedot on koottu.
- Valid
Tallenteen voimassaoloaika; yleensä ajanjakso. Esimerkiksi Vantaan joukkoliikenteen elokuussa 1998 julkaistu aikataulu oli voimassa 1998-08-17/1999-06-06.
Ajanjakson koodaustavaksi suositetaan seuraavaa:
- 1992/1997 # alkaa 1992 ja päättyy 1997
- 1998-09-05T08:15/1998-09-05T13:15 # viiden tunnin periodi 5. syyskuuta 1998.
- 1948/ # vuodesta 1948 (ei päättymisajankohtaa)
- /1989 # vuoteen 1989 (ei alkamismisajankohtaa)
-
Laji
Name: Laji
Identifier: type
Definition: Tallenteen kirjallisuuslaji, luonne tai genre
Comment: Tallenteen lajina voi olla esimerkiksi kotisivu, romaani, runo, tekninen raportti, essee tai sanakirja. Kuvailun yhteismitallisuuden varmistamiseksi tyyppi tulisi valita Dublin Core -yhteisön ylläpitämästä listasta (http://sunsite.berkeley.edu/Metadata/types.html, katso myös http://www.agcrc.csiro.au/projects/3018CO/metadata/dc_tf/type_simple.html).
Jos valmiit vaihtoehdot eivät riitä, omia voi lisätä, mutta kirjallisuuslajin nimessä on laajennuskohdassa käytettävä merkkejä X- (esimerkiksi Text.Article.X-Refereed).
-
Formaatti
Name: Formaatti
Identifier: format
Definition: Tallenteen fyysinen tai digitaalinen ilmiasu.
Comment: Yleensä Formaatti ilmaisee tallenteen tiedostoformaatin tai vaihtoehtoisesti myös tallenteen kokotietoja (esimerkiksi kesto minuutteina tai koko kilo- tai megatavuina). Formaattitietoa voidaan käyttää sen selvittämiseen, mitä laitteisto- ja ohjelmistoympäristöä tallenteen hyödyntäminen edellyttää.
Atk-tallenteille pitää toistaiseksi käyttää ns. MIME-tyyppiä (http://www.isi.edu/in-notes/iana/assignments/media-types/media-types). Dublin Core -yhteisö on rakentamassa omaa tiedostoformaattien luetteloa.
-
Identifikaatiotunnus
Name: Identifikaatiotunnus
Identifier: identifier
Definition: Tunnus joka identifioi tallenteen yksiselitteisesti.
Comment: Virallisten identifikaatiotunnusten käyttö on suositeltavaa. Verkkojulkaisuille voidaan antaa esimerkiksi URN- (Uniform Resource Name) tai URL-tunnus. URL:n eli sijaintitiedon käyttöä ainoana ID-tunnuksena ei suositella.
Monia perinteisiä ID-tunnuksia kuten esimerkiksi ISBN:ää tai kansallisbibliografian ID-numeroita voidaan käyttää sekä verkkoaineiston että painetun aineiston kuvailussa. Helsingin yliopiston kirjaston URN-jakeluohjelma on käytettävissä osoitteessa http://www.lib.helsinki.fi/cgi-bin/urn.pl. Sovellus rakentaa kansallisbibliografian ID-numeroon perustuvia URN-tunnuksia.
Lisätietoja saa Helsingin yliopiston kirjaston julkistamasta ja ylläpitämästä raportista Elektronisten julkaisujen identifiointi (
http://www.lib.helsinki.fi/meta/id.html).
-
Lähde
Name: Lähde
Identifier: source
Definition: Tunnus, joka identifioi yksiselitteisesti tallenteen, johon kuvailtava tallenne perustuu kokonaan tai osittain.
Comment: Yleisesti Dublin Core -kuvailu saa sisältää tietoa vain kuvailtavasta tallenteesta, mutta Lähde-kenttään voidaan syöttää toista tallennetta koskevaa informaatiota silloin kun tästä on hyötyä kuvailtavana olevan julkaisun löytämisen kannalta. Suositeltavaa on viitata lähteeseen jollakin identifikaatiotunnuksella (esim. ISBN, URN).
-
Kieli
Name: Kieli
Identifier: language
Definition: Tallenteen kieli.
Comment: Tallennetaan koodina siten kuin Internet-standardissa RFC 1766 (http://info.internet.isi.edu/in-notes/rfc/files/rfc1766.txt) on määritelty. RFC 1766 pohjautuu kahteen ISO-standardiin (ISO639 ja ISO3166), joissa kielikoodi on kaksimerkkinen. Esimerkiksi "fi" on finnish, "en" english ja "en-uk" tarkoittaa brittienglantia.
Kuvailun kielen, esimerkiksi nimekkeen erikielisten versioiden, määrittelyyn voidaan käyttää Lang-tarkennetta.
-
Suhde
Name: Suhde
Identifier: relation
Definition: Viittaus muuhun tallenteeseen, joka liittyy kuvailtavaan tallenteeseen.
Comment: Tässä kentässä on suositeltavaa viitata suhteessa olevaan tallenteeseen jollakin identifikaatiotunnuksella.
Tallenteiden välisten suhteiden luonne voidaan ilmaista tarkenteilla. Dublin Core -yhteisö on määritellyt joukon tallenteiden välisiä suhdetyyppejä.
- Osa/kokonaisuus -tyyppisissä suhteissa yksi tallenne on toisen fyysinen tai looginen osa. Tarkenteet ovat IsPartOf ja HasPart.
- Versiosuhteet vallitsevat saman tekijän tuottaman saman tallenteen eri aikoina julkaistujen tai julkistettujen varianttien välillä. Tarkenteet ovat IsVersionOf ja HasVersion.
- Formaattikonversiosuhteissa eri tallenteilla on sama intellektuaalinen sisältö, mutta niiden tiedostoformaatti on erilainen. Tarkenteet ovat IsFormatOf ja HasFormat.
- Viittaussuhteella tarkoitetaan sitä, että yhden tallenteen tekijä lainaa tai muuten viittaa toiseen tallenteeseen. Tarkenteet ovat References ja IsReferencedBy.
- Teos voi perustua toiseen teokseen olemalla esimerkiksi sen käännös, sovitus (esimerkiksi kirjasta tehty näytelmä tai elokuva) tai tulkinta. Tarkenteet ovat IsBasedOn ja IsBasisFor.
- Riippuvuussuhde vallitsee kahden tallenteen välillä silloin, kun yhtä tallennetta ei voi hyödyntää ilman toista. Tarkenteet ovat Requires ja IsRequiredBy.
-
Kate
Name: Kate
Identifier: coverage
Definition: Tallenteen sisällön ajallinen, maantieteellinen tai hallinnon alaan liittyvä kate.
Comment: Maantieteellinen kate voidaan määritellä paikan nimellä tai koordinaateilla. Ajallinen kate viittaa aikakauteen jota teoksen sisältö käsittelee, eikä siihen milloin teos on julkaistu. Aikamääritys tehdään joko aikakauden nimeä (esimerkiksi rauta-aika) käyttäen tai Päivämäärä-elementissä määritellyllä tavalla. Hallinnon alan kate ilmaistaan nimeämällä kyseessä oleva halllinnon alue, yksikkö, virasto tms.
Kate-elementtiä tallennettaessa on pakko määritellä tarkenteiden avulla minkä tyyppisestä katteesta on kyse. Tarkenteet ovat PeriodName, PlaceName ja Jurisdiction.
-
Tekijänoikeudet
Name: Tekijänoikeudet
Identifier: rights
Definition: Tallenteeseen liittyvät oikeudet.
Comment: Tekijänoikeudet -kenttään voidaan tallentaa lyhyt maininta tallenteen käyttöoikeuksista tai ID-tunnus (esimerkiksi URL) tarkempiin tekijänoikeustietoihin, tai palveluun joka antaa tietoja tallenteen käyttömahdollisuuksista. Jos tallenne on vapaasti käytettävissä, kenttään tallennetaan teksti "Public domain". Vaikka tämä kenttä olisi jätetty tyhjäksi, ei tallenteen tekijänoikeuksista voi tehdä minkäänlaisia oletuksia.
Lisätietoja
Dublin Core kotisivu (Suomi)
URL: http://www.lib.helsinki.fi/dublin_core/index.html
Dublin Core Metadata Element Set, Version 1.1.
Elektroninen julkaisu, URL: http://purl.org/dc/documents/proposed_recommendations/pr-dces-19990702.htm.
Version 1.1 alkuperäinen englanninkielinen versio.
Dublin Core Metadata Iniative
URL: http://purl.org/dc/
Hakala, Juha: Dublin Core Metadata Element Set: Internet-tiedonhaun hakuelementit. Elektroninen julkaisu, URL:
http://www.lib.helsinki.fi/meta/dcref-fin-old.html.
Weibel, S. et al.: Dublin Core Metadata for Resource Discovery (RFC2413). Elektroninen julkaisu, URL: ftp://ftp.isi.edu/in-notes/rfc2413.txt.