Dublin Core – formaatti ja sen soveltaminen Tietoa tiedosta – Tietoa metatiedosta Juha Hakala
Sisältö Dublin Core: hallintorakenne; yleistä DC-sovellusprofiilit Nykytilanne: Eurooppa, Suomi
Metadata Internet-ympäristössä Globaali haku: – Rakenteinen kuvailutieto (eli metadata) upotettuna verkkodokumentissa, hakurobottien käytettävissä -> monipuoliset hakumahdollisuudet – Tekijät luovat metadatan (esim. DC kuvailun) – Ajatus hyvä, käytäntö ontuu: metadatan luonti on vaikeaa Paikalliset hakuympäristöt: mahdollisuuksia... – Paikalliset hakurobotit – Kuvailutyö dokumentin tekijällä (tai ammattilaisella, metadatan täydentäminen?)
Dublin Core 8 v. Tunnettu (elektronisen aineiston) kuvailuformaatti Pääfunktio: aineistojen kuvailu + tiedonhaku kohdistuu metadataan Kehitys alkoi 1995, teknisesti ja organisatorisesti + standardoinnin kannalta asema nyt stabiili Käytössä elektronisten aineistojen hankkeissa – eri kielet, aineistot – eri ympäristöt (kirjastot, arkistot, julkishallinto...)
Dublin Core Metadata Initiative OCLC vastuuorganisaationa; merkittävä taloudellinen tuki DCMI:lle (with no strings attached) DC Board of Trustees - ylin hallintoelin DC Directorate & Advisory Board – päivittäishallinto ja DCMI:n edustaminen – Stu Weibel, Makx Dekkers
Dublin Core Metadata Initiative (2) DC Usage Board – sisällölliset linjaukset – Tom Baker, Traugott Koch etc. – application profile –määritysten, tarkenteiden hyväksyntä DC Working Groups – kehitystyö DCMI National Affiliate – Dublin Coren soveltamisen alueellinen tukeminen – HYK ensimmäinen maailmassa 05/2003-
Dublin Coren kehitystyö Alin taso työryhmät (esim. usage, education, libraries...) Usage board hyväksyy työryhmien työn Konferenssi + workshop Board of Trustees – strategiset linjaukset, talousasiat Standardointi: ANSI/NISO, ISO, SFS – ISO-standardi 04/2003, NISO + SFS 2002 Standardin luojat vs. implementoijat – soveltajille joustavuus tärkeää
Dublin Core - yleisiä periaatteita Yhteinen semantiikka Kansainvälinen sovellettavuus, monikielisyys Laajennettavuus, joustavuus Monelle eri alalle ja alueelle Kuvailutiedon siirto, yhteensopivuus, ”vaihtomuoto”, ”Metadata for the masses” Periaatteet tuovat mukanaan myös ongelmia Metadatalla monia funktioita
Yhteinen semantiikka ja ydin Kansainvälisesti sovitut kentät ja niiden määritelmät 15 peruskenttää (ydin, core) Tarkenteet DC käännökset Käyttötarkoitukset vs. yhteiset periaatteet ja standardit DC:n yhteys muihin metadataformaatteihin
Laajennukset: sovellusprofiilit DC Application Profiles: tiettyyn käyttötarkoitukseen ja funktioihin sovellettu joukko metadatakenttiä 1. Hyödyntää mahdollisesti useita nimiavaruuksia – vrt. XML namespaces – lisäkentät poimitaan muista formaateista (nimiavaruuksista) 2. Täysin uusille kentille tarvitaan oma nimiavaruus 3. Voi määritellä tallennettavan tiedon arvoja tai merkintätapoja, pakollisuuksia tms. 4. Voi tarkentaa tai ”jalostaa” standardimäärityksiä
DC-Library Application profile ”DC- Lib” Tarkoitettu kirjastomaisiin DC-sovelluksiin Viisi nimiavaruutta Perus-DC + – yleiset tarkenteet – roolit tekijöille – muutama uusi date-tarkenne – useita id-tunnisteita – kohdeyleisö - audience (DC-ed) – holding location (fyysiset kappaleet)
Yhteensopivuus DC-sovellusprofiilien eroavaisuudet, modulaarisuus Mikä tahansa laajennettu ja tarkennettu Dublin Core -kuvailu voidaan palauttaa peruskentiksi DC.Date.accepted -> DC.Date – Informaation menetys? Ydin = yhteinen datasisältö kaikille sovelluksille – yli domain-rajojen voi olla hyvin kapea
Metadatarekisterit Eri yhteisöjen tuottamien metadataformaattien (metadata schemas) ja sovellusprofiilien hallintaan Apuväline metadatan kanssa painivalle henkilölle – formaatit, sovellusprofiilit, nimiavaruudet, mappaukset, sanastot DCMI- registry Schemas:
Dublin Core - missä mennään? Soveltuu paikallisiin tarpeisiin ja paikallisiin hakujärjestelmiin sekä myös yhteisten ratkaisujen perustaksi Sovellusprofiilien luonti, uusia alueita Standardointi valmis Ennustaminen kuitenkin vaikeaa: – DC vuonna 2005? – käytössä mutta miten yleisesti? – kirjastoissa – missä järjestelmissä? arkistoissa? – toimi paikallisesti, ajattele globaalisti Peruskysymys: kustannus - hyöty?
Yhteydet Open Archival Iniative (OAI) Digital Object Management Systems (DOMS) Portaalit, kokoelmatason kuvailu Semanttinen verkko, RDF E-learning (IEEE-LOM) Metadata/kirjastohankkeet, Z39.50 Muut metadataformaatit (MARC, ONIX, EAD...)
Semantic Web, RDF Tulevaisuuden verkko: rakenteisemmat, koneymmärrettävät verkkosivut (XML + RDF + semantiikan määrittely; ”Yleinen Suomalainen Ontologia”) DC on semantiikkaa (kuvailutiedon semantiikka), mutta vaatii alleen asiasanastoon perustuvan ontologian RDF (Resource Description Framework) Semantic Webin syntaksi ja alusta DC-kuvailuille RDF-metadata – Adobe tukee: RDF-metadata pdf-dokumentissa
Dublin Core Euroopassa Formaatin käännökset eri kielille DCMI - EU: EU rahoitusta DC:n edistämiseksi? – Usage guidelines and best practice – Architecture and infrastructure Eurooppalaiset hankkeet: monissa DC mukana – TEL, Renardus, Schemas... UK, Saksa, Tanska, Italia
Dublin Core Suomessa SFS-standardi (2001), HYK tukiorganisaationa JHS Asiakirjojen metadata – soveltaminen arkistojen hankkeissa? Hankkeissa: Suomi.fi, Opintoluotsi, VNK, Web- sivuissa, julkaisuhankkeissa, jne. HYK:n Dublin Core sivut –