Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

Kuvailevan metadatan standardeista

Samankaltaiset esitykset


Esitys aiheesta: "Kuvailevan metadatan standardeista"— Esityksen transkriptio:

1 Kuvailevan metadatan standardeista
Juha Hakala Kansalliskirjasto

2 Metadatatyyppejä Kuvaileva metadata Hallinnollinen metadata
Resurssin löytämisen ja ymmärtämisen apuväline Hallinnollinen metadata Tekninen metadata, tiedostojen (ohjelmalliseen) tulkintaan Pitkäaikaissäilytyksen metadata e-aineistojen käytettävyyden turvaamiseen Oikeuksien hallinnan metadata Aineistoihin liittyvät tekijänoikeudet ja aineistojen käyttöä koskevat sopimukset eli lisenssit Rakenteellinen metadata Resurssin osien suhteet toisiinsa Merkintäkielet (kuvauskielet) Tekstin rakenne ja/tai esitystapa kuvataan metadatalla Metadatastandardeista

3 Kirjastot ja metadata Perinteisesti formaatit ja kuvailusäännöt ovat painottuneet kuvailevaan metadataan Elektroniset aineistot tarvitsevat lisäksi hallinnollista ja rakenteellista metadataa Nämä metatiedot tuotetaan (tai pitäisi tuottaa) osin koneellisesti ja niillä on omat metadataformaattinsa MARC-formaattiin on lisätty hallinnollisen metatiedon elementtejä Luetteloijilla pitäisi olla ainakin perustiedot kaiken tyyppisistä metatiedoista ja niiden tuotantoprosesseista Mikään yksittäinen formaatti tai kuvailusääntö ei tule jatkossakaan kattamaan kaikkea sitä, mitä e-aineistojen hallinnointi ja pitkäaikaissäilytys edellyttää Metadatastandardeista

4 Kuvaileva metadata kirjastoissa
Kaksi formaattia yli muiden MARC 21 (ISO 2709) Luotu 60-luvun lopulla; kehittyy edelleen (alkuaan 20 kenttää, nykyään noin 200 kenttää ja yli 2000 tietoelementtiä) Voidaan esittää koodeineen XML-muodossa (MARCXML-formaatti) BIBFRAME Kongressin kirjaston hanke, tavoitteena uuden sukupolven formaatti Projekti on myöhässä, mutta tunnelin päässä näkyy valoa ”Ex Libris has a public roadmap for its Alma system to support both MARC to BIBFRAME crosswalk and for native cataloging in BIBFRAME” Index Data rakentaa MARC – BIBFRAME 2.0 -konversiota Kongressin kirjastolle Kolmas vaihtoehto MODS, Metadata Object Description Schema MARC-metadata XML-muodossa ilman MARC 21 -koodausta Metadatastandardeista

5 BIBFRAME:n merkitys kirjastoille
”BIBFRAME isn't just a MARC replacement. This is essential […]. BIBFRAME challenges assumptions about how metadata is created and shared, and the role of shared utilities. We must move from legacy notions of "copy cataloging" to approaches that favor true sharing and re-use rather than minting redundant copies of information all over the place.” Sebastian Hammer, Bibframe-lista BIBFRAME voi tehostaa luettelointia merkittävästi, mutta vain jos kansalliskirjastot ja muut tietokantojen ylläpitäjät asettavat bibliografiset ja auktoriteettitietonsa vapaasti tarjolle muiden hyödynnettäviksi ja linkitettäviksi Kuka hallinnoi avointa linkitettyä metadataa? Metadatastandardeista

6 BIBFRAME:n merkitys ulkopuolisille
Ulkopuolisten on periaatteessa helpompi käyttää hyväksi yleisesti tunnettuun standardiin perustuvia avoimia linkitettyjä metatietoja kuin vaihtomuodossa olevia MARC-tietueita … mutta metatietojen julkaiseminen esimerkiksi RDF-muodossa ei vielä takaa sitä että muut käyttävät niitä Pragmatiikka – kattaako resurssin kuvailu kaiken sen, mitä ulkopuolinen taho toiminnassaan tarvitsee? Semantiikka – pystyykö ulkopuolinen toimija tulkitsemaan metatiedot järkevästi? Metadatastandardeista

7 BIBFRAME:n roolista Emme tarvitse uutta formaattia MARC-datan esittämiseen XML-muodossa (MARCXML ja MODS meillä on jo) BIBFRAME ei tule hallitsemaan kuvailua MARCin tavoin Olemme siirtymässä yhden formaatin valtakaudelta useiden formaattien rinnakkaiskäyttöön Kukaan ei vielä tiedä parasta tapaa toteuttaa BIBFRAME-sovellus, mutta ensimmäiset järjestelmät ovat jo rakenteilla ”It's a messy, unruly world out there, and our software had better be ready to adapt.” Sovellukseen tallennettava metadata voi olla esim. MARC-, BIBFRAME- ja DC-pohjaista ja tietokantaa voidaan ylläpitää sekä suoraluetteloinnilla että eräpäivityksinä Metadatastandardeista

8 Muita kuvailevan metadatan formaatteja
Toimijoiden omaan pragmatiikkaan perustuvia formaatteja, joiden semantiikka eroaa kirjastojen formaateista Kustantajat kehittävät ONIX-formaattiperhettä; ONIX for Books mahdollistaa MARC-formaattia tarkemman kuvailun Esim. kirjan paksuus milleinä tai ulkoasun todella eksakti kuvailu ovat kirjakaupalle oleellisia tietoja Dublin Core määrittelee ”semanttisen ytimen” johon pohjautuen on kehitetty useita formaatteja moniin tarkoituksiin DC Collections Application Profile DCAT, Data Catalog Vocabulary, tutkimusdatan kuvailu Opinnäytteiden kuvailuun tarkoitetut DC-versiot Artikkeleiden kuvailuun tarkoitetut DC-versiot Metadatastandardeista

9 Muita kuvailevan metadatan formaatteja (2)
Museot ja arkistot kehittävät omia, niiden toimintaan hyvin soveltuvia ontologioita ja formaatteja CIDOC CRM (Conceptual Reference Model) Kehittäjä The International Council on Museum’s International Committee for Documentation CDWA, Categories for the Desription of Works of Art VRA (Visual Resources Association) Core LIDO (Lightweight Information Describing Objects) EAD (Encoded Archival Description) Kehittäjä Society of American Archivists Näiden semanttinen yhteismitallisuus keskenään ja kirjastojen formaattien kanssa on kohtuullinen, mutta pragmatiikkaerot heijastuvat myös kuvailuun Metadatastandardeista

10 Globaalista yhteistyöstä
Kirjastojen tuottamat kuvailutiedot halutaan saada haettaviksi monista eri lähteistä Asiakkaat käyttävät Googlen kaltaisia verkkopalveluita enemmän kuin kirjastojen näyttöluetteloita tai yhteisluetteloita Tietojen saaminen muihin ympäristöihin edellyttää niiden metadataformaattien tukemista Google: Schema.org Ontologiapalvelut: SKOS, OWL Kustantajat: ONIX-formaattiperhe Dublin Corella merkittävä rooli yhteisenä nimittäjänä erityyppisten palveluiden välillä Avoimen linkitetyn datamme käyttö jatkossa? Metadatastandardeista

11 Hallinnollinen metadata: pitkäaikaissäilytys
PREservation Metadata: Implementation Strategies (PREMIS) “the international standard for metadata to support the preservation of digital objects and ensure their long-term usability” Monopoliasema pitkäaikaissäilytysjärjestelmissä Data dictionary, ei perinteinen formaatti Määrittelee tietoelementit sekä tietomallin: Metadatastandardeista

12 Hallinnollinen metadata (2)
Teknisen metadatan formaatit ovat aineistotyyppikohtaisia Still-kuvat: MIX ( Teksti: TextMD ( Liikkuva kuva VideoMD; ääni: AudioMD ( Täydentävät PREMIS-formaatissa tallennettavia tietoja MIX-formaatilla voidaan kuvata esim. skanneri ja skannauksessa käytetyt asetukset, PREMISillä taas voidaan kertoa miten skannerin tuottamaa kuvaa on muokattu (esim. rajausten teko) Vain keskeisimmät tiedot ilmaistaan MARC-formaatissa Kongressin kirjastolla on merkittävä rooli näiden formaattien ylläpidossa Metadatastandardeista

13 Hallinnollinen metadata (3)
Oikeuksien hallinnan metatietojen tallentamiseen on monia muualla kehitettyjä erikoisformaatteja Yleisnimitys REL – Rights Expression Language Lisenssien kuvaaminen: ONIX PL, CC-lisenssit ccREL ODRL (Open Digital Rights Language) Kuvailevan metadatan formaateilla ja etenkin MARC 21:llä voi tallentaa varsin kattavasti oikeuksien hallinnan metatietoja Päällekkäisyyttä oleellisesti enemmän kuin teknisissä ja pitkäaikaissäilytyksen metatiedoissa Kirjastojärjestelmien pitää pystyä käyttämään näitä metatietoja kun selvitetään sallitaanko asiakkaalle pääsy aineistoon, riippumatta siitä missä formaatissa ne on tallennettu Metadatastandardeista

14 KAM-sektorin tuottamista metatiedoista
KDK:n Finna-hakuliittymä tukee useita KAM-sektorilla käytössä olevia metadataformaatteja, mutta… Metatietojen harmonisoinnissa on vielä paljon toivomisen varaa esimerkiksi paikkatietojen osalta KDK- ja ATT-hankkeissa laaditaan yhteisiä linjauksia oikeuksien hallinnan metatiedoille Käyttörajoituksen kohteen tulee ilmetä yksiselitteisesti Käyttöä ja saatavuutta (pääsyä) koskevat rajoitukset pitää erottaa toisistaan Kaikki käytön rajoitukset tulisi kuvata metatiedoissa sekä ihmis- että koneluettavalla ja –ymmärrettävällä tavalla CC-lisenssien käyttöä suositellaan Selvitys ei ota kantaa käytettävään formaattiin Metadatastandardeista

15 Lopuksi Kirjastojen metadataformaattitilanne ei ole ollut 50 vuoteen niin epäselvä kuin nyt Varmaa on vain se, että MARCin yksinvaltius päättyy, ja kirjastojen järjestelmät tukevat jatkossa useita formaatteja joista MARC on yksi Muut ovat sen kanssa riittäväsit yhteismitallisia FRBR-tuki voi olla BIBFRAMEa suurempi haaste, koska siihen siirtyminen edellyttää takautuvaa metatietojen siivousta Poimintaluettelointia tehokkaampi avoimeen linkitettyyn dataan perustuva yhteistyö käynnistyy, vaikka sen tiellä on paljon muitakin kuin vain teknisiä esteitä Miten varmistetaan etteivät tietueet muutu hallitsemattomasti? Metadatastandardeista


Lataa ppt "Kuvailevan metadatan standardeista"

Samankaltaiset esitykset


Iklan oleh Google