Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

Metadata digitaalisen aineiston pitkäaikaissäilytyksessä Jani Stenvall 2003-04-10 Seminaari: Tietoa tiedosta - tietoa metatiedosta.

Samankaltaiset esitykset


Esitys aiheesta: "Metadata digitaalisen aineiston pitkäaikaissäilytyksessä Jani Stenvall 2003-04-10 Seminaari: Tietoa tiedosta - tietoa metatiedosta."— Esityksen transkriptio:

1 Metadata digitaalisen aineiston pitkäaikaissäilytyksessä Jani Stenvall 2003-04-10 Seminaari: Tietoa tiedosta - tietoa metatiedosta

2 Sisältö  Digiaineistot (julkaisut) ja pitkäaikaissäilytys  Menetelmiä pitkäaikaissäilytykseen  Miksi metadata on tärkeää tässäkin asiassa

3 Digitaaliset aineistot (1)  Tekstit, kuvat, audio, video, multimedia, ohjelmat, pelit, data-aineistot  Rakenteet voivat olla monimutkaisia  toiminnallisuus  hyperlinkit, useita osadokumentteja  dynaamiset web-sivut, GIS, VR...  Merkistöt, koodaukset  Suojaukset, käyttörajoitukset

4 Digitaaliset aineistot (2)  Käyttö sidottu johonkin laitteeseen (usein tietokone)  Aineisto tallennettu jollekin tietovälineelle, taltiolle  Esim. levykkeellä olevan Word-6 dokumentin avaamiseen tarvitaan:  tekstinkäsittelyohjelma, joka avaa dokumentin  käyttöjärjestelmä  tietokone, jossa levykeasema (+ ajuri)

5 Mooren laki  ”Moore's Law, which has defined a doubling of price/performance/value produced by semi- conductors every 12 to 18 months since 1966, will continue to deliver its exponential benefits for at least another five decades, without stopping or slowing.”  2000 $ veto osoitteessa http://www.longbets.org/  http://firstmonday.org/issues/issue7_11/tuomi/

6 Säilytyksen ongelmatekijät...  Tietotekninen kehitys  Tallennusvälineet, tietovälineet (medium)  Itse digitaalinen aineisto  Julkaisujen hallinnointi  Digitaalinen arkisto, organisointi, jatkuvuus  Oikeudelliset kysymykset...

7 ...Ongelmia  Tärkeitä (?) elektronisia aineistoja jo hukattu  tiedostot tuhottu tai hävitetty vahingossa, kadotettu, vaurioituneet tai tuntemattomassa muodossa  kallista yrittää pelastaa (jos edes mahdollista)  välttämättä ei enää asiantuntijoita olemassa

8 Digi-julkaisujen pitkäaikaissäilytys  Mitä itseasiassa pitää säilyttää?  bitit  käyttömahdollisuus: bittien tulkinta  julkaisun intellektuaalinen sisältö  ulkoasu, toiminnallisuus + konteksti + ”autenttisuus”  Pitkäaikaissäilytys?  5, 20, 100 vai 500 vuotta?  jatkuva prosessi  ”Digitaaliset arkistot”

9 Miten pitkäaikaissäilytys onnistuu? Menetelmät...  Tulostetaan paperille?  Yksi CD-ROM tulostettuna (tekstiä)  lienee kohtuullinen nippu paperia  Menetetään toiminnallisuus ja ”look-and- feel”  Ehkä joillekin julkaisuille…

10 Menetelmä: siirrot  Siirtomenetelmä (migration)  virkistys (refreshing) = kopiointia  konvertointi (conversion) = muuntamista  Siirretään uudelle tietovälineelle/ympäristöön/formaattiin  Konvertointi: tukeudutaan standardeihin  rakenteiset dokumentit (SGML, XML)  standardit eivät ole ikuisia

11 Menetelmä: emulointi  ”Imitoidaan” alkuperäistä ympäristöä uudessa ympäristössä -> orig. ympäristön julkaisujen käyttö  Tallennetaan dokumentin lisäksi ohjelma ja käyttöjärjestelmä, metadataa + orig. laitteiston kuvaus  Emulaattoriohjelman rakentaminen  laitteiston (hardware) emulointi  Digiaineiston käyttäjän on hallittava vanha käyttöympäristö

12 Strategiat:  Laite- ja ohjelmistomuseot  ongelmana tietovälineiden rappeutuminen sekä laitteiden käyttöikä/huolto  Rosettan kiekko  Rosetta Stones Translation  Typed Object Model Conversion  UVC = Universal Virtual Computer (IBM)  ”Pysyvä arkisto” (Persistent Archive method)

13 Digitaaliset arkistot: OAIS  Yleinen digitaalisen arkiston malli: OAIS Open Archival Information System  Arkiston eri osat, aineistojen syöttö, arkistointi ja käyttö  Hallinnointitietoja = pitkäaikaissäilytyksen metadataa  Preservation Description Information  Content Information  Representation Information

14 Metadata p-aikaissäilytyksessä 1  ”Preservation metadata”: kuvailevaa, hallinnollista, teknistä...  1.enabling preservation managers to take appropriate action to preserve a digital object's bit stream over the long term  2.ensuring that the content of the archived object can be rendered and interpreted. (Bellinger)

15 Metadata p-aikaissäilytyksessä 2  Aineistojen käsittelyn/hallinnoinnin dokumentointi pitkäaikaissäilytyksen kannalta  Tulisi mahdollistaa julkaisujen jaottelu teknisten kriteerien mukaan, tukea arkistoivan organisaation toimintaa  Toimenpiteiden ja muutosten dokumentointi (elinkaari, versiot)  Aineistojen merkittävät (tekniset) ominaisuudet  Aineistojen käytön (rendering) varmistaminen  käyttöön tarvittavien ohjelmistojen ja ympäristöjen hallinta  ”autenttisuus”

16 Metadata p-aikaissäilytyksessä 3  Ei olemassa kattavaa metadatastandardia  Olemassa olevien standardien laajentaminen?  MARC, Dublin Core  Semanttisia määrityksiä: NEDLIB, Cedars, RLG/OCLC, NLA, NLNZ  OAISiin tukeutuminen  Nykyään kaikki metadata ajatellaan koodattavaksi XML:n avulla  METS (Metadata Encoding and Transmission Schema)  Technical metadata for images (->MIX)

17 Metadata p-aikaissäilytyksessä 4 Teknistä tietoa  Kohde: kokoelma objekteja, objekti, tiedosto  Käyttöympäristö Säilytykseen liittävää tietoa:  Kuvailtavien kohteiden väliset suhteet, versiot, konteksti  Prosessi: säilytysmenetelmä, toimenpiteet Metadatan luominen ja tallentaminen

18 ESIMERKKI: Tekniset tiedot  Tarvittava laitteisto  Käyttöjärjestelmä  Sovellusohjelma ja muut ohjelmat, aputiedostot  Tietoväline tai verkkoprotokolla  Kohteen kuvaus (*)  teksti, kuva, audio, video, multi, 3-D, ohjelma...  tiedostoformaatti  muita ominaisuuksia

19 * Kohteen kuvaus: esim. kuva  formaatti + versio  skannauksen tietoja  pakkaus  koko (Kb, Mb)  resoluutio (ppi)  värimäärä (bittisyys)  värijärjestelmä (RGB, CMYK)  väripalkki  digitaalinen vesileima...jne

20 ESIMERKKI: Säilytyksen tiedot  Identifikaatiotunnus, nimi, sijainti  Alkuperä ja muuttumattomuus  Säilytysprosessi (*)  Suhteet  muut julkaisut, help-tiedostot  Oikeudet  Vastuulliset  Huomautukset

21 * Säilytysprosessi  arkistointipvm (arkistoon/järjestelmään, keräyspvm)  säilytysmenetelmä (menetelmään liittyvät päätökset ja muutokset)  toimenpiteet  asennukset, tarkistukset  käytetyt työkalut  muutokset alkuperäiseen/edelliseen...

22 Mitä Suomessa tapahtuu?  ”Arkistoivia yksikköjä”, pitkäaikaisuus?  Kansallisarkisto, arkistolaitos  Kansalliskirjasto eli HYK  Yksittäiset organisaatiot ja yritykset  Data-aineistot: Siirtymät uuteen järjestelmään aina isoja hankkeita  Digitaalisten julkaisujen/dokumenttien/asiakirjojen pitkäaikaissäilytyksestä vielä vähän todellisia käytännön kokemuksia

23 Linkkejä  PADI - Preserving Access to Digital Information  http://www-prod.nla.gov.au/padi/  The State of Digital Preservation: An International Perspective (konferenssijulkaisu, pdf tai html)  http://www.clir.org/pubs/abstract/pub107abst.html  A Metadata Framework to Support the Preservation of Digital Objects (OCLC/RLG raportti, 2002)  http://www.oclc.org/research/pmwg/pm_framework.pdf  Seuraavat kuvat tästä raportista...

24

25


Lataa ppt "Metadata digitaalisen aineiston pitkäaikaissäilytyksessä Jani Stenvall 2003-04-10 Seminaari: Tietoa tiedosta - tietoa metatiedosta."

Samankaltaiset esitykset


Iklan oleh Google