Tutkimusaineistojen metadata ”Tietoa tiedosta - Tietoa metatiedosta” Tilastokeskus Mari Kleemola
Yhteiskuntatieteellisen tietoarkiston (FSD) esittely DDI-kuvailuformaatti ja sen hyödyntäminen Aiheeni tänään Yhteiskuntatieteellinen tietoarkisto TAMPEREEN YLIOPISTO
Yhteiskuntatieteellinen tietoarkisto (FSD) perustettu 1999 Tampereen yliopiston erillinen laitos perustehtävät: –arkistoi yhteiskuntatiet. tutkimusaineistoja –antaa niihin liittyvää tietopalvelua –edistää olemassaolevien koti- ja ulkomaisten tutkimusaineistojen käyttöä asiakkaina tutkijat ja opiskelijat Suomessa ja ulkomailla peruspalvelut maksuttomia
DDI Data Documentation Initiative komitea perustettiin 1995 tavoite: formaatti kvantitatiivisten yhteiskuntatieteellisten tutkimusaineistojen kuvailuun kehitystyössä tehtiin ja tehdään vertailuja muihin formaatteihin (mm. MARC, ISO690-2, Dublin Core)
DDI:n tavoite ”... an effort to establish an international criterion and methodology for the content, presentation, transport, and preservation of "metadata" about datasets in the social and behavioral sciences. Metadata (data about data) constitute the information that enables the effective, efficient, and accurate use of those datasets.”
DDI Data Documentation Initiative ensimmäinen versio ilmestyi tuorein kehitysversio 1.3 versio 2.0 tänä keväänä käytössä myös kvalitatiivisten aineistojen kuvailussa sopii myös muiden kuin yhteiskunta- tieteellisten aineistojen kuvailuun laajennuksia lisätään
DDI ja XML DDI-aineistonkuvaukset tehdään XML- kielellä XML on dokumenttirakenteiden määrittely- ja esitystapakieli XML-dokumentissa sallitut elementit ja niiden väliset suhteet, järjestys ja toistettavuus määritellään dokumenttityyppimäärittelyssä (DTD)
DDI:n rakenne DDI:n DTD koostuu viidestä osasta 1. Dokumentaation kuvaus 2. Tutkimuksen kuvaus 3. Datatiedoston kuvaus 4. Muuttujien kuvaus 5. Muu tutkimukseen liittyvä materiaali yhteensä noin 300 elementtiä kaikkia ei tarvitse käyttää
Pala DDI-DTD:n rakennetta | | stdyInfo* (ATT == ID, xml:lang, source) | | | | | | subject? (ATT == ID, xml:lang, source) | | | | | | keyword* (ATT == ID, xml:lang, source, vocab, vocabURI) | | | topcClas* (ATT == ID, xml:lang, source, vocab, vocabURI) | | | | | | abstract* (ATT == ID, xml:lang, source, date) | | | | | | sumDscr* (ATT == ID, xml:lang, source) | | | | | | timePrd* (ATT == ID, xml:lang, source, event, date) | | | | collDate* (ATT == ID, xml:lang, source, event, date) | | | | nation* (ATT == ID, xml:lang, source, abbr) | | | | geogCover* (ATT == ID, xml:lang, source) | | | | geogUnit* (ATT == ID, xml:lang, source) | | | | anlyUnit* (ATT == ID, xml:lang, source, unit)
FSD:n aineistonkuvaus (FSD0116)
WWW
Koodikirja - pdf - printti
Nesstar Light
DDI:tä hyödyntävät... tietoarkistot eri maissa ( Nesstar ( Madiera ( Counting California ( Virtual Data Center (Harvard & MIT) (
DDI:n ”kehityslistalla” DDI-DTD:n laajentaminen: –monimutkaisten tiedostojen kuvaaminen –spatial data –aineistosarjojen kuvailun kehittäminen kontrolloidut sanastot attribuuteille DDI-dokumenttien luomista tukevien ohjelmistojen kehittäminen (”DDI-editori”) erilaisten datanjakelujärjestelmien yhteensopivuuden varmistaminen
DDI:n tulevaisuus DDI vapaasti käytettävissä DDI Alliance –jäsenyyteen perustuva ylläpito- ja rahoitusmalli –kansainvälinen koalitio –isäntäorganisaatiot ICPSR ja Roper Center –jokaisella jäsenellä yksi edustaja Expert Committeessa, joka vastaa DDI:n kehitystyöstä
MADIERA ( kesto: rahoitus: EU:n 5. puiteohjelma tavoite: monikielinen www-portaali yhteiskuntatiet. tutkimusaineistojen hakuun, selaamiseen ja imurointiin FSD:n vastuulla: –ELSST-tesaurus suomeksi –tiedotus
MADIERAssa mukana Osallistujat: NSD, Norja (koord.) UKDA, Iso-Britannia DDA, Tanska FSD, Suomi SIDOS, Sveitsi EKKE, Kreikka ZA, Saksa