Tutkimusdatan hallinta Tiedostomuodot ja tallennuspaikat tutkimuksen aikana ja jälkeen Tämä teos on lisensoitu Creative Commons Nimeä 4.0 Kansainvälinen -käyttöluvalla. Tarkastele käyttölupaa osoitteessa http://creativecommons.org/licenses/by/4.0/ Simo Keuramo, IT-palvelut simo.keuramo@utu.fi
Esityksen aiheita Periaatteita tutkimusdatan hallintaan avoimuuden näkökulmasta Datan luokittelua: raakadatasta tietokantoihin Tiedostoformaatit ja avoimuus Koneluettavuus Tallennuspaikat tutkimuksen aikana ja jälkeen Etsin – metadatahakukone
5 ★ OPEN DATA – 5stardata.info ★ ★ ★ ★ ★ Linked Open Data ★ ★ ★ ★ Linkable with URI ★ ★ ★ Open Format ★ ★ Machine Readable ★ Online with Open License
Avoimuuteen tähtäävä tutkimusdatan hallinta Tallenna aina verkkoon Tutkimusaineisto muistitikulla pöytälaatikossa on avoimen tieteen vastakohta (ja riski tietojen menettämiseen on todellinen) Järjestelmällisyys Kömpelökin järjestelmä on parempi kuin satunnaisesti hallittu tieto Järjestelmällisyys tukee uudelleenkäyttöä Metadata! Datan kuvailua on vähintään tuskaista, jollei mahdotonta tehdä jälkikäteen Metadata on keskiössä myös tutkimusaineistojen jakamisessa Mitä metadata on? Readme-tekstitiedosto Muuttujien nimet, koodien tulkinnat jne
Raakadatasta tietokantoihin Mitä tahansa tiedostoja (teksti/ääni/kuva/video/jne) Rakenteellisuutta mahdollista tuoda esim. kansiorakenteella ja tiedostonimillä Taulukkomuoto Sopii “kaksiulotteiselle” datalle, jossa tapauksia ja muuttujia Excel, SPSS Tietokannat Tukee monipuolisempia analyysimenetelmiä tietokantakyselyin NVivo, räätälöidyt tietokantaratkaisut
Avoimet tiedostoformaatit Avoimien formaattien käyttö tukee aineiston jatkokäyttöä ja laajempaa hyödyntämistä Suljettujen formaattien (esim. NVivon tai SPSS:n työtiedostot) kanssa ollaan lukossa kyseisen ohjelmiston käyttöön Avoimilla formaateilla (esim. Office-tiedostot, CSV, XML) kanssa ei olla jumissa yhteen ohjelmistoon Käytännössä käytäntö sanelee ja tiedostoformaatti valittava välineen mukaan Tutkimuksen aikana ja jälkeen formaatti voi kuitenkin olla eri: Työstettävä aineisto tarkoituksenmukaisessa formaatilla Konversio, esim. SPSS CSV ”Valmiin” aineiston säilytys avoimessa formaatissa .rtf .txt
Koneluettavuus Koneluettavuus = sähköisesti tallennetun tiedon lukemista (itse laadituilla) tietokoneohjelmilla Edellytyksiä Tallennuksessa on käytetty avoimia tiedostoformaatteja TAI aineisto on tietokannassa johon on avoin rajapinta verkossa Aineistolla on toimiva metadatakuvaus
Suositellut tallennuspaikat tutkimuksen aikana Verkkolevyt Oma verkkokansio Yksikön tai projektin verkkolevy Taltio – verkkolevyalue isolle datalle Seafile (seafile.utu.fi) Pilvitallennuspalvelu, jossa valmiit jako-ominaisuudet Käyttö selaimella tai Seafile-ohjelmilla Tietokantaratkaisut Tietokantapalvelin Web- tai palvelinhotellissa NVivo Server Ei suositella: Kaikki ”fyysiset” tallennusvälineet: Koneen kiintolevy, muistitikut jne. Varovainen arvio: 5 % kiintolevyistä hajoaa 5 käyttövuoden aikana
Tallennuspaikat tutkimuksen päätyttyä Yliopiston omat ratkaisut Verkkolevyt ja Seafile (+ metadata Etsimeen) Ei varsinaista PAS-lupausta, mutta ei myöskään aikomusta hävittää dataa Kansallisia ratkaisuja Tietoarkisto ja AILA (TaY) https://services.fsd.uta.fi/ IDA (CSC) http://avointiede.fi/ida AVAA (CSC) http://avaa.tdata.fi/web/avaa/etusivu Kansallinen digitaalinen kirjasto (KDK), kulttuuriperintöaineistoille Kansainvälisiä ratkaisuja http://www.re3data.org/
Aineistojen lisääminen Etsimeen etsin.avointiede.fi Kansallinen metadata-hakukone tutkimusaineistoille Aineistolle pysyvä tunniste, jota voi käyttää viittaamisessa Aineiston lisääminen Etsimeen ei edellytä sen suoraa avaamista
Lisää materiaalia Kirjaston tutkimusdatanhallinnan opas http://libguides.utu.fi/tutkimusdata Tietoarkiston ohjeet tiedostoformaatteihin http://www.fsd.uta.fi/aineistonhallinta/fi/tiedostoformaatit-ja-ohjelmistot.html Kansallisen digitaalisen kirjaston (KDK) ohjeistuksia pitkäaikaissäilytykseen http://www.kdk.fi/fi/pitkaaikaissailytys/maeaerittely-ja-dokumentit/5-suomi/pitkaeaikaissaeilytys/141-kdkn-saeilytys-ja-siirtokelpoiset-tiedostomuodot http://www.kdk.fi/fi/pitkaaikaissailytys/maeaerittely-ja-dokumentit/5-suomi/pitkaeaikaissaeilytys/145-kdkn-hallinnolliset-ja-rakenteelliset-metatiedot-ja-aineiston-paketointi
Pikakertaus Tallenna järjestelmällisesti verkkoon Datalle: Verkkolevyt, Seafile Metadatalle: Etsin Datalle JA metadatalle: IDA, Tietoarkisto Muista metadata ja suosi avoimia formaatteja fiksua avoimuuden kannalta = fiksua jatkuvuuden kannalta Rekisteröi aineistosi Etsimeen ja julkaise halutessasi Kysyttävää? openutu@utu.fi ja helpdesk@utu.fi palvelee!