Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

Tutkimusdatakysely Helsingin yliopiston tutkijoille 2016

Samankaltaiset esitykset


Esitys aiheesta: "Tutkimusdatakysely Helsingin yliopiston tutkijoille 2016"— Esityksen transkriptio:

1 Tutkimusdatakysely Helsingin yliopiston tutkijoille 2016
Tutkimusdatainfrastruktuurin kehittämishanke MILDRED, projekti 3: Julkaisu- ja metadatapalvelut Helsingin yliopisto Helsingin yliopiston kirjasto, Anna Salmi & Mari Elisa Kuusniemi

2 Esiselvitys tutkijoiden käyttämistä datatietokannoista
Selvityksen toteutti korkeakouluharjoittelija Anna Salmi Työn ohjasivat Mari Elisa Kuusniemi ja Mikko Ojanen Kesäkuussa 2016 selattiin 250 aikavälillä 2015–2016 ilmestynyttä tutkimusartikkelia, joista 210 PLOS- julkaisuja (muita Nature sekä WoS:n julkaisuja) Inventoitavana HY:n tutkijoiden luoma data PLOS-julkaisuformaatti sisältää kirjoittajien selvityksen datan luomisesta ja sijoittamisesta Figshare-repositorypalvelu erityisasemassa, koska toimii PLOS-julkaisujen dataliitteiden pilvipalvelutuottajana Helsingin yliopiston kirjasto, Anna Salmi

3 Helsingin yliopiston kirjasto,
Kysely ja vastaukset Kysely suunnattiin sähköpostitse kaikkien tiedekuntien ja tutkimusyksikköjen tutkimushenkilökunnan jäsenille kesä- heinäkuussa 2016 258 vastausta 62 % elämätieteistä, 21 % humanistis-yhteiskuntatieteistä ja 17 % luonnontieteistä 1) Monivalinnat: 10 esiselvityksessä yleisintä tietokantaa (sekä esim. FIN-CLARIN ja FDS tasoittamassa elämätieteellistä painotusta) 2) valikoima muita tallennusmuotoja: henkilökohtainen tietokone, CSC:n palvelut jne 3) Vapaa vastauskenttä syille, miksi tietokantoja ei käytetty oman datan tallentamiseen Helsingin yliopiston kirjasto, Anna Salmi

4 Käytetyt repositorypalvelut
44 % käytti yhtä tai useampaa digitaalista repositorya/digiarkistoa 21 % käytti kahta tai useampaa 10 % käytti kolmea tai useampaa 56 % ei käyttänyt mitään tietokantaa 15 % käytti jotain muuta kuin monivalinnan tietokantoja Monitieteellisistä mukana B2SHARE, figshare, Dryad, GitHub ja Zenodo Yleisimmät GenBank (16,7 %), GitHub (14 %), Sequence Read Archive (6,6 %) ja Gene Expression Omnibus (5 %) Helsingin yliopiston kirjasto, Anna Salmi

5 Kun data ei ollut sijoitettuna tietokantaan…
29 % ilmoitti, ettei tiennyt tallennusmahdollisuuksista tarpeeksi 11 %: data luonteeltaan sensitiivistä 54 % säilytti dataa HY:n verkkolevyillä 68 % käytti henkilökohtaista tallennustilaa 58 % käytti ulkoisia kovalevyjä 50 % käytti USB-tikkua 37 % piti dataa kaupallisissa pilvipalveluissa kuten Dropboxissa Helsingin yliopiston kirjasto, Anna Salmi

6 Miksei tarvetta tallentamiselle?
11 %: tallentamiskysymys oli epärelevantti oman tutkimuksen kannalta 8,5 %: ei tarvetta tarkemmin määrittelemättömästä syystä 7,7 %: dataa oli vain vähän 4,6 %: Nykyiset tallennustilat ja -palvelut olivat riittäviä Helsingin yliopiston kirjasto, Anna Salmi

7 Poimintoja vastauksista
” I do not know or trust them [repositories] enough. I do not have such big data that it would be a problem to store it otherways. I would need a system that is reliable, easy to use and access and permanent solution.” “Data repositories (such as GEO etc) are only practical once the research is published and the data is published. Other means to store data for short (or long) term are essential while the research and analyses are still ongoing.” “No knowledge about depositories that could be useful, no knowledge about repositories one might have access to.” Helsingin yliopiston kirjasto, Anna Salmi

8 Poimintoja vastauksista, jatkuu
“The [research] results are fully covered by the published articles.” “Unclear benefits with respect to effort.” “It was sufficient until this moment to store the data within University infrastructure, although convenient data sharing between collaborators is still lacking.” “[I] would prefer a local (institutional) databank.” ”I don’t know what CSC is.” Helsingin yliopiston kirjasto, Anna Salmi

9 Jatkoselvitys Selvityksessä löytyi 48 data-arkistostoa/repositoria, joita HY:n tutkijat käyttävät Näille etsittiin Re3data tietokannasta tunniste ja sen avulla tietokannan API:n kautta haettiin sieltä löytyvät tiedot, kuten: dataAccessType dataLicenseName softwareName citationGuidelineURL qualityManagement metadataStandardName apidSyste (= ORCID tms.) Helsingin yliopiston kirjasto, Mari Elisa Kuusniemi

10 Metadata selvitys Etsittiin tietokannoista kuvaus metadatakentistä
Testattiin tietokantoja hakemalla Henkilön nimellä (Sen tutkijan nimi tai nimen osa, joka ilmoitti tallentaneensa kyseiseen tietokantaan) Organisaatiolla (Helsinki) Helsingin yliopiston kirjasto, Mari Elisa Kuusniemi

11 Henkilön nimi Henkilön nimellä pystyi hakemaan 21/48 tietokannassa.
Henkilön nimellä ei voinut hakea 22/48 tietokannassa. Tietokannoista 4/48 jäi epäselväksi (metadatan kuvausta ei löytynyt, eikä testihaku tuottanut selvää tulosta) Helsingin yliopiston kirjasto, Mari Elisa Kuusniemi

12 Organisaatiotiedot Organisaation nimellä pystyi hakemaan 9/48 tietokannassa. Organisaation nimellä ei voinut hakea 36/48 tietokannassa. Tietokannoista 3/48 jäi epäselväksi (metadatan kuvausta ei löytynyt, eikä testihaku tuottanut selvää tulosta) Helsingin yliopiston kirjasto, Mari Elisa Kuusniemi

13 Organisaatiolla voi hakea
dbGaP Finnish Social Science Data Archive Gene Expression Omnibus GitHub Global Biodiversity Information Facility Inspire-HEP Kielipankki MG-RAST Zenodo Helsingin yliopiston kirjasto, Mari Elisa Kuusniemi

14 Yhteenveto Monet tutkijat käyttävät kansainvälisiä data-arkistoja (44% vastaajista). Toisaalta monilla tutkijoilla ei ole riittävästi tietoa asiasta (28% vastaajista kertoi tästä vapaassa vastauskentässä). Nyt tiedämme 48 repositoria/data-arkistoa, jossa on HY:n dataa. Vain muutamasta näistä voimme erottaa HY:n datat/metadatat muista datoista (9/48). Helsingin yliopiston kirjasto, Mari Elisa Kuusniemi


Lataa ppt "Tutkimusdatakysely Helsingin yliopiston tutkijoille 2016"

Samankaltaiset esitykset


Iklan oleh Google