Tilastotieteen etiikka

Slides:

Advertisements

Samankaltaiset esitykset

Tuloksista rahoitukseen alustusluento osa 2. Tulokset •Tuloksissa tulee kertoa mitä löydettiin alkaen tutkittavien rekrytoinnista, tutkittavan populaation.

Advertisements

Meta-analyysit Jouko Miettunen, dosentti Psykiatrian klinikka Oulun yliopisto Oulu

Hypoteesin testeistä Testin valinta perustuu aina tutkimusongelmaan ja kuvailuun (joka perustuu mitta-asteikoihin) Testaus ei koskaan ole itsenäinen, vaan.

Tutkimusartikkelien kriittinen arviointi

Kliiniset kokeet Jouko Miettunen Tutkimuksen kriittinen arviointi

Artikkelin kriittinen arviointi

Harry Scheinin1 Lääkäripäivät P Tutkijakoulutus: jatkokurssi (pienryhmä), torstai Hypoteesin testaus ja tutkimuksen voima Harry.

Kliinisten kokeiden arviointi Jouko Miettunen

Artikkelin kriittinen arviointi

Milloin tutkimus on kliinisesti merkittävä – GRADE-menetelmä

Kirsi Peltonen Graduaiheita Syksy 2012 Kirsi Peltonen

Tutkimusartikkelien arviointi ja soveltaminen kliiniseen työhön Jouko Miettunen

SATTUMAN ONGELMA TUTKIMUKSESSA 1 x: tenttiin valmistautumiseen käytetty aika (tunteja) Perusjoukko μ = 39,87.

Monimuuttujamenetelmistä Lähtökohtana mallittaa muuttujien välinen riippuvuusrakenne. Rakenne tulee sovellusalan teoriasta. Sopiva analyysi valitaan mallin.

Anna Wiksten, Doctoral Candidate SSL Webinar, R ja JAGS: Esimerkki Bayesilaisesta data-analyysista.

Tiedonhaku ja arviointi kliinikon on osattava etsiä tietoa internet, kirjat, lehdet kliinikon on osattava seuloa tietoa kliiniset kokeet, oppikirjat perinteiset.

TIPTOP – Lessons learnt Sisältö Tiptop-projektissa opittua, osallistujien terveiset seuraaville projekteille. Mitä tässä projektissa onnistui.

Avoimuuden huomiointi tutkimuksen suunnittelussa Jessica Parland-von Essen CC-BY 4.0 Opetus- ja kulttuuriministeriö.

Yleiset kompetenssit (Generic competences) Osaamisen kuvaus (description of the competence) Oppimisen taidot (Learning competence) Tradenomi  osaa arvioida.

U LOS JA YHTEISKUNTAAN Salla-Maaria tutkija, Viestinnän tutkimuskeskus CRC & Kuluttajatutkimuskeskus Helsingin yliopisto Avoimen tieteen.

UNIVERSITY OF JYVÄSKYLÄ Tutkimussuunnitelma Jaakko Seikkula

Jarl Wahlström MITEN TEHDÄÄN VÄITÖSKIRJA? Psykoterapian monitieteisen tohtorikoulutusohjelman aloitusseminaari

YFIA202 Kvantitatiiviset menetelmät, luento YTT Pertti Jokivuori Syksy luento (Ti )

Epäily herää – miten toimia? K-Sshp, Läheisväkivallan ehkäisyn kansallinen osaamiskeskus-hanke: koulutuspäivät Noora-Maria Ahl psykologi Marja.

Tietoturva ja tietosuoja Mikael Kivelä, kasvatustieteen laitos.

Yhteisöllisen median käytön periaatteet Metropoliassa.

Apurahojen haku Jouko Miettunen

Kansalaisten näkemykset sote-uudistuksesta ja valinnanvapaudesta

Suomalaisten Energia-asenteet 2016

REGRESSIOANALYYSI.

Interventiotutkimukseen liittyvät tilastotieteelliset näkökohdat

Verkoston ulkoisvaikutukset

MINI-INTERVENTIO TAVOITTEENA ON LÖYTÄÄ JA HOITAA VARHAISESSA VAIHEESSA ALKOHOLIN SUURKULUTTAJAT JA ONGELMAKÄYTTÄJÄT.

VARIANSSIANALYYSI.

VaR-mallien toimivuuden testaus historian avulla (backtesting)

Tutkimuksen abc.

YFIA202 Kvantitatiiviset menetelmät, luento

Rekisterien käyttö väestötutkimuksissa

Tutkimustietovaranto – Virran tuomaa Työpaja

Sivisverkon digitaaliset osaamismerkit

Riskien arviointi, Oulun eteläinen osakokonaisuus

Tiedon hallinnan viitearkkitehtuurin osa-alueet

Laadullisten tutkimusmenetelmien seminaari

TE3- seurantatutkimus Seurantajakso n. 1 viikko ( )

Kokeeseen vastaaminen

Pääsihteeri Sanna Kaisa Spoof ,

Rajoitteet Iäkkään henkilön hoidossa käytetylle fyysiselle rajoittamiselle ei ole olemassa yhtä yleispätevää määritelmää. Yhteistä rajoitteille on kuitenkin.

TILASTOKUVIO kuvio on voimakkain tapa esittää tietoa

Mittaamisen punainen lanka - tukimateriaali turvallisuusindikaattorien kehitykseen ja hyötykäyttöön Arviointipalvelut / Jukka Hovi.

Mitä on näyttöön perustuva toiminta neuvolatyössä

<Hankkeen nimi>

Kilpailustrategia LEA4LH004 SWOT – synteesianalyysi TOWS – strategiavaihtoehtojen luonti SWOTin pohjalta Riitta Rautava.

Mikä Kykyviisari? Maksuton työ- ja toimintakyvyn itsearviointimenetelmä työikäisille Perustuu vastajaan omaan arvioon tilanteestaan Arvioi suuntaa-antavasti.

OSALLISTUMISJÄRJESTELMÄT

Ympäristöriskinarviointi viranomaistoiminnassa

Digityökalujen valmistelu järjestämistehtävää varten

MELUNTORJUNTAOHJELMA

POHJOIS-POHJALAISTEN HYVINVOINTI: 1

Opintopsykologi Katja Hietanen

Tiedon avaaminen Trafissa ja avaamisen haasteet

[Hankkeen nimi] [Tutkijan nimi]

OSALLISTUMISJÄRJESTELMÄT

Rajat ylittävä terveydenhuolto ja järjestöyhteistyö

Arvioitava tehtävä Työ tehdään 2-4 hengen ryhmissä

w w w . v i r t u a a l i a m k . f i Tietokantojen hallinta, 2 ov

Arviointi, vaikutukset ja vaikuttavuus HYTE -työssä

Järjestötieto muutoksessa

RYHMÄTYÖ kansalliset ORL-laaturekisterit

Luonnontiedeaiheinen projekti

Yläkouluikäisten tyttöjen. vapaa-ajan fyysinen aktiivisuus

Esityksen transkriptio:

Tilastotieteen etiikka Jouko Miettunen, Professori, Akatemiatutkija Elinikäisen terveyden tutkimusyksikkö Oulun yliopisto jouko.miettunen@oulu.fi

SISÄLTÖ Eettiset säännöt tilastotieteessä Tilastotestien oletukset Monitestaus Tilastollinen voima ja kato Julkaisuharha Lähteitä

Huonot tilastometodit  Huonoa tiedettä ! Tilastollisten menetelmien väärä käyttö voi rikkoa useita eettisiä sääntöjä tai velvollisuuksia, kuten velvollisuutta olla rehellinen ja objektiivinen, sekä velvollisuutta välttää virheitä ja olla avoin? Huonot tilastometodit  Huonoa tiedettä ! Gardenier and Resnik 2002

Tilastollisten käytäntöjen eettiset ohjeet Esitä havainnot ja tulkinnat rehellisesti ja puolueettomasti Vältä totuudenvastaisia, harhaanjohtavia tai epäselviä lausuntoja Selvitä mahdolliset taloudelliset tai muut eturistiriidat, jotka voivat vaikuttaa ammatilliseen lausuntoon (tai tutkimukseen) Kerää vain tarvittavat tiedot tutkimuksen tarkoitukseen Varmistettava, että aina kun tiedot siirretään muille henkilöille tai järjestöille siirto on sallittu ja luottamuksellisuus säilyy Esim. filesender ohjelma, kirjallinen vakuutus (engagement) American Statistical Association 1999 (www.amstat.org)

Tilastollisten käytäntöjen eettiset ohjeet Tunnista että tilastollinen menettely saattaa jossain määrin olla tulkintakysymys Huomioida että asiakas (tutkija) tai työnantaja voi olla henkilö joka ei tunne tilastokäytäntöjä ja -metodeita Valitse tilastolliset menetelmät ilman huolta ”myönteisestä” tuloksesta (esim. p<0.05 haluttuun suuntaan!) Esitä selvästi, tarkasti ja kattavasti vaihtoehtoiset (suositeltavat) tilastolliset menetelmät (sensitivity analysis) sekä kaikkien mahdollisten lähestymistapojen edut ja vaikutukset

Testien oletukset Normaalijakautuneisuus Visuaalinen tarkastelu Keskiarvo vs. mediaani Regressioanalyysin oletus Muunnokset (logaritmi tms.) Voivat vaikeuttaa tulkintaa Osborne and Waters 2002

Testien oletukset Havaintojen riippumattomuus Jos hyvin suunniteltu tutkimus ei ole yleensä ongelma Isoissa tutkimuksissa ei ole ongelma Mittauksien luotettavuus Huono luotettavuus vähentää tilastollista voimaa! Osborne and Waters 2002

Monitestaus

Monitestaus Hypoteesin asettaminen on tärkeää! Data louhinta tai kalastelu (data fishing, data mining) False Discovery Rate (FDR) Bootstrap- menetelmä Post-Hoc testaus varianssianalyysissa Monitestaus korjaukset esim. Bonferroni korjaus yksinkertainen, mutta konservatiivinen

Tilastollinen merkitsevyys vs. vaikutus (effect) ? “The difference between ‘significant’ and ‘not significant’ is not itself statistically significant” ”Absence of evidence is not evidence of absence

Tilastollinen voima

Voima-analyysit Power analyses Hyvin tehty voima-analyysi tulisi olla osa kaikkia tutkimussuunnitelmia! Liian paljon tutkimusta liian pienillä aineistoilla  eettinen ongelma!

Moher et al. CONSORT statement 2010 Voima-analyysit Otoskoot kliinisissä kokeissa ovat yleensä pieniä, esim. Nivelreuma: mediaani otoskoko 54 potilasta (196 kliinistä koetta) Ihotaudit: 46 potilasta (73 koetta) Skitsofrenia: 65 potilasta (2000 koetta) Otoskoko ei yleensä perustu mihinkään! Post hoc voima-analyysit ovat turhia, luottamusvälit kertovat voimasta Moher et al. CONSORT statement 2010

Voima-analyysit Tarvittavat tiedot Tutkittavien määrä Tärkeimmän vasteen esiintyvyys (odotettu vastetapahtumien määrä) Tehtävät oletukset Vaikutuksen koko Tilastollisen merkitsevyyden raja (α) Tilastollinen voima (1-β)

Alfa eli merkitsevyystaso (esim. 0.05 tai 5%) Todennäköisyys että ero löytyy vaikka sitä ei ole olemassa (väärä positiivinen löydös) Beta eli voima (esim. 0.8 tai 80%) Todennäköisyys että löydetty ero on todellinen Välianalyysit (interim analyses) Etukäteen (a priori) suunniteltuja analyyseja meneillään olevaan kliiniseen kokeeseen Syyt eettisiä tai taloudellisia, voima voi jäädä riittämättömäksi? Suresh KP & Chandrashekara S. J Hum Reprod Sci 2012; 5: 7–13.

Keskiarvojen tai osuuksien erot Monimuuttujamallit Erilaisia ohjelmia Erilaisia asetelmia Keskiarvojen tai osuuksien erot Monimuuttujamallit Erilaisia ohjelmia Nettilaskurit Spesifit ohjelmat, esim. SPSS sample power http://homepage.stat.uiowa.edu/~rlenth/Power/index.html

Kliinisissä kokeissa pienempi otoskoko on riittävä Varianssi Tutkimusasetelma Kliinisissä kokeissa pienempi otoskoko on riittävä Varianssi Suurempi varianssi vaatii isompaa aineistoa ryhmäerojen löytämiseksi Seurantatutkimukset Huomioi kato (muutot, kuolemat, kieltäytymiset) Suresh KP & Chandrashekara S. J Hum Reprod Sci 2012; 5: 7–13.

Satunnaistamisen vaikutus säilyy! Intention-to-treat Suositus analyyseille kliinisissä kokeissa Aineisto analysoidaan satunnaistamisen mukaisesti. Satunnaistamisen vaikutus säilyy!

Kliinisten kokeiden raportoinnista Menetelmät Intervention valinta Perusteet? Tutkimuksen kesto? Yleistettävyys? Ensisijainen vs. toissijainen vaste, alaryhmien analyysit Tilastolliset menetelmät tulisi esittää selkeästi Tulokset Aineiston kuvaus Luottamusvälit tulisi esittää kun kuvataan vaikutuksen varmuutta Tarkat p-arvot (ei <0.05 tms.) Pohdinta Vertailu aiempiin tutkimuksiin, heikkoudet Yleistettävyys, tulkinta, johtopäätökset

Julkaisuharha Tutkimuksen perusongelma Ongelma meta-analyyseissa ja alkuperäistutkimuksissa Johtuu tutkijoista ja lehdistä!

Miten ei tule raportoida ei-merkitseviä tuloksia! a clear, strong trend (p=0.09) an encouraging trend (p<0.1) an important trend (p=0.066) approached conventional levels of significance (p<0.10) below (but verging on) the statistical significant level (p>0.05) difference was apparent (p=0.07) essentially significant (p=0.10) failed to reach significance on this occasion (p=0.09) flirting with conventional levels of significance (p>0.1) leaning towards significance (p=0.15) narrowly escaped significance (p=0.08) not conventionally significant (p=0.089), but.. not significant in the narrow sense of the word (p=0.29) on the very fringes of signiﬁcance (p=0.099) http://mchankins.wordpress.com/2013/04/21/still-not-significant-2/

Meta-analyysit Julkaisuharhaa voidaan arvioida funnel plotin avulla Oletetaan että tarkimmat (usein suurimmat) tutkimukset antavat keskimääräiset tulokset, muut tutkimukset sijoittuvat molemmille puolille keskiarvoa ”Trim and fill” Rosenberg. Evolution 2005;59: 464-8

Trim and Fill Corpet & Pierre Eur J Cancer 2005 (http://corpet.free.fr/MAaspirin.html)

Trim and Fill Voidaan korjata julkaisuharhaa

Satunnainen virhe ja systemaattinen harha (random error / systematic bias) Virhe (error): tiedon keräämisessä tapahtunut väärä mittaus Harha (bias): tiedon keräämisessä esiintyvä ongelma kun tietoa kerätään valikoituneesti tai mittausmenetelmä tuottaa järjestelmällisesti virheellisen tuloksen johtaa todellisen yhteyden heikkenemiseen ? tuo esille olemattoman yhteyden ? vääristää olemassa olevaa yhteyttä ?

Ratkaisuja eettisiin ongelmiin? Enemmän tilastotieteen opetusta? Enemmän ohjeita? Monitieteellinen ryhmätyö ja verkostoituminen? Tutkimusten rekisteröinti? Julkisesti saatavilla olevat aineistot? Sensitiivisyysanalyysit?

Kirjallisuutta jouko.miettunen@oulu.fi Gardenier J & Resnik D. The misuse of statistics: concepts, tools, and a research agenda. Accountability in Research: Policies and Quality Assurance 2002; 9:65-74. Ioannidis JPA. Why most published research findings are false. PLOS Medicine 2005;2:e124. Mark DB, et al. Understanding the role of p values and hypothesis tests in clinical research. JAMA Cardiol. 2016; 1(9):1048-1054. Moher D, et al. CONSORT 2010 explanation and elaboration: updated guidelines for reporting parallel group randomised trials. BMJ 2010; 340:c869. Suresh KP & Chandrashekara S. Sample size estimation and power analysis for clinical research studies. J Hum Reprod Sci 2012; 5: 7–13. jouko.miettunen@oulu.fi

KIITOS! jouko.miettunen@oulu.fi www.joukomiettunen.net