Kotitehtävän 21 ratkaisu Ensimmäisen havaintoaineiston luokittelu – Ryhmäkeskiarvot hakeutuvat niin, että ryhmään kuuluvat pisteet ovat mahdollisimman lähellä ryhmäkeskiarvoja. Tällöin havaintojen ollessa ”tähtimuodostelmassa”, keskiarvot hakeutuvat tähden sakaroihin, joissa todelliset jakaumien odotusarvot ovat. => Hyvä luokittelu
Toisen havaintoaineiston luokittelu – Nyt kun havaintoaineiston (kaikki 600 havaintoa) hajonta y-akselin suunnassa on huomattavasti suurempaa kuin x-akselin suunnassa, ryhmäkeskiarvot asettuvat niin, että havainnot jakautuvat ryhmiin suurpiirteisesti niiden y- koordinaatin mukaan. – Aineisto näyttää olevan helposti ryhmiteltävissä, koska kolmen havaintoryppään välissä havainnot ovat harvassa. K-keskiarvoa menetelmä ei huomioi tällaista asiaa mitenkään, vaan minimoi vain ryhmään kuuluvien havaintojen etäisyyttä ryhmäkeskiarvosta, jolloin vierekkäin olevien pitkulaisten jakaumien päät luokitellaan samoihin ryhmiin.
Pisteytys Oikeanlaiset kuvat ja oikeansuuntainen oikein luokiteltujen havaintojen määrä: 3 pistettä per aineisto. Vastaus kysymykseen: – Ei vastausta tai perustelut täysin väärin: 0 pistettä – Jotain oikean suuntaista: 2 pistettä – Järkevä perustelu: 4 pistettä