Lataa esitys
Esittely latautuu. Ole hyvä ja odota
JulkaistuMerja Ketonen Muutettu yli 9 vuotta sitten
1
Alkuvaiheen koodaus edistyneiden suomenoppijoiden aineistossa Tallinna 13.11.2008 Ilmari Ivaska ja Kirsti Siitonen
2
Edistyneiden suomenoppijoiden korpus, TY •Informantit suomen ja sen sukukielten maisteriohjelman opiskelijoita –Seuranta-aika 2–3 vuotta –Kielitaito vahva jo alussa •Monipuolinen tekstilajivalikoima –Tentit, esseet, tutkielmat, katsaukset –1. vaiheessa pääpaino tenttivastauksissa •Rakenteistaminen TY:n Lauseopin arkiston mallin mukaisesti –Morfologinen, syntaktinen, lauserakenteellinen ja virhekoodaus
3
Korpuksen rakenne Korpus informantti tekstilaji (tentti, essee ym. lajina) teksti (tentti, essee, tutkielma ym.) tekstijakso (vastaus, luku) kappale virke lause sana
4
1. Sanakirja •Metodi LA:n tutkija Nobufumi Inaban kehittämä •Kaikki aineistossa esiintyvät sanamuodot –Täydentäminen aineiston karttuessa •Morfologinen koodaus ja hakusanoittaminen –Monitulkintaisista sanoista todennäköisin koodiksi ja vaihtoehdot kommentiksi •Vartalovirheiden ym. huomioiminen –Lemmaan tavoiteltu sana, mikäli on tunnistettavissa –Virheiden kommentointi virhetyyppiluokittelua varten (vartalo, av, vokaaliharmonia, sekamuoto ym)
5
1. Sanakirja (jatkoa) kerran kerro kerron kerrostumaan kerrostumiin kerrotaan kerrottava kerrottiin kertaa kertoa kertoi kertoisi kertomus kertoo kertova kertovat keruu- keruu keruumatkasta keruuttamansa keruutti
6
2. Syntaktinen koodaus •Valmis sanakirja syötetään takaisin aineistoon –Virkkeet, kappaleet ja tentit rakenteistettu automaattisesti skriptillä, koodausvirheiden korjaus käsin •Kontekstisidonnainen koodaus –Jako lauseisiin ja sanojen syntaktisen roolin koodaus –Sanakirjavaiheen koodausvirheiden korjaus •Virhekoodausta edeltävän tyypittelyn kannalta keskeisin vaihe –Keskeisin virhetaso edistyneillä kielenoppijoilla
7
2. Syntaktinen koodaus (jatkoa) 20060221 Suomen astevaihtelun perusperiaatteet Agglutinoiva kielenä suomen sanoihin liimataan taivutuspäätteet, mikä ei muuta sanan luokkaa.
8
3. Virhetyypittely •Tyypittely muodostetaan koodauksen aikana tehdyn kommentoinnin pohjalta –Takaa aineistolähtöisen luokittelun •Viisiportainen, hierarkkinen luokitus –Joiltakin osin ristikkäinen, monitasoiset virheet –Toimii ainoastaan yhdessä yleiskoodauksen kanssa •Esim. objektin sijavalinnan ongelmat virhekoodauksessa vain sijavalinta-virheinä •Tekninen toteutus kesken –Lauseopin X-arkiston käyttöliittymän mukautettu versio
9
Virhekoodaus (jatkoa) 1.Virheetön/virheellinen 2.Päätasot a.Sanastollis-johto-opilliset virheet b.Sanastollis-morfologiset virheet c.Morfologiset virheet d.Syntaktiset virheet e.Lauserakenteelliset virheet
10
Seuraavaksi: •Virhekoodauksen teknisten ratkaisujen luominen •Vertailuaineiston koostaminen –Suomenkielisten opiskelijoiden tenttivastauksia •Tekstilajivalikoiman laajentaminen •Ensimmäiset julkaisut ja tulevia tutkimusaiheita: –Ivaska 2009: Eksistentiaalilause lausetyyppinä edistyneiden suomenoppijoiden kielessä (pro gradu) –Siitonen: Muoto-opillisten virheiden väheneminen, verbivalikoiman monipuolistuminen, infinitiivi- ja partisiippirakenteiden lisääntyminen –Siitonen: alkeisopetuksen vaikutus myöhempään kielitaitoon, oppijansuomen rakenne-erot äidinkielisten suomeen nähden
Samankaltaiset esitykset
© 2024 SlidePlayer.fi Inc.
All rights reserved.