Alkuvaiheen koodaus edistyneiden suomenoppijoiden aineistossa Tallinna 13.11.2008 Ilmari Ivaska ja Kirsti Siitonen.

Slides:



Advertisements
Samankaltaiset esitykset
Tutkielman teko Esityksen perustana on käytetty dos. Marja-Leena Sorjosen 1998 tekemää ohjetta: Ohjeita tutkielman tekoon. Tuula Marila
Advertisements

Semantiikka/ Kysy kirjastonhoitajalta 05/2008. Semanttinen vastausliittymä Prototyyppi Opas luotiin FinnOnto-projektin osana (2006). Opas sisälsi vastaajan.
Anssi Heinonen - Melon Arbus Productions
Tekstilaji Tekstin tyyppi.
Tutkimussuunnitelma Teränkäyttöharjoitusten vaikutus luistelumotoriikan kehittymiseen kielihäiriöisillä lapsilla Mika Hakasaari.
Projektikatselmus Publicum Teknillinen korkeakoulu Publicum-ryhmä.
Lukemaan oppii vain lukemalla
Pupa-versot rakennekaavio / päätaso
Ketterä kehitys käytännössä – TFS & Meteor
MITÄ IHMETTÄ… TEKSTILAJIT ELI GENRET?
OKM: N J ULKAISUTIETOJENKERUUPROSESSI JA SEN KEHITTÄMINEN Ylitarkastaja Jukka Haapamäki.
13. Hyvä ohjelmointitapa (osa 1)
Tuloksia liikenneministeriön tulevaisuuskatsauksen jäsentämisestä Sami Majaniemi LVM, Jouni Tuomisto THL.
OPPIMINEN JA OPETUS / DIDAKTIIKAN KURSSIN WIKITENTTI.
Koodistopalvelu. Mikä? Palvelu, jonka avulla koodistoja voidaan jakaa ja hallinnoida keskitetysti. Perustuu JHS-työryhmän suositusluonnokseen ja sen yhteydessä.
1 © Jukka Juslin Web-käyttöliittymä Jukka Juslin.
Mitä kuuluu rakennekaavioille? Jari Sjölund
750696S Maisteriseminaari Laajuus 4 op / 107 h opiskelijan työtä
Tekstitaidon vastauksen eteneminen
Oodin hopsin käyttö ja käyttöönottojen tilanne Eeva Tuori-Pastila, Opiskelijarekisteri.
VIII Etiikka ja esitystapa
A! Aalto University 1 Semanttinen Kalevala: Sisällöntuotanto, toteutus ja demonstraatio Tuomas Palonen ja Joeli Takala Semantic Computing Research Group.
LAAJENNETTU TYÖSSÄOPPIMINEN toimintasuunnitelma Etelä-Savon ammattiopisto.
2. a. Pareittain esittele kirjoittamasi esittelyteksti ja valitsemasi lehtijutut. 2. b. Tarkastelkaa yhdessä valitsemianne lehtijuttuja ja merkitkää juttuihin.
OHJELMOINTITAITO ICT02D 12 ECTS. OPINTOJAKSON TOTEUTUS  KESTO: –  AVOIMEN OPISKELIJAT: – YKSI LUOKA (SUOMI) – LUOKKA ICT02O-1.
Eveliina Okkonen & Johanna Hägg, LO-07
Oodin version 3.3 yhteenveto 1Opiskelijarekisteri.
A! Aalto University 1 Case SÄHKE-asiakirjojen automaattinen luokittaminen asiakirjojen tekstin pohjalta Katariina Nyberg Semantic Computing Research Group.
Syntaksin harjoituskurssi CYK140 P Luento ma
Kielen- ja tekstinhuoltoa
Funktio.
Tuottotehtävä tekstitaitokokeessa
Lukion OPS-prosessin aikataulutusta
Tunnetko tekstilajit, entä tekstityypit?
Opetussuunnitelma/OPS
Tiivistelmä ja kypsyysnäyte
Aiheet ● Ohjelmointikielten kääntäminen ● Kieliopin määrittely ● Kääntäjän toiminta.
KITKA-PROJEKTI ? MIKÄ, MISSÄ MENNÄÄN ? Niitä ja näitä NELLIstä KITKA 2-projektikoordinaattori Virva Soikkeli.
AINEISTOPOHJAINEN KIRJOITELMA
kehittämispäivän ryhmätyöt. Ryhmät  Kalle -ryhmä: mielenterveys- ja päihdekuntoutujat, asumispalvelut, avopalvelut, sos.kuntoutus (Satakunta,
Kaikkien aikojen Porvoo Alla tiders Borgå LUKION OPS-PROSESSIN AIKATAULUTUSTA OPS 2016.
Avoimuuden huomiointi tutkimuksen suunnittelussa Jessica Parland-von Essen CC-BY 4.0 Opetus- ja kulttuuriministeriö.
Aineistoon viittaaminen Intertekstuaalisen kirjoittajan tärkeä taito!
AI8 Tekstin keinot, uutinen Tekstin keinot Kappalejaolla voidaan auttaa lukijaa hahmottamaan tekstiä ja sen pääkohtia. – Kappaleen alussa tulee.
Datan avaamisen ohjeistus  Tarkoituksena tukea datan avaajia ja hyödyntäjiä  Tarjoaa hyviä käytäntöjä, suosituksia, työkaluja ja case-esimerkkejä sekä.
Ohjeet Kandidaattiseminaariin integroitu kypsyysnäytesuorittaminen
TEKSTITAIDON VASTAUS Miten vastauksen ainekset kerätään, kuinka sen rakenne suunnitellaan, kuinka se kirjoitetaan ja miten se arvioidaan?
Kotoutumiskoulutus verkossa
Perustuslakivaliokunnan ja sen työn kehittäminen
ÄIDINKIELI JA kIRJALLISUUS 1. KURSSI
Suomi 2A
Tutkielman teko-ohjeet
Aineistoaine Särmä s. 359 Vastaa Särmä-kysymyksiin TK:sta s. 96
Suomen kirjoituskurssi edistyneille
Suomen kirjoituskurssi edistyneille
Tunnetko tekstilajit, entä tekstityypit?
Lingsoft Language Management
Tekstin kokonaisrakenne ja argumentointi
ESSEE.
Aineiston käyttö oman tekstin pohjana
Harjoitus 4.3: Objektien käsittely kerralla ja tyylin kopiointi
Kielen- ja tekstinhuoltoa
Suomi 2A
LUKU Lukemisen ja kirjoittamisen oppikirja aikuisille maahanmuuttajille Kaisa Häkkinen & Anna Nylund.
PDPP.
Suomen kielisten tekstien morfologinen analyysi
MS Visio Prosessikaavion mallintaminen sanallisesta kuvauksesta
OHJELMOINTITAITO ICT02D 12 ECTS.
”Matka maailman ympäri”-näyttely: Ohjeet ja aineisto
Sosiaalisen median kuvamalli
Esityksen transkriptio:

Alkuvaiheen koodaus edistyneiden suomenoppijoiden aineistossa Tallinna Ilmari Ivaska ja Kirsti Siitonen

Edistyneiden suomenoppijoiden korpus, TY •Informantit suomen ja sen sukukielten maisteriohjelman opiskelijoita –Seuranta-aika 2–3 vuotta –Kielitaito vahva jo alussa •Monipuolinen tekstilajivalikoima –Tentit, esseet, tutkielmat, katsaukset –1. vaiheessa pääpaino tenttivastauksissa •Rakenteistaminen TY:n Lauseopin arkiston mallin mukaisesti –Morfologinen, syntaktinen, lauserakenteellinen ja virhekoodaus

Korpuksen rakenne Korpus informantti tekstilaji (tentti, essee ym. lajina) teksti (tentti, essee, tutkielma ym.) tekstijakso (vastaus, luku) kappale virke lause sana

1. Sanakirja •Metodi LA:n tutkija Nobufumi Inaban kehittämä •Kaikki aineistossa esiintyvät sanamuodot –Täydentäminen aineiston karttuessa •Morfologinen koodaus ja hakusanoittaminen –Monitulkintaisista sanoista todennäköisin koodiksi ja vaihtoehdot kommentiksi •Vartalovirheiden ym. huomioiminen –Lemmaan tavoiteltu sana, mikäli on tunnistettavissa –Virheiden kommentointi virhetyyppiluokittelua varten (vartalo, av, vokaaliharmonia, sekamuoto ym)

1. Sanakirja (jatkoa) kerran kerro kerron kerrostumaan kerrostumiin kerrotaan kerrottava kerrottiin kertaa kertoa kertoi kertoisi kertomus kertoo kertova kertovat keruu- keruu keruumatkasta keruuttamansa keruutti

2. Syntaktinen koodaus •Valmis sanakirja syötetään takaisin aineistoon –Virkkeet, kappaleet ja tentit rakenteistettu automaattisesti skriptillä, koodausvirheiden korjaus käsin •Kontekstisidonnainen koodaus –Jako lauseisiin ja sanojen syntaktisen roolin koodaus –Sanakirjavaiheen koodausvirheiden korjaus •Virhekoodausta edeltävän tyypittelyn kannalta keskeisin vaihe –Keskeisin virhetaso edistyneillä kielenoppijoilla

2. Syntaktinen koodaus (jatkoa) Suomen astevaihtelun perusperiaatteet Agglutinoiva kielenä suomen sanoihin liimataan taivutuspäätteet, mikä ei muuta sanan luokkaa.

3. Virhetyypittely •Tyypittely muodostetaan koodauksen aikana tehdyn kommentoinnin pohjalta –Takaa aineistolähtöisen luokittelun •Viisiportainen, hierarkkinen luokitus –Joiltakin osin ristikkäinen, monitasoiset virheet –Toimii ainoastaan yhdessä yleiskoodauksen kanssa •Esim. objektin sijavalinnan ongelmat virhekoodauksessa vain sijavalinta-virheinä •Tekninen toteutus kesken –Lauseopin X-arkiston käyttöliittymän mukautettu versio

Virhekoodaus (jatkoa) 1.Virheetön/virheellinen 2.Päätasot a.Sanastollis-johto-opilliset virheet b.Sanastollis-morfologiset virheet c.Morfologiset virheet d.Syntaktiset virheet e.Lauserakenteelliset virheet

Seuraavaksi: •Virhekoodauksen teknisten ratkaisujen luominen •Vertailuaineiston koostaminen –Suomenkielisten opiskelijoiden tenttivastauksia •Tekstilajivalikoiman laajentaminen •Ensimmäiset julkaisut ja tulevia tutkimusaiheita: –Ivaska 2009: Eksistentiaalilause lausetyyppinä edistyneiden suomenoppijoiden kielessä (pro gradu) –Siitonen: Muoto-opillisten virheiden väheneminen, verbivalikoiman monipuolistuminen, infinitiivi- ja partisiippirakenteiden lisääntyminen –Siitonen: alkeisopetuksen vaikutus myöhempään kielitaitoon, oppijansuomen rakenne-erot äidinkielisten suomeen nähden