Application of the AR2NL system for reporting association rules in Finnish 21.10.2004 Emilia Ylirinne emilia@iki.fi Tampere University of Technology.

Slides:



Advertisements
Samankaltaiset esitykset
Tietokantakehitys kiinteäksi osaksi modernia ohjelmistokehitystä Vesa Tikkanen |
Advertisements

EPiServer 7. Paras EPiServer ikinä käyttäjää.
1 Sektorin nimi. 2 Reading times of magazines NRS Finland 2012.
Paljoussanat.
ENAK  to trust sth/sb  maximum/minimum  dozens of exercise books  nowAdays  becAuse  enough_  through_  jotta = so (that)  yhtä –kuin.
ENA 10 Feedback on Essay 1. Spelling  nowadays  decide  immediately  chance  to lose hope  The whole world  A hole in the wall  at least  of.
COURSE 1 In Touch (Wsoy). RULES RULES Please, don’t be late! If the door is closed, don't bother! Please, don’t be late! If the door is closed, don't.
Abikertaus Adjektiivit ja adverbit. Let’s practise! Jack on parhaiten tunnettu jalkapalloilijana. Hän on kaikkein paras! Jack is best known as a footballer.
Development Association SEPRA How to involve youth into strategic rural development work? Budapest, 8th November 2011 Euroopan maaseudun kehittämisen maatalousrahasto:
AP: Legoman jumping THE IDEA: -Finnish has 15 different noun cases, which are inflected forms of a noun. -They are hard to remember and it’s quite hard.
JYVÄSKYLÄ - HUMAN TECHNOLOGY CITY
End-User Needs and Contextual Design Katja Konkka and Satu Kalliokulju
A solution for flexible bicycle transportation
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Mustajoki and Hämäläinen Decision analysis by interval SMART/SWING / 1 Decision analysis by interval.
IML FINNISH LEVEL 1. * Steve is staying with friends in Joensuu. He has been invited to Pekka and Leena’s summerhouse. Steve and Pekka are making arrangements.
Fuzzy Pay-off Method for Real Option Valuation Sumean tuoton menetelmä reaalioption arvon laskemiseen Dr. Mikael Collan IAMSR, ÅA.
1 Sektorin nimi. 2 Reading times of magazines NRS Finland 2011.
ICT4D in teacher training - Tieto- ja viestintätekniikkaa kehitysmaan opettajankoulutuksessa Mikko Vesisenaho Faculty of Education.
JYVÄSKYLÄN YLIOPISTO UNIVERSITY OF JYVÄSKYLÄJYVÄSKYLÄN YLIOPISTO UNIVERSITY OF JYVÄSKYLÄ Creating methodologic al tools for wp2-wp4 Workpackage 1 UPDATE.
Getting on Thursday Chapter 8 Grammar  verbi + ing (kestomuoto, gerundi) ja verbi + infinitiivi eli perusmuoto saattavat merkitä aivan eri.
ETELÄ-POHJANMAA HOSPITAL DISTRICT
Vaillinaiset apuverbit: can
Getting on Thursday Chapter 8 Grammar  verbi + ing (kestomuoto, gerundi) ja verbi + infinitiivi eli perusmuoto saattavat merkitä aivan eri.
Tekstitiedostosta lukeminen tMyn1 Tekstitiedostosta lukeminen Tiedosto voidaan avata pelkästään lukemista varten tai kirjoittamista ja lukemista varten.
Development Association Sepra as Sub-regional Developer in Finland Hungary, 17th November, 2010 Euroopan maaseudun kehittämisen maatalousrahasto: Eurooppa.
Englanti: aikamuodot.
Sijan distribuutio The Distribution of Case (Chapter 15) Edith A. Moravcsik Wilhelmina Dyster Sijojen teoriaa -kurssi
Today’s Special ENA5 Fall älä jaa sanoja otsikon numero (älä muuta otsikkoa) sanamäärä ei saa ylittyä liikaa! sanaston monipuolisuus! ajattelun.
Lauseen sanajärjestys
Irmeli Sinkkonen TkL, tutkija
ENG Masters, part 2, Citing
Fiksu Opiskelija. Opetusaineisto jätteen synnyn ehkäisystä HSY Jätehuolto. Thoughts about Good Life Collected by Tuovi Kurttio, Pääkaupunkiseudun.
SoberIT Ohjelmistoliiketoiminnan ja –tuotannon instituutti TEKNILLINEN KORKEAKOULU T Käyttöliittymien ja käytettävyyden seminaari Kontekstiherkkyydestä.
INFRA ry Vastuuhenkilö Eija Ehrukainen Ottaa käsiteltäväkseen myös asfalttialan ympäristöasiat Seurataan, vaikutetaan ja ohjeistetaan: Lainsäädännön muutokset.
By Learning for Integration ry. Immigration issues in Finland: Somalis  Until the 1980s Finland was very much a homogenous society with only a few foreigners.
CAF eTool Rekisteröitymisen kautta maksutta käyttöön Kansallinen laatuhanke /TjV 1.
Toiminta-arkkitehtuurin palvelut Outi Tasala
Infinitiivi + to-partikkeli
Tervetuloa suomen kielen kurssille!
OLLA-verbit Olla-verbejä on englannin kielessä kaksi: ’be’ ja ’have’.
Reports in Apply / eAge system
Kysymykset QUESTIONS P. 188.
PPJ Ruoholahti-Jätkäsaari 2007/2008
Can I Buy Renova Cream Online
to eat and to drink (and other verbs with da/dä)
Power Grammar: Konditionaali
Kestoperfekti Käyttö He has been writing that for half an hour.
RELATIIVI- JA INDEFINIITTIPRONOMINIT
Verbin perusmuoto 1 ’TO SING’ OR ’SING’.
How should I ask my questions?
MyData – asiakas keskiöön
Persoonapronominit minä, sinä, hän, me, te, he.
vedestä, ilmasta ja tulesta.
Shortened clauses / sentences
to eat and to drink (and other verbs with da/dä)
Introduction to decision analysis
to eat and to drink (and other verbs with da/dä)
Hierarchical models Biotieteellinen tiedekunta / Henkilön nimi / Esityksen nimi
DIC and BMA in BUGS Biotieteellinen tiedekunta / Henkilön nimi / Esityksen nimi
Probability models and decision analysis
Introduction to decision analysis
vedestä, ilmasta ja tulesta.
vedestä, ilmasta ja tulesta.
vedestä, ilmasta ja tulesta.
X-ROAD ENVIRONMENTAL MONITORING
My final comments to you can be summarized as the three Ps:
Information for teachers
Lecture slides start on the next page.
What is Ethics?.
Copyright Pearson Prentice Hall
Esityksen transkriptio:

Application of the AR2NL system for reporting association rules in Finnish 21.10.2004 Emilia Ylirinne emilia@iki.fi Tampere University of Technology

Introduction Based on system LISp-Miner Data of the medical project STULONG AR2NL translates association rules into Czech and English Translating into Finnish

Topics Reporting Data Mining results in Natural Language System AR2NL Translating into Finnish Concluding Remarks (based on doctor Petr Strossa’s articles)

Reporting Data Mining results in Natural Language Association rule φ  ψ Founded implication φ  ψ  p,n Four-fold contingency table

ED(univ)  RS(mng)  0.95,76 AJ(sits) Example of association rule ED(univ)  RS(mng)  0.95,76 AJ(sits) Four-fold table

Natural Language (NL) Formulations several ways to formulate 1. 76 (i.e. 95 %) of the observed patients confirm this dependence: if the patient has university education and responsibility of a manager, then he mainly sits in his job. 1. 76 (eli 95 %) havainnoiduista potilaista toteuttaa seuraavan riippuvuuden: jos potilaalla on korkeakoulutus ja työ johtotehtävissä, hän istuu enimmäkseen työssään.

Natural Language (NL) Formulations 2. 95 % of the observed patients that have reached university education and work as a managerial position also mainly sit in their job. 2. 95 % havainnoiduista potilaista, jotka ovat saaneet korkeakoulutuksen ja työskentelevät johtotehtävissä, myös enimmäkseen istuvat työssään.

Natural Language (NL) Formulations 3. It is characteristic for the patients that have reached university education and work as a managerial position that they also have a sedentary job. This fact is confirmed by 76 (i.e. 95 %) observed patients. 3. Potilaille, jotka ovat saaneet korkeakoulutuksen ja työskentelevät johtotehtävissä, on ominaista, että heillä on myös istumatyö. Tämän toteuttaa 76 (eli 95 %) havainnoitua potilasta.

Natural Language (NL) Formulations X  Y 0.95,76 Z 1. a (i.e. 100p %) of the observed patients confirm this dependence: if the patient has NLF(X) and NLF(Y), then he NLF(Z). 2. 100p % of the observed patients that NLF(X) and NLF(Y) also NLF(Z). 3. It is characteristic for the patients that NLF(X) and NLF(Y) that they also have NLF(Z). This fact is confirmed by a (i.e. 100p %) observed patients.

Noun phrase, NP Verb phrase, VP Adjectival phrase AP university education korkeakoulutus a managerial position työ johtotehtävissä a sedentary job istumatyö Verb phrase, VP works as a managerial position työskentelee johtotehtävissä has reached university education on saavuttanut korkeakoulutuksen Adjectival phrase AP university-educated korkeakoulutettu Participial phrase working as a manager johtotehtävissä työskentelevä mainly sitting in his job työssään istuva

Natural Language (NL) Formulations 1. a (i.e. 100p %) of the observed patients confirm this dependence: if the patient has NP(X) and NP(Y), then he VP(Z). 1. a (eli 100p %) havainnoiduista potilaista toteuttaa seuraavan riippuvuuden: jos potilaalla on NP(X) ja NP(Y), hän VP(Z).

Natural Language (NL) Formulations 2. 100p % of the observed patients that VP(X) and VP(Y) also VP(Z). 2. 100p % havainnoiduista potilaista, jotka VP(X) ja VP(Y), myös VP(Z).

Natural Language (NL) Formulations 3. It is characteristic for the patients that VP(X) and VP(Y) that they also have NP(Z). This fact is confirmed by a (i.e. 100p %) observed patients. 3. Potilaille, jotka VP(X) ja VP(Y), on ominaista, että heillä on myös NP(Z). Tämän toteuttaa a (eli 100p %) havainnoitua potilasta.

Finnish language Belongs to Uralian family of languages More than a dozen cases (http://www.cs.tut.fi/~jkorpela/finnish-cases.html) Synthetic language uses suffixes to express grammatical relations and also to derive new words in my house, too -> talossanikin after you had written -> kirjoitettuasi ”Free” word order

Pete loves Anna - Anna loves Pete Pete rakastaa Annaa. This is the normal word order, the same as in English. Annaa Pete rakastaa. This emphasizes the word Annaa: the object of Pete's love is Anna, not someone else. Rakastaa Pete Annaa. This emphasizes the word rakastaa, and such a sentence might used as a response to some doubt about Pete's love; so one might say it corresponds to Pete does love Anna. Pete Annaa rakastaa. This word order might be used, in conjunction with special stress on Pete in pronunciation, to emphasize that it is Pete and not someone else who loves Anna. Annaa rakastaa Pete. This might be used in a context where we mention some people and tell about each of them who loves them. So this roughly corresponds to the English sentence Anna is loved by Pete. Rakastaa Annaa Pete. This does not sound like a normal sentence, but it is quite understandable. source: http://www.cs.tut.fi/~jkorpela/finnish-intro.html

Finnish language no definite or indefinite article no grammatical gender negation, corresponding to English not, behaves as a verb ownership or possession (have and be in English) I have a dog -> Minulla on koira ("at me (there) is (a) dog")

System AR2NL Main features Written in XML standard Files which contains data needed in translations Translates association rules with founded implication

FP-file Formulation Patterns Base of (NL) sentences File which contains data needed in translations Translates association rules with founded implication

FP-file

FPA-file Formulation Patterns - Auxiliary Substitutions for higher-order non-terminal symbols Variability of sentences

FPA-file

Entitynames-file Entities e.g. ”Patient”, ”which”

MN-file Morphology - Nouns Language dependent Singular and plural case endings 7 cases in Czech, 14 cases in Finnish

MN-file

MV-file Morphology - Verbs Singular and plural case endings Participial form and case

Elementary-file Important part Contains data of the literals Noun phrase, Adjectival phrase, Verb phrase

Elementary-file

Conversion process example of the process

Problems word order in participial form cases in participial form drink beer - drinking beer juoda olutta - olutta juova cases in participial form many cases ja (and) in logic and in Finnish Patients drinking beer and smoking mainly sits in their job. Olutta juovat ja tupakoivat potilaat istuvan enimmäkseen työssään ownership

Concluding Remark AR2NL system can translate association rules into Finnish, too