Hakukyselyn laajentaminen Query Expansion. Query: papal travels 259 total matching documents, 4.0 out of 16 relevant rankings: [4][25][126][170] Query:

Slides:



Advertisements
Samankaltaiset esitykset
Opiskelijat työmarkkinoilla vuonna 2011 Ympäristöasiantuntijoiden Keskusliitto Lokakuu 2011 Real Stats Oy.
Advertisements

”Epämääräisen” tiedon yhdistämien
1 Ostopaikkakysely Heli Rauman Anu Simonen. 2 Kyselyn toteutus •Riihimäen kotitalouksiin lähetettiin yhteensä 2780 kyselyä •Kotitaloudet valitsimme postinumeroiden.
Pääkaupunkiseudun 8. luokkien palvelukyky Espoo, Tapiolan koulu Joulukuu 2013.
Kokoelmien kuvailun formaatteja ja standardeja Marit Olander Helsingin yliopiston kirjasto
F IN EL IB - KÄYTTÄJÄKYSELYN AINEISTON YLEISESITTELY - TUTKIMUSLAITOKSET FinELib toteutti syys-lokakuussa 2011 tutkijoiden elektronisten julkaisujen käyttöä.
NYKYTILAKARTOITUS HANGOSSA - KOTIHOIDON ASIAKKAAN KÄYTÖSSÄ OLEVAT APUVÄLINEET JA TULEVAISUUDEN APUVÄLINETARPEET HENKILÖKUNNAN ARVIOIMANA (TOTEUTUS VIIKOT.
John Rawls REILUPELI.
Lapista tulevaisuus Lapin korkeakouluista valmistuneet työelämässä.
Intelligent Gaze-Added Interfaces by Salvucci & Anderson Anssi Kainulainen Tampere University Computer Human Interaction Group.
Julkaisuportaalin prototyyppi Tutki-ohjausryhmä, Jyrki Ilva
SLS vaalii ja kehittää Suomen ruotsinkielistä kulttuuriperintöä.
SUOMEN OLYMPIA-AKATEMIA
1 ©TNS 2012 Tämän tutkimuksen tulokset on tarkoitettu vain tilaajan omaan käyttöön. Niitä ei saa lainata, luovuttaa, jälleenmyydä tai julkaista ilman tutkimusyrityksen.
Työhyvinvoinnin tekijät Akavan Erityisalojen työmarkkinatutkimusten tuloksia Tiivistelmädiat
Kappaleiden tilavuus 8m 5m 7cm 5 cm 14cm 6cm 4cm 4cm 3cm 10cm.
Location-aware applications: keyword clustering
Mielikuvat ja odotukset senioritaloista
Place client logo here in Slide Master RI Elokuu 2009 Jorma Hakanen Lääkkeiden määrääminen ja rinnakkaislääkkeet –tutkimus.
ARJEN TALOUSKATSAUS Telebus helmikuu/2008/viikko 9.
Puu- ja kivitalojen vertaileva asumistyytyväisyystutkimus 2008 | |1T-6370VR Puu- ja kivitalojen vertaileva asumistyytyväisyystutkimus 2008 Suomen.
Tieteellisten julkaisujen bibliometrinen tutkimus Henri Schildt ( Teknologiantutkimuksen perinne ja uudet suunnat
CSC / Tietohallinnon asiakkaat ja tuotteet / Teemu Kemppainen Aikataulu 09:00-09:30Mallin kehitys versioon 1 ja tästä eteenpäin; UML-notaatio.
Elinkeinopoliittinen mittaristo 2014 Kittilä 1. ELINKEINOPOLITIIKAN TILA 2.
Conspectus tasojen soveltamisessa ilmenneitä periaatteellisia ja käytännöllisiä eroja Raine Wilén
Kanuuna seminaari Seinäjoki  Aiemmissa malleissa lähtökohta, jossa määriteltiin hyvinvoinnin esteitä, joita sitten voitiin ratkoa  Toimintavalmius.
T YTÖT, POJAT JA VÄKIVALTA – KULTTUURINEN KÄYTÄNTÖ, SOSIAALINEN ONGELMA VAI KASVATUKSEN KYSYMYS ? Päivi Honkatukia, VTT, nuorisotutkimuksen professori,
Työmäärän vaihtelu automaattilypsy-
TPO-oppilaitoskysely keväällä 2010 Toimintaympäristö ja talous Oppilaat Henkilöstö Opetustarjonta.
Anna tutki: Naisen asema työelämässä.
Mittaustekniikka (3 op)
Yrittäjien äänestyskäyttäytyminen 50,7 57,6 55,0 23,4 20,3 21,9 11,4 9,3 8,0 5,2 5,5 6,9 4,2 4,5 3,6 0,7 1,7 1,3 1,7 0,0 0,0 0,7 0,0 0,0 2,7 1,0 3,3.
MITEN MÄÄRITTELEMME VAMMAISUUTTA?
Interact järjestelmäarkkitehtuuri + vuorovaikutustekniikoista ja evaluoinnista Markku Turunen Tampereen yliopisto Tietojenkäsittelytieteiden laitos Interact.
Tietoturvan perusteet - Syksy 2005 SSH salattu yhteys & autentikointi Tekijät: Antti Huhtala & Asko Ikävalko (TP02S)
Eksponentiaalinen kasvaminen ja väheneminen
Tiedonhakumenetelmät
Yrittäjyydestä ja yhteistyöstä Teollisuusneuvos Heikki Vesa.
JYVÄSKYLÄN YLIOPISTO/COSSE InBCT 2.4/A-KIT 2003 A-KIT Agora Exploratory Environment for Knowledge Discovery Timo Aittokoski Olli Hokkanen Tommi Kärkkäinen.
EU monikielisyyttä edistämässä Hannele Nevalampi
Kuntalaiset ja suorat osallistumis-/vaikuttamistavat - erilaisten osallistumis-/vaikuttamistapojen käyttö - arviot osallistumis-/vaikuttamistapojen vaikuttavuudesta.
KTT Minna Söderqvist: Miten työnantajat näkevät ulkomaiset työnhakijat ja ulkomaisen henkilökunnan? 33 työnantajahaastattelua 2004 Kokemusta ulkomaisista.
 Plan and brainstorm  Organize your ideas  Write the first version  Edit and correct any errors  Revise and improve.
Kansallisen terveyshankkeen ydintietomäärittelyt ja jatkohoidonsuunnitelma Jari Porrasmaa Kuopion yliopisto/HIS-T&K Suomen kuntaliitto.
Yliopistojen yhteisen YDW tietovaraston määrityshanke - tilannekatsaus Tampere
Tiedonhakumenetelmät Helena Ahonen-Myka kevät 2004, osa 3 Indeksointi (1/2), harjoitustyön tehtävänmäärittely.
Tiedonhakumenetelmät Helena Ahonen-Myka Kevät 2004, osa 4 Indeksointi (2/2)
University of Joensuu Dept. of Computer Science P.O. Box 111 FIN Joensuu Tel fax Tietojenkäsittelytieteen.
Heuristinen arviointi Käyttöliittymäseminaari Jere Salonen.
SATTUMAN ONGELMA TUTKIMUKSESSA 1 x: tenttiin valmistautumiseen käytetty aika (tunteja) Perusjoukko μ = 39,87.
Näin luon digitaalisen ekosysteemin
Suomen Lääkäriliitto | Finnish Medical AssociationLääkärit Suomessa | Physicians in Finland Tilastotietoja lääkäreistä ja terveydenhuollosta 2014 Statistics.
Etsintä verkosta (Searching from the Web) T Datasta tietoon Heikki Mannila, Jouni Seppänen
Avoimen yliopiston pedagoginen kahvila
Silmän käyttäytymisen tutkimus ja sovellukset Veikko Surakka Tampere University Computer Human Interaction Group.
JYVÄSKYLÄN YLIOPISTO UNIVERSITY OF JYVÄSKYLÄ 1 Informaatioteknologian tiedekunnan opinto-opas Eija Ihanainen Vesa Lappalainen Miika Nurminen Pekka Rinne.
Tilastollinen testaus Χ 2 -testi nelikentässä kaikkein yksinkertaisin lähtökohta tilastolliselle testille Esim. materiaalin (rauta tai pronssi) ja korun.
Tilastollisesti merkitsevä nousu Tilastollisesti merkitsevä lasku Edelliseen aineistoon KMT 2005 verrattuna* KMT Kevät06 puolivuosiaineisto KMT SYKSY05/KEVÄT06.
1 Lastensuojelun tieto lapsesta Mirva Makkonen Kehittäjä-sosiaalityöntekijä Oulun seudun lastensuojelun kehittämisyksikkö.
”Ahvenisjärven koulun ahtaus jätettiin hymysuin taakse, kun
SUSE linux Sami Kiviharju OH Historiaa.
YFIA202 Kvantitatiiviset menetelmät, luento YTT Pertti Jokivuori Syksy luento (Ti )
YFIA202 Kvantitatiiviset menetelmät, luento
Tips for a good entry Kaisa Sibelius Forum Virium Helsinki
Yleistä SPSS:stä Alunperin lyhennys sanoista Statistical Package for Social Sciences Valittu opiskeltavaksi ohjelmaksi, koska on helppokäyttöinen ja riittävän.
Datan metadata - mitä metadata on ja miksi sellaista tarvitaan?
Lähipalvelukilpailu Ilmoituslaatikkoverkosto tuo arjen mahdollisuudet esille uudella tavalla, sekä toimii kehittymisen myötä infrastruktuurina yksilön,
BIBLIOMETRIIKKASEMINAARI 2017
Suuri verkkokauppatutkimus 2018
Esityksen transkriptio:

Hakukyselyn laajentaminen Query Expansion

Query: papal travels 259 total matching documents, 4.0 out of 16 relevant rankings: [4][25][126][170] Query: (papal pontifical apostolical apostolic pope) (travels travelling traveling travel) 3016 total matching documents, 16.0 out of 16 relevant rankings: [2][3][14][44][290][291][292][293][294][304][317][318][320][32 1][329][388]

Tutkimuksia lähivuosilta Massachusetts: James P. Callan, W. Bruce Croft, John Broglio Recent Experiments with InQuery Tampere: Järvelin, K. & Kristensen, I. & Niemi, T. & Sormunen, E. & Keskustalo, H. (1996) A deductive data model for thesaurus navigation and query expansion

Lähestymistapoja: relevanssipalautteen perusteella voidaan valita hakuavainten ympäristöstä usein löytyviä hahmoja, joita sovittamalla muihin dokumentteihin voidaan löytää hakuavainten synonyymejä yleisempää kuin tekstikokoelmasta riippumattomat menetelmät, jotka käyttävät jotain sanastoa tai tesaurusta esim. WordNet, ROGET's

Tilastollisia menetelmiä SMART Harvardin yliopisto 1961 relevanssipalautteen perusteella muokkaa kyselyä tarvittaessa useita kertoja OKAPI Lontoo (City University) Käyttää jonkin verran sanastoa apuna laajennuksessa lisää kyselyyn varmasti sopivina pitämiään hakuavaimia esim: Britain -> GB, UK Great Britain jne. muokkaa kyselyä lisää relevanssipalautteen perusteella

Sanastopohjaisia kokeiluja: Boyd, Driscoll & Syu (1994) ROGET's thesaurus (vuoden 1911 versio) ei kovin rohkaisevia tuloksia Voorhees (1994) WordNet automaattista & manuaalista kokeilua, tulokset eivät kovin kiinnostavia automaattisissa kokeissa synsetin tuli olla yhdistettävissä osaan muista hakuavaimista

Gonzalo & al. tutkivat kyselyn laajennusta lisäämällä kyselyihin kontrolloidusti huonoja hakuavaimia kyselyt sietävät keskimäärin 10% vääriä termejä Disambiguointi fdg jäsennys Lesk-algoritmi

luonnolliskielisen kyselyn jäsennys - poistaa yleensä vääriä tulkintoja parien muodostaminen hakuavaimista disambiguoitavan hakuavaimen merkitysten määritelmiä verrataan parin määritelmiin, valitaan sopivin määritelmä Laajennus lisätään valittuun merkitykseen sopivat synonyymit kyselyyn rakenteistetaan kysely Disambiguointi

score(q,d) = Σ tf (t in d) * idf (t) * getBoost (t.field in d) * lengthNorm (t.field in d) * coord (q,d) * queryNorm (q) t in q Lucene: InQuery:

Cross Language Evaluation Forum CLEF Englanninkielistä dokumenttia 50 kyselyä relevanssitietoineen 2004 Testidata

Precision P P = relevantit tulosjoukossa / koko tulosjoukko Recall R R = relevantit tulosjoukossa / kaikki relevantit Kyselyiden tarkkuuden keskiarvo, kun R = 100% Mittareita

Toistaiseksi testattu lähinnä WordNet:n synsetistä saatavien synonyymien lisäämistä kyselyihin alkuperäisten avainten painottamista

Tuloksista erot menetelmien välillä eivät kovin merkittäviä tulokset todennäköisesti vaihtelevat eri kokoelmilla kuitenkin pääosin positiivisia

Loppu