1 Kulttuurisampo.fi ja tiedon semanttinen integrointi Eetu Mäkelä Semantic Computing Research Group (SeCo) Helsinki University of Technology (TKK), Department of Media Technology and University of Helsinki, Department of Computer Science
2 FinnONTO-projekti Tekes-tutkimushanke, tutkimusosapuolina TKK, Helsingin yliopisto ja Tampereen yliopisto Ydintavoite: luoda Suomelle yhteinen kansallinen semanttisen webin infrastruktuuri, joka mahdollistaa teknologian hyödyntämisen mahdollisimman halvalla Käytännössä: –Loppukäyttäjille suunnattuja palvelukonsepteja ja työkaluja niiden toteuttamiseen (Kulttuurisampo, TerveSuomi.fi, Opintie,...) –Apuvälineitä tiedon tuotantoon ja yhdistämiseen Käynnistyi vuonna 2003 – : 14 rahoittajaa – : 16 rahoittajaa – : 30 rahoittajaa – : 37 rahoittajaa – : 38 rahoittajaa –...
3 FinnONTO-projektin rahoittajat AAC Global Oy Antikvaria-ryhmä CelAmanzi Oy Connexor Oy Coronaria Oy Eduskunta Ego Beta Oy Elisa Oy Espoon kaupunginmuseo Geol. tutkimusk. GTK Hgin kaupunginkirjasto Hgin yliopiston Viikin tiedekirjasto Sininen Meteoriitti Oy Stakes Suomen Asiakastieto Oy Suomalaisen kirjallisuuden seura SKS Suomen valokuvataiteen museo Taideteollisen korkeakoulun kirjasto Terveyden edistämisen keskus (Tekry) TietoEnator Oyj Valtion taidemuseo Valtiovarainministeriö / ValtIT Wärtsilä Oyj Kansallisarkisto Kansalliskirjasto Kansanterveyslaitos Koulutuskeskus Dipoli Maa- ja metsätalousministeriö Maanmittauslaitos M-Cult Merenkulkulaitos Museovirasto Mysema Oy Osuuspankkikeskus OSK PKT-Säätiö Profium Oy Rautaruukki Oyj Sanastokeskus TSK –Pilotointialueet : kulttuuri, terveydenhuolto, yrityspalvelut, asiakirjanhallinta
Cultural Content Compexity: Heterogenous and Interlinked Encyclopedia Artifacts Maps Videos Buildings Fine arts Biographies Narratives Literature Cultural sites Music
Cultural Content Production: Distributed and Independent
National Ontology Infrastructure CultureSampo in a Nutshell Semantic Metadata Content Providers
Kulttuurisampo.fi – Mistä on kyse? Kulttuurisampo on keskitetty web-portaali, joka esittelee semanttisen webin teknologioista saatavaa lisäarvoa monimuotoisten ja monilähteisten kulttuurisisältöjen yhteisöllisessä julkaisussa 1)Museoesineet (Espoon kaupunginmuseo, Lahden kaupunginmuseo, Kansallismuseo, Pohjois-Karjalan museo, Suomen maatalousmuseo Sarka) 2)Maalaukset, veistokset, piirustukset ja muu esittävä ja abstrakti taide (Valtion taidemuseo) 3)Kaunokirjallisuus (Helsingin kaupunginkirjasto) 4)WWW-tietosivut (Wikipedia) 5)Runot (ml. Kalevala) (Suomen kansan vanhat runot, SKS) 6)Kalevalan paikat ja henkilöt 7)Kansansävelmät (Jyväskylän yliopiston musiikin laitos ja SKS) 1)Valokuvat (Kuopion kulttuurihistoriallinen museo, Kansallismuseo) 2)Ilmavalokuvat (Veljekset Karhumäki Oy) 3)Henkilöt ja organisaatiot (Getty Union List of Artist Names) 4)Biografiat (Kansallisbiografia, SKS) 5)Historialliset tapahtumat (Agricola – Suomen historiaverkko) 6)Taidot (Taideteollisen korkeakoulun kirjasto, Suomen maatalousmuseo Sarka) 7)Videot (Espoon kaupunginmuseo) 8)Rakennetut kohteet (Espoon kaupunginmuseo) 9)Muinaismuistokohteet (Museovirasto)
Kulttuurisammon teknologia mahdollistaa: Eri toimijoiden eri tyyppisiä objekteja sisältävien tietokantojen yhdistämisen kustannustehokkaasti ja mielekkäästi Moniaineistoselailun ja suosittelun –Kalevalan tekstistä kuvien kautta maalarin elämänkertaan Paremmat hakutoiminnot –Historialliset paikat, Ontologinen tekstihaku Yhteyksien löytämisen ja visualisoinnin –Mitä yhteistä on Akseli Gallen-Kallelalla ja Napoleonilla? Aineiston jäsentelyn ja esitysten muodostamisen –Näyttely, aikajana, karttanäkymä Kaikki tämä ihmisen ymmärtämien merkitysten tasolla, kielestä riippumatta
Kulttuurisammon teknologia mahdollistaa: Eri toimijoiden eri tyyppisiä objekteja sisältävien tietokantojen yhdistämisen kustannustehokkaasti ja mielekkäästi Moniaineistoselailun ja suosittelun –Kalevalan tekstistä kuvien kautta maalarin elämänkertaanKalevalan tekstistä kuvien kautta maalarin elämänkertaan Paremmat hakutoiminnot –Historialliset paikat, Ontologinen tekstihaku Yhteyksien löytämisen ja visualisoinnin –Mitä yhteistä on Akseli Gallen-Kallelalla ja Napoleonilla? Aineiston jäsentelyn ja esitysten muodostamisen –Näyttely, aikajana, karttanäkymä Kaikki tämä ihmisen ymmärtämien merkitysten tasolla, kielestä riippumatta
Kulttuurisammon teknologia mahdollistaa: Eri toimijoiden eri tyyppisiä objekteja sisältävien tietokantojen yhdistämisen kustannustehokkaasti ja mielekkäästi Moniaineistoselailun ja suosittelun –Kalevalan tekstistä kuvien kautta maalarin elämänkertaan Paremmat hakutoiminnot –Historialliset paikat, Ontologinen tekstihaku Yhteyksien löytämisen ja visualisoinnin –Mitä yhteistä on Akseli Gallen-Kallelalla ja Napoleonilla? Aineiston jäsentelyn ja esitysten muodostamisen –Näyttely, aikajana, karttanäkymäNäyttely, aikajana, karttanäkymä Kaikki tämä ihmisen ymmärtämien merkitysten tasolla, kielestä riippumatta
25 Hyötyä myös koneille: Kulttuurisammon Web 2.0-arkkitehtuuri Kulttuurisammon sekä toiminnallisuus että käyttöliittymät on rakennettu yleisistä, uudelleenkäytettävistä palikoista Tästä johtuen lähes kaikki Kulttuurisammon toiminnallisuus on kenen tahansa omaan palveluun liitettävissä – – Tulevia käyttäjiä: Yleisten kirjastojen kaunokirjallisuusportaali Kirjasampo SmartMuseum EU-hanke
26
27 Apuvälineitä tiedon tuotantoon ja yhdistämiseen KOKO -ontologiainfrastruktuuri: yhteinen yläontologia YSO, tusina erikoisalalontologiaa Palveluja ontologoiden hajautettuun kehittämiseen ja käyttöön tiedon kuvailussa ja haussa Standardoitavia toiminta- ja kuvailutapoja Työkaluja valmiiden tietovarantojen muuttamiseen semanttisen webin muotoon
28 KOKO -ontologiainfrastruktuuri Yläontologia YSO (fi,sv,en) liittää yhteen erikoisalaontologiat, mm. –Museoalan ontologia MAO (fi) –Paikkaontologia SUO (fi,sv,saamet,en) –Ajallinen paikkaontologia SAPO (fi) –Toimijaontologia TOIMO (monikielinen) –Taideteollisen alan ontologia TAO (fi) –Valokuvausontologia VALO (fi) –Agriforest maa- ja metsätalousontologia AFO (fi,en) Muiden luokittelujärjestelmien liittäminen –YKL + HKLJ + YSO, Kaunokki + YSO, ICONCLASS + YSO Kansainväliset kytkökset: AAT, ULAN, TGN, WordNet, DBPedia,... Paljonko ontologiatyö vaatii aikaa ja rahaa? –Ennen YSOa: MASA → MAO ~30 käsitettä/päivä –YSO:n jälkeen: Agriforest → AFO ~ käsitettä/päivä Museoala n ontologia MAO (7000) Agrifores t Ontologia AFO (10 000)... Kansallinen yläontologia YSO ( käsitettä)...
29 ONKI-ontologiakirjastopalvelin Ei pelkästään keskitettyjä sanastoja, vaan myös jaettua toiminnallisuutta – Ontologioiden ja sanastojen selaus ja käsite/asiasanavalinta Sekä indeksoinnin että haun tarpeisiin Myös upotettuna omiin indeksointi- ja hakujärjestelmiin Oma SKOS-muodossa oleva sanasto käden käänteessä palvelimelle Pysyvää infrastuktuuria – Kansalliskirjasto korvaa VESA-sanastopalvelunsa ONKI-SKOS-YSA- palvelimella ja selvittää projektin kanssa pysyviä ylläpitokuvioita “Uusi ONKI-YSA, ONKI-ympäristön sanastot ja ontologiat sekä ONKI itsessään ovat tärkeitä kansallisia palveluita, joiden jatkuva kehittäminen on turvattava” – Tunnistettu myös Kansallinen digitaalinen kirjasto -hankkeessa “välttämättömäksi kansalliseksi palveluksi” Käytössä edellämainittujen lisäksi myös Kysy kirjastonhoitajalta-palvelussa
30
31
32 Kiitos Kulttuurisampo osoitteessa Lisätietoja osoitteesta Oma sähköpostiosoitteeni: