Sisällöistä konteksteihin – Kirjasampo ja semanttinen web Vaasan kaupunginkirjasto Eloseminaari sisällönkuvailusta Kaisa Hypén Kirjasampo-projekti Turun kaupunginkirjasto ja Kirjastot.fi
Esityksen aiheet: 1.Kirjasampo-hankkeen taustaa 2.Kaunokki-ontologia ja Kirjasampo-SAHA - uudet sisällönkuvailun ja tiedontallennuksen välineet 3.Semanttinen verkko
Kirjasampo-hankkeen taustaa Kuva: Ville Kettunen
Kaunokirjallisuuteen liittyviä tietopalvelukysymyksiä ”missä romaanissa on kuvaus Suurinkvisiittorista” ”Daniil Harmsin tyyppistä satiiria” ”runo yksinaruisesta keinusta” ”runo, josta asiakas muistaa ainoastaan ’yksinäisyys soittaa viuluaan’” ”romaaneja, joissa veisataan virsiä” ”romaaneja, joissa kuvataan työntekoa positiivisessa hengessä” ”amerikansuomalaisen kirjoittajan kirjoittama romaani, jossa käytetään hienoa amerikansuomea ja se on suht vanha, ehkä 1960-luvulta. Tekijän etunimi alkaa ehkä A- kirjaimella” ”turkin kielestä käännetty, turkkilaista surrealismia edustava teos, lienee kirjoitettu noin kolmekymmenluvulta, ruotsinnos tai suomennos” …
Kuva: Päivi Autere Ihmiskunnan muisti?
Kirjasampo – -kaunokirjallisuuteen keskittyvä, semanttisia tekniikoita hyödyntävä palvelu, joka on tiedonhaun apu yhteisöllinen foorumi uudenlainen käyttöliittymä kirjaston kokoelmiin Kirjasampo on osa opetusministeriön Arjen tietoyhteiskunta -ohjelmaa
- Semanttinen RDF-tietokanta - Kaunokirjallisuuden metadataskeema - FRBR-sovellus -Suomen- ja ruotsin- kielinen aikuisten kaunokirjallisuus Perustiedot: HelMet Aineiston kuvailu: - kuvailutietojen rikastaminen - suosittelut - hiljainen tieto - long tail Kirjastolaisten yhteisö Kirjasampo ”kirjallisuuden kotisivu” Lukijoiden yhteisö - monipuoliset haut - blogit - kirjallisuuskeskustelu - lukupiirit - … - tägit - arviot - esittelyt - omat hyllyt - suosittelut - tägit - arviot - esittelyt - omat hyllyt - suosittelut Kirjasampo- SAHA Uutuus- seuranta: BTJ Kulttuurisampo ”äly & moottorit & mylly” -semanttiset tekniikat, suosittelut -yhteydet digitaalisiin aineistoihin ja verkkopalveluihin
Toteutusaikataulu Esiselvitys 2007 – 2008 Sisällöt, toiminnot, toimintaedellytykset Tekniset ratkaisut Ideointiryhmä, yhteistyöverkosto Toteutusvaihe 2008 – 2011 Teosrekisteri Haku- ja käyttöliittymä Sisällönkuvailijoiden verkosto Osaksi yleisten kirjastojen tietoteknistä infrastruktuuria & kirjallisuusinstituutiota Beta-versio keväällä Ylläpito ja kehittäminen 2011 – Integrointi osaksi kirjastot.fi -palveluita Palvelulla täysipäiväinen päätoimittaja Tekninen tuki ja palvelinympäristö:
Kaunokki-ontologia ja Kirjasampo-SAHA uudet sisällönkuvailun ja tiedontallennuksen välineet
Ontologian määrittelyä ontologia fil. olevaisen perimmäistä olemusta tutkiva filosofian osa (Kielitoimiston sanakirja) käsite on omittu tietohallintaan ja tekoälytutkimukseen, ja sillä on useita, toisistaan poikkeavia määritelmiä tässä: tesauruslähtöinen, tietokoneohjelmistojen näkökulmasta kehitettyä sisällönkuvailujärjestelmää, joka kuvaa järjestelmän käsitteet järjestää käsitteiden väliset suhteet on verrattavissa tesauruksiin ja indeksointiin (muk. Eija Airio)
Asiasanasto / ontologia Asiasanastojen avulla tuotettu tieto edellyttää aina ihmisen tulkintaa. Asiasanaston termien analyysi, merkitysten ja keskinäisten suhteiden määrittely. Ontologian käsitteet yksilöidään urien avulla koneluettavuus linkitettävyys Asiasanastot ja tesaurukset kortistoajan sisällönkuvailuväline, ontologiat verkkomaailman Asiasanasto > ontologia:
Ontologiainfrastruktuuri Suomessa kehitetty FinnONTO -hankkeessa Ontologiat käytettävissä ONKI-palvelimella Tällä hetkellä palvelimella on 83 ontologiaa tai asiasanastoa Ontologiat integroitavissa sisällönkuvailu- ja hakuliittymiin Kirjasammossa käytössä olevat ontologiat: Kaunokki KOKO Lingvoj (kieli) Paikkaontologiat (12 milj. paikkaa) > karttasovellukset Aikaontologia > aikajanat Kansallisuusontologia Ontologiat yhdistetty tiedontallennusalustan kuvailukenttiin
Mikä Kaunokki? Fiktiivisen aineiston asiasanasto, n termiä Kaikki kirjallisuudenlajit & elokuvat, aikuiset & lapset Noudatettu YSAn periaatteita ja rakennetta – YSAa käytetty Kaunokin ohella kaunokirjallisuuden sisällönkuvailuun Fasetit: genre, teema, aika, paikka, toimija Ruotsinkielinen versio Bella Ylläpito ja kehittäminen Helsingin kaupunginkirjastossa Taustalla Jarmo Saartin väitös Kaunokirjallisuuden sisällönkuvailun aspektit (Oulun yliopisto 1999) Kaunokirjallisuuden luonne – teos omalakisensa taideluomus, kielen eri tasot > monitulkintaisuus Kirjallisuuden aiheena voi olla mikä vain, sen käsittelytapa yksilöllinen > haasteita sanastoille! Kaunokirjallisuuden sisällönkuvailun luonne – ”aboutness” Mitä saa kertoa, kuinka paljon paljastaa – tiedonhaun tarpeet
Kokeilupainos v Verkko-Kaunokki v Kaunokki-ontologia v vars. painos v. 2000
Kaunokki-ontologia Ontologisointi osana Kirjasampo–projektia, Katri Seppälän (TKK) ohjaus Käsiteanalyysi, käsitteiden määritelmät ja niiden väliset suhteet ja hierarkiat, ripustus YSO:an. Kaunokki-ontologia = yhdistelmäontologia, jossa mukana Kaunokin ja YSA:n termit ontologisoituna. Integroitu annotointiohjelmaan > helppo poimia Termin kontekstitiedot esiin > nähdään määritelmä, lähikäsitteet Kieliriippumattomuus > sisällönkuvailu tehdään vain kerran suomeksi tai ruotsiksi, voidaan esittää jommallakummalla kielellä Sisällöllisesti asiasanastot ja ontologia pyritään pitämään mahdollisimman identtisinä.
Mikä SAHA3? Selainpohjainen annotointi- eli dokumenttien kuvailujärjestelmä Sovellus käyttäjille, jotka eivät tunne semanttisen webin tekniikoita eivätkä annotointiin liittyviä erityiskäsitteitä Jaettavissa useiden käyttäjien kesken Toimii web-palvelimella, ei edellytä asennuksia omalle työasemalle Toteutettu Semanttisen laskennan tutkimusyksikössä (SeCo), Aalto-yliopisto Dublin Core Erilaisia ”sahoja”, räätälöitävyys tallennettavan tiedon ja sen käytön ja tarpeiden perusteella Kirjasampo-SAHA: huomio fiktiivisen aineiston kuvailun erityispiirteisiin SAHA<3
Semanttinen verkko "Semantic web is so difficult to explain to people who are used to the Web. Before the Web, it was so difficult to explain to people what the Web was all about." - Tim Berners-Lee
Semanttinen web… Tavoitteena luoda internetiin metadatakerros, jonka avulla sen sisältöjä voidaan tunnistaa ja käsitellä koneellisesti aiempaa tehokkaammin Semanttinen verkko, jossa dataa prosessoidaan monipuolisemmin Tiedon kontekstualisointi, metadatan monipuolinen käyttö eri yhteyksissä – koneluettavuus ja linkitettävyys Ontologioilla tässä keskeinen rooli: mm. niiden avulla kerrotaan, mitä sisältöjä missäkin on
…ja Open Linked Data From semantic web to web of data Avoin data, tiedon yhdistely Libris Richard Talis libraries-ifla-2010http:// libraries-ifla-2010 Suomessa julkishallinnon tietoarkkitehtuurin tavoitteita: Semanttisen webin, linkitetyn avoimen datan, paikkatietoinfrastruktuurin mahdollisuuksien yhteinen hyödyntäminen ja kehittäminen Semanttinen yhteen toimivuus (tietojärjestelmä pystyy yhdistämään ja käsittelemään eri lähteistä saamaansa tietoa niin, että merkitys säilyy ja etsitty tieto löytyy) Anne Kauhanen-Simanainen:
How RDF(S) solves problems of XML and Literal Values? <artifact:artifact rdf:about=”&artifact;NBA_H26069_467” artifact:target_literal="cup and plate" artifact:material_literal="porcelain” artifact:creator_literal="Meissen” artifact:creationLocation_literal=”Germany”> NBA_H26069_467 loc:Germany cups creationLocation loc:Europe loc:partOf rdfs:subclassOf vessels target plates rdfs:subclassOf... Find all vessels? Find all ceramic products? Find artifacts manufactured in Europe? Does the city of Meissen manufacture ceramics? Linkeddata.org
ja kaunokirjallisuus Kaunokirjallisuus testiaineistona Kulttuurisammossa: mitä kirjallisuutta tiettyyn aiheeseen / paikkaan / henkilöön / kirjallisuudenlajiin liittyy, mitkä teokset ovat "samankaltaisia" toistensa kanssa, keiden kirjailijoiden tuotanto liittyy jollakin tavoin toisiinsa semanttiset suosittelut, temaattiset yhteydet toimivat tulokset rohkaisevia ja innostavia
Lemminkäinen ja Sata naista
Tiedontallennus 2.0? Modernit verkkotekniikat + kirjastojen perinteinen tiedonhallinnan osaaminen = tiedontallennus 2.0 Kortistoista verkon dynamiikkaan: tiedon linkittäminen, prosessointi ja aktiivinen tarjoaminen Ontologiat: kytketään yhteen verkon palveluita ja sisältöjä Monipuolisempi metadata – metadatan monipuolisempi käyttö Esineen kuvailusta sisältöjen kuvailuun Kirjaston tuottama metatieto uusissa yhteyksissä: muistiorganisaatioiden portaalit, oppimisympäristöt, matkailu- ja paikkatietopalvelut, mobiiliversiot… Viitetiedon ilmaisuvoima semanttisessa verkossa Enemmän ja parempia sisältöjä!
Content king no longer - Context is! Lise Vandborg, Project Manager, Litteratursiden.dk
Kuva: Päivi Autere Kiitos! Lue lisää: > Kirjasampo Kysy lisää: