Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

Sanastosta ontologiaksi

Samankaltaiset esitykset


Esitys aiheesta: "Sanastosta ontologiaksi"— Esityksen transkriptio:

1 Sanastosta ontologiaksi
mikä muuttuu? Seinäjoen kaupunginkirjasto-maakuntakirjasto Kaisa Hypén

2 Ontologian määrittelyä
ontologia fil. olevaisen perimmäistä olemusta tutkiva filosofian osa (Kielitoimiston sanakirja) käsite on omittu tietohallintaan ja tekoälytutkimukseen, ja sillä on useita, toisistaan poikkeavia määritelmiä ontologioilla keskeinen asema semanttisessa webissä tässä: tesauruslähtöinen, tietokoneohjelmistojen näkökulmasta kehitettyä sisällönkuvailujärjestelmää, joka kuvaa mikromaailman käsitteet / oliot järjestää käsitteiden väliset suhteet on formaali, eksplisiittinen ja yhdenmukainen on verrattavissa tesauruksiin ja indeksointiin Eija Airio

3 Käsitteiden väliset suhteet kuvataan loogisella,
myös tietokoneen "ymmärtämällä" tavalla. Funktio- eli assosiatiivinen suhde Koostumussuhde Hierarkkinen suhde Katri Seppälä: Käsiteanalyysi ontologiatyössä

4 Asiasanasto / ontologia
Asiasanastojen avulla tuotettu tieto edellyttää aina ihmisen tulkintaa. Asiasanasto > ontologia: Asiasanaston termien analyysi, merkitysten ja keskinäisten suhteiden määrittely. Ontologian käsitteet yksilöidään urien avulla koneluettavuus linkitettävyys

5

6

7 Kaunokin ontologisointi
Osa Kirjasampo –projektia Turun kaupunginkirjastossa, TKK:n ohjaus. Protégé-ontologisointiohjelma. Käsiteanalyysi, käsitteiden väliset suhteet ja hierarkiat, ripustus YSO:an. Lisätään Kaunokin sisäistä hierarkkisuutta ja käsitteiden määritelmiä (esim. genret). Kaunokin fasetit huomioitu ontologiassa. Kaunokki-ontologia = yhdistelmäontologia, jossa mukana Kaunokin ja YSA:n termit ontologisoituna. Sisällöllisesti asiasanasto ja ontologia pyritään pitämään mahdollisimman identtisinä. käytettävissä ONKI-palvelimella

8 Esimerkki 1: Kaunokin käsitteiden tarkempi määrittely
Kaunokki Määritelmä Kaunokki-ontologia ihminen ∟alkuihminen biol. ihmisen kehityshistorian varhainen muoto (Kielitoimiston sanakirja) eläimet taksonin mukaan (YSO) ∟ihminen ∟yli-ihminen kyvyiltään t. persoonallisuudeltaan tavanomaiset mitat ylittävä ihminen (joka katsoo olevansa tavanomaisen moraalin yläpuolella); ihminen jolla ei ole inhimillisiä heikkouksia (Kielitoimiston sanakirja) kulttuuriset tuotokset (YSO) nuoruus ∟ ikuinen nuoruus ∟ikäkaudet (YSO) ∟nuoruus ∟ikuinen nuoruus

9 Esimerkki 2: yhdistäminen YSO:an
Kirjallisuus, YSOssa eritelty käsite Kirjallisuus taidelajina Kirjalliset teokset Kirjallisuus erikoisalana Kaunokki-ontologiassa noudatetaan YSOn logiikkaa, osittain eri kuin Kaunokissa Kaunokki Kaunokki-ontologia Lastenkirjallisuus ∟Lastenrunot Kirjallisuus taidelajina ∟Kirjallisuus kohderyhmän mukaan ∟Lastenkirjallisuus Kirjalliset teokset ∟Lastenkirjat ∟Runot

10 Esimerkki 3: lisämerkityksiä YSO:ssa oleville käsitteille
Lisämerkitys mm. näille YSO:n käsitteille: Termi YSO Kaunokki-ontologia Ellipsi Geometriset kuviot Kielellinen ilmiö, ”sananheitto” Dekadenssi Muutos, rappeutuminen Ranskalainen kirjallisuuden ja taiteen suuntaus 1880-luvulla Nonsense Kirjallisuuden tyyli Lyriikan laji Luuranko KT luusto, ruumiinosat Fiktiivinen henkilö

11 Kaunokin myötä yhdistelmäontologioihin tulee runsaasti lisää
termejä erityisesti luokkiin kulttuuriset ilmiöt kulttuuriset tuotokset mentaaliset ilmiöt keskinäinen toiminta sisäiset ja ulkoiset ominaisuudet

12 Summa summarum Pohjana sanasto, jonka termistö esitetään uudella tavalla Uusi tapa ja menetelmä hahmottaa sanaston kokonaisuutta Ontologiarakenne myös sanaston sisällöllisen kehittämisen työväline Asiasanastot ja tesaurukset kortistoajan sisällönkuvailuväline, ontologiat verkkomaailman Sanastot muodostavat hyvän lähtökohdan ontologioille, ontologiat kehittävät osaamista edelleen

13 Ontologiainfrastruktuuri, perusta luotu FinnONTO-hankkeessa (TKK) 2003-2007
KOKO YSO KAUNOKKI AFO MAO VALO TAO Ontologisointi tehty osana Kirjasampo-projektia. Julkistus syyskuussa 2009. ... ... Ontologiat käytettävissä ONKI-palvelimella

14 Miksi kirjastoissa pitäisi tietää semanttisesta webistä ja ontologioista?
Semanttinen web vahvistuu vähitellen? Ontologiat vaikuttavat sisällönkuvailutyön käytäntöihin Uudella tavalla tuotettu metadata on käytettävissä monipuolisemmin – kirjastot osaksi semanttista verkkoa? Semanttinen verkko, jossa tietoja prosessoidaan aiempaa tehokkaammin Mikä vahvistaa kirjaston roolia verkossa, auttaa myös fyysisessä kirjastossa

15 Entäpä sitten käytännössä?
Mikä Saha?

16 Muumimamman meditatiivinen Saha?
Äiti sahasi sahaamistaan lempeässä harmaassa ilmassa, hän mittasi pölkyt täsmälleen yhtä pitkiksi ja järjesti ne sievästi kaareksi ympärilleen. Puumuuri kasvoi yhä korkeammaksi, ja lopulta äiti sahasi pienessä tilassa, joka antoi hänelle erinomaisen turvallisuuden tunteen… Jakaranda ja palisanteri, mutisi äiti hartaan tyytyväisenä ja jatkoi sahaamistaan. … Toiset olivat tottuneet sahaavaan äitiin, jota näkyi yhä vähemmän puupinon takaa… Lopulta pino tuli niin korkeaksi, että äidistä näkyivät vain korvat. Mutta hän vain sahasi sahaamistaan, ja joka aamu hän kulki ympäri saaren ja kokosi uusia laudanpätkiä. Tove Jansson: Muumipappa ja meri. Suom. Laila Järvinen.

17 … vai tällainen…

18 Sittenkin tällainen: SAHA3
Selainpohjainen annotaatiojärjestelmä Sovellus käyttäjille, jotka eivät tunne semanttisen webin tekniikoita eivätkä annotointiin liittyviä erityiskäsitteitä Jaettavissa useiden käyttäjien kesken Toimii tietokoneen sijasta web-palvelimella (Valkeapää 2006, 35)

19 Kaunokki-Saha Semanttisen laskennan tutkimusyksikön kehittämä annotaatioeditori Annotointi = kuvailusta käytetty termi semanttisessa webissä Lähtökohtana kaunokirjallisuuden erityispiirteet Erityistä huomiota Sisällönkuvailuun Osakohteiden tallennukseen Teosten välisten yhteyksien esilletuomiseen Funktionaalisen luetteloinnin piirteitä Kukin teos yhtenä tietueena Kieliversiot Mukana myös kirjailijoihin liittyvää tietoa Kehittyneemmät ja monipuolisemmat hakuehdot Kun tallennetaan yhden teoksen tietoja, täydennetään samalla semanttista verkkoa

20 Sisällönkuvailu Kaunokki-Sahaan
Kaunokki-ontologia integroitu Kaunokki-Sahaan sisällönkuvailutermejä ei tarvitse etsiä erillisistä selaimista käytettävissä YSOn ja Kaunokin käsitteet sisällönkuvailu tehdään vain yhdellä kielellä, voidaan näyttää käyttöliittymässä/Sahassa halutulla kielellä (Kaunokki-ontologia: suomi, ruotsi, YSO: suomi, ruotsi, englanti) Sisällönkuvailutyön perusteet eivät muutu, tiedontallennuksen ja –esittämisen välineet kyllä Lukijat mukaan sisällönkuvailutyöhön?

21 Abstrakti ja fyysinen teos Sahassa
Abstrakti teos - kuvaillaan sitä, mikä on yhteistä kaikenkielisille ja eri formaateissa julkaistuille versioille Sisällönkuvailu Päävastuullinen tekijä Fyysinen teos – kuvaillaan sitä, mikä liittyy kyseiseen kirjaan Kirjaan liittyvät tekijät (kääntäjä, toimittaja, kuvittaja…) Ulkoasu (sivumäärä, kansi…) Julkaisuhistoria (kieli, kustantaja, ilmestymisaika…) Ohje:

22 Mitä kirjastoilta toivotaan? Miten kirjastot hyötyvät?
Kaunokki-Sahassa suomenkielisen kaunokirjallisuuden perustiedot Tarvitaan yhteistyötä vanhemman kaunokirjallisuuden sisällönkuvailuun Kirjastot rakentavat yhdessä kaunokirjallisuuden tiedonhaun välinettä Voimat yhdistämällä ja keskittämällä parempia tuloksia Miten yhdessä tuotettu metadata on integroitavissa esim. kirjastojärjestelmiin?

23 Kauno- kirjallisuuden sisällönkuvailu
Seinäjoki Kaisa Hypén

24 Kirjastonhoitaja Jouko Raivion kirjaston kaunokirjallisuutta käyttävien asiakkaiden tyypittely (1990) tekijäorientoituneet: etsivät tietyn kirjailijan tuotantoa apuna kokoelmatietokanta, tekijän mukaan järjestetyt kokoelmat lajiorientoituneet: etsivät tiettyyn lajityyppiin kuuluvaa kirjallisuutta apuna kokoelmatietokanta, jos kirjallisuutta on asiasanoitettu apuna hyllyryhmittely, jos se on kirjastossa käytössä aiheorientoituneet: etsivät kirjallisuutta tietystä aiheesta apuna kirjaston henkilökunta, erilaiset hakemistot Näiden lisäksi erilaiset samoojat, etsijät, vanhoja lukukokemuksia kaipaavat, löytöjen tekijät, palautushyllyjen selaajat.

25 Kaunokirjallisuuteen liittyviä tietopalvelukysymyksiä
”missä romaanissa on kuvaus Suurinkvisiittorista” ”Daniil Harmsin tyyppistä satiiria” ”runo yksinaruisesta keinusta” ”runo, josta asiakas muistaa ainoastaan ’yksinäisyys soittaa viuluaan’” ”romaaneja, joissa veisataan virsiä” ”romaaneja, joissa kuvataan työntekoa positiivisessa hengessä” ”amerikansuomalaisen kirjoittajan kirjoittama romaani, jossa käytetään hienoa amerikansuomea ja se on suht vanha, ehkä 1960-luvulta. Tekijän etunimi alkaa ehkä A-kirjaimella” ”turkin kielestä käännetty, turkkilaista surrealismia edustava teos, lienee kirjoitettu noin kolmekymmenluvulta, ruotsinnos tai suomennos”

26 Kaunokirjallisuuden indeksoinnin perusteista
Jarmo Saarti: Kaunokirjallisuuden sisällönkuvailun aspektit: kirjastoammattilaisten ja kirjastonkäyttäjien tekemien romaanien tiivistelmien ja asiasanoitusten yhdenmukaisuus. Väitöskirja, Oulun yliopisto 1999. kirjallisuuden monitulkintaisuus, oman tulkinnan osuuden tunnistaminen vaatii asiantuntemusta, yleissivistystä, genrejen sisäisten konventioiden tuntemusta ns. genre-kirjallisuuden asiasanoitus: genren konventiot ohjaavat lukutapaa ns. avoin (”laatu”) kirjallisuus: avoin useammille tulkinnoille

27 Mikä Kaunokki? Fiktiivisen aineiston asiasanasto, n. 4 500 termiä
Kokeilupainos v. 1996, varsinainen asiasanasto v. 2000, verkkoversio v. 2007 Perustana Jarmo Saartin väitöskirja ja sisällönkuvailutyö Kajaanin kaupunginkirjastossa Kattaa kaikki kirjallisuudenlajit, aikuisten ja lasten kirjallisuuden, elokuvat Mukana jonkin verran kirjallisuudentutkimukseen liittyviä termejä Noudatettu YSAn periaatteita ja rakennetta Ruotsinkielinen versio Bella Ylläpito ja kehittäminen Helsingin kaupunginkirjastossa, Kaunokki-työryhmä

28 Kaunokin erityisyydestä
Kaunokirjallisuuden luonne – teos omalakisensa taideluomus, kielen eri tasot (metaforisuus, konnotaatiot, vertaukset) > monitulkintaisuus ”[Kirjallisuuden kieli] on aina ihmisenä olemista koskevan perustiedon kieltä.” (Rikama, 2007) Kirjallisuuden aiheena voi olla mikä vain, sen käsittelytapa yksilöllinen > haasteita sanastoille! Kohderyhmän vaikutus: lasten- ja aikuistenkirjallisuus Kaunokirjallisuuden sisällönkuvailun luonne – ”aboutness”

29 Kaunokin fasetit Genre, laji, tyyli Teema Henkilö, toimija
Paikka, miljöö Aika Muut

30 Genrestä (1) genre ~ kirjallisuudenlaji, -luokka
genrejä satoja, uusia syntyy jatkuvasti Kaunokissa n. 600 genreä, liittyvät niin kirjan muotoon (novellit) kuin sisältöön (filosofiset romaanit) ”genrekirjallisuus” ~ viihdekirjallisuus (esim. dekkarit, naisten viihdekirjallisuus): ”ajanvietteeksi tarkoitettu kaunokirjallisuus, jolla ei ole kunnianhimoisia taiteellisia tavoitteita” (Otavan kirjallisuustieto 1990). Pyrkii noudattamaan genren vakiintuneita piirteitä, vastaamaan lukijan odotuksiin. genrellä tärkeä merkitys teoksen markkinoinnissa, ja se ohjaa myös lukijan odotuksia, valintoja ja lukutapaa

31 Genrestä (2) genre kuvaa kokoavasti sitä, miten teoksessa käsitellään aiheita ja teemoja, mikä teoksen näkökulma kuvaamiinsa asioihin teoksessa käytetyt kerronnan keinot, mikä teoksen tyyli on esim. sairaus motiivina dekkarissa tai elämäkerrallisessa romaanissa. kaikkia nimekkeitä ei voi määritellä kuuluvaksi johonkin genreen - on romaaneja, joille voi luontevasti antaa useitakin genrejä kaunokirjallisuuden hyllyryhmittely perustuu genreille

32 Muut fasetit (1) aiheet, teemat, motiivit henkilöt, toimijat
”aboutness”: mistä kirjassa on kyse liittyy usein tarinaan, juoneen vältettävä liikaa tulkintaa keskeisimmät teemat, aiheet ja motiivit, myös sivuteemat, jos käsitelty aihe harvinainen poimitaan ontologiasta henkilöt, toimijat teoksen keskeiset toimijat ihmiset, eläimet, taruolennot, kyborgit… - poimitaan ontologiasta tai luodaan uusi, erityisesti nimetyt päähenkilöt miljööt, tapahtumapaikat todelliset, tunnistettavat paikat (maat, kaupungit, kylät) fiktiiviset paikat (myyttien, tarujen paikat, avaruus…) poimitaan ontologiasta (Kaunokki, paikkaontologia) tai luodaan uusi tapahtumapaikat kannattaa indeksoida tarkasti, jos ne käyvät tekstistä ilmi

33 Muut fasetit (2) tapahtuma-aika muut kuvattavat seikat
tarkka aika (vuodet, päivä…) ”sumea aika” (kesä, yö…) – poimitaan ontologiasta muut kuvattavat seikat esim. palkinnoille ja sovituksille Sahassa omat kentät tähän kenttään on mahdollista tallentaa oma asiasana, jos ontologiasta ei löydy (harkintaa!) asiasanayhdistelmät eli ketjut toisiinsa liittyvät asiasanat, jotka eivät ole ontologiassa toistensa ylä- tai alakäsitteitä esim. symboliikka : kivet kuvaus suorasanainen kuvaus teoksesta (esim. oma tiivistelmä, takakansiteksti, poiminta kritiikistä… lähde mainittava)

34 Indeksoinnista vielä yksityiskohtaisemmat ohjeet ks. Kaunokki s. 6-18
Kaunokin / Bellan lisäksi käytetty YSA Yleinen suomalainen asiasanasto ja Allärs Allmän tesaurus på svenska indeksointi on aina subjektiivista, yksi näkemys teoksen sisältöön erilaiset indeksoinnit samasta teoksesta, valitut asiasanat osattava perustella yhtä ainoaa ”oikeaa” sisällönkuvailua ei ole! Kirjasampo-Sahan pelisäännöt? uusi, yhteisöllinen toimintatapa erilaiset näkemykset, kompromissit, yhteisesti sovittavat käytännöt

35 Ja ei kun testaamaan…


Lataa ppt "Sanastosta ontologiaksi"

Samankaltaiset esitykset


Iklan oleh Google