Metatieto ja HTML-dokumentit Markus Virkkala Esa Kaihlanen TJTD63 - Semanttinen Web - 4/2002.

Slides:



Advertisements
Samankaltaiset esitykset
Kokoelmien kuvailun formaatteja ja standardeja Marit Olander Helsingin yliopiston kirjasto
Advertisements

Monimediaista sisältöä verkkokursseille ideoita sisällöntuotantoon Kajaani Terho Kontioinen Joensuun yliopisto.
Arvioitavat kohdat Nielsenin mukaan – heuristinen lista
Wikispace jatkokurssi Jarmo Heikkinen Karoliina Kemppainen Satu Kylmänen.
Tiedonhallinnan näkökulma valokuvien digitoinnin suunnitteluun Originaalin vähimmäistiedot, jälkituotannon tiedot ja metadata Anne Isomursu Suomen valokuvataiteen.
Active directory.
© 2010 IBM Corporation1 Bannerikaruselli  Bannerikaruselli on sisällönhallinnan komponentti, jolla voidaan laittaa www-sivulla haluttuun kohtaan näkymään.
JavaScript oliot © Reiska, DOM Oliot  JavaScript sisältää paljon valmiita DOM olioita, on sisältänyt jo DOM level 0 (ns. Legacy DOM) alkaen  WWW-ympäristössä.
JavaScript (c) Irja & Reino Aarinen, 2007
IST Julkaisuarkistojen yhteentoimivuus – standardit ja suosituksia Rita Voigt Teknillisen korkeakoulun kirjasto ja OA-JES Julkaisupäivä –
Dublin Core – formaatti ja sen soveltaminen Tietoa tiedosta – Tietoa metatiedosta Juha Hakala
Julkaisukielet ja - tekniikat tMyn1 Julkaisukielet ja -tekniikat •Verkko-ohjelmointi voidaan jakaa kahteen osaan: asiakaspuolen ja palvelinpuolen ohjelmointiin.
Oppimisaihiot ja standardointi Harto Pönkä,
Erik Fallenius Kevät  Taustaa ◦ Ontologiat  Tavoitteet  Teknologiat ◦ Dojo/AJAX ◦ JSON ◦ SOAP  Projektin kulku  Lopputulos – demo.
W w w. h a m k. f i Wiki koulutus Leenakaija Lehto
EXtensible Markup Language
Oppimateriaalien metadata Metadatapäivä Mikael Vakkari HY / Kirjastopalvelujen koordinointiyksikkö.
Hajautettu toiminnan suunnittelu webissä Markku Syrjänen Teknillinen korkeakoulu.
HAKUKONEOPTIMOINTI Jaakko Rautiainen. Aihealue Hakukoneiden toiminta Web-sivun optimointi.
OHJELMAN OSITTAMINEN LUOKKA ATTRIBUUTIT METODIT. LUOKKA JAVA ohjelma koostuu luokista LUOKKA sisältää metodeja molemmat sisältävät attribuutteja eli muuttujia.
Metatieto on tietoa tiedosta, sen avulla voidaan kertoa:  Sisällön alkuperästä  Sisällön käyttötarkoituksesta  Sisällön muutoksista  Sisällön sijainnista.
1 WWW-lomakkeet Sähköisen liiketoiminnan tärkeä elementti.
CSS ja sen sovellukset Vesa Jussila. Esitys  Yleistä –Historia –Etuja ja huonoja puolia –Mediatyypit  Käyttö –Laatikkomalli –CSS-taitto –Sovelluksia.
URI Universal Resource Identifier Matti BrockmanMatti Brockman, , TKTLTKTL.
Resource Description Framework
WLAN Langaton verkkoyhteys
XML -kielen perusteet SIMO Seminaari Antti Mäkinen.
MARC Helsinki Kuopio Tampere Oulu Turku Ulla Ikäheimo & Arne Hedman.
Aineiston siirto Open Journal Systems -järjestelmään.
Cmap-tools opetus käyttö kongnitiivinen merkitys.
Finnan kansallisen näkymän palvelukonsepti
Web 2.0 tiivistetysti 1. Ohjelmistoalusta on Web. Webtop korvaa Desktopin. Keskeistä yhteisöllisyys ja ”Software as a Service”. 2. Kollektiivisen älyn.
Koodistopalvelu. Mikä? Palvelu, jonka avulla koodistoja voidaan jakaa ja hallinnoida keskitetysti. Perustuu JHS-työryhmän suositusluonnokseen ja sen yhteydessä.
XML Namespaces 1 XML Namespaces provide a method to avoid element name conflicts –name conflict will occur when two different documents use the same element.
Tiedonhaku Tiedonhankinta Tiedonhallinta Äidinkielen opetus 2.0.
Lomakkeet © Reiska, Lomakkeet Varsinkin Web-sovelluksia ajetaan täyttämällä sivulla lomake ja lähettämällä tiedot palvelimella olevan Web-sovelluksen.
XHTML-perusteita Teppo Räisänen
Mikromoduuli Projekti. Mikromoduulit? Pieniä tietopaketteja Pieniä tietopaketteja Helposti omaksuttavia ja tiiviitä kokonaisuuksia Helposti omaksuttavia.
1 Airi Salminen digitaalisen median professori Jyväskylän yliopisto Tietojenkäsittelytieteiden laitos Tutkimusalueita: rakenteiset.
XML/DTD – osa 3 Teppo Räisänen
DTD Teppo Räisänen Liiketalouden yksikkö.
Opiskelun ja opetuksen viitearkkitehtuuri
Tutkimusaineistojen metadata ”Tietoa tiedosta - Tietoa metatiedosta” Tilastokeskus Mari Kleemola.
Verkkomateriaalin tuotanto - Teemu Kerola Teemu Kerola Interaktiivisen verkkomateriaalin tuotantoprosessi TKTL:llä (IVT) Taustoja Interaktiivinen.
Kehykset 1. KEHYKSET: rakenne 2. Frameset 3. Esimerkki: cols 4. Cols: mittayksiköt 5. Cols: mittayksiköt 6. Cols: esimerkki 7. Rows-mittayksiköt 8. Rows-esimerkki.
Resurssirekisteri – Haka-metatiedon hallintatyökalu
CSS – osa 1 Teppo Räisänen
XML Schema Teppo Räisänen Liiketalouden yksikkö.
XML – osa 2 Teppo Räisänen
Metadata editor - rakenteen luonnos 1. TEHTÄVÄ 1) Järjestelmä lukee xml-dokumentin ja xml- skeeman sekä tarkistaa niiden validiuden 2) Järjestelmä lukee.
XSL Teppo Räisänen
XSL Teppo Räisänen
DTD rakenne ELEMENT elementtien määrittely ATTLISTattribuuttien määrittely ENTITYentiteettien määrittely NOTATIONnotaatioiden määrittely.
XML Skeema Määritellään XML:llä Vältetään suurinosa DTD:n puutteista. Datatyypit (string, boolean,...) Voidaan asettaa rajoitteita datatyypeille (minLength,
SharePoint2010 ATK-seminaari Totti Nykvist.
SYKEn metatietopalvelu Kaisu Harju Suomen ympäristökeskus SYKE VM Metatietotyöpaja
Tyylitiedosto html-koodin apuna
Kuvailevan metadatan standardeista
Mukaan Finnaan - liittymisprosessin vaiheet
Mukaan Finnaan - liittymisprosessin vaiheet
Oikeuksien hallintaan liittyvät metatiedot
Kuvailusäännöt, formaatti ja kirjastojärjestelmä
Datan metadata - mitä metadata on ja miksi sellaista tarvitaan?
WWW-Sisällönhallintaohjelmat
Teppo Räisänen CSS – osa 1 Teppo Räisänen
OHJELMOINTITAITO ICT02D 12 ECTS.
DATAN JA AINEISTOJEN AVAAMINEN FINNAN AVULLA
Teppo Räisänen CSS – osa 2 Teppo Räisänen
Datan ja aineistojen avaaminen Finnan avulla
Pitkäaikaissäilytyksen metatiedot
Esityksen transkriptio:

Metatieto ja HTML-dokumentit Markus Virkkala Esa Kaihlanen TJTD63 - Semanttinen Web - 4/2002

Metatieto ja HTML-dokumentit Mitä on metatieto? Metatiedon tuottaminen Metatieto ja HTML Metatietostandardit ja formaatit Hyötyjä Ongelmia

Mitä on metatieto? Metatieto on tietoa tiedosta, sen avulla voidaan kertoa esimerkiksi: - Sisällön alkuperästä - Sisällön käyttötarkoituksesta - Sisällön muutoksista - Sisällön sijainnista

Metatiedon tuottaminen Metatieto voidaan tuottaa: - Automaattisesti - Dokumenttien ominaisuustiedoista - Dokumentin sisällöstä rakenteisuutta hyödyntäen - Sisällönhallintajärjestelmistä - Työkaluohjelmat (HTML-editorit) - Manuaalisesti - Kaikki itse kirjoitettu lisätieto, jota dokumenttiin halutaan liittää. - Tarpeen aina, kun automaattinen tuotto ei ole mahdollista, tai se on epätäydellistä.

Metatieto ja HTML-sivustot Metatietoa käytetään HTML-dokumenteissa: - Helpottamaan relevanttien hakutulosten saamista - avainsanat - kielikoodit - aikaleimat - Välittämään lisätietoa dokumentista (tekijä, aika, jne.), - Voi sisältää muutakin informaatiota: - ohjaa hakukoneita esim. kieltämällä dokumentin indeksoinnin

Metatieto ja HTML-sivustot Metatiedon liittämiseen on kaksi tapaa: - Upottaa metatieto itse dokumenttiin - Varastoida metatieto ulkoisesti, erilleen dokumentista Metatieto voi myös olla: - Hajautettuna yksittäisiin dokumenttiin - Keskitettynä “metatietopankkiin” erilleen dokumenteista

Metatieto ja HTML-sivustot Metatiedon upottaminen HTML dokumenttiin 1/3: - Sijoitetaan -elementin sisään, -tagin sisään: - Kaksi pää-attribuuttia: name, content - Vaihtoehtoinen ‘scheme’ -attribuutti määrittää esitysmuodon: scheme=”päivä-kuukausi-vuosi” - Meta-attribuutit ovat käyttäjän vapaasti määriteltävissä

Metatieto ja HTML-sivustot Metatiedon upottaminen dokumenttiin 2/3: - Content -attribuutti voi sisältää tekstiä, tai entiteettejä. - Entiteettejä voivat olla mm. &copy, &alpha - HTML-tageja ei saa käyttää - Robotit hakukoneita varten: - - index, noindex, follow, all, none

Metatieto ja HTML-sivustot Metatiedon upottaminen HTML dokumenttiin 3/3: - Kansainvälisyysattribuutit - &Lang, &Dir - Name-attribuutti voidaan korvata HTTP-EQUIV -attribuutilla -

Metatieto ja HTML-sivustot Ulkoinen metatieto: - Metatieto sijaitsee erillisessä dokumentissa tai metatietokannassa - Erillinen dokumentti voi olla esimerkiksi XML-muotoinen - Ainoa keino lisätä metatietoa webin ulkopuolisista asioista - Voi koskea myös dokumenttijoukkoa - Viitataan resurssiin esim. URI:n avulla (RDF) Esimerkki

Metatieto multimediassa Multimedia-metatiedot jaetaan kolmeen luokkaan: - Mediakohtainen metatieto - Median käsittelyyn liittyvä metatieto - Sisältöön liittyvä metatieto

Metatietostandardit / formaatit Metatietostandardeja ja formaatteja: - MARC (USMARC, CANMARC, MARC21, FINMARC) - IEEE LOM - Dublin Core - PICS - RFD - XML - XTM (TopicMaps) - Ohjaavat kehitystä ja yhtenäistävät metadatan esitystapoja

Metatietostandardit / formaatit - MARC - Lyhenne sanoista “Machine Readable Cataloging” - Kehitetty alunperin 30v sitten Yhdysvaltain kongressin kirjaston käyttöön - Tavoitteena luoda mekanismi, jonka avulla tietokoneet pystyisivät vaihtamaan, käyttämään ja tulkitsemaan bibliografista informaatiota. - Suomalaistettu versio FINMARC MARC - esimerkki

Metatietostandardit / formaatit - IEEE LOM - IEEE:n määrittelemä standardi opetus- ja koulutus- materiaalien metadatan esittämiseen (Learning Objects Metadata) (ei vielä valmis) - Tavoitteena auttaa sekä opiskelijoita, että opettajia löytämään, arvioimaan, hankkimaan ja hyödyntäämän erilaisia opetuskäyttöön suunniteltuja resursseja. - Ei suunniteltu suoraan HTML- käyttöön, mutta mahdollisesti hyödynnettävissä verkkopohjaisissa opetusympäristöissä. Lisätietoja

Metatietostandardit / formaatit - Dublin Core 1/2 - DCMI eli Dublin Core Metadata Initiative - Suunniteltu kuvaamaan WWW-resursseja - Koostuu 15 elementistä - Perustuu pitkälti kirjastomaailmaan - Ei välttämättä sovellu kaikille WWW-dokumenteille - Ehkä tunnetuin metadataformaatti

Metatietostandardit / formaatit - Dublin Core 2/2 - Liitetään HTML dokumenttiin osioon, -tagien sisään Tie Unelmiin - Väinö Mattila <link rel = "schema.DC" href = " <meta name = "DC.Title" content = ”Tie Unelmiin"> <meta name = "DC.Creator" content = ”Mattila,, Väinö Juhani"> <meta name = "DC.Type" content = ”Kaunokirjallisuus"> <meta name = "DC.Date" content = "1951"> <meta name = "DC.Format" content = ”teksti/ASCII"> <meta name = "DC.Language" content = ”FI"> Dublin Core - elementit

Metatietostandardit / formaatit - PICS 1/2 - Platform for Internet Content Selection - Mahdollistaa WWW-sivujen sisällön soveliaisuuden kuvaamisen erilaisille käyttäjäryhmille. - PICS Label määrittelee minkälaisesta siällöstä on kyse - PICS Label voidaan asettaa HTML-dokumentin tagin sisään PICS Esimerkki

Metatietostandardit / formaatit - PICS 2/2 - PICSRules - formaatti suodatinmäärityksille Esimerkki pääsyn kontrolloinnista: (PicsRule-1.1 ( serviceinfo ( " shortname "Cool" bureauURL " UseEmbedded "N" ) Policy (RejectIf "((Cool.Coolness = 3))") Policy (AcceptIf "otherwise") ) Lähde:

Metatietostandardit / formaatit - RDF 1/2 - Resource Description Framework - W3C:n suositus standardiksi - Malli minkä tahansa resurssin kuvaamiseen Internetissä - Syntaksi pohjautuu XML:ään - Lisätään HTML-dokumenttiin -tagien väliin - Resurssiin viitataan URI:n avulla

Metatietostandardit / formaatit - RDF 2/2 RDF-metatiedon liittäminen HTML-dokumenttiin: <rdf:RDF xmlns:rdf=" xmlns:dc=" <rdf:Seq ID="CreatorsAlphabeticalBySurname" rdf:_1=”Matti Aavikko" rdf:_2=”Juhani Heino"/> Tämä on käypä HTML-dokumentti. Esimerkin lähde:

Metatietostandardit / formaatit - XML - eXtensible Markup Language - Oleellinen metatiedon kannalta rakenteelisuutensa vuoksi, esitetty metatiedon tallennusmuodoksi - Unicode-tuki mahdollistaa kaikkien maailman kielien käytön - Ulkoisen metatiedon luonti automaattisesti suhteellisen helppoa - Hyödynnetään mm. RDF:ssä

Metatietostandardit / formaatit - XTM - Toiselta nimeltään TopicMaps, eli aihekartta - XTM = XML Topic Map - Aihekartta on XML-dokumentti, jolla kuvataan jonkin olemassa olevan tiedon rakenne - TopicMaps pyrkii tuomaan paremman vaihtoehdon perinteisille hakemistoille TopicMaps

HTML -metatiedon hyödyt - Relevantin tiedon nopeampi löytyminen - Kuvien, videon, äänen ja muun multimedian kuvaaminen - WWW:n ulkopuolisten resurssien saaminen mukaan (taideteokset, muut ei sähköisesssä muodossa olevat resurssit) - Sähköinen kaupankäynti ja tekijänoikeudet

Ongelmia metatiedon hyödyntämisessä - WWW:n ulkopuolisten resurssien saaminen mukaan - Luonnollisten kielien runsaus - Koneellisen tulkinnan vaikeus - Erilaisia määrittelyjä on monia - WWW-dokumenttien sijainnin pysyvyys epävarmaa - Hakukoneiden indeksoinnin hitaus, ja indeksien ajan tasalla pitäminen

Mahdollisia ratkaisuja - Tarpeeksi monipuolisten standardien laaja käyttöönotto - WWW:n ulkopuolisten resurssien saaminen mukaan - Automaattinen metatiedon luonti ja tulkinta - Metatietostandardit tuntevat hakukoneet - Luonnollisista kielistä riippumaton “koodattu” metatieto

Hyödyllisiä linkkejä: World Wide Web Consortium: Dublin Core RDF IEEE Learning Technology Standards Committee HTML 4.0 Spesifikaatio