Sten-Erik Sandås Acenet Oy Oodi ja Unicode Sten-Erik Sandås Acenet Oy 20.11.2013 1
Agenda ISO-Latin ja Unicode yleisesti Unicode ja Oodi sovellukset Vaikutukset WinOodiin 2.4.2017 2
ISO Latin kirjainmerkkien tallennusmuoto ISO Latin valikoimaan mahtuu 256 merkkiä, muttei edes kaikki EU-kielien merkit. Sen takia on variantteja: ISO-LATIN1 Western: missä on mm skandit ÅÄÖ ISO-LATIN2 Eastern: itäeuropan merkit ISO-LATIN9 missä skandit ja €-merkin OODI-tietokannoissa on ISO_LATIN9 2.4.2017
Unicode Yleismaailmallinen merkkivalikoima, mihin on määritelty yli 100 000 kirjoitusmerkkiä, myös kiinalaiset ja japanilaiset merkit Moderni merkkivalikoima käytetään mm. HTML, XML rakenteissa ja suurin osa it-alalla on siirtynyt unicode:een
UTF-8 Unicode tallennetaan fyysisesti UTF-8 tai UTF-16 (tai UTF-32 tai joku muu muoto) UTF-8:ssa merkit tallennetaan 1-4 tavuna 1-tavuset ASCII A-Z 2-tavuset Western Ö Σ 3-tavuset Asialaiset 부엌 4-tavuset Kiina/Japani 妈 马
UTF-16 Vastaavat kuin UTF-8, mutta jokainen merkki on aina vähintään kaksitavuset Windows käyttää sisäisesti UTF-16 UTF-16 vie enemmän tila kuin UTF-8 XML ja HTML käyttää useimmiten UTF-8 tilasäästön takia
Unicode ja Oodi sovellukset Oodi-sovelluksissa käytetään tällä hetkellä vain skandinaaviset aakkoset, joka on osaa unicode:a Tallennusmuoto hoidetaan automaattisesti välineistä, joten data näyttää samalta kuin ennen WinOodi on jo nyt UTF-8 sisäisesti ja Windows käyttöliittymä UTF-16 2.4.2017 7
Kuitenkin ... WinOodi käyttää c-aliohjelmia ja Excel, näissä joudumme ehkä tehdä ohjelmointimuutoksia Suoria tietokanta-työkaluja pitää ehkä konfiguroida, koska Oraclen tietomuodot muuttuvat
Mahdollisuuksia Itä-europpalaisia, Kiinalaisia yms erikoismerkkejä voidaan jatkossa käyttää Oodi-sovelluksissa Oletuksena odotamme, ettei niitä tullaan käyttämään kovin paljon vai ??? Keskustelu pitäisi aloittaa siitä, missä halutaan käyttää erikoiskielien merkit: Rajoitetaanko vai avataanko kaikkea?
Miksi kysymme? Toimittajat pitää tähän varautua, koska pitää valita sovellusstrategia: Avaammeko kaikki kentät, jotta erikoismerkkien syöttäminen on mahdollista? Suljemmeko kaikki kentät, joihin ei saa syöttää erikoismerkkejä?
Unicode joka paikassa ? Otsikot Koodit Tunnisteet Kaikki syöttötiedot Käyttäjätunnukset ja salasanat
Unicode vain rajoitetusti ? Henkilöiden nimet Osoitteet Opetuksen nimi ja sisältö
Asiakasnäkökanta Opiskelijat pitäisi saada todistuksiin ja tulosteisiin oma nimi kirjoitettu täysin oikein Opettajat ja hallintohenkilöt pitäisi pystyä lukemaan ja kirjoittamaan osallistujalistat Kirjoittaminen on haaste, ”copy-paste” toimii ja Väestörekisteri siirtyy unicodeen 2014.
Vaikutukset WinOodiin WinOodi käyttää sisäisesti UTF-8 ja Windows GUI-rajapinnassa UTF-16 Latin-merkistöjen käyttö on tavallaan ylimääräinen merkkikonvertointi WinOodiin on integroitu mm MS-Excel, emme tiedä mitä vaikutusta tästä on niihin 03.09.2013
Merkistömuutoksia Asn-tiedostoihin lisätään $DEF_CHARSET = UTF8 Jos C ja Excel rajapinnoissa tulee ongelmia $SYS_CHARSET = CP1252 tai LATIN1
Kenttäpituustarkistukset Unicode merkkien pituudet vaihtelee, ehkä ongelmia pituustarkistuksissa Tietomallimuutoksia Interface malleihin: Packing codes: C -> W Char -> WideCharacters VC -> VW VarChar -> VarWide
Wide characters behavior $WIDE_CHAR_BEHAVIOR {=} Unicode | BMP | Charset Unicode Full range BMP Basic Multiligual Plane Charset W packing code sama kuin C
Unicode fontit Unicode merkit voidaan hyödyntää laajemmin, jos fontit tukeevat unicode WinOodi 3.7 yhteydessä olemme vaihtaneet fontit Arial Unicode MS Lucinda Sans Unicode
Disclaimer Ennen kuin tietokannat on konvertoitu ja testit suoritettu, asia näyttää WinOodin (ja WebOodin) kannalta helpolta Yleensä totuus on tarua ihmeellisempää