Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

Merkistöstandardeista

Samankaltaiset esitykset


Esitys aiheesta: "Merkistöstandardeista"— Esityksen transkriptio:

1 Merkistöstandardeista
Teppo Räisänen

2 Yleistä Kaikki käyttäjälle käyttöliittymässä esiintyvät merkit pohjautuvat binääridataan Tarvitaan sopimus siitä, mitä merkkiä tietty binäärijakso vastaa, esim. = ’K’ vai = ”£” Sopimukset = Merkistöstandardit

3 Yleistä Tavallisin tietokoneen tapa käsitellä dataa on jakaa se 8-bittisiin tavuihin 8:lla bitillä voidaan esittää 256 erilaista bittiyhdistelmää => esim. 256 erilaista merkkiä Kun bittien (tavujen) määrää kasvatetaan kasvaa mahdollisten yhdistelmien määrä 2:n potensseina

4 ASCII ASCII (American Standard Code for Information Interchange) julkaistiin 1968 ASCII perustuu 7:ään bittiin => 128 yhdistelmää Määrä on riittämätön erikoismerkkien ja eri kielten grafeemien ilmaisuun

5 ASCII Alkuperäinen US-ASCII ei sisällä esim. skandinaavisia vokaaleita
ASCII:n suomalainen versio ISO-646-SF sisältää äöåü-merkit Merkit saatiin käyttöön korvaamalla US-merkistön merkkejä

6 ISO 8859-1 ISO 8859-1 on ASCII-merkistön 8-bittinen laajennos
Tuli käyttöön 1982 Tukee länsieurooppalaisten kielten merkkejä Tunnetaan myös Latin1-nimellä versio laajensi kielitukea, mutta on vähän käytetty

7 Muut 8-bittiset merkistöt
ASCII-merkistöstä on olemassa lukuisia ISO-laajennoksia Lisäksi käytössä on lukuisia muita 8-bittisiä merkistöjä kuten esim. KOI-8-versiot Applen MacRoman-merkistö MSWindowsin merkistöt HP:n HP-Roman

8 Monitavuiset merkistöt
Lokalisoinnista ja laajennoksista huolimatta 8 bittiä on riittämätön määrä monien kielten merkintään 1976 julkaistiin japanin kieltä varten JIS X 0208 –merkistö (n merkkiä) Monitavuisia merkistöjä kehitettiin erityisesti Aasian alueella

9 Unicode Yleismaailmallinen ja kattava merkistö
Tarkoituksena kehittää muut merkistöt korvaava standardi Kehitystyö alkoi 1980-luvulla Versio 3.0 kuvasi 16 bitillä merkkiä Nykyään merkintään käytössä bittistä tasoa => yli miljoona erilaista merkkiä

10 Unicode-merkistökoodaukset
Koodausversiot ovat UTF-8 = merkkien tavumäärä vaihtelee UTF-16 = käytössä 1 tai 2 tavuparia UTF-32 = jokainen merkki esitetään 4 tavulla

11 Unicoden käyttö Unicoden 64 ensimmäistä merkkiä ovat ASCII-yhteensopivia Unicoden 128 ensimmäistä merkkiä ovat ISO yhteensopivia Unicode-tuki puuttuu edelleen monista kielistä ja ohjelmistoista

12 Unicoden käyttö WinXP tukee Unicodea (esim. WordPad)
Vain hyvin harvat Fontit kykenevät esittämään koko Unicode-merkistön Java-ohjelmointikieli tukee Unicodea XML tukee unicodea

13 XML ja merkistöt ASCII-editorilla kirjoitettu XML perustuu oletusarvoisesti UTF-8-standardiin => Skand. vokaalit eivät käytössä Pohjoismaiset vokaalit saadaan käyttöön julistamalla dokumentti ISO merkistön mukaiseksi

14 Esimerkki <?xml version="1.0" encoding="iso-8859-1"?>
<ääkköset> äääööö </ääkköset>

15 XML ja merkistöt Tekstieditoreilla kirjoitetut XML-tiedostot kannattaa yleensä julistaa iso :n mukaisiksi Muiden kuin suomenkielisten dokumenttien koodaustapojen suhteen tulee olla varovainen

16 Unicode-tuki Tämän linkin takana on luettelo Unicodea tukevista ja tukemattomista editoreista Esim. Dreamweaverin MX-versio sisältää tuen mutta aik. versiot 5.0:aan saakka eivät

17 Unicode-tuki WinXP:n pikkueditoreilla (WordPad ja NotePad) voidaan tiedosto tallentaa Unicode-muodossa Merkistö valitaan tallennusdialogin valikosta Huom. Unicodena tallennettu tiedosto ei avaudu oikein Unicodea tukemattomassa editorissa


Lataa ppt "Merkistöstandardeista"

Samankaltaiset esitykset


Iklan oleh Google