Luento 5: Paikkatietokyselyt ja -tietokannat sekä geometrialaskelmat - digitointivirheet ja metatieto SELECT WORLD.COUNTRY, WORLD.POP_2007 FROM WORLD.

Slides:



Advertisements
Samankaltaiset esitykset
Tietokannat: MySQL ja PostgreSQL. Yleistä • Relaatiotietokantaohjelmisto, jolla voidaan luoda, ylläpitää ja muuttaa ja hallinnoida tietokantoja • Avoin.
Advertisements

15. Loogiset operaatiot.
@ Leena Lahtinen Helia Ohjelman perusrakenteet 1. PERÄKKÄISRAKENNE 2. VALINTARAKENNE 3. TOISTORAKENNE.
TILDA-Verkkotilastointi
Ohjelmiston tekninen suunnittelu
Ohjelman perusrakenteet
Luku 5 – Tietojen hakeminen sovelluksiin
Relaatiomalli •Ted Codd 1970 •Matemaattinen perusta •Helppo toteuttaa •Helppo omaksua •Käytetyin tietomalli •Muodostaa perustan kurssin myöhemmille asioille.
Tietokanta.
Kökkötraktori-verkkokauppa
2.8.3 Abstraktit tietotyypit
Rakenteinen ohjelmointi
Aggregaattifunktiot (1)
Näytölle tulostaminen. 7.2 Sisällys System.out.println - ja System.out.print -operaatiot. Tulostus erikoismerkeillä. Edistyneempää tulosteiden.
Auli Jaakkola 1 Palkkatiedustelun tietomallin mukaisen tilastovastauksen luonti Tässä esimerkissä tiedosto tuotetaan excelistä csv-muotoon. 1.Oletetaan,
Pasi Helasuo Työn valvoja Professori Jukka Manner
@ Leena Lahtinen OHJELMAN OSITTAMINEN LUOKKA ATTRIBUUTIT METODIT.
TIETOKONEOHJELMAN RAKENNE OHJELMALLA ON KAKSI OSAA  MÄÄRITYSOSA TIETOJEN KUVAUKSIA VARTEN  SUORITUSOSA TIETOJEN KÄSITTELYÄ VARTEN.
VB:n tietokantakäsittely
Johdatus paikkatietoon
TAULUKKO YKSIULOTTEINEN TAULUKKO. TAULUKKO  Taulukon tarkoitus Ohjelmassa tarvitaan paljon samantyyppisiä samaan kohdealueeseen kuuluvia muuttujia Näitä.
Ohjelman perusrakenteet
TIETO JA TIETOKONEOHJELMA TIETOKONEOHJELMA KÄSITTELEE TIETOJA TIETOJA VOIDAAN KÄSITELLÄ OHJELMASSA VAIN SALLITUILLA MENETELMILLÄ.
2. Vuokaaviot.
Haaga-Helia Ammattikorkeakoulu
Relaatioalgebra (1) Kokoelma relaatioiden käsittelyyn tarkoitettuja operaatioita Operaatiot muuntavat relaatioita uusiksi relaatioiksi Muodostaa perustan.
Monikon lisääminen (1) Luetellaan kaikki lisättävän rivin arvot INSERT INTO Asiakas VALUES (4, ’Assi’, ’Asiakas’); Luetellaan vain osa arvoista; muut arvot.
4-Tietokantaohjelmointi Teuhola Tietokantasovellusten ohjelmointi Taustaa 4.1. Relaatioskeemaa täydentäviä piirteitä 4.2. Sulautettu SQL, Java.
SQL Standardoitu kieli, jonka avulla voidaan
Metropolian kirjasto oppimisen tukena. Häkkinen / Ylitalo-Kallio Mistä tietoa? Metropolian kirjaston kokoelmat ja www-sivut

@ Leena Lahtinen OHJELMAN OSITTAMINEN LUOKKA ATTRIBUUTIT METODIT.
Toistorakenne Toistorakennetta käytetään ohjelmissa sellaisissa tilanteissa, joissa jotain tiettyä ohjelmassa tapahtuvaa toimenpidekokonaisuutta halutaan.
Tietokannat –kurssi SQL peruskyselyt
Tietokannat -kurssi KSAO, Datanomit, käytön tuki kevät 2015 Lauri Tapola.
6. Relaatioalgebra ja relaatiokalkyyli
1 Ohjelmointikielten varhaishistoria Esa-Matti Miettinen
@ Leena Lahtinen TIETOKONEOHJELMAN RAKENNE OHJELMALLA ON KAKSI OSAA:  MÄÄRITYSOSA TIETOJEN KUVAUKSIA VARTEN  SUORITUSOSA TIETOJEN KÄSITTELYÄ.
Miksi tietokannattMyn1 Miksi tietokannat Esim. kirjastossa oli kortisto, joka koostui käsin täytettävistä arkistokorteista. Kortit oli järjestetty tekijän.
DO NOT PRINT THIS DOCUMENT SQL -valintaehto CREATE TABLE opettaja ( opetunnus varchar(12) NOT NULL, nimi varchar(40) NOT NULL, puhelin varchar(12), tyohuone.
DO NOT PRINT THIS DOCUMENT SQL -valintaehto CREATE TABLE opettaja ( opetunnus varchar(12) NOT NULL, nimi varchar(40) NOT NULL, puhelin varchar(12), tyohuone.
Tietokannat Tietotekniikan perusteet Pekka Orponen.
Java - Tietokanta. JDBC=Java database connectivity  ODBC:n kaltainen ohjelmointiliittymä SQL- tietokantoihin  Koostuu Java-kehitysympäristön (esim.
Karteesinen tulo Huomaa attribuuttien nimien tarkentaminen taulujen nimillä.
Relaatiomalli kilpailijoineen ja 1970-luvuilla
Toistorakenne Toistorakennetta käytetään ohjelmissa sellaisissa tilanteissa, joissa jotain tiettyä ohjelmassa tapahtuvaa toimenpidekokonaisuutta halutaan.
Tietokannat -kurssi KSAO, Datanomit, käytön tuki kevät 2015 Lauri Tapola.
XSL Teppo Räisänen
XSL Teppo Räisänen
Tietokannat -kurssi KSAO, Datanomit, käytön tuki kevät 2015 Lauri Tapola.
Valintarakenne valintarakenne alkaa aina kysymyksellä eli ehdolla ehto tarkoittaa, että muuttujan sisältöä verrataan toisen muuttujan sisältöön tai vakioon.
MySQL & PostgreSQL Heikki Airaksinen & Janne Richter.
Tietokantapalvelimet Ville Parviainen. Sisältö Yleistä tietokannoista SQL PostgreSQL MySQL MySQL vs. PostgreSQL Linux -työ.
Hakemistot Nopeuttavat hakuoperaatioita Hidastavat päivitysoperaatioita Pääavaimelle luodaan aina indeksi; päävain toimii usein hakukriteerinä Luodaan.
MapInfon tiedostot TAB – Tiedosto, jonka avulla tietokanta avataan MapInfossa. Tiedostossa tietoja kentistä ja koordinaattijärjestelmästä. DAT, XLS. TXT.
KSAO, Datanomit, käytön tuki kevät 2015 Lauri Tapola
Toistorakenne Toistorakennetta käytetään ohjelmissa sellaisissa tilanteissa, joissa jotain tiettyä ohjelmassa tapahtuvaa toimenpidekokonaisuutta halutaan.
Copyright Oy Thomas Antila Consulting Ab 1 Indeksointi Oracle 8i tietokannassa OUGF Syksy 2000.
SQL ● Structured Query Language ● Standardoitu kieli tietokantakyselyiden tekemiseen – Standardoitu ei tarkoita etteikö olisi useampia versioita, joten.
Tietokantakyselyt.  Tietokantakysely eli osajoukon erottaminen suuremmasta tietokannasta  Esimerkiksi: Suomen kunnat: Oulu Suomen kunnat: yli
Paikkatietojärjestelmät Kaikesta tiedosta jopa 80 % on sidottavissa johonkin paikkaan (maantieteellinen koordinaatisto, hallinnollinen raja tai osoite)
Toistorakenne Toistorakennetta käytetään ohjelmissa sellaisissa tilanteissa, joissa jotain tiettyä ohjelmassa tapahtuvaa toimenpidekokonaisuutta halutaan.
SPARQL.
13. Loogiset operaatiot.
Sisältö PostgreSQL MySQL Historia yms. ORDBMS Ominaisuuksia Asennus
Paikkatiedon käyttötapoja
Muuttujamuunnoksista
Jouni Juntunen Oulun seudun ammattikorkeakoulu Liiketalouden yksikkö
13. Loogiset operaatiot.
Ohjelman perusrakenteet
Esityksen transkriptio:

Luento 5: Paikkatietokyselyt ja -tietokannat sekä geometrialaskelmat - digitointivirheet ja metatieto SELECT WORLD.COUNTRY, WORLD.POP_2007 FROM WORLD WHERE (((WORLD.COUNTRY)="Finland" Or (WORLD.COUNTRY)="Sweden" Or (WORLD.COUNTRY)="Norway" Or (WORLD.COUNTRY)="Denmark"));

Kyselyt Paikkatietojärjestelmien päätehtävät Aineistojen käsittely Tiedon keruu Valmiit paikkatietoaineistot kenttätutkimukset kaukokartoitus julkaistut kartat Aineistojen käsittely muokkaus yhdistely päivittäminen laaduntarkkailu Esittäminen valitut karttatasot teemakartat 3-ulotteisuus virtualitodellisuus Kyselyt valinnat haut ryhmittelyt Analyysit visuaalinen tarkastelu verkosto pinta overlay

Paikkatietokyselyt tietokannoista sekä geometrialaskelmat Esimerkkejä attribuuttikyselystä: Aktiiviset metsäpalot jossa analyysiruudussa yli 5 paloa vuosien 2002 – 2005 välisenä aikanan: SELECT * FROM firesum02_05 WHERE COUNT > 5 Afrikan maat jossa yli 10 miljoonaa asukasta: SELECT * FROM WORLD WHERE CONTINENT = “AFRICA” AND POPULATION > 10 000 000

Paikkatietokyselyistä yleisesti kuuluu paikkatietojärjestelmien yleisimpiin toimintoihin kysellään tietyt ehdot täyttäviä kohteita joko ominaisuustietojen tai sijainnin perusteella teknisesti yksinkertainen toimenpide jossa tiedon rakenne ei muutu kyselyissä valituiksi tulleet kohteet voidaan tallentaa jälkikäteen pysyvästi tiedostoksi / tietokantaan. ArcGIS (Data / Export Data) GISissä kysely perustuu yleensä SQL-kieleen, structured query language, jota voi hyödyntää suppeammin tai laajemmin

Paikkatietokyselyjen tavoitteista ja tuloksista Paikkatietojärjestelmien tavoitteena on tuottaa tietoa ja uudenlaista ymmärrystä ilmiöiden alueellisesta jakautumisesta ja niiden vaihtelusta. Paikkatietokannasta tehdyt kyselyt tuottavat vastauksia kysymykseen hakemalla tietokannasta kaikki kohteet, jotka täyttävät annetut hakuehdot. Hakuehdot voivat perustua joko sijainti- tai ominaisuustietoihin tai molempiin. Kyselyjen tulokset voi esittää joko kartalla, jolloin voidaan tarkastella kohteen sijaintia tai taulukkona, jolloin voidaan tarkastella kohteen ominaisuustietoja. Kyselyjen avulla voidaan myös luoda laajemmasta aineistosta uusia suppeampia osa-aineistoja ja tallentaa saatu aineisto uutena tietokantana myöhempää käyttöä varten.

Kyselyjen tulosten hyödyntämisestä - usein käyttökelpoista tietoa sellaisenaan - kyselyjen ja visuaalisen karttatulkinnan ”linkitys” paikkatietomenetelmien vahvuusalue - visuaalinen ja numeerinen tarkastelu tukevat toinen toisiaan - uusimmissa GIS-ohjelmistoissa valinnat kartalta ja taulukoista mahdollista linkittää myös erilaisiin tilastokaavioihin (esim. valinnat suhteessa jakaumakuvaajiin) - valintojen hyödyntäminen jatkoanalyyseissa ja visualisoinneissa: - ehdot täyttävien kohteiden kuvaaminen kartalla - valintojen pohjalta tehdyt muuttujamuunnokset (esim. uudelleenluokittelut) - osajoukkoa kuvaavat tilastotunnusluvut, taulukot, jne. (esim. aluevertailut) - kyselyjen integroiminen analyysiprosessin eri vaiheisiin

SQL Relaatiotietokantojen tietokannan käsittelykielen standardiksi on muodostunut SQL-kieli (eng. Structured Query Language). E.F. Coddin julkaistua relaatiomallin vuonna 1970, IBM lähti kehittämään relaatiomallin mukaista prototyyppitietokantaa. Ensimmäinen kaupallinen SQL-tuote oli Oracle vuonna 1979. IBM itse julkisti ensimmäisen SQL-tuotteensa SQL/DS:n vasta vuonna 1981. 1980-luvulla syntyi joukko SQL-pohjaisia tuotteita ja nykyisin suurin osa niin kaupallis-hallinnollisista kuin luonnonvarainhallintaan tarkoitetuista sovelluksista tehdään SQL-pohjaisille relaatiotietokannoille.

SQL (Structured Query Language) Paikkatieto-ohjelmistoissa sisäänrakennettuna erilaisia käyttöliittymiä SQL-kyselyille SQL on kehitetty relaatiotietokantojen kysely- ja muokkauskieleksi Paikkatietoaineistoissa ominaisuustiedoille tyypillistä nimenomaan relaatiomuoto, karttakohteet vastaavat taulukon rivejä ja muuttujat sarakkeita Paikkatietoa varten kehitetty myös sijaintiin pohjautuvia hakukriteereitä SQL-ohjelmistoja: -MySQL (Open source) -SQLite (Public domain); -Microsoft SQL Server 2005 Express Edition (free) -Kaupalliset tuotteet: mm. Microsoft Access, Oracle Spatial 10g release 2 -Microsoft SQL 2005 server

SQL (Structured Query Language) Tärkeimmät komennot: SELECT, UPDATE, INSERT ja DELETE. Paikkatietokyselyissä käytetään pääasiassa SELECT-komentoa Kyselyt rakennetaan muuttujien, operaattoreiden ja arvojen avulla: CONTINENT = “Africa" Kokonaisuudessaan SQL-kieli toimii kuitenkin laajempana lauseena Select * from WORLD where CONTINENT = “Africa" into Selection

SQL-kyselyn suppea perusmuoto SELECT ominaisuus_1,  ominaisuus_2, ... = Tulostaulukon kentät FROM tietojoukko_1, tietojoukko_2 ’ = Lähtöaineiston taulu(t) WHERE ehto_1, ehto_2, ...; = valintakriteeri(t) Esimerkki: SELECT * FROM WORLD WHERE CONTINENT = “AFRICA” AND POPULATION 2007 > 50 000 000 Tulos:

Lauseiden yhdistäminen Boolen operaattoreilla Haettavien kohteiden ominaisuustiedot joko täyttävät tai eivät täytä hakuehtoja Kohdejoukkoon kohdistuvan haun tulos voi siis olla tosi tai epätosi   Kyselyjen yhdistäminen loogisten operaattorien avulla * Leikkaus:  AND * Unioni:  OR * Poissulkeva joko-tai:  XOR * Negaatio:  NOT    

SQL-kysely - Boolen operaattori esimerkki 1 Esimerkki SQL kyselylausekkeesta toteutettuna MS Access tietokantaohjelmistolla. SELECT WORLD.COUNTRY, WORLD.POP_2007, WORLD.CONTINENT FROM WORLD WHERE (((WORLD.POP_2007) > 50000000 AND (WORLD.POP_2007) < 100000000) AND ((WORLD.CONTINENT)="Africa")); Tulos: tulos sisältää Afrikan maat joiden asukasluku on suurempi kuin 50 miljoonaa, mutta pienempi kuin 100 miljoonaa

Boolen algebra esimerkki 2 Mikäli kaupunki-tietokanta sisältää kentät NIMI ja ASUKASLUKU, voidaan kysellä esimerkiksi: asukasluku >= 50000 AND asukasluku <100000 tulos sisältää kaupungit, joiden asukasluku on suurempi tai yhtä suuri kuin 50000, mutta pienempi kuin 100000 asukasluku < 50000 OR asukasluku > 100000 tulos sisältää kaupungit joiden asukasluku on joko pienempi kuin 50000 tai suurempi kuin 100000 asukasluku > 100000 NOT Nimi= ”Helsinki” tulos sisältää Helsinkiä lukuun ottamatta kaupungit, joiden asukasluku on suurempi kuin 100 000.

Boolen algebra esimerkki 3 aineistossa on tietoja rakennuksista (rakennusvuosi, suojelutietoja, kaavatietoja) halutaan selvittää kyselyllä ennen v. 1930 rakennetut rakennukset: rakennusvuosi < 1930   Tuloksena kaksi tulosjoukkoa: tosi ja epätosi Jos aineistossa on kohteita joiden rakennusvuositieto puuttuu ja se on koodattu esim. nollaksi, Joudutaan käyttämään JA -leikkausehtoa: rakennusvuosi < 1930 JA rakennusvuosi > 0  * jos taas halutaan selvittää mitkä rakennukset ovat "vanhoja" tai rakennussuojelukohteita niin käytetään unioniehtoa TAI (rakennusvuosi < 1930 JA rakennusvuosi > 0) TAI suojelukohde ="Kyllä” ehtojen suoritusjärjestys voi vaikuttaa lopputulokseen ehtolausekkeiden suoritusjärjestys on vasemmalta oikealle ellei suluilla osoiteta toisin

Kyselyesimerkki toteutettuna Microsoft Access tietokantaohjelmistolla Design näkymä kyselyjen tekoon SQL -näkymä kyselystä: SELECT WORLD.COUNTRY, WORLD.POP_2007 FROM WORLD WHERE (((WORLD.COUNTRY)="Finland" Or (WORLD.COUNTRY)="Sweden" Or (WORLD.COUNTRY)="Norway" Or (WORLD.COUNTRY)="Denmark"));

Select-lause kokonaisuudessaan Laaja SQL-tuki sallii alikyselyt ja tulosten ryhmittelyn, sekä tulostaulun kenttien valinnan – mm. MapInfo tukee Select CONTINENT, Count(*), sum(POP_2007), Min(POP_GRW_RT), Max(POP_GRW_RT) from WORLD group by continent order by continent into Selection Esim. ArcGIS ei tue näitä ja siksi oleellista osata ”ketjuttaa” ominaisuustieto- ja sijaintikyselyitä esim. yli 5 km: päässä keskustasta sijaitsevat kaupunginosat, joissa työttömyysaste on yli 10 % yli 40-vuotiaiden asukkaiden keskuudessa?

Relaatiotietokannat Relaatiotietokannassa tiedot esitetään tauluina (engl. table), joita kutsutaan myös relaatioiksi. Kukin taulu koostuu tietueista ja kentistä. Taulun riveillä, joita kutsutaan tietueiksi, on yhtä monta tietoa eli kenttää. Jokaisella rivillä täytyy olla yksikäsitteinen perusavain, joka vastaa jotakin reaalimaailman kohdetta. Kuhunkin kohteeseen liitetään vain siihen välittömästi liittyvät ominaisuudet. Taulut liittyvät toisiinsa avainkenttien avulla. Mikäli kahden taulun avainkentissä on sama arvo, täydentävät tietueet toisiinsa. Relaatiotietokannoista tietoa haetaan vain tiedon nimien ja arvojen perusteella, ei tiedon sijainnin tai järjestyksen mukaan. Kukin yksittäinen tieto relaatiotietokannassa voidaan hakea esimerkiksi ilmoittamalla taulun nimi, perusavaimen kentän nimi ja avaimen arvo sekä haettavan tiedon kentän nimi. Lähde: Ilkka Blomqvist ja Tino Johansson 2004

Relaatiotietokannan taulut ja avainkentät (Primary key) Relaatiotietokantojen taulut eli relaatiot ovat yhdistettävissä toisiinsa avainkenttien avulla Lähde: Ilkka Blomqvist ja Tino Johansson 2004

Edistyneempiä SQL-kyselyitä 1 - relaatiotietokannat voivat käsittää yhden tai useamman taulun - jos kysely kohdistuu kahteen tai useampaan tauluun niin yhden ehdon on yhdistettävä taulut toisiinsa Esimerkki: SELECT rakennukset.rakennustunnus, rakennukset.osoite, rakennukset.rakennusvuosi, suojelukohteet.päätösperuste FROM rakennukset, suojelukohteet WHERE rakennukset.rakennustunnus = suojelukohteet.rakennustunnus AND ( (rakennukset.rakennusvuosi < 1930 AND rakennukset.rakennusvuosi > 0) OR rakennukset.suojelukohde="Kyllä" ); 

Edistyneempiä SQL-kyselyitä 2 Venäjän paloalueiden lukumäärä hallintoalueittain (1996-2002)

Paikkatietokyselyt paikkatieto-ohjelmistoissa Kyselyjen periaate eri ohjelmistoissa sama, mutta toteutus vähän erilainen kyselyjen tekeminen nykyisissä desktop-GIS –ohjelmistoissa hyvin joustavaa -esim. ArcMap:in varsinaiset kyselytyökalut Select by attributes- (ominaisuustietokyselyt) ja Select by location- (sijaintietokyselyt) kyselyikkunat -esim. MapInfossa samalla kyselytyökalulla tehdään molemmat valintatyypit -samalla periaatteella hyödynnetään myös erikoistoimintojen yhteydessä (esim. puuttuvien arvojen poissulkeminen teemakarttoja tehdessä, Label-toiminnon kohdistaminen vain tietyn tyyppisiin kohteisiin, jne.)

Ominaisuustietokyselyjen toteutus ArcMap:issa - Kohteiden valinta ominaisuustietojen perusteella (Selection  Select by Attributes) SQL-käyttöliittymä Esimerkki: Halutaan löytää 1997 myynnissä olleista asunnoista yksiöt ja kaksiot joiden neliöhinta on alle 10000 markkaa. Lauseke on tällöin: "HUON_LKM" <= 2 AND "NELIOHINTA" < 10000

Valinta sijainnin perusteella - ”Select by location”

Kohteiden valinta sijainnin perusteella yksinkertaisin sijaintiin perustuva kysely on kohteen visuaalinen paikantaminen näytöltä ja sen ominaisuustietojen kysely infotyökalulla käytetyimpiä ovat kuitenkin kyselyt, joissa valinnan kriteereinä ovat taulujen väliset sijaintisuhteet. Tällöin kohdejoukko A sisältää, leikkaa, sivuaa tai sijaitsee tietyn etäisyyden päässä kohdejoukkoa B, jonka koostumus pyritään saamaan selville. Kysytään esimerkiksi: Mitkä ovat jonkin alueen naapurialueet? Mitkä rakennukset kuuluvat johonkin kortteliin? Mitkä rakennukset sijaitsevat 300 metrin päässä rannasta? Samoja sijaintisuhteiden määrittelyjä käytetään myös tietokantaliitoksissa (join), yhdistettäessä ominaisuustietoja toisiin

Sijaintikyselyt: Sijaintisuhde ja geometriatyyppejä - Intersect : valitsee tulos-layerin kohteet, jotka leikkaavat valintalayerin kohteita ainakin yhdessä kohtaa tai jäävät kokonaan valintalayerin kohteiden sisään. Asetettaessa tulos- ja valintalayer samaksi, tulokseksi saadaan naapurusto (valittuna kohde ja sen viereiset kohteet). - Are within distance of: valitsee määrätyn etäisyyden päässä valintalayerin kohteista sijaitsevat tuloslayerin kohteet. Asetettaessa valintaetäisyys nollaksi tulokseksi saadaan naapurusto. Valintoja voi tehdä myös saman layerin kohteille. - Are completely within: valitsee valintalayerin kohteiden sisällä kokonaisuudessaan olevat tuloslayerin kohteet; esim. kuntapolygonin alueella sijaitsevat väestöpisteet, tiesegmentit tai rakennuspolygonit. - Completely contain (edellinen toisinpäin): esim. valitaan väestöpisteiden, tiesegmenttien tai rakennuspolygonien perusteella tuloslayerista kuntapolygoni/t. - Have their center in: kuten Are completely within, mutta perusteena tuloslayerin kohteiden keskipisteet. - Contain the center of: kuten Completely Contain, mutta valintaperusteena valintalayerin kohteiden keskipisteet.

ArcGIS 10. 1 ”Select by Location” valintamahdollisuudet kts

Intersect

Are within a distance of:

Are completely within

Contain

Touch the boundary of:

Sijaintiin perustuvan kyselyn toteutus ArcMap:issa valinta-layer sisältää valittuina ne kohteet, joiden sijaintiin nähden tulos-layerin kohteita valitaan 1. Valitaan ensin (esim. aluevalintatyökalulla) halutut valinta-layerin kohteet (kaikki kohteet/osa kohteista!) 2. Siirrytään Select by Location –kyselyikkunaan, jossa määritetään mm.: - valinnan tyyppi (valinta kaikista kohteista, OR-valinta, AND-valinta, poistava NOT-valinta) - valinnassa käytettävän sijaintisuhteen tyyppi

Esimerkki: valitaan 300 metrin päässä metroasemasta sijaitsevat kohteet edellä valittujen ("HUON_LKM" <= 2 AND "NELIOHINTA" < 10000) edullisten yksiöiden ja kaksioiden osajoukosta:

Yhteenveto paikkatietokyselyistä Paikkatietokyselyt noudattavat relaatiotietokannoille kehitettyjä kyselymenetelmiä Tavallisin kyselykieli on SQL, Structured query language SQL-syntaksi on aina samaa muotoa: Select * from WORLD where CONTINENT = "Africa" into.. Kyselyjä voidaan tehdä ominaisuustiedon tai sijainnin mukaan Sijaintirelaatioiden määrittelyssä on ohjelmistokohtaisia eroja.

Geometrialaskelmat: olennainen osa kyselyitä jo ensimmäistä paikkatietojärjelmää (CGIS, Canadian Geographic Information Systems) kehitettäessä yhtenä tavoitteena oli manuaalisten menetelmien (esim. planimetri) korvaaminen pinta-alatietojen tuottamisessa numeerisessa muodossa oleva sijaintitieto mahdollistaa mm. seuraavien tunnuslukujen laskemisen: kohteiden väliset etäisyydet keskipiste/keskisijainti (sentroidi), keskietäisyys sentroidista, jne. kohteiden pituus, mutkikkuus, suuntautuneisuus (viivamaiset kohteet) pinta-ala, ympärysmitta, muoto, suuntautuneisuus (aluemaiset kohteet) kaltevuus, viettosuunta, kuperuus/koveruus (korkeustiedon sisältävä data) * ks. lisätietoja oppikirjoista: Jensen & Jensen s. 233-240; Longley et al. (2001): s. 286-291; Heywood et al. (2002), Demers (1996): s. 203-226

Kohteiden välinen etäisyys (suoran viivan pituus) perustapaus (vektoridata): kahden pisteen (A ja B) välinen etäisyys (viiva) Suoran viivan pituus lasketaan Pythagoraan lausetta hyödyntäen

Usean viivan pituus * useammasta koordinaattiparista muodostuvan mutkittelevan viivan pituus saadaan summaamalla segmenttien pituudet yhteen -

Pinta-alan laskeminen ominaisuustietotauluun ArcMapissä Laskeminen vektorikarttatasoille tapahtuu attribuuttitaulun numeeriseen Kenttään Calculate Geometry valikosta

Habitaattilaikkujen pinta-alat (m2)

Muita aluemaisia kohteita kuvaavia tunnuslukuja * suuntautuneisuus (voi perustua esim. polygonin pohjois/etelä- vs. itä/länsi- suuntaisten akselien suhteeseen) * polygonin muotoa kuvaavat tunnusluvut Esim. yksinkertaisen ”kompaktiutta” kuvaavan tunnusluvun laskeminen polygonin ympärysmitan ja pinta-alan suhteeseen perustuen (Longley et al. 2001):  

Rasteriaineiston geometrialaskelmat rasteriaineistoissa kohteiden pituuksien yms. geometristen suureiden laskemisessa hyödynnetään tietoa resoluutiosta (solun sivun pituus etäisyysyksiköissä) * ortogonaalinen (+) etäisyys solujen välillä johdetaan suoraan resoluutiosta * diagonaalinen (Χ) etäisyys saadaan vastaavasti Pythagoraan lauseesta (1.414 * resoluutio)

Geometristen laskelmien käyttöalueista: 1) kohteista saatavalla geometrisella tiedolla usein sinällään sovellusarvoa: * esim. karttapalvelut netissä (esim. lyhimmät reitit) * paljonko matkaa lähimpään palveluun? * kuinka paljon tonteilla rakentamatonta maata (rakennustehokkuus)? * jne. 2) lisäksi perusgeometriaa hyödynnetään osana kehittyneempiä paikkatietomenetelmiä, mm.: * bufferi- eli etäisyysvyöhykeanalyysit * reitti- ja verkostoanalyysit: lyhin reitti, travelling salesman –ongelma, jne. * monet interpolointimenetelmät: esim. Thiessenin polygonit, idw, kriging * spatiaaliset mallinnusmenetelmät: esim.kustannusetäisyysmallit, hydrologinen mallinnus, näkyvyysanalyysit

Sijaintitiedon tuottaminen digitoimalla - paluu luento 4 aiheeseen jota ei ehditty käsitellä

Digitointi = karttojen analogisen sijaintitiedon muuntaminen digitaaliseen muotoon koordinaattipiste kerrallaan

Digitointitavat A. Manuaalinen (työpöytä)digitointi - (paperi) karttapohjan asemoiminen digitointipöydälle - tukipisteiden määrittäminen (min. 4) = asemointi karttakoordinaatistoon - sijaintipisteiden manuaalinen tai puoliautomatisoitu tallentaminen kursorityökalua liikuttamalla B. Kuvaruutudigitointi tyypillinen työskentelyjärjestys: 1. kartan yms. skannaus 2. skannatun kartan/kuvan oikaiseminen koordinaatistoon tunnettuja koordinaattipisteitä hyödyntämällä ”georeferencing” 3. haluttujen kohteiden digitointi uudeksi paikkatietoaineistoksi 4. ominaisuustietojen syöttäminen kohteille  

Digitointivirheitä Lähde: Ilkka Blomqvist ja Tino Johansson 2004

Lisää digitointivirheistä Digitointivirheitä: (A) undershoots and overshoots; (B) invalid polygons; and (C) sliver polygons

Lisää digitointivirheistä - sliver- eli suikalepolygonit (1) - ali- ja ylitarttuminen (2-3) - alueella puuttuva, vajavainen tai ylimääräinen viivasegmentti (4-6) - huolimaton digitointi (7-8) - lähtöaineistojen erot (9)

Viivakarttatason digitointivirheitä

Vierekkäisten digitointien yhteensopimattomuus: vaatii esim Vierekkäisten digitointien yhteensopimattomuus: vaatii esim. “Rubber sheeting korjaustoimintoa” Mismatch of adjacent spatial data sources that require rubber-sheeting

Formaattimunnoksista Vektorointi (vectorisation) = Digitaalisten rasterikuvien ja –karttojen automatisoidut muunnokset vektorimuotoon -esim. peruskartan skannaaminen  tie-elementtien erottaminen kuvankäsittelyohjelmassa  valittujen elementtien vektorointi viivoiksi -yksinkertaisin tapa ArcMap:issa: Spatial Analyst  Convert  Raster to features rasterointi (rasterisation) -operaatio onnistuu yleensä paremmin toisinpäin (vektoriaineistojen rasterointi: Features to raster) HUOM! formaattimuutoksen jälkeen kannattaa aineisto käydä tarkkaan läpi jotta ymmärtää mitä aineistolle mahdollisesti tapahtui muunnoksen aikana – tyypillisiä ongelmia: aineiston yleistyminen, sijaintivirheet ns. ”Shift” ym.

Muunnokset rasteri- ja vektoriaineistojen välillä Lähde: Jones 1996

GIS datan virheet tuotantoprosessin eri vaiheissa

Virheet Virheet GIS datassa ovat yleisiä, jopa yleisempiä kuin perinteisissä karttatuotteissa koska usein GIS data on johdettu esim. kartoista. Näin ollen virheet GIS datassa voivat kumuloitua Virhe = “error” is the difference between different observers or between measuring instruments (The concrete meaning of the Latin word error means "wandering“ or "straying“) Tarkkuus = “accuracy” is the difference between reality and our representation of reality Epävarmuus = “uncertainty” - our representations are always incomplete measurements of reality Virheet voivat esiintyä eri “GIS-operointi” vaiheissa: a. Tiedon tuottaminen / tuonti - Input b. Tiedon hallinta - Database management    c. Tiedon analyysi - Analysis   d. Tiedon esittäminen / visualisointi - Output

Esimerkkejä GIS-virheistä

Metsälaikkujen digitointivirheet Päällekkäiset polygonit Sliverit koodausvirheet

Koordinaattivirheet X ja Y- koordinaatit geokoodattu väärinpäin

Attribuuttitaulu virheet Attribuuttitaulu virheet: korruptoitunut tekstitiedosto Syy: tekstitiedostoa laadittaessa tekstikentän pituus liian pitkä

Muita mahdollisia virhelähteitä GIS tietokannoissa Virheet tietokantaliitoksissa: esim. ”one to one” relaatio talujen välillä huomioimatta JOIN operaatiossa Virheet datamanipuloinnissa Virheet ja epätarkkuudet jotka ilmenneet formaattimunnoksissa Virheet GIS analyyseissä Virheet GIS output vaiheessa ja tulosten visualisoinnissa esim. väärä luokitusmetodi.

Aineistojen dokumentointi: Metatieto paikkatiedossa – tietoa mm Aineistojen dokumentointi: Metatieto paikkatiedossa – tietoa mm. aineiston tarkkuudesta, tekijästä, tuotantomittakaavasta, koordinaatistosta ym.

Metatieto Aineistontuottaja? Ominaisuustiedot? Formaatti? Tietomalli Mittakaava ja MMU? Käyttötarkoitus? Hinta? Kuvaustapa? ?

Metatieto – tietoa tiedosta Aineiston valinta perustuu yhä useammin tietoa koskevaan kuvailu- eli metatietoon Metatiedolla tarkoitetaan tietoa, joka kuvailee (paikka)tietokokonaisuuksia Suomen kansallisen paikkatietostrategian sanoin: “Metatietojen avulla käyttäjä tai tietojärjestelmä voi päätellä tietojen sopivuuden erilaisiin tarpeisiin.” “Metatiedoissa kuvataan tavallisesti aineiston kattavuus, luokittelutapa, ajantasaisuus, laatu, luontimenetelmä ja muita käytettävyyteen liittyviä seikkoja.”

Metatieto voidaan jaotella Yleisempiin paikkatietoaineistojen ja tuotteiden hakemista tukeviin kuvaileviin metatietoihin Yksityiskohtaisempiin tietojen ja tuotteiden tarkkaa arviointia tukeviin tietoihin, joilla yksittäisen kohteen laatua voi arvioida

CHIESA project – work package 2 (WP2)

CHIESA GeoNetwork (http://chiesa-gis. geography. helsinki

FAO GeoNetwork http://www.fao.org/geonetwork/srv/en/main.home

ArcGIS ArCatalog 10 Metadata editing