Tietovarastointikoulutus Mitä asiantuntija tarvitsee tulevaisuudessa? Tapani Lahti Sovelto Oyj.

Slides:



Advertisements
Samankaltaiset esitykset
Inspiroidu uudelle uralle
Advertisements

Näkövammaiset ja verkkosivustot Virpi Jylhä
ER-mallista relaatiomalliin
Historia • Blogger-palvelun perusti pieni sanfranciscolainen yritys nimeltään Pyra Labs jo vuoden 1999 elokuussa • Bloggerin kehittivät kolme kaveria,
Tilannekatsaus sovelluskehitysprojektiin Marraskuu 2008 Ilkka Kommeri
Tietojärjestelmät 2.
SAP Yksi ERP-sovellus.
Suunnitelma ohjelmiston testaukseen
Toimittaja – Sovellusarkkitehtuuritas on pilkkominen Kalle Launiala, ProtonIT Oy
Tietokanta.
Käytettävyystestaus GenMetrics projektissa Jonas Alam
Tapani Lahti & Hanna Koivula LUONNONTIETEELLINEN KESKUSMUSEO MUSTIKKA Hanna Koivula & Tapani Lahti Luonnontieteellinen keskusmuseo.
Raportointiportaali Vipunen
Visual Studio 2008 ja sovellusten elinkaaren hallinta Matti Antila Jukka Wallasvaara Iikka Paavolainen Microsoft Oy.
TFS vaiheittainen käyttöönotto
Korkeakoulujen ja opetusministeriön yhteinen tietohallintohanke, jota CSC koordinoi RAkenteellisen KEhittämisen Tukena TIetohallinto RAKETTI-XDW Käsitemäärittely,
Kaustisen seutukunnassa on 29 erillistä perusopetuskoulua luokat perusopetuskoulua luokat 7-9 (yläasteet) 4 lukiota.
Ketterä kehitys käytännössä – TFS & Meteor
Julkaisujärjestelmät Mitä seuraavaksi? Rami Alanko.
Data warehouse(tietovarasto) *yritysten tietojärjestelmissä on suunnaton määrä operatiivista tietoa *liikkeenjohdon ratkaisuille tiedon tislaaminen.
Korkeakoulujen ja opetus- ja kulttuuriministeriön yhteinen tietohallintohanke, jota CSC koordinoi RAkenteellisen KEhittämisen Tukena TIetohallinto Korkeakoulujen.
Esa Ramstadius Jussi Iltanen MTT Agronet portaali.
Kuntainfra murroksessa -kokemuksia, näkemyksiä ja arvauksia yksityisen sektorin hyödyntämisestä laajamittaisessa teknisten palveluiden tuottamisessa Tero.
SQL Standardoitu kieli, jonka avulla voidaan
Case Hanke2007DW | Topi Laamanen | Case Hanke2007DW (Maaseudun hanke- ja yritystukien raportointiratkaisu ohjelmakaudella ) Topi Laamanen.
Valvoja: Professori Raimo Kantola Ohjaaja: DI Saara Marmo
Tietojärjestelmän ylläpitorutiinien kehittäminen Asko Ikävalko TP02S.
Roni Leinonen.  Nimi tulee Gentoo pingviinistä, joka on nopeiten uiva pingviinilaji  Ensimmäinen versio julkaistiin vuonna 2002  Käyttäjällä on täysi.
Heikki Hyötyniemi Teknillinen korkeakoulu, Systeemitekniikan laboratorio 1. Älykäs WWW Totuus vai Todellisuus - tutkimuksen haasteet Heikki.
Miten yritykset voivat hyötyä avoimesta tiedosta? Jarmo Nieminen Projektipäällikkö CSC – Tieteen tietotekniikan keskus.
SUUPOHJAN PALVELUPORTIT. Suupohjan palveluportit Suupohjan palveluportit-hankkeen tavoitteena on asumis- ja hoivapalvelujen sekä seudun yhdistysten verkkopalvelujen.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Turkka Anttonen Systeemitieteiden kandidaattiseminaari – Syksy 2009 Epälineaariset pienimmän neliösumman.
RUMBA Loppuesittely Tietoa projektista Tekijät:  Jari-Pekka Heini Projektipäällikkö Testaus  Olli Lajunen Dokumentointi  Ville-Veikko Pasanen.
S11-08 Workflow-tuote tuotantojärjestelmien integraatiossa Projektisuunnitelma.
1Copyright © Sopima 2009 Sopima Oy Hiilikatu 3, FI-00180, Helsinki, Finland Sopimusten verkkopankki Paras tapa hallita.
Verkkopalvelun personointi verkon käytön louhinnan avulla Michael Holler Tieteellisen kirjoittamisen kurssi Tietojenkäsittelytieteen.
Linux-käyttöjärjestelmä. Mitä Ubuntu tarkoittaa ? Mitä Ubuntu on ? ● Afrikkalainen sana → zulu- ja xhosa-kielistä ● Kuvaa yhteisöllisyyttä ● Voidaan suomentaa.
Muutoshallinta tietovarastointiprojektissa Tietovarastoforum III Kari Karru.
Oivaltamisen iloa. Tietovaraston kehittäminen – tilannekatsaus ja kokemuksia Suunnittelija Toni Niittymäki, Kehittämisyksikkö.
Tietovarastoinnin tavoitteet ja tilanne Oulun seudun koulutuskuntayhtymässä Samuli Malinen Oulun seudun koulutuskuntayhtymä.
TEKNISEN KONSULTOINNIN TOIMIALARAPORTTI Timo Metsä-Tokila.
Perinteinen raportointimalli Muut tiedot Taloushallinnon järjestelmät Raportti 2 Raportti 1 Lopullinen raportti Suuret määrät detaljitietoa - tilaukset.
VIRTA-opintotietopalvelun tulevaisuuden skenaariot.
Tietovaraston kehittäminen Metropolia Ammattikorkeakoulussa Antti Tikka,
SYKEn metatietopalvelu Kaisu Harju Suomen ympäristökeskus SYKE VM Metatietotyöpaja
Tietovarastoforum IX Iltapäivän keskustelumuistio 1.
Oppimis- ja koulutustoiminnan analytiikan jaosto 3. 4
Työelämän uudet valvonnan muodot
Käsitemallin suunnittelutyökalut
Tietokantamoottorit Suosittuja tietokantamoottoreita: MySQL SQLite
THL verkkokoulut Kokonaispalvelu
Kanavan suosio kasvaa mobiili turvallisuuskysymykset
Mitä Business Robotics tekee?
CSC:n tietovarastopalveluiden arkkitehtuuri
Metropolian tietovaraston toteuttaminen Kimballin arkkitehtuurilla
Tietovarastofoorumi V Antti Pikkarainen
Sisältö PostgreSQL MySQL Historia yms. ORDBMS Ominaisuuksia Asennus
AHAA-palvelun tilanne
Lomake-editori Käyttöönottokoulutus
VARDA Tiedon välittyminen -työpaja
Liiketoimintaprosessit ja MS Visio 2010
Mediatekniikan Seminaari Annina Alamäki
Oulun seudun ammattiopisto Uusi toimintatapa – mitä iloa simulaattoreista Pekka Lammassaari.
EDGE
Ohjelmistotekniikan menetelmät, muutoksenhallinnan työkaluista
w w w . v i r t u a a l i a m k . f i Tietokantojen hallinta, 2 ov
Projektin ohjaus, seuranta ja raportointi Riitta Rautava .
Avoimen tuotteenhallinta
Korkeakoulujen tiedolla johtamisen ekosysteemi
Esityksen transkriptio:

Tietovarastointikoulutus Mitä asiantuntija tarvitsee tulevaisuudessa? Tapani Lahti Sovelto Oyj

DW-koulutuksen kaksi osa-aluetta ►Tietovarastoinnissa käytettävien tekniikoiden hallinta ►Tietovarastoinnissa käytettävien laitteistojen ja ohjelmistojen hallinta 2

3 Tietovaraston suunnittelu ja toteutus ►Tietovarastojen toteutuksessa on monia eri koulukuntia, joiden näkemykset oikeaoppisesta tietovarastosta eroavat toisistaan ►Dimensiomalli vs. normalisointi ►Top-down vs. bottom-up ►Tietovaraston tietomallista riippumatta analysointi perustuu pääosin dimensiomallin mukaiseen näkymään dataan

4 Datan lataus (ETL-prosessi) ►Extract ►Transform ►Load ►Suurten datamäärien käsittelyssä ETL-työkalulla ratkaisevan tärkeä rooli ►Eri tietolähteistä tulevan datan rakenteen yhtenäistäminen vaatii paljon käsityötä ►Schemamuutosten hallinta

ETL-työkalut, esimerkki (SSIS) 5

6 Datan ylläpito ja laadunvarmistus ►Tietovarastoon tuleva data on yleensä huonolaatuista ►Suurin osa ajasta tietovaraston ylläpidossa kuluu data siivoamiseen ja yhtenäistämiseen ►Tietovarastoon tulevaa dataa voi yhtenäistää jo alkulähteillä ►Ydintiedon hallinta (Master Data Management) ►Datan laadunvarmistukseen voidaan käyttää profilointityökaluja

Datan profilointi, esimerkki 7

8 Tietovaraston suorituskyvyn optimointi ►Tietovarastossa on tyypillisesti yksityiskohtaista dataa pitkältä aikaväliltä ►Datavolyymit kasvavat huomattavan suuriksi, suurimmat nykyään jo petatavujen luokassa ►Tallennustilan kapasiteetti ja suorituskyky vaativat suunnittelua ►Tietokannat alkavat eriytyä teknisesti: operatiiviset vs. analyysitietokannat ►Pilvipalvelujen mahdollisuudet ja uhkat (United Spies of America)

Suorituskyvyn seuranta, esimerkki 9

10 Datan analysointi (OLAP) ►Datan analysoinnin perusmalli on hyperkuutio, jossa on joukko ortogonaalisia dimensioita ►Dimensiot tyypillisesti hierarkkisia ►OLAP-työkalut mahdollistavat datan monipuolisen analysoinnin "kysy-mitä-vain"-periaatteella ►OLAP-työkalut optimoivat toimintaansa käyttäjän valintojen perusteella ►OLAP ei ole kuitenkaan massojen työkalu vaan edistyneiden analyytikoiden apuväline (alle 10% käyttäjistä)

OLAP-esimerkki (Excel PowerPivot) 11

12 Raportointi ►90% käyttäjistä tyytyy raportteihin ►Raportti on ennaltamääritelty näkymä hyperkuution dataan ►Raportoinnissa on haasteena löytää optimaalinen taso: oikea tieto oikeaan aikaan oikealle henkilölle ►Numeerisen datan rinnalla tarjolla runsaasti 2d-, 3d- ja 4d-visualisoinnin mahdollisuuksia ►Paperiraportit vs. interaktiiviset selainraportit

13 Tiedon louhinta ►Tiedon louhinta (Data Mining) tarjoaa tilastollisia tekniikoita tietovaraston datan analysointiin ►Rutiinikäytössä suurissa yrityksissä, läpimurtoa laajamittaiseen käyttöön PK-yrityksissä ei ole tapahtunut ►Vaatii syvällistä matemaattisten ja tilastollisten menetelmien hallintaa

Tietokantatekniikat kehittyvät ►Relaatiokannat ja SQL (1980-luvulta) ►NoSQL (2010-luku) ►SQL-rajapinta on tullut ja tulossa yhä useampiin NoSQL-tuotteisiin, tarjoaa yhteydet työkalujen välille ►NewSQL (2010-luku): relaatiotietokantoja uudella tekniikalla 14

Must know ►Relaatiomalli ►Dimensiomalli ►SQL-kieli ►Käytettävien tuotteiden ominaisuudet 15

Should know ►DW-koulukuntien erot ►OLAP perusteet ►ETL perusteet ►Raportointi perusteet ►Master Data Management perusteet ►Virtualisointi ja pilvipalvelut 16

Sovelto DW-koulutustarjontaa TEORIAA JA TEKNIIKOITA ►Tietovaraston suunnittelu ja laadunvalvonta (3pv) ►SQL-kielen peruskurssi (2pv) ►SQL-kielen jatkokurssi (2pv) TUOTEKOHTAISIA (MS SQL Server) ►SQL Server Analysis Services (3pv) ►SQL Server Reporting Services (3pv) ►SQL Server Integration Services (2pv) ►10777: Implementing a Data Warehouse with Microsoft SQL Server 2012 (4pv) 17