Digitaalisen aineiston pitkäaikaissäilytyshanke (KDK-PAS-jatkohanke) 28.10.2010 Kirjastoverkkopäivät Kimmo Koivunen
Esityksen sisältö Hankkeen kuvaus, tavoitteet ja tulokset Hankkeen tukiryhmä Lähtökohdat Suunnittelun seuraavat painopisteet
www.kdk2011.fi
KDK-PAS-jatkohanke Osa Kansallinen digitaalinen kirjasto-hanketta Tilaaja: opetus- ja kulttuuriministeriö Toteuttaja: CSC – Tieteentietotekniikan keskus Oy Kesto: 1.6.2010 – 30.10.2011 Tavoite: Edistää KDK:n pitkäaikaissäilytyksen suunnittelua ja tuottaa pitkäaikaissäilytyksen yksityiskohtainen toteuttamisuunnitelma sekä edistää yhteistoimintaa KDK:n pitkäaikaissäilytyksen tavoitteiden ja painopisteiden toteutumiseksi
Tavoite tarkemmin Tavoite voidaan yksilöidä seuraaviin osatavoitteisiin: KDK:n kokonaisarkkitehtuurinäkemysten konkretisointi Pitkäaikaissäilytyksen toteutuksen yksityiskohtainen suunnitteleminen Toimijoiden osaamisen kasvattaminen Kansallisen yhteistyöverkoston rakentaminen Kansainvälisten kontaktien voimistaminen Hanke pohjautuu KDK:n kokonaisarkkitehtuuriin ja PAS- jaoston tekemään työhön
Hankkeen tulokset Etenemissuunnitelma (valmistuu syksyllä 2010) Toteuttamissuunnitelma (valmistuu syksyllä 2011) sisältäen eri osa-alueita syventäviä osaraportteja Selvitys kansallisen yhteistyön mahdollisuuksista Selvitys kansainvälisiin yhteistyöverkostoihin osallistumisesta Lisäksi koulutuksia ja/tai tapahtumia osaamisen jakamiseksi sekä hankkeen edistymisestä tiedottamiseksi
PAS-jatkohankkeen tukiryhmä Asetettu 26.8.2010 Tehtävä ” tukea pitkäaikaissäilytyshankkeen toteuttamista osallistumalla pitkäaikaissäilytystä koskevien suunnitelmien laatimiseen, seuraamalla hankkeen etenemistä operatiivisella tasolla, vaihtamalla tietoja ja kokemuksia sekä osallistumalla aktiivisesti kansallisen ja kansainvälisen yhteistyöverkoston kehittämiseen.” Käytännössä kommentoi, ehdottaa, tunnistaa, osallistuu, vastaa (että hanke tuntee kattavasti eri sektoreiden tarpeet), huolehtii, tiedottaa www.kdk2011.fi
Tukiryhmä Jäsenet: • Juha Hakala, Kansalliskirjasto • Vesa Hongisto, Museovirasto • Minna Karvonen, opetus- ja kulttuuriministeriö • Istvan Kecskemeti, Kansallisarkisto • Esa-Pekka Keskitalo, Kansalliskirjasto • Markus Merenmies, Kansallisarkisto • Jessica Parland-von Essen, Svenska Litteratursällskapet I Finland SLS • Kari Peiponen, Valtion taidemuseo • Tapani Sainio, KDK-hanke • Pekka Tähtinen, Kansallinen audiovisuaalinen arkisto CSC toimii tukiryhmän puheenjohtajana (Kimmo Koivunen) ja sihteerinä (Kuisma Lehtonen) www.kdk2011.fi
PAS-jatkohankkeen lähtökohdat ”Missä mennään KDK:n digitaalisen pitkäaikaissäilytyksen suunnittelussa?” www.kdk2011.fi
KDK:n kokonaisarkkitehtuuri http://www.kdk2011.fi/fi/kokonaisarkkitehtuuri
KDK-PAS noudattaa OAIS-mallia
PAS-jaoston työ Loppuraportti ja sen liitteet: PAS-järjestelmän hallinnolliset ja rakenteelliset metatiedot Pitkäaikaissäilytysjärjestelmän toiminnallisuus ja toteutus PAS-palvelukuvaus Pitkäaikaissäilyttämiseen osallistuvat organisaatiot ja niiden tehtävät ja vastuut Arkistojen, kirjastojen ja museoiden sähköiset aineistot - aineistoselvitys PAS-hankkeen hyötyjen määrittely ja liittyjän valmiuksien kehittäminen http://www.kdk2011.fi/fi/pitkaaikaissailytys/loppuraportti
Esimerkki teknisestä infrasturktuurista
Pitkäaikaissäilytyksen hyöty- ja kustannusanalyysi Vuosi Järjestelmän toteutuksen vaihe Aineistoa 1 Vaatimusmäärittelyjen täydennys, työkalujen ja tukipalveluiden kehitystyö, hankintojen ja kilpailutuksen suunnittelu - 2 Työkalujen ja tukipalveluiden kehitystyö, kilpailutukset (ohjelmisto ja laitteisto), pilottijärjestelmän asennus 3 Ensimmäisten taustajärjestelmien liittäminen pilottiin, integrointiprojekti, tuotantoon ottaminen, … 300 Tt 4 Tuotantokäyttö, vaihe 1: 1. säilytyspiste tuotannossa, laitteiston täydennys, kapasiteetin lisäys, käyttö ja ylläpito 700 Tt 5 Tuotantokäyttö, vaihe 1: Maantieteellisen hajautuksen valmistelu. Toisen säilytyspisteen hankintojen kilpailutus 1000 Tt 6 Tuotantokäyttö, vaihe 2: 2. säilytyspiste tuotannossa, Kapasiteetin täydentäminen: molemmissa säilytyspisteissä kaikki aineisto 1400 Tt 7-12 Tuotantokäyttö (kaksi säilytyspistettä): Kapasiteetin lisäys 15% vuosittain, vuodesta 11 alkaen 25%, laitteistojen ja ohjelmistojen uusiminen syklien mukaisesti, vuosittain laitteiden uusintaa jossakin säilytyspisteessä, vuonna 11 uusitaan PAS-ohjelmisto Aineistotau-lukon mukainen http://www.kdk2011.fi/fi/pitkaaikaissailytys/kustannus-ja-hyotyanalyysi
Pitkäaikaissäilytyksen hyöty- ja kustannusanalyysi SADe-ohjelman mukainen hyötyanalyysi Yhteinen PAS-järjestelmä saavuttaa muihin toteutustapoihin verrattaessa tuotantovaiheessa yli 10 miljoonan vuosittaiset säästöt ja käyttöönottovaiheessa n. 30 miljoonan kertaluontoiset säästöt kumulatiivinen hyöty 12 ensimmäisen vuoden aikana 100 miljoonaa euroa Kustannusanalyysi Pohjautuu LIFE-malliin ja rajautuu keskitetyn ratkaisun kustannuksiin Yhteisen PAS-järjestelmän kokonaiskustannukset 12 ensimmäisen toimintavuoden aikana olisivat noin 42 miljoonaa euroa Jos säilyttämistä varmennetaan ns. pimeällä arkistolla (alkaen 6. toimintavuodesta), lisäkustannukset olisivat noin 3,4 miljoonaa euroa http://www.kdk2011.fi/fi/pitkaaikaissailytys/kustannus-ja-hyotyanalyysi
Säilyttämisen vaatimustasot Vaativin, mutta käyttäjän kannalta mielenkiintoisin taso Esim. Tietokonepelin pelaaminen samoin kuin 30 vuotta sitten Alkuperäisen käyttökokemuksen säilyttäminen Teksti, kuvat ja muu olennainen sisältö voidaan tulkita Ymmärrettävyys riippuu myös kohdeyleisöstä Käytön ja uuden tiedon tuottamisen kannalta yleensä tärkein taso Sisällön ymmärrettävyyden säilyttäminen Varmistetaan alkuperäisten ykkösten ja nollien säilyminen ja luettavuus, sisällön tulkinnasta ei takeita Säilyttämisen perusta ja minimitaso säilytyksen aloittamiseen: Suunnitelmallisesti tehtynä vaatimustasoa voidaan nostaa myöhemmin Bittien säilyttäminen
Säilyttämisen menetelmiä Emulaatio Emulaattoreiden kehittäminen uusille alustoille, formaattien seuranta jne. Aktiivinen testaaminen ja seuranta Alkuperäisen käyttökokemuksen säilyttäminen Migraatio Tiedostomuotojen kehityksen seuranta (formaattikirjasto) Muunnosten kehittäminen, testaaminen, toteuttaminen ja valvonta Varautuminen palautuksiin Sisällön ymmärrettävyyden säilyttäminen Eheyden varmistaminen Tiedostojen validointi ja valvonta Kopioiden hallinta Koskee sekä objekteja että metadataa Bittien säilyttäminen
Lähtökohdista tuloksiin Etenemissuunnitelma Toteuttamissuunnitelma www.kdk2011.fi
PAS-suunnittelun seuraavat painopisteet www.kdk2011.fi
Etenemissuunnitelma Kuvaus KDK:n PAS-järjestelmän suunnittelun ja toteuttamisen etenemisestä ja vaiheistamisesta Hahmottelee ja kuvaa mm. toteuttamissuunnitelman laadinnan vaatimia osaraportteja ja testejä Hankkeen yksityiskohtaisemmat tehtävät Tukiryhmän roolin kansallisen ja kansainvälisen yhteistyön mahdollisuuksia www.kdk2011.fi
www.kdk2011.fi
Tehtävien aikatulutus 2010 2011 Tehtävät Loka Mar Jou Tam Hel Maa Huh Tou Ke Hei Elo Syys 4.2.1 PAS-tiedostomuodot 4.2.2 SIP tarkastuksen rakent. 4.2.3 Migraatioprosessi 4.2.4 Replikointiprosessi 4.2.5 Virkistämisprosessi 4.1.4 Hallinnollinen metadata 4.2.8 Emulointitarpeen kart. 4.2.6 Paketointipalvelu 4.1.5 SIP-suositukset 4.3.1 PAS-sopimukset 4.1.3 PAS:n kuvaileva metadata 4.1.6 SIP ja DIP rakenne 4.2.7 AIP rakenne 4.1.1 PAS-vastaanoton toiminnot 4.1.2 PAS-käytön toiminnot 4.3.2 PAS-hallinn. prosessit 4.3.3 PAS hankinnat ja kilpail. 4.2.9 PAS-ohjelmistojen kartoitus 4.4.1 Toteuttamissuunnitelma 4.4.2 Yhteistyömahdollisuudet 4.4.3 PAS-koulutus Toteuttamissuunnitelma valmistuu CSC TA PASPA KDK www.kdk2011.fi
Kiitos! Kysymyksiä? Kimmo.Koivunen@csc.fi www.kdk2011.fi