Lataa esitys
Esittely latautuu. Ole hyvä ja odota
JulkaistuHanna-Mari Koskinen Muutettu yli 9 vuotta sitten
1
Dependable Clustered Computing Jari Kellokoski
2
Pankkipalvelut, verkosta ostaminen, tieteellinen laskenta (mallinnus), telepalvelut, valvontajärjestelmät, palvelinohjelmistot, jne. Yhteistä: toimintavarmuus ja suorituskyky oltavia hyviä Tiedepiirit Tuhansia solmuja Laitteistovauriot Sovellusvirheet Kaupallinen puoli Kriittiset sovellukset Tiedon varmistus Palveluiden saatavuus Skaalautuvuus Suorituskyky Ylläpito
3
Luotettavuus käsitteitä Virheiden erilainen kesto MTBF ja MTTR Virheiden estäminen Virheiden sieto Ohjelmalliset virheet –Heisenbugs –Bohrbugs Arkkitehtuuri Jaettu –Jaettuja resursseja –Resurssi aina yhden solmun käytössä kerralla Jakamaton Aktiivinen / varalla Aktiivinen / aktiivinen
4
Virheiden havainnointi Virheenkorjaus sekä laitteisto että ohjelma tasolla –Kuinka suuri osa virheistä saadaan korjattua? –Kuinka nopeasti virheet havaitaan? Oma diagnostiikka (self-testing) Watchdog –Laitteistotasolla –Ohjelmatasolla Heartbeats Idle notifications Error notifications Consistency checking ABFT
5
Toipuminen virheistä Tarkistuspisteet ja niihin palaaminen Toimintojen siirtäminen (failover ja failback) –Uudelleen järjestelyt Vuorovaikutukset (transactions) –Jakamattomat –Yhdenmukaisuus –Eheys –Säilyminen
6
Käytännön kokemukset Microsoft Cluster Server –Resource, Resource Group, Cluster –20 - 30 sekunnin alhaalla olo aika / vuosi NCR LifeKeeper –active/active –active/standby –N-way Oracle Fail Safe and Parallel Server –maksimissaan 2 solmua (Oracle Fail Safe) –Parallel Server tarjoaa myös skaalautuvuutta Liitännät Klustereiden kannalta kolmenlaisia liitäntöjä: verkko, tiedontallennus ja valvonta Tiedontallennuksessa –SAN ja Fiber Channel –SCSI –VIA Ulkopuolinen verkkoliikenne –Ethernet Valvonnassa –Yhdistelmä edellisistä tai oma menetelmä
Samankaltaiset esitykset
© 2024 SlidePlayer.fi Inc.
All rights reserved.