日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

故障檢測和相關鏈接


故障檢測和防范是服務器群集提供的關鍵優(yōu)點 。當群集中的節(jié)點或應用程序失敗時,服務器群集可以通過重啟失敗的應用程序或將故障系統(tǒng)的工作分散給幸存的群集節(jié)點來做出響應 。服務器群集故障檢測和防范包括雙向故障轉移、應用程序故障轉移、并行恢復以及自動故障恢復 。
群集服務可以檢測各個資源或整個節(jié)點的故障,并動態(tài)地將應用程序、數(shù)據(jù)和文件資源轉移到群集中可用的正常服務器上,然后重新啟動它們 。借此,數(shù)據(jù)庫、文件共享和應用程序等資源可以對用戶和客戶端應用程序保持高度可用性 。
服務器群集在設計上帶有兩個不同的故障檢測機制 :
•心跳 通訊,用于檢測節(jié)點故障 。
•資源監(jiān)視器和資源 DLL,用于檢測資源故障 。
檢測節(jié)點故障群集的各個節(jié)點在相互間會定期使用專用的群集網(wǎng)絡交換數(shù)據(jù)報消息 。這些消息被稱作 心跳。通過心跳通訊,每個節(jié)點可以檢查其它節(jié)點以及它們的應用程序的可用性 。如果服務器沒有對心跳通訊做出響應,則正常工作的服務器會啟動故障轉移過程(包括對故障服務器擁有的資源和應用程序的所有權進行仲裁) 。仲裁是使用質詢和辯護協(xié)議來執(zhí)行的 。換言之,如果某個節(jié)點似乎發(fā)生了故障,則會在給定的時間內允許它以幾種方式中的任何一種表明它仍處于正常運行當中,并且可以同其它正常的節(jié)點通訊 。如果它無法證明,則此時會將它移出群集 。
多種事件都可能導致節(jié)點無法響應心跳消息,比如計算機故障、網(wǎng)絡接口故障、網(wǎng)絡故障,甚至可能是由于少有的高峰活動期 。通常來說,當所有節(jié)點進行通訊時,配置數(shù)據(jù)庫管理器會向每個節(jié)點發(fā)送全局性的配置數(shù)據(jù)庫更新 。但當發(fā)生心跳通訊失敗時,日志管理器還會將配置數(shù)據(jù)庫的變更保存到仲裁資源中 。這保證了幸存的節(jié)點可以在恢復過程中訪問最新的群集配置和本地節(jié)點的注冊表項數(shù)據(jù) 。
要注意的是,故障檢測算法相當保守 : 換句話說,它會盡量多地給那些明顯發(fā)生故障的節(jié)點以質詢的機會,然后才會進入故障轉移過程 。如果導致心跳響應失敗的原因是暫時的,避免故障轉移所可能造成的潛在影響當然是再好不過 。但是,由于無法知道這樣的節(jié)點還將沉默多少時間,因此該節(jié)點可能遭受長時期的故障影響 。因此,在經(jīng)過一個合理的時間段后,就應該啟動故障轉移 。
檢測資源故障故障轉移管理器和資源監(jiān)視器可聯(lián)同檢測資源故障并實現(xiàn)從資源故障的恢復 。資源監(jiān)視器通過使用資源 DLL 對資源進行定期輪詢來跟蹤資源狀態(tài) 。輪詢包括兩個步驟,即一個短促的 LooksAlive 查詢和一個時間較長并且更權威的 IsAlive 查詢 。當資源監(jiān)視器檢測到資源故障時,它會通知故障轉移管理器并且繼續(xù)監(jiān)視該資源 。
故障轉移管理器將維護資源和資源組的狀態(tài) 。它還負責在資源發(fā)生故障時執(zhí)行恢復操作,并且調用資源監(jiān)視器來響應用戶操作或故障 。
檢測到資源故障后,故障轉移管理器可以執(zhí)行恢復操作,這包括重啟資源及其依存的資源,或者將整個資源組轉移到另外的節(jié)點上 。資源和資源組的屬性以及節(jié)點的可用性將決定要執(zhí)行的是哪種恢復操作 。
為了保證能正確恢復資源依存關系,在故障轉移過程中,資源組將被作為故障轉移單位 。一旦資源從故障中恢復,資源監(jiān)視器就會通知故障轉移管理器,而后者又可以基于資源組故障轉移屬性的配置,接著執(zhí)行資源組的自動故障轉移 。
未來方向同基于 Windows 的產(chǎn)品一樣,服務器群集的將來發(fā)展也將立足于以下主要環(huán)節(jié) :
•更方便地安裝和檢查群集配置,包括對新型硬件的支持 。

推薦閱讀