產(chǎn)品分類導(dǎo)航
CPHI制藥在線 資訊 A001 計(jì)算機(jī)化系統(tǒng)災(zāi)難恢復(fù)計(jì)劃制定

計(jì)算機(jī)化系統(tǒng)災(zāi)難恢復(fù)計(jì)劃制定

作者:A001  來源:CPHI制藥在線
  2022-11-24
災(zāi)難恢復(fù)(Disaster Recovery 簡稱DR)系統(tǒng)主要是針對在計(jì)算機(jī)軟件系統(tǒng)在正常使用過程中,如果服務(wù)器等關(guān)鍵部件運(yùn)行出現(xiàn)了問題以后,我們?nèi)绾巫龊脩?yīng)急恢復(fù)工作。

計(jì)算機(jī)化系統(tǒng)災(zāi)難恢復(fù)計(jì)劃制定

       災(zāi)難恢復(fù)(Disaster Recovery 簡稱DR)系統(tǒng)主要是針對在計(jì)算機(jī)軟件系統(tǒng)在正常使用過程中,如果服務(wù)器等關(guān)鍵部件運(yùn)行出現(xiàn)了問題以后,我們?nèi)绾巫龊脩?yīng)急恢復(fù)工作,就像突然遭遇到了一個災(zāi)難,如何讓計(jì)算機(jī)系統(tǒng)恢復(fù)過來。目前對于災(zāi)難的定義有很多種,可以是自然災(zāi)害如水淹、火災(zāi)、黑客入侵等,稱之為災(zāi)難說明事故很嚴(yán)重,并不是系統(tǒng)出現(xiàn)了一個小BUG,你可以自己去恢復(fù),而是需是用一種事先制定好的災(zāi)難恢復(fù)計(jì)劃來恢復(fù)。目前對于災(zāi)難恢復(fù)現(xiàn)在有很多種方式,自己的單位要事先制定一套災(zāi)難恢復(fù)計(jì)劃,比如說這一個服務(wù)器不可用了,你可以用其它的,還有現(xiàn)在可以應(yīng)用云的技術(shù),把服務(wù)器布署在云上,可以減少物理災(zāi)害,用的是云的算力而不需要自己的服務(wù)器。當(dāng)然云服務(wù)器服務(wù)商也要有如何避免災(zāi)難的措施。

       災(zāi)難恢復(fù)一般是由IT部門負(fù)責(zé),包括了系統(tǒng)的恢復(fù),任何一個系統(tǒng)都應(yīng)該有一個災(zāi)難恢復(fù)計(jì)劃,不只局限于計(jì)算機(jī)化系統(tǒng),也包括我們的生產(chǎn)系統(tǒng)和系統(tǒng)運(yùn)行所需要的所有基礎(chǔ)設(shè)施。災(zāi)難恢復(fù)計(jì)劃是要確保在災(zāi)難下組織的生產(chǎn)系統(tǒng)能在預(yù)定義的時間內(nèi)恢復(fù)基本運(yùn)作。

       做災(zāi)難恢復(fù)首先要明白什么叫系統(tǒng)恢復(fù)和容錯能力,系統(tǒng)恢復(fù)和容錯能力的主要目標(biāo)就是消除單點(diǎn)故障,就是一個組件故障了,整個系統(tǒng)崩潰。容錯能力就是那怕是單點(diǎn)故障了,一個組件壞了以后,整個系統(tǒng)仍然可以正常運(yùn)行。計(jì)算機(jī)化系統(tǒng)里稱之為冗余。包含的主要部件有硬盤驅(qū)動器、服務(wù)器、網(wǎng)絡(luò)設(shè)備、電源、PLC等。

       硬般服務(wù)器常冗余見的就是做鏡象備份,如插兩塊硬盤,實(shí)時備份,如果其中一個壞掉了,另外一個可以保證正常應(yīng)用。電源冗余就是雙電源供電,一個壞了另一個還可以接著用、一用一備。我們要避免單點(diǎn)故障就把整個系統(tǒng)拖跨。所以要提高主要部件冗余程度。

       災(zāi)難恢復(fù)的主要策略:首先就是確定業(yè)務(wù)單元的優(yōu)先順序,為了能盡快的有效恢復(fù)系統(tǒng)運(yùn)行,設(shè)計(jì)我們的應(yīng)爭恢復(fù)計(jì)劃應(yīng)該從優(yōu)先級別最高為主,比如純化水系統(tǒng)故障了,首先是恢復(fù)能手動控制能繼續(xù)保證生產(chǎn),這是第一位的,再恢復(fù)PLC實(shí)現(xiàn)自動控制相關(guān)的,這些不恢復(fù)暫時不影響操作,所以要確定系統(tǒng)中各業(yè)務(wù)單元的優(yōu)先順序。如果手工流程可以使業(yè)務(wù)繼續(xù)運(yùn)行下去的話,還需要考慮一旦電子化系統(tǒng)恢復(fù)以后,之前手工的流程如何同步回我們的電子記錄,或者說我們這一段的記錄怎么交接。

       其次要有災(zāi)難發(fā)生時的處置程序,對員工進(jìn)行災(zāi)難恢復(fù)的培訓(xùn),讓員工知道遇到災(zāi)難發(fā)生時應(yīng)該按照什么流程處理,讓管理者在出現(xiàn)災(zāi)難時能夠按照正確的規(guī)程來執(zhí)行恢復(fù),相當(dāng)于一個應(yīng)急預(yù)案。

       系統(tǒng)按照工作組劃分來進(jìn)行恢復(fù),在設(shè)計(jì)災(zāi)難恢復(fù)計(jì)劃時都是以組來進(jìn)行實(shí)施的,比如一個車間出現(xiàn)問題的時候,我們肯定是生產(chǎn)組的管生產(chǎn)設(shè)備,IT組的管服務(wù)器、PLC等,QC的管QC等按組來分的,在制定計(jì)劃時要以組為目標(biāo),每個組恢復(fù)到正常的工作狀態(tài)。

       是否有可替化的設(shè)備或方案,如果PLC壞了是否有手動的方法和流程,這就是可替代的方案,筆者曾經(jīng)遇到過,我車間臺壓片機(jī),員工的操作中沒有蓋下觸摸屏的防護(hù)罩,怡好一個工具落上去,屏幕環(huán)了無法顯示了,但設(shè)備還在運(yùn)行,其它部件完全不受影響,當(dāng)時這臺設(shè)備也是新購買不久的,沒有屏幕備件,就面臨著運(yùn)行參數(shù)不可控,產(chǎn)品質(zhì)量無法保證。當(dāng)時正好我單位有別的車間新購了一臺同型號的壓片機(jī),我們直接拆下控制屏換上了,這就是替代的方案,但不認(rèn)為是一個好的應(yīng)急案。

       恢復(fù)計(jì)劃制定的主要關(guān)注點(diǎn),不限于計(jì)算機(jī)化系統(tǒng)。包括緊急事件響應(yīng),人員的通知,評估、數(shù)據(jù)備份、外部通信、公共設(shè)施、物流、恢復(fù)與還原等。出現(xiàn)了緊急事件以后,要按按照事先規(guī)定的,那些優(yōu)先級高的要先處理,優(yōu)先級低的可以往后放,災(zāi)難恢復(fù)一定要有一個聯(lián)系人的清單和聯(lián)系方式,在出現(xiàn)故障時現(xiàn)場人員可以直接聯(lián)上,甚至還要有備作聯(lián)系人。當(dāng)人員到場后需要對這個災(zāi)難進(jìn)行評估,這個災(zāi)難是屬于那一個級別的,應(yīng)該執(zhí)行那一個災(zāi)難恢復(fù)的流程,最好能夠列出一些依據(jù)。數(shù)據(jù)一定要遠(yuǎn)程備份,定期備份,每天進(jìn)行增量備份,定期進(jìn)行一個完整的備份。災(zāi)難恢復(fù)時有一些備件要提前備上,關(guān)鍵部件一般價值都比較高,正常情況下會有供貨周期,如遇到突發(fā)情況如疫情發(fā)生,物流不走了,想發(fā)都發(fā)不出,這就在計(jì)劃中制定那些關(guān)鍵部件要備分。在恢復(fù)系統(tǒng)時是執(zhí)行恢復(fù)還是還原,就要 看如果原系統(tǒng)在恢復(fù)的基礎(chǔ)上還能用,那就恢復(fù)回來,如果無法恢復(fù),那就在原來備份的基礎(chǔ)上還原回來,這個也是要進(jìn)行評估的?;謴?fù)后根據(jù)系統(tǒng)的關(guān)鍵性進(jìn)行確認(rèn)與驗(yàn)證工作。

       災(zāi)難恢復(fù)后期還是要進(jìn)行培訓(xùn),對新員工進(jìn)行培訓(xùn),對擔(dān)任災(zāi)難恢復(fù)的主要人員進(jìn)行培訓(xùn),對恢復(fù)的團(tuán)隊(duì)進(jìn)行培訓(xùn),定期對培訓(xùn)效果進(jìn)行評價,有備無患。如果從來沒進(jìn)行過災(zāi)難恢復(fù),當(dāng)真出了事故時,雖然你有這些規(guī)程,但沒有人執(zhí)行過,實(shí)操過程肯定會出現(xiàn)許多漏洞。

       災(zāi)難恢復(fù)后的測試與確認(rèn),首先進(jìn)行模擬演習(xí),災(zāi)難恢復(fù)團(tuán)隊(duì)的人就像頭腦風(fēng)暴一樣,聚在一起每個人扮演自己的角色,模擬恢復(fù)過程,通過模擬恢復(fù)過程檢查災(zāi)難恢復(fù)計(jì)劃制定的是否完善,是不是需要補(bǔ)充。還可設(shè)定一個情境,要求相關(guān)人員作出對就的搶救措施,評估效果。有時一些廠家的軟件我們無法自行安裝,例HPLC的控制軟件,它可能需要授權(quán)碼,所以建議大家在SAT(工廠驗(yàn)收)交付時,讓供應(yīng)商一定要配合驗(yàn)證工作,把對應(yīng)的測試做了。

       災(zāi)難恢復(fù)計(jì)劃是一個很靈活的計(jì)劃,計(jì)算機(jī)化系統(tǒng)也在不斷變化,不斷的有新設(shè)備的增加、操作系統(tǒng)更新、舊設(shè)備的淘汰、人員的變更等。組織需求的變化后,我們的流程也應(yīng)不斷的更新。當(dāng)出現(xiàn)了些大的變更時,有必面進(jìn)行災(zāi)難恢復(fù)計(jì)劃的更新。出現(xiàn)什么問題有計(jì)劃,才能做好恢復(fù)工作。如果真出現(xiàn)問題了,先拍腦門就很容易出現(xiàn)一些無法挽回的事。       

相關(guān)文章

合作咨詢

   肖女士    021-33392297    Kelly.Xiao@imsinoexpo.com

2006-2024 上海博華國際展覽有限公司版權(quán)所有(保留一切權(quán)利) 滬ICP備05034851號-57