淺析計算機軟件可靠性設計

學識都 人氣:2.04W

軟件可靠性設計工程是一門還處於不成熟的正在發展確立階段的新工程學科,以下是小編蒐集整理的一篇探究計算機軟件可靠性設計的論文範文,供大家閱讀參考。

淺析計算機軟件可靠性設計

摘要:本文介紹了軟件可靠性設計的基本概念,軟件故障產生的機理,軟件質量的可靠性參數,並且着重介紹了軟件可靠性設計方法。

關鍵詞:計算機軟件;可靠性設計;機理;參數

隨着科學技術的不斷進步,軟件可靠性成爲我們關注的一個問題,軟件系統規模越做越大越複雜,其可靠性越來越難保證。應用本身對系統運行的可靠性要求越來越高,在一些關鍵的應用領域,如航空、航天等,其可靠性要求尤爲重要,在銀行等服務性行業,其軟件系統的可靠性也直接關係到自身的聲譽和生存發展競爭能力。特別是軟件可靠性比硬件可靠性更難保證,會嚴重影響整個系統的可靠性。在許多項目開發過程中,對可靠性沒有提出明確的要求,開發商(部門)也不在可靠性方面花更多的精力,往往只注重速度、結果的正確性和用戶界面的友好性等,而忽略了可靠性。在投入使用後才發現大量可靠性問題,增加了維護困難和工作量,嚴重時只有束之高閣,無法投入實際使用。本文僅就軟件可靠性工程在軟件開發過程中的應用談談自己的認識。

1.軟件可靠性設計的基本概念

1.1 軟件及軟件故障。軟件(也稱程序)本質上是一種把一組離散輸入變成一組離散輸出的工具,它由一組編碼語句組成,這些語句的功能基本上是以下功能之一:(1)計算一個表達式並將其結果存儲在單元裏;(2)決定下一步要執行哪個語句;(3)進行輸入/輸出控制。

軟件產品與硬件產品一樣。軟件的可靠性工作也是貫穿於軟件的整個壽命週期的。軟件的壽命週期,是指從軟件任務的提出一直到它完成使命,因陳舊而被廢棄爲止的整個時間歷程,這個壽命週期包括了提出要求/規格說明、設計、實現、檢驗、維護等五個階段,前四個階段爲開發期,維護階段爲使用期。

1.2 軟件可靠性。關於軟件可靠性的定義是什麼。較多的人認爲軟件的可靠性與“概率統計的可靠性”的概念密切相關,軟件的可靠性是軟件在規定的條件下、規定的時間週期內執行所要求功能的能力。軟件的可靠度是軟件在規定的條件下、規定的時間內不引起系統故障的概率,該概率是系統輸入與系統使用的函數。

2.軟件質量的可靠性參數

2.1 系統平均不工作間隔時間(MTBSD或MTBD)。設d爲軟件正常工作總時間,d爲系統由於軟件故障而停止工作的次數,則定義TBSD=Tv/(d+1)。式中,TBSD―MTBSD;Tv―軟件正常工作總時間(h);d―系統由於軟件故障而停止工作的次數。MTBSD反映了系統的穩定性。

2.2 系統不工作次數(一定時期內)。由於軟件故障而停止工作,必須由操作者介入再啓動才能繼續工作的次數。

2.3 可用度A。設Tv爲軟件正常工作總時間,TD爲由於軟件故障使系統不工作的時間,則定義A=TV/(TV+TD)。它反映了系統的穩定性,亦可表達爲A=TBD/(TBD+TDT)。式中,TBD―MTBD(h),TDT―平均不工作時間,以下簡稱MDT(h)。對一般生產用計算機系統,要求A≥99.8%;銀行計算機系統,要求A>99.9%。

2.4 MTTR。它反映了出現軟件缺陷後採取對策的效率。在一定程度上也反映了軟件企業對社會服務的責任心。對於在線系統而言,MTT只要求不超過2天,變差係數應小於1。一般的MTTR也應小於7天,變差係數小於1。

2.5 平均不工作時間(MDT)。即由於軟件故障,系統不工作的均值。對在線系統而言。MDT要求不超過10min一般的MDT<30min。

2.6 初期故障。一般以軟件交付使用後的三個月內爲初期故障期。初期故障率的大小取決於軟件設計水平、檢查項日數、軟件規模、軟件調試徹底與否等因素。

2.7 偶然故障率。一般以軟件交付給使用方四個月後爲偶然故障期,偶然故障率以每1000h的故障數爲單位,它反映了軟件處於穩定狀態下的質量。一般最少要求偶然故障率不超過1,即每千小時不到1個故障,亦即MTBF超過1000h。

2.8 使用方誤用率。使用方不按照軟件規範及說明等使用造成的錯誤叫使用方誤用。在總使用次數中,使用方誤用次數佔的百分率叫使用方誤用率。造成使用方誤用的原因之一是使用方對說明理解不深,操作不熟練,但也有可能是說明沒有講得很清楚而引起誤解。其他的原因還有軟件系統的可操作性還應改進、對使用方的使用培訓還要更深入等等

2.9 用戶提出補充要求數。這反映軟件未能充分滿足用戶的`需要,有時要求是特定用戶的特定要求,生產方爲了更好地爲社會服務,應該盡力滿足他們的要求。

2.10 處理能力。處理能力有各種指標。例如可用每小時平均處理多少文件、每項工作的反應時間多少秒等來表示,根據需要而定。在評價軟件及系統的經濟效益時需用這項指標。

3.軟件可靠性設計方法

從軟件可靠性的概念可知,軟件的缺陷可以導致錯誤並造成系統的故障,因此,缺陷是一切錯誤的根源。爲了提高軟件的可靠性,最關鍵的還是力求減少軟件中的缺陷。軟件的缺陷來自軟件壽命週期的各個階段,因此應想方設法在壽命週期的各個階段減少缺陷。缺陷在一定的環境條件下暴露,導致系統運行中出現錯誤。軟件的錯誤概括地說可能由規範(要求/規格說明)、軟件系統設計及編碼過程產生。

3.1 要求/規格說明。只要在規格說明與用戶要求說明之間存在誤差,就會產生規範錯誤。

規範它不僅規定程序的要求,還規定所用的結構、研製及試驗中需要的程序試驗要求和文件,以及程序語言、輸入和輸出的基本要求。通過對這些方面作出適當的規定,就可以建立使產生錯誤的可能性最小、並保證錯誤能被發現和改正的程序生成的結構。

這種說明書是軟件設計人員和用戶間相互瞭解的基礎,是軟件設計人員進行程序設計、調試的基礎和評價軟件的依據。要求/規格說明書應具有以下性質:

(1)可測性:生產出來的軟件產品應能根據要求/規格說明書的內容進行測試。(2)完整性:對軟件要求的描述要完整無缺。(3)明確性:對軟件的要求必須是明確的,不存在語義上的支義性。(4)一致性:要求說明書中的概念與規範化。(5)彈性:當軟件的工作環境發生變化時,其功能說明也相應地擴充或壓縮。

3.2 軟件設計。軟件系統是根據要求/規格說明(規範)設計的,通過設計將確定程序結構、測試點及限制等。爲設計出可靠的軟件,需要在考慮諸如機型、資源、語言、模型及數據結構等實際問題的基礎上,採取一些有效的設計方法。

3.2.1 “自頂向下設計”法。這種設計方法是處理分級問題最有效的設計技術。它是以一個系統功能的最抽象描述開始作爲最高層次;從它出發,設計一系列較詳細的子系統。由這些子系統來完成員高層次的功能;再以每個子系統爲基礎,設計出一系列更詳細的子系統,等等。如此逐次向下作功能分解,直到最低層次的子系統能夠比較方便用計算機程序設計語言來實現爲止。自頂向下設計方法的價值在於,它在設計的同時,指出了複雜性不同的處理層次,而且各種設計要素之間的關係是比較清楚的。通過這樣一種結構化構造途徑,有可能在早期就洞察出設計問題,從而避免了不必要地先去考慮較低層次的細節問題。

3.2.2 結構化程序設計。軟件結構對軟件的可靠性具有重要的意義。結構良好的程序易於編寫、檢查,便於查錯定位、修改和維護。結構化程序設計(也稱爲模塊化程序設計)把程序要求分成若干獨立的、更小的程序要求或模塊化的功能要求,分別提出各自的要求/規格說明,並註明是如何與程序中的其他部分接口,還必須指出所有的輸入與輸出,以及測試要求。對每一個更小的程序和模塊,可分別編程和測試,使得模塊間高度分離。

3.2.3 容錯設計。對軟件錯誤所引起的後果特別嚴重的情況,如飛機的飛行控制系統、空中交通管制系統、核反應堆安全系統等,需採用容錯軟件。容錯設計的途徑有:(1)加強軟件的健壯性;使程序設計得能夠緩解錯誤的影響,不致造成諸如死鎖或崩潰這樣的嚴重後果,並能指出錯誤源。(2)採用N(>2)版本編程法:即儘可能用不同的算法與編程語言,經不同的班組編制,以提高各軟件版本的獨立性。這N個軟件版本同時在N臺計算機上運行,各計算機間能進行高效通信,並作出快速比較,當結果不一致時,按多數表決或預定的策略選擇輸出。(3)恢復塊法:給需要作容錯處理的塊(基本塊)提供備份塊,並附加錯誤檢測和恢復措施

3 軟件編碼。在軟件結構設計的基礎上就可以進行編碼,編碼產生的缺陷是軟件錯誤的主要來源。一般的編碼錯誤是:鍵入錯代碼;數值錯誤(尤其是單位不統一時易出這類錯誤);丟失代碼(如括號);用了被零除這樣不定值的表達式等。爲了減少編碼錯誤,實現設計與生產分離,首先由高水平的軟件工程師完成結構設計,再由程序設計員完成程序的編制是合理的、必要的,並在編碼過程中儘早地查出缺陷予以改正。

4.結束語

軟件可靠性設計工程是一門雖然得到普遍承認,但還處於不成熟的正在發展確立階段的新工程學科,任然存在很多問題,需要去探索、研究和解決。本文介紹只在軟件可靠性設計方面拋磚引玉,提供借鑑。

參考文獻

[1] 張磊,周繼鋒,張強.系統軟件可靠性驗證測試方法研究[J].計算機與數字工程,2010,06.

[2] 曾福萍,靳慧亮,陸民燕.軟件缺陷模式的研究[J].計算機科學,2011,02