探討會計數據倉庫建立

學識都 人氣:1.99W

 希望本站求職網小編精心準備的範文可以幫助到您,這是一篇關於探討會計數據倉庫建立的會計畢業論文,歡迎您的瀏覽!

探討會計數據倉庫建立

會計覈算軟件數據接口國家標準的頒佈,給不同會計軟件之間的數據交換提供了一個統一和規範的格式。隨着數據接口標準的推廣實施,利用基於會計覈算軟件數據接口標準建立的數據倉庫,對企業的財務進行分析就成爲必然。文章從數據倉庫的模型設計,數據的採集、轉換等方面,對基於國家會計數據接口標準建立數據倉庫進行了相關的技術探討。

隨着會計信息化的發展,我國的會計軟件種類也越來越多,但是往往都自成體系,採用的數據庫平臺和數據結構也就大不相同。由此使得不同的會計軟件之間,以及會計軟件與會計數據相關的業務軟件之間的數據交換,形成了一定的障礙。2004年9月20日,GB/T19581—2004《信息技術會計覈算軟件數據接口》國家標準的頒佈,在很大程度上解決了會計軟件之間數據交換的障礙。只要符合會計數據接口標準要求,實現會計信息化的單位就很容易將歷年的會計數據導出,通過建立數據倉庫,並利用會計覈算軟件對數據倉庫的數據進行相關的財務分析和決策。同時利用數據倉庫對繁多的會計數據進行管理,不僅將提高會計數據利用率,通過利用數據倉庫進行財務分析,還可以提高管理決策的質量。

一、會計覈算軟件標準數據接口基本內容

由於目前財務軟件的平臺複雜多樣,而這些軟件之間的數據沒有一個統一的數據規範,造成不同財務軟件之間數據交流相當困難。GB/T19581—2004《信息技術會計覈算軟件數據接口》的頒佈主要是對國內所有正在使用的會計覈算軟件(包括含會計覈算功能的會計信息系統、管理信息系統等)規定統一的數據輸出的內容和格式。會計覈算軟件數據接口分兩個部分,一部分是規定其內容,包括電子賬簿、會計科目、科目餘額、記賬憑證、報表等;另一部分規定其輸出的格式要求,包括文本文件的輸出方式和XML 文件的輸出方式,並要求以一定期間爲單位導出會計覈算數據。

二、數據倉庫與接口標準之間的關係

William H. Inmon 在1993年寫的《Building the Data Warehouse》論著中,將數據倉庫定義爲:“一個面向主題的、集成的、隨時間變化的、非易失性數據的集合,用於支持管理層的決策過程”。由定義可知,數據倉庫的主要特徵爲:面向主題性、數據的集成性、穩定性、時變性。通過數據倉庫,不同層次的管理人員可以進行各種管理決策的分析。數據倉庫中存放的是數據的歷史值,並且是靜態的歷史數據,可以定期添加,具有低訪問率,高訪問量的特點。而這些數據都來源於其他不同的數據庫。

目前的多數財務軟件在數據庫的選用、數據庫的格式上大不相同,導致各財務軟件之間不能互相交換數據,也給審計軟件導入財務軟件的數據帶來了一定的困難。而以往數據倉庫在財務上的應用,基本上都是面向單個企業的單獨開發。GB/T19581—2004《信息技術會計覈算軟件數據接口》的頒佈,在很大程度上解決了這種障礙。按照會計覈算軟件數據接口標準的數據結構和內容,建立一個標準數據庫即數據倉庫,從而企業可以根據會計數據接口標準要求,將原數據庫中的數據轉換爲標準規定的格式,並可以通過數據倉庫將符合要求的會計數據從會計覈算軟件導入或導出,從而實現對數據倉庫進行相關的財務分析及決策。

三、數據倉庫的模型設計

數據倉庫創建之前首先要根據需求明確所構建內容的主題域。在根據需求分析確定主題域後,就可以通過建立數據模型對數據倉庫進行描述。模型是對現實世界進行的抽象描述,在信息管理中要實現對信息的管理與分析,就要依靠數據模型將現實世界的事物轉換爲信息世界的數據。創建數據倉庫所採用的模型主要有概念模型、邏輯模型、物理模型。

(一)主題域的確定

數據倉庫設計的關鍵是主題域的確定,整個數據倉庫的數據都是圍繞主題和軟件標準數據接口而組織的,主要用於對企業的財務進行分析。根據數據接口標準規定的數據文件,主題可以分爲以下幾類:

資產負債表主題:主要分析企業某一特定日期內的財務狀況,還可以進一步細化分爲資產主題,負債主題,所有者權益主題;

現金流量表主題:分析企業在一定會計期間現金及現金等價物的流入和流出情況;

利潤表主題:用於分析企業在一定會計期間的經營成果;

所有者權益變動表主題:分析企業一定時期所有者權益變動的情況;

財務分析指標主題:通過以上主題來分析企業一定時期的營運能力、償債能力、獲利能力及發展能力等。

(二)概念模型設計

星型模型和雪花型模型是概念模型設計常使用的兩種模型。雪花型模型是對星型模型的擴展,適用於具有複雜結構數據倉庫的應用,星型模型是最常使用的模型。模型設計主要用於設置事實表與維表之間的連接,使每個維表通過主鍵與外鍵連接,進而實現與事實表的連接。概念模型的設計就是要根據需求,確定業務中的指標實體和維實體,以及在實體間建立聯繫,概念模型設計後可以在一些開發工具中,利用一些技術功能直接轉換爲物理模型,再生成數據庫,從而節約了時間並提高了效率。

 (三)邏輯模型設計

通常在概念模型設計好後,還要依靠邏輯模型來實現概念模型到物理模型的轉換。由於目前數據庫都建立在關係數據庫基礎上,所以所採用的邏輯模型主要是關係模型。會計覈算軟件數據接口標準對所涉及的數據元素規定了統一的格式,在建立的邏輯模型中,要根據數據接口的規定對數據的字段進行格式描述。邏輯模型設計主要包括事實表,維表設計以及粒度的劃分。

(1)事實表。直接反映了數據倉庫中應用的主題,是星型結構中最主要的表,包含了數據倉庫中最主要的信息,如資產負債表、現金流量表、利潤表、所有者權益變動表、財務分析表。而數據倉庫的數據都是來自於不同數據接口的數據庫,在進行數據倉庫的邏輯模型設計時,還要確定各表中的數據元素即字段與數據源的邏輯關係,以便覈算軟件按照接口標準要求輸出文件。其中的對應關係可以歸納爲:第一種是數據元素和數據源的一一對應,即可以在覈算軟件中找到與數據元素直接對應的表與字段;第二種是數據元素需數據源通過計算得到,即必須對數據源進行計算處理才能滿足標準規定的數據元素的需要;最後一種對應關係是依據邏輯判斷非源於特定數據源的數據。數據源的確定和對應關係是會計軟件輸出符合標準數據的邏輯基礎。因爲過於龐大的事實表在表的處理、備份和恢復、用戶的查詢等方面需要較長的時間,在設計時要注意使事實表儘可能地小。

(2)維表。主要用來描述事實表,與事實表有着非常重要的關係,在事實表中大多數屬性都要依賴於維表,維表的主鍵組成了事實表的外鍵,每個維表都通過主鍵與事實表的外鍵連接,實現數據庫快速查詢。維表的屬性也要根據接口標準規定進行規範定義。維表也會影響企業決策的因素,如不同企業、日期、指標類別都是影響企業決策的因素,通過這些因素決策者可以按照不同企業不同日期不同指標類別進行決策分析。根據事實表設計的維表有會計期間維表、報表編碼維表、日期維表、企業維表等。

(3)粒度的劃分。粒度是指數據倉庫的數據單位中保存數據的細化或綜合程度的級別。通過粒度的劃分,決定了數據倉庫是採用單一粒度還是多重粒度,以及粒度的劃分層次。粒度級越低,細化程度越高;相反,粒度級越高,細化程度越低。粒度的劃分直接影響到數據倉庫中的數據量和信息查詢,以及進一步進行OLAP(聯機分析處理)和數據挖掘的效果。如果主題的數據量、信息量較多,對主題數據分析細化程度要求較高,就要根據用戶對數據倉庫應用的需求,採用多重粒度進行數據劃分。用低粒度即細化到月的數據,保存近期的會計報表及財務分析指標數據,對時間較遠的會計報表及財務分析指標數據的保存用粒度較大即細化到年的數據。這樣既可以對財務近況進行細節分析,又可以利用粒度較大的數據對財務趨勢進行分析;否則採用單一粒度進行劃分。

(四)物理模型設計

邏輯模型在物理系統中的體現模式,需要通過數據倉庫的物理模型設計來實現。包括邏輯模型中的各種實體表的具體化,包括表的數據結構類型、索引策略、數據存放位置及數據存儲分配等。會計軟件數據接口標準中所要求的數據接口輸出數據,包含接口標準要求的16個數據文件和1個格式說明文件,每個文件的文件名都進行了嚴格的規定。同時在標準中對16個數據文件的81個數據元素也進行了嚴格定義,首先,在物理模型設計中表的數據結構應根據接口標準要求,對數據的格式及內容進行統一的定義規範,如表的字段標識符要採用三位數字進行標記,字段的類型長度最多爲5位可變長字符。只要會計軟件的數據倉庫的數據接口符合接口標準,就可以實現輸出符合標準的數據。其次,由於數據倉庫的數據量很大,通過索引的創建可以提高數據存取的效率,通常按事實表的主鍵和外鍵來建立索引。在數據倉庫中首先需要爲事實表設置索引,在爲事實表的主鍵聲明約束時,應該按照這些列的聲明次序創建一個惟一的索引。而對於使用頻率較高的外鍵,應置於主鍵索引的前面,以提高查詢效率。

數據倉庫中的數據可以通過數據庫訪問接口,將源數據庫中的數據轉換爲標準格式的數據導入。其中數據的存儲通常按數據的重要性、使用頻率以及對響應時間的要求進行分類,並將不同類型的'數據分別存儲在不同的存儲設備中,其中重要性高、經常存取並對響應時間要求高的數據存放在高速存儲設備上,而存取頻率低或對存取響應時間要求低的數據則可以存放在低速存儲設備上。

四、數據倉庫的創建

通過對數據倉庫中的事實表、維表的邏輯模型設計,同時根據在物理模型中對各種表的存儲區間、方式的處理,在數據倉庫的實施過程,採用適當的數據倉庫創建工具,就可以創建數據倉庫。目前用於創建數據庫的工具主要有SQL Server、Oracle10i、Sybase等。數據倉庫的創建可以根據具體情況選擇適合的開發工具。

五、數據的採集及轉換

數據倉庫的物理模型設計完成後,就要根據會計覈算軟件數據接口標準,來完成數據倉庫結構的建立,實現數據倉庫和元數據庫的創建,然後就可以對數據倉庫進行數據的加載。元數據庫是數據倉庫的靈魂,沒有元數據庫,用戶就無法對數據倉庫的數據進行良好的定義、組織和管理。數據的採集及轉換是建立數據倉庫中最重要的處理過程之一,這一過程實際上是要把來自不同的操作性數據源、不同的數據進行集成,將非標準的數據轉化爲在一定程度上的標準化的數據。採集之前首先需要對數據進行預處理,即進行準備工作包括清空工作區、準備區。由於數據倉庫中的數據來源十分複雜,這些數據在進入數據倉庫之前常常需要在準備區對數據進行標準化處理,即將不同數據結構的數據進行統一處理,如源數據庫中的數據類型與長度和標準規定的有所差別,就需要進行數據的類型轉換、長度的截取等工作。數據的採集可以通過數據庫接口訪問源數據庫,將數據轉換爲標準格式數據存入數據倉庫,同時爲了確保數據倉庫中數據質量,還要對數據進行必要的清理即篩選工作。數據的清理工作必須嚴格依據元數據的定義進行,數據清理結束就可以將經過淨化和轉換的數據加載到數據倉庫事實表中。實現的工具主要有SQL Sever、Oracle等。對數據提取以後,同樣也可以利用SQL語言實現對數據的加載。

六、數據倉庫的使用

在會計數據標準接口中,已經將會計科目、會計憑證、會計賬簿、會計報表等中的數據納入,並進行了統一規範。因此可以通過標準數據接口將每年的會計數據保存到數據倉庫。按照會計數據接口標準要求,將會計數據倉庫中的歷年數據輸入到會計覈算軟件中,並利用會計覈算軟件對其進行相關的財務分析、經濟前景預測,以幫助管理者爲企業的將來做出正確的決策。隨着數據接口標準的推廣實施,基於會計覈算軟件數據接口的數據分析技術和方法會越來越多,並且應用範圍也會越來越廣泛。