摘要:爲解決基因表達式編程(GEP)在符號迴歸、RFID分類及經濟領域中對時序數據的挖掘速度和精度還不夠的問題,提出了統計基因、統計染色體和統計時序一適應度的定義,並針對傳統GEP經濟時序模型進行了綜合改進;提出了新穎的單變量時序和多變量時序挖掘算法,提高了GEP統計時序挖掘的速度和精度;實驗表明,與傳統GEP、單變量GEP時序算法相比,多變量GEP時序算法挖掘速度快,其預測精度比單變量時序算法高出5%以上。該算法同樣適用於RFID以及其他經濟系統中的時序數據挖掘。
關鍵詞:經濟統計時序預測模型;單變量時序;多變量時序;GEP函數挖掘
GEP經濟統計時序挖掘算法涉及到時序基因、時序染色體和適應度函數等概念,作者提出的GEP時序挖掘模型是針對歷年的經濟統計時序數據,例如對成都市國民經濟和社會發展總量與速度等經濟指標時間序列進行預測。針對經濟統計時序數據特點,在傳統GEP概念的基礎上¨。J,提出了—C,ene、和Statistical—Fitness等新概念和技術。
1、問題描述
爲了形式化描述GEP時間序列的統計指標序列數據對象,引入下列定義:
定義l GEP時序中的統計基因是一個5元組。
定義2統計時序一適應度。
2、統計數據的時序GEP算法
目前GEP與遺傳算法和遺傳編程一樣,還存在未成熟收斂和收斂精度差的難題m 8l。爲解決其精度差問題,對GEP時間序列模型進行了綜合改進。
1)GEP浮點數係數編碼在GEP算法中,對於數值編碼採用了浮點數編碼的方法。經過實際應用,發現浮點數編碼能提高了GEP運算效率,適合精度較高應用。