數據挖掘的算法及技術的應用的研究論文

學識都 人氣:2.34W

摘要:數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中發現隱含的、規律性的、人們事先未知的, 但又是潛在有用的並且最終可被理解的信息和知識的非平凡過程。任何有數據管理和知識發現需求的地方都可以藉助數據挖掘技術來解決問題。本文對數據挖掘的算法以及數據挖掘技術的應用展開研究, 論文對數據挖掘技術的應用做了有益的研究。

數據挖掘的算法及技術的應用的研究論文

關鍵詞:數據挖掘; 技術; 應用;

引言:數據挖掘技術是人們長期對數據庫技術進行研究和開發的結果。起初各種商業數據是存儲在計算機的數據庫中的, 然後發展到可對數據庫進行查詢和訪問, 進而發展到對數據庫的即時遍歷。數據挖掘使數據庫技術進入了一個更高級的階段, 它不僅能對過去的數據進行查詢和遍歷, 並且能夠找出過去數據之間的潛在聯繫, 從而促進信息的傳遞。

一、數據挖掘概述

數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中發現隱含的、規律性的、人們事先未知的, 但又是潛在有用的並且最終可被理解的信息和知識的非平凡過程。

二、數據挖掘的基本過程

(1) 數據選擇:選擇與目標相關的數據進行數據挖掘。根據不同的數據挖掘目標, 對數據進行處理, 不僅可以排除不必要的數據干擾, 還可以極大地提高數據挖掘的效率。 (2) 數據預處理:主要進行數據清理、數據集成和變換、數據歸約、離散化和概念分層生成。 (3) 模式發現:從數據中發現用户感興趣的模式的過程.是知識發現的主要的處理過程。 (4) 模式評估:通過某種度量得出真正代表知識的模式。一般來説企業進行數據挖掘主要遵循以下流程——準備數據, 即收集數據並進行積累, 此時企業就需要知道其所需要的是什麼樣的數據, 並通過分類、編輯、清洗、預處理得到客觀明確的目標數據。數據挖掘這是最為關鍵的步驟, 主要是針對預處理後的數據進行進一步的挖掘, 取得更加客觀準確的數據, 方能引入決策之中, 不同的企業可能採取的數據挖掘技術不同, 但在當前來看暫時脱離不了上述的挖掘方法。當然隨着技術的進步, 大數據必定會進一步成為企業的立身之本, 在當前已經在很多領域得以應用。如市場營銷, 這是數據挖掘應用最早的領域, 旨在挖掘用户消費習慣, 分析用户消費特徵進而進行精準營銷。就以令人深惡痛絕的彈窗廣告來説, 當消費者有網購習慣並在網絡上搜索喜愛的產品, 當再一次進行搜索時, 就會彈出很多針對消費者消費習慣的商品。

三、數據挖掘方法

1、聚集發現。

聚集是把整個數據庫分成不同的羣組。它的目的是要羣與羣之間差別很明顯.而同一個羣之間的數據儘量相似.聚集在電子商務上的典型應用是幫助市場分析人員從客户基本庫中發現不同的客户羣, 並且用購買模式來刻畫不同客户羣的特徵。此外聚類分析可以作為其它算法 (如特徵和分類等) 的預處理步驟, 這些算法再在生成的簇上進行處理。與分類不同, 在開始聚集之前你不知道要把數據分成幾組, 也不知道怎麼分 (依照哪幾個變量) .因此在聚集之後要有一個對業務很熟悉的人來解釋這樣分羣的意義。很多情況下一次聚集你得到的分羣對你的業務來説可能並不好, 這時你需要刪除或增加變量以影響分羣的方式, 經過幾次反覆之後才能最終得到一個理想的結果.聚類方法主要有兩類, 包括統計方法和神經網絡方法.自組織神經網絡方法和K-均值是比較常用的`聚集算法。

2、決策樹。

這在解決歸類與預測上能力極強, 通過一系列的問題組成法則並表達出來, 然後經過不斷詢問問題導出所需的結果。典型的決策樹頂端是一個樹根, 底部擁有許多樹葉, 記錄分解成不同的子集, 每個子集可能包含一個簡單法則。

四、數據挖掘的應用領域

4.1市場營銷

市場銷售數據採掘在銷售業上的應用可分為兩類:數據庫銷售和籃子數據分析。前者的任務是通過交互式查詢、數據分割和模型預測等方法來選擇潛在的顧客以便向它們推銷產品, 而不是像以前那樣盲目地選擇顧客推銷;後者的任務是分析市場銷售數據以識別顧客的購買行為模式, 從而幫助確定商店貨架的佈局排放以促銷某些商品。

4.2金融投資

典型的金融分析領域有投資評估和股票交易市場預測, 分析方法一般採用模型預測法。這方面的系統有Fidelity Stock Selector, LBS Capital Management。前者的任務是使用神經網絡模型選擇投資, 後者則使用了專家系統、神經網絡和基因算法技術輔助管理多達6億美元的有價證券。

結論:數據挖掘是一種新興的智能信息處理技術。隨着相關信息技術的迅猛發展, 數據挖掘的應用領域不斷地拓寬和深入, 特別是在電信、軍事、生物工程和商業智能等方面的應用將成為新的研究熱點。同時, 數據挖掘應用也面臨着許多技術上的挑戰, 如何對複雜類型的數據進行挖掘, 數據挖掘與數據庫、數據倉庫和Web技術等技術的集成問題, 以及數據挖掘的可視化和數據質量等問題都有待於進一步研究和探索。

參考文獻

[1]孟強, 李海晨數據挖掘技術及應用研究[J].電腦與信息技術, 2017, 25 (1) :59-62.

[2]高海峯.智能交通系統中數據挖掘技術的應用研究[J].數字技術與應用, 2016 (5) :108-108.