理工畢業論文開題報告範文

學識都 人氣:8.4K

在實際應用中,估計數據集中的離羣點可能是非常困難的,很多算法通常丟棄增長緩慢的簇,這樣的簇趨向於代表離羣點。下面是關於理工畢業論文開題報告範文的介紹,不妨加以參考。

理工畢業論文開題報告範文

 一、論文的研究內容

論文的研究內容包括兩個方面:一是研究新的高效的聚類算法;一是把已有的聚類算法或論文提出的新算法和入侵檢測技術相結合,從而提出一個好的入侵檢測模型。具體的研究內容包括以下幾個點:

 第一、針對聚類算法的研究問題:

1、如何提高算法的可擴展性

許多聚類算法在小於200個數據對象的小數據集上是高效率的,但是無法處理一個大規模數據庫裏的海量對象。現有的聚類算法只有極少數適合處理大數據集,而且只能處理數值型數據對象,無法分析具有類屬性的數據對象。

2、如何處理離羣點

然而在某些應用中,用戶可能對相對較小的簇比較感興趣,比如入侵檢測中,這些小的簇可能代表異常行爲,那麼我們需要考慮在對算法影響更小的'前提下,如何更好的處理這些離羣點。

3、研究適合具有類屬性數據的聚類算法的有效性

對聚類分析而言,有效性問題通常可以轉換爲最佳類別數K的決策。而目前有關聚類算法的有效性分析,大都集中在對數值數據的聚類方式分析上。對於具有類屬性的數據聚類,還沒有行之有效的分析方法。

第二、針對聚類算法在IDS應用中的研究問題:

1、如何結合聚類技術和入侵檢測技術取得更好的效果

很多的聚類算法都已經和IDS應用環境結合起來了,很多研究者對前人提出的算法作出改進後,應用到IDS系統中去,或者提出一個全新的算法來適應IDS的要求。隨着聚類技術的不斷髮展,聚類技術在入侵檢測中的應用將是一個很有前景的工作。我們需要把更好的聚類技術成果應用到入侵檢測中。

 2、利用聚類技術處理入侵檢測中的頻繁誤警

雖然入侵檢測是重要的安全措施,然而它常常觸發大量的誤警,使得安全管理員不堪重負,事實上,大量的誤警是重複發生並且頻繁發生的,可以利用聚類技術來尋找導致IDS產生大量誤警的本質原因。

 二、學位論文研究依據

學位論文的選題依據和研究意義,以及國內外研究現狀和發展趨勢

聚類分析研究已經有很長的歷史,其重要性及其與其他研究方向的交叉特性已經得到了研究者的充分肯定。對聚類算法的研究必將推動相關學科向前發展。另外,聚類技術已經活躍在廣泛的應用領域。作爲與信息安全專業的交叉學科,近年來,聚類算法在入侵檢測方面也得到大量的應用。然而,聚類算法雖取得了長足的發展,但仍有一些未解決的問題。同時,聚類算法在某些應用領域還沒有充分的發揮作用,聚類技術和入侵檢測技術結合得還不夠完善。在這種背景下,我們認爲,論文的選題是非常有意義的。

本論文研究的內容主要包括兩個方面:聚類算法的研究以及聚類算法在入侵檢測中的應用。下面從兩個方面闡述國內外這兩個方面的發展現狀和趨勢:

前人已經提出很多聚類算法,然而沒有任何一種聚類算法可以普遍適用於揭示各種多維數據集所呈現出來的多種多樣的結構,根據數據在聚類中的積聚規則以及應用這些規則的方法,可以將聚類算法分爲以下幾種:

 1.劃分聚類算法

劃分聚類算法需要預先指定聚類數目或聚類中心,通過反覆迭代運算,逐步降低目標函數的誤差值,當目標函數收斂時,得到最終的聚類結果,劃分聚類算法典型代表是k-means算法[1]和k-modoids算法。這些算法處理過程簡單,運行效率好,但是存在對聚類數目的依賴性和退化性。迄今爲止,許多聚類任務都選擇這兩個經典算法,針對k-means及k-modoids的固有弱點,也出現了的不少改進版本。

 2.層次聚類算法

又稱樹聚類算法,它使用數據的聯接規則,透過一種層次的架構方式,反覆將數據進行分裂和聚合,以形成一個層次序列的聚類問題解。由於層次聚類算法的計算複雜性比較高,所以適合於小型數據集的聚類。20xx年,Gelbard等人有提出一種新的層次聚合算法,稱爲正二進制方法。該方法把待分類數據以正的二進制形式存儲在二維矩陣中,他們認爲,將原始數據轉換成正二進制會改善聚類結果的正確率和聚類的魯棒性,對於層次聚類算法尤其如此。Kumar等人[9]面向連續數據提出一種新的基於不可分辨粗聚合的層次聚類算法,既考慮了項的出現次序又考慮了集合內容,該算法能有效挖掘連續數據,並刻畫類簇的主要特性。