學習筆記(三) 使用K近鄰演算法檢測Rootkit

2021-08-29 01:45:11 字數 957 閱讀 5757

rootkit是一種特殊的惡意軟體,它的功能是在安裝目標上隱藏自身以及指定的檔案,程序和網路鏈結等資訊。

1.資料蒐集

kdd 99 tcp連線內容特徵包括hot ,num_faild_logins ,logged_in ,num_compromised ,root_shell ,su_attempted ,num_root ,num_file_creations ,num_shells ,num_access_files ,num_outbound_cmds ,is_hot_login ,is_guest_login

載入kdd99資料集中的資料:

def load_kdd99(filename):

x=with open(filename) asf:

for line in f:

line=line.strip('\n')

line=line.split(',')

return x

篩選標記為rootkit和normal且是telnet協議的資料:

if (x1[41] in ['rootkit.','normal.']) and (x1[2]=='telnet'):

if x1[41]=='rootkit.':

else:

2.特徵化:挑選rootkit有關的特徵作為樣本特徵

x1 = x1[9:21]

for x1 in v:

v1 =

for x2 in x1:

3.訓練樣本

clf = kneighborsclassifier(n_neighbors = 3)
4.效果驗證

print cross_validation.cross_val_score(clf, x, y, n_jobs=-1, cv=10)

學習筆記 K 近鄰演算法

一 k 近鄰演算法概述 適用於 數值型和標量型 1 收集資料 2 準備資料 向量點距離 3 按照距離遞增次序排序 4 選取與當前距離最小的k個點 5 確定選擇k個點所在類別的頻率 6 判斷當前點的的類別 二 k 近鄰演算法實現 python語言實現 共有資料1000行,含有三個資料特徵 每年獲得的飛...

學習筆記34 k近鄰演算法

k nearest neighbor knn 這是一種分類演算法,它的核心思想是 對於新的樣本,根據其k個最近鄰的樣本的類別,通過多數表決等決策規則,決定它的類別。使用k近鄰演算法,首先需要確定三個東西 距離度量,k值的選擇,分類決策規則 特徵空間中兩個樣本點之間的距離反映了這兩個樣本的相似程度,距...

學習筆記(一)k 近鄰演算法(KNN)

終於找到 機器學習實戰 這本書了,在此記錄一些總結,便於回顧。knn的工作原理是 存在乙個樣本資料集合,也稱作訓練樣本集,並且樣本集中每個資料都存在標籤,即我們知道樣本集中每一資料與所屬分類的對應關係。輸入沒有標籤的新資料後,將新資料的每個特徵與樣本集中資料對應的特徵進行比較,然後演算法提取樣本集中...