DM 大資料題 含答案和解析

2021-10-21 17:17:56 字數 1206 閱讀 9087

1. 在基於圖的簇評估度量表裡面,如果簇度量為proximity(ci , c),簇權值為mi ,那麼它的型別是( )。

a  基於圖的凝聚度

b  基於原型的凝聚度

c  基於原型的分離度

d  基於圖的凝聚度和分離度

2. dbscan在最壞情況下的時間複雜度是(  )。

a  o(m)

b  o(m2)

c  o(log m)

d  o(m*log m)

3. (  )將兩個簇的鄰近度定義為不同簇的所有點對的平均逐對鄰近度,它是一種凝聚層次聚類技術。

a  min(單鏈)

b  max(全鏈)

c  組平均

d  ward方法

4. 檢測一元正態分佈中的離群點,屬於異常檢測中的基於(  )的離群點檢測。

a  統計方法

b  鄰近度

c  密度

d  聚類技術

5. birch是一種( b )。

a  分類器

b  聚類演算法

c  關聯分析演算法

d  特徵選擇演算法

6. (  )是乙個觀測值,它與其他觀測值的差別如此之大,以至於懷疑它是由不同的機制產生的。

a  邊界點

b  質心

c  離群點

d  核心點

7. 在基本k均值演算法裡,當鄰近度函式採用( )的時候,合適的質心是簇中各點的中位數。

a  曼哈頓距離

b  平方歐幾里德距離

c  余弦距離

d  bregman散度

8. 簡單地將資料物件集劃分成不重疊的子集,使得每個資料物件恰在乙個子集中,這種聚類型別稱作(  )

a  層次聚類

b  劃分聚類

c  非互斥聚類

d  模糊聚類

9. 通過聚集多個分類器的**來提高分類準確率的技術稱為 ( )

a  組合(ensemble)

b  聚集(aggregate)

c  合併(combination)

d  投票(voting)

10. 以下關於人工神經網路(ann)的描述錯誤的有 ( )

a  神經網路對訓練資料中的雜訊非常魯棒

b  可以處理冗餘特徵

c  訓練ann是乙個很耗時的過程

d  至少含有乙個隱藏層的多層神經網路

獲取答案和詳細的答案解析:

DM 大資料題 含答案和解析

1.考慮兩隊之間的足球比賽 隊0和隊1。假設65 的比賽隊0勝出,剩餘的比賽隊1獲勝。隊0獲勝的比賽中只有30 是在隊1的主場,而隊1取勝的比賽中75 是主場獲勝。如果下一場比賽在隊1的主場進行隊1獲勝的概率為 a 0.75 b 0.35 c 0.4678 d 0.5738 2.如果允許一條記錄觸發...

DM 大資料題 含答案和解析

1.考慮值集 其四分位數極差是 a 31 b 24 c 55 d 3 2.假定用於分析的資料報含屬性age。資料元組中age的值如下 按遞增序 13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,問題 使用按...

演算法題 含答案和解析

1.某段文字中各個字母出現的頻率分別是,使用哈夫曼編碼,則哪種是可能的編碼 a a 001 b 000 h 01 i 10 o 11 b a 0000 b 0001 h 001 o 01 i 1 c a 000 b 001 h 01 i 10 o 00 d a 0000 b 0001 h 001 o...