DM 大資料題 含答案和解析

2021-10-21 17:17:56 字數 1178 閱讀 4076

1. 考慮值集 ,其四分位數極差是

a  31

b  24

c  55

d  3

2. 假定用於分析的資料報含屬性age。資料元組中age的值如下(按遞增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 問題:使用按箱平均值平滑方法對上述資料進行平滑,箱的深度為3。第二個箱子值為

a  18.3

b  22.6

c  26.8

d  27.9

3. 假設屬性income的最大最小值分別是12000元和98000元。利用最大最小規範化的方法將屬性的值對映到0至1的範圍內。對屬性income的73600元將被轉化為

a  0.821

b  1.224

c  1.458

d  0.716

4. 熵是為消除不確定性所需要獲得的資訊量,投擲均勻正六面體骰子的熵是

a  1位元

b  2.6位元

c  3.2位元

d  3.8位元

5. 下面哪個屬於對映資料到新的空間的方法?

a  傅利葉變換

b  特徵加權

c  漸進抽樣

d  維歸約

6. 考慮值集,其截斷均值(p=20%)是

a  2

b  3

c  3.5

d  5

7. 下面不屬於建立新屬性的相關方法的是

a  特徵提取

b  特徵修改

c  對映資料到新的空間

d  特徵構造

8. 只有非零值才重要的二元屬性被稱作

a  計數屬性

b  離散屬性

c  非對稱的二元屬性

d  對稱屬性

9. 下面哪個不屬於資料的屬性型別

a  標稱

b  序數

c  區間

d  相異

10. 假設12個銷售**記錄組已經排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用如下每種方法將它們劃分成四個箱。等頻(等深)劃分時,15在第幾個箱子內?

a  第乙個

b  第二個

c  第三個

d  第四個

獲取答案和詳細的答案解析:

DM 大資料題 含答案和解析

1.在基於圖的簇評估度量表裡面,如果簇度量為proximity ci c 簇權值為mi 那麼它的型別是 a 基於圖的凝聚度 b 基於原型的凝聚度 c 基於原型的分離度 d 基於圖的凝聚度和分離度 2.dbscan在最壞情況下的時間複雜度是 a o m b o m2 c o log m d o m l...

DM 大資料題 含答案和解析

1.考慮兩隊之間的足球比賽 隊0和隊1。假設65 的比賽隊0勝出,剩餘的比賽隊1獲勝。隊0獲勝的比賽中只有30 是在隊1的主場,而隊1取勝的比賽中75 是主場獲勝。如果下一場比賽在隊1的主場進行隊1獲勝的概率為 a 0.75 b 0.35 c 0.4678 d 0.5738 2.如果允許一條記錄觸發...

演算法題 含答案和解析

1.某段文字中各個字母出現的頻率分別是,使用哈夫曼編碼,則哪種是可能的編碼 a a 001 b 000 h 01 i 10 o 11 b a 0000 b 0001 h 001 o 01 i 1 c a 000 b 001 h 01 i 10 o 00 d a 0000 b 0001 h 001 o...