機器學習題 含答案和解析

2021-10-21 13:33:32 字數 1153 閱讀 1444

1. 對於t-sne代價函式,以下陳述中的哪乙個正確?

a  本質上是不對稱的

b  本質上是對稱的

c  與sne的代價函式相同

2. 在相同的機器上執行並設定最小的計算能力,以下哪種情況下t-sne比pca降維效果更好?

a  具有1百萬項300個特徵的資料集

b  具有100000項310個特徵的資料集

c  具有10,000項8個特徵的資料集

d  具有10,000項200個特徵的資料集

3. 假設使用維數降低作為預處理技術,使用pca將資料減少到k維度。然後使用這些pca**作為特徵,以下哪個宣告是正確的?

a  更高的「k」意味著更正則化

b  更高的「k」意味著較少的正則化

c  都不對

4. 最常用的降維演算法是pca,以下哪項是關於pca的?

1.pca是一種無監督的方法

2.它搜尋資料具有最大差異的方向

3.主成分的最大數量

4.所有主成分彼此正交

a  2、3和4

b  1、2和3

c  1、2和4

d  以上所有

5. 判斷:pca可用於在較小維度上投影和視覺化資料。

a  真

b  假

6. 以下哪種演算法不能用於降低資料的維數?

a  t-sne

b  pca

c  lda

d  都不是

7. 判斷:降維演算法是減少構建模型所需計算時間的方法之一。

a  真

b  假

8. 以下哪種技術對於減少資料集的維度會更好?

a  刪除缺少值太多的列

b  刪除資料差異較大的列

c  刪除不同資料趨勢的列

d  都不是

9. 在資料集中有4個變數,如a,b,c和d.執行了以下操作:

步驟1:使用上述變數建立另外兩個變數,即e = a + 3 * b和f = b + 5 * c + d。

步驟2:然後只使用變數e和f建立了乙個隨機森林模型。

上述步驟可以表示降維方法嗎?

a  真

b  假

10. 判斷:沒有必要有乙個用於應用維數降低演算法的目標變數。

a  真

b  假

獲取答案和詳細的答案解析:

機器學習題 含答案和解析

1.目標變數在訓練集上的7個實際值為 1,1,1,1,0,0,0 目標變數的熵近似值是 log3 7 0.847,log4 7 0.560 a 0.683 b 0.683 c 0.724 d 0.243 2.關於k means聚類演算法說法不正確的是 a 對大資料集有較高的效率並且具有可伸縮性。b ...

機器學習題 含答案和解析

1.假設x公司的員工收入分布中位數為 35,000,25 和75 比例處的數值為 21,000 和 53,000。收入 1會被認為是異常值嗎?a 是 b 否 c 需要更多資訊 d 以上都不對 2.眾所周知,身高體重呈正相關。忽略圖表大小 變數被標準化了 下列兩張圖哪張更像描繪身高 x軸 體重 y軸 ...

機器學習題 含答案和解析

a 只有 1 b 只有 2 c 只有 3 2.下面哪個 些超引數的增加可能會造成隨機森林資料過擬合?1 樹的數量 2 樹的深度 3 學習速率 a 只有 1 b 有1 2 c 只有 3 d 都正確 3.下面哪一項對梯度下降 gd 和隨機梯度下降 sgd 的描述是正確的?1 在 gd 和 sgd 中,每...