機器學習題 含答案和解析

2021-10-21 13:33:32 字數 1497 閱讀 9789

a  只有 1

b  只有 2

c  只有 3

2. 下面哪個/些超引數的增加可能會造成隨機森林資料過擬合?

1 樹的數量

2 樹的深度

3 學習速率

a  只有 1

b  有1、2

c  只有 3

d  都正確

3. 下面哪一項對梯度下降(gd)和隨機梯度下降(sgd)的描述是正確的?

1 在 gd 和 sgd 中,每一次迭代中都是更新一組引數以最小化損失函式。

2 在 sgd 中,每一次迭代都需要遍歷訓練集中的所有樣本以更新一次引數。

3 在 gd 中,每一次迭代需要使用整個訓練集或子訓練集的資料更新乙個引數。

a  只有 1

b  只有 2

c  只有 3

d  都正確

4. 兩個變數的 pearson 相關性係數為零,但這兩個變數的值同樣可以相關。

a  正確

b  錯誤

5. 下面哪個選項中哪一項屬於確定性演算法?

a  pca

b  k-means

c  以上都不是

6. 假定特徵 f1 可以取特定值:a、b、c、d、e 和 f,其代表著學生在大學所獲得的評分。

在下面說法中哪一項是正確的?

a  特徵 f1 是名義變數(nominal variable)的乙個例項。

b  特徵 f1 是有序變數(ordinal variable)的乙個例項。

c  該特徵並不屬於以上的分類。

d  以上說法都正確。

7. 假設有乙個如下定義的神經網路:

如果我們去掉relu層,這個神經網路仍能夠處理非線性函式,這種說法是:

a  正確的

b  錯誤的

8. 選擇logistic回歸中的one-vs-all方法中的哪個選項是真實的。(n>2)

a  我們需要在n類分類問題中適合n個模型

b  我們需要適合n-1個模型來分類為n個類

c  我們需要只適合1個模型來分類為n個類

d  這些都沒有

9. 假設對給定資料應用了logistic回歸模型,並獲得了訓練精度x和測試精度y。現在要在同一資料中新增一些新特徵,以下哪些是錯誤的選項。

注:假設剩餘引數相同。

a  訓練精度提高

b  訓練準確度提高或保持不變

c  測試精度提高或保持不變

10. logistic回歸分類器是否能對下列資料進行完美分類?

注:只可使用x1和x2變數,且只能使用兩個二進位制值(0,1)。

a  是

b  否

c  不確定

d  都不是

獲取答案和詳細的答案解析:

機器學習題 含答案和解析

1.目標變數在訓練集上的7個實際值為 1,1,1,1,0,0,0 目標變數的熵近似值是 log3 7 0.847,log4 7 0.560 a 0.683 b 0.683 c 0.724 d 0.243 2.關於k means聚類演算法說法不正確的是 a 對大資料集有較高的效率並且具有可伸縮性。b ...

機器學習題 含答案和解析

1.假設x公司的員工收入分布中位數為 35,000,25 和75 比例處的數值為 21,000 和 53,000。收入 1會被認為是異常值嗎?a 是 b 否 c 需要更多資訊 d 以上都不對 2.眾所周知,身高體重呈正相關。忽略圖表大小 變數被標準化了 下列兩張圖哪張更像描繪身高 x軸 體重 y軸 ...

機器學習題 含答案和解析

1.如下散點圖使用了邏輯回歸 黑線是決策邊界 對所有資料點進行了正確分類。若使用 high infinite regularisation 正則化無限大 時偏差會如何變化?a 偏差很大 b 偏差很小 c 不確定 d 都不是 2.假設,下圖是邏輯回歸的代價函式 現在,圖中有多少個區域性最小值?a 1 ...