機器學習題 含答案和解析

2021-10-21 13:33:32 字數 1151 閱讀 9018

1. 假設x公司的員工收入分布中位數為$35,000,25%和75%比例處的數值為$21,000 和$53,000。收入$1會被認為是異常值嗎?

a  是

b  否

c  需要更多資訊

d  以上都不對

2. 眾所周知,身高體重呈正相關。忽略圖表大小(變數被標準化了)下列兩張圖哪張更像描繪身高(x軸)體重(y軸)的圖表?

a  圖2

b  圖1

c  兩張都是

d  無法確定

3. 下圖顯示了由x**y的回歸線,圖上的值展示了每個預期的離差,請據此計算sse(殘差平方和)

a  3.02

b  0.75

c  1.01

d  以上都不對

4. 變數的相關係數可以為零,對嗎?

a  是

b  否

5. 若兩個變數相關,它們之間一定有線性關係嗎?

a  是

b  否

a  a比b高

b  a比b低

c  兩者相同

d  以上都不對

7. 為了評價乙個簡單線性回歸模型(單自變數),需要多少個引數?

a  1

b  2

c  不確定

a  1和2

b  1和3

c  2和3

d  1,2和3

9. 我們可以通過一種叫「正規方程」的分析方法來計算線性回歸的相關係數,下列關於「正規方程」哪一項是正確的?

1.我們不必選擇學習比率

2.當特徵值數量很大時會很慢

3.不需要迭代

a  1和2

b  1和3

c  2和3

d  1,2和3

10. 下列哪項可以評價回歸模型?

1.r方

2.調整r方

3.f統計量

4.rmse/mse/mae

a  2和4

b  1和2

c  2,3和4

d  以上所有

獲取答案和詳細的答案解析:

機器學習題 含答案和解析

1.目標變數在訓練集上的7個實際值為 1,1,1,1,0,0,0 目標變數的熵近似值是 log3 7 0.847,log4 7 0.560 a 0.683 b 0.683 c 0.724 d 0.243 2.關於k means聚類演算法說法不正確的是 a 對大資料集有較高的效率並且具有可伸縮性。b ...

機器學習題 含答案和解析

a 只有 1 b 只有 2 c 只有 3 2.下面哪個 些超引數的增加可能會造成隨機森林資料過擬合?1 樹的數量 2 樹的深度 3 學習速率 a 只有 1 b 有1 2 c 只有 3 d 都正確 3.下面哪一項對梯度下降 gd 和隨機梯度下降 sgd 的描述是正確的?1 在 gd 和 sgd 中,每...

機器學習題 含答案和解析

1.如下散點圖使用了邏輯回歸 黑線是決策邊界 對所有資料點進行了正確分類。若使用 high infinite regularisation 正則化無限大 時偏差會如何變化?a 偏差很大 b 偏差很小 c 不確定 d 都不是 2.假設,下圖是邏輯回歸的代價函式 現在,圖中有多少個區域性最小值?a 1 ...