00 02error從何而來

2021-08-19 21:29:18 字數 1373 閱讀 5528

1.bias和variance

上節說到,更複雜的model在testing data上不一定表現的更好,也就是可能會有更大的error。
那麼error從何而來呢,有兩個因素影響,乙個是bias(偏差),乙個是variance(方差)。
這裡涉及到數學方面,講述bias和variance

抽樣的次數越多, bias和variance越接近真實值,所以每次在乙個model中找出乙個最好的function,再有很多很多model,把最好的function求期望,就會接近真實的function。

比較簡單的model和複雜的model,發現簡單的model受樣本資料影響更小,有更小的variance,但有可能一開始就瞄錯了靶心,即bias比較大。而複雜的model雖然variance更大,但很多複雜model的最好function求期望之後,卻更為接近真實的function。如下圖。

2.underfitting和overfitting

3.如何處理bias和variance

當model不能較好地fittraining data時,一般認為有比較大的bias(underfitting),這時候可以重新設計model,比如考慮更多feature,或者選擇更複雜的model。

當variance比較大的時候,收集更多的資料是乙個行之有效的方法,但這並不總是能辦到的,另外一種方法就是regularization。具體看接下來的學習吧。

興趣從何而來?

做事情有三種境界 第一種境界是強迫,在外界 例如紀律 或者自己的強迫 自制力 下做事情,例如大部分人記英語單詞,這種境界可以說是 苦不堪言 第二種境界是習慣,做的過程中既沒有痛苦也沒有快樂,例如每天早上的洗臉刷牙,這種境界可以說是 習以為常 第三種境界是喜歡,不僅不需要強迫才去做,而且是非常愉快地去...

臭毛病從何而來

我自認為算是乙個open mind的人,但和開源社群的朋友們結識後,我發現我需要進一步推進我的open mind。在北京經泰穩介紹,我們和多位熱心開源事業的朋友們結識了,當晚多位新朋友都給我留下了深刻印象 有些靦腆的gaoaang,沉靜而堅毅 帥氣的kaifeng貌似言辭銳利,但細觀卻質樸熱情。yy...

自信從何而來

很早就明白要做單元測試,要做整合測試.但是這邊的行業氛圍就是趕,基本上沒有留給程式設計師多少時間做這些.好在招測試倒是挺鬆,於是所有的鍋都會一股腦得丟給進入社會沒多久誤入測試坑的年輕人頭上.儘管每次新建專案的時候都會建立乙個單元測試專案,可往往後來這個單元測試專案中就只有開始時候作為示例的幾個dem...