機器學習第5周!

2021-07-22 10:35:51 字數 1332 閱讀 8838

教輔說這週的作業是史上最難,果不其然,我花了好久好久才完成….好吧其實也沒有很難,就一開始的cost function卡了很久,後面倒是挺順利的,簡單地調了幾遍就過了,現在第五周完成了,還有1個小時第六周就過期了。。。路漫漫,是真的。

機器學習的本質在於通過大量資料的訓練,使計算機能夠擁有人類的某種能力,比如識別數字、開車,正如人類有認知錯誤一樣,計算機學習以後的識別也會有些偏差。比如讓它識別10個數字,它可能對了9個,錯了乙個,我們希望它識別100個數字的時候也只錯乙個,這就是識別的優化。cost function就是那些造成偏差東西,而我們要減少偏差,就是要最小化這個cost function,這是從第一周就開始的機器學習基本思想。

上面介紹了cost function的本質,具體怎麼構成這個方程可能涉及了很多高深推理,ng教授也只是給了方法,他承認很多機器學習的工作者知道的也不多,會用這些方法,會用fminunc函式就賺了很多錢,我這裡就回顧一下教授教的方法吧。j(

θ)=1

m∑i=

1m∑k

=1k[

−y(i

)klo

g((h

θ(x(

i)))

k)−(

1−y(

i)k)

log(

1−(h

θ(x(

i)))

k)]

呼…這個公式很長,但由於它是在之前線性回歸方法的cost之上進一步發展出來的,所以理解上去不是很難。原來的cost function是這樣的: j(

θ)=1

m∑i=

1m[−

y(i)

log(

hθ(x

(i))

)−(1

−y(i

))lo

g(1−

(hθ(

x(i)

)))]

出現不同的原因在於,之前要實現的功能,比如**房價,只需要輸出乙個數字(表示**)即可,而現在不一樣,之前的文章也提過,輸出的是該影象屬於10中不同種類的概率,所以偏差需要把這10個種類對應的偏差都加起來。

上一周用於識別的方法是層層計算,得出的概率找最大的,最大值的索引就是所在分類,比如向量v中第4個分量最大,那麼可以得出結論v對應的影象上是數字4. 這周介紹了乙個新的方法叫做backpropagation, 工作原理是這樣的:取一組訓練集合(就是一張畫素資料存在 x(

i)中的和它顯示的數字 y(

i)), 正方向按照上一周的方式算過去,再反過來計算

δ 和

δ 的值,依據他們倆來得出梯度,用函式fminunc多次迭代….

就一種方法而已,怎麼算的wiki裡都有,我**也通過了,我就不介紹了,今天洗洗睡了。

20162307 第5周學習總結

解決方案 物件導向是一種程式設計方法,一種思維方式,不是一種程式語言。2 問題 解決方案 找到了乙個人的部落格,並自己進行了實踐 2 問題 解決方案 量截圖 其中有1000行是我在網上找的別人的四則運算擴充套件的 想要學習,儲存在我的目錄裡,所以我的 會多。行數 新增 累積 部落格量 新增 累積 學...

慕課第5周學習總結

我在網易雲課堂上選擇了中國大學mocc 城市總體規劃 課程,下面是我對上一周學習的總結。首先不得不說的是網易雲課堂真的是乙個很好的自學平台,裡提供了很多學習資源,各個學科,各個領域的知識,非常全面,並且由名校導師授課。當你選擇了一門課程後,從公告到評分標準,從課件到測驗作業,從考試到討論區,乙個很清...

第5周心得

上週軟院學生會召開一次會議,所有幹事和15級班幹部都到場,宣布了軟體學院學生會接下來的工作,還有關於15級幹事與班委的培訓,讓老師給我們上一堂課,我們社聯在昨天上了培訓課,社聯的指導老師給我們講了關於如何做乙個幹事,作為乙個部長主席怎麼安排社聯的活動不影響幹事的學習,我們來到學校最重要的是學習要把重...