L2R讀書筆記 pointwise

2021-09-22 10:06:46 字數 976 閱讀 4008

雖然搜尋歷經了30多年,但是基本的框架還是沒有改動的。

通常來說,乙個訓練集是由n個query組成的,每個query又有自己相關的一系列documents。

point wise方法,顧名思義,即僅僅考慮了每個query中每個document的與query相關得分和最後的label之間的關係。書中把point wise的方法一共做了3類的區分,基於回歸,基於分類和基於有序的方法。

可以用常用的回歸方法,loss函式為常用的mse。

基於二分類方法,以svm為例

當標籤取值為時(即不相關與相關),採取該類演算法。眾所周知,常用於二分類的經典模型主要有邏輯回歸,svm,lda,qda等。這裡主要介紹基於svm的方法。優化公式如下

其核心思想為用核函式去優化margin. 具體的有關svm的細節可以查閱svm相關資料。

基於多分類的方法

對於多分類問題,標籤往往意味著全部相關(y=3),大部分相關(y=2),小部分相關(y=1),不相關(y=0)等多個級別。多分類問題常用的機器學習模型有樹模型,多分類邏輯回歸模型,神經網路模型等,模型的基本思想都是一樣的,比如損失函式的定義就是

然後再用乙個softmax即可獲取

還有種是利用規則,這個和具體業務相關,這次就不去討論了。

《R實戰》讀書筆記一

你只要想處理資料,r實戰 這本書就可以助你一臂之力。r實戰 的目標是讓你認識r,並且能夠對資料進行操作,視覺化和理解。該書包括4部分16個章節8個附錄。第一部分 入門,包括5章,簡述如下。第一章 r簡介。談及r是什麼以及r的安裝,r的互動式程式設計和批處理程式設計。第二章 建立資料集。談及r獲取資料...

讀書筆記2

關於this指標 雖然this指標大家已經很熟悉了,但是我這裡討論的關於this指標的問題可能大家還沒注意過 為了說明這個關於this的歸屬問題,我自寫了一段再簡單不過的程式,雖簡單但具體 include class a void aa 我的問題是指標p1是指向b自身嗎?一看程式,大家就知道 不是,...

讀書筆記(2)

沉默的藝術 意識科學基礎理論 量子效應只是用於穩定某種內在自由度極大的基本粒子,然後再用基本粒子的內在屬性產生意識體驗。只能通過呈現乙個系統的 物理 屬性來描述乙個系統。只能通過變成內在屬性配對的其中乙個系統,以直接體驗的方式來獲得這些內在屬性的資訊。定義乙個包含所有系統的系統d,除該系統外無任何系...