NLP修行之路 day1

2021-10-08 07:43:42 字數 493 閱讀 9123

一入程式設計深似海,時光荏苒,不知不覺已從事軟體行業五年。作為乙個懶人,未為社群做半分貢獻,賬號已荒蕪多年。若不是參與datawhale社群的組團訓練營,怕是我的賬號仍舊一片白板。廢話少說,進入正題。

訓練營本期的練手專案是阿里天池上面的新聞分類任務,傳送門:零基礎入門nlp - 新聞文字分類 有興趣的同學也可以參與一下。首日的任務對賽題進行剖析

要求:對14個類別的新聞進行分類建模

標準:以f1分數作為評估模型優良的標準

目標:在測試集上的f1越大越好

未知:源文字,語言類別是英文還是中文

datawhale提供了四種解題思路導引:

思路1:tf-idf + 機器學習分類器

思路2:fasttext

思路3:wordvec + 深度學習分類器

思路4:bert詞向量

對於這個題目,tf-idf+機器學習分類器個人認為效果應該不會太好。並不是博主對tf-idf抱有偏見,而是對於匿名數字文字,我們無從得知源文字是

成長之路 Day1

今天算不上完整的一天,上午有了這個想法,下午才貫徹執行。但多多少少都記錄一下 1.學了慕客網上js高階篇的內建物件,並完成了隨之的程式設計練習。明天看完剩下的兩個知識點,再看別的。2.找工作這方面又跑去boss直聘了,亂七八糟找了一通,因為怕找不到工作方向一直不敢定專一的乙個,徒增負擔,什麼時候能確...

禿頂之路 Day 1

一 注釋 1.單行注釋 2.多行注釋 或者 3 多行注釋的注意點 注意巢狀 裡面用三個單引號,外面用三個雙引號 裡面用三個雙引號,外面用三個單引號 單雙引號岔開,不要同時使用 4.作用 具有一定的排錯性 二 變數 1.定義 可以改變的量,實際上指代記憶體的一塊空間。例如 a 1 a,b 1,2 a ...

Python成長之路 day1

print 判斷奇偶性 tmp int input 請輸入乙個整數 if tmp 2 1 print 這是乙個奇數 else print 這是乙個偶數 python demo2 用input輸入得到相應的輸出 根據性別和段位輸出相應的評價結果 gender input 請輸入性別 if gender...