7月3日 9日 週報

2022-08-11 02:36:12 字數 699 閱讀 8607

一、情感分類方面

為了提高cnn情感分類的準確率,對cnn模型的輸入層進行改進,加入word2vec。

各個方案基於這樣的前提:

a. 經過上個星期除錯,當kernel_num=200, kernel_sizes=[3, 4, 5, 6, 7] 時準確率最高,所以下面所有改進都是基於此結論的基礎上的,達到的最高準確率。

b. 所用資料是老師提供的統一資料,2分類,訓練、開發、測試資料量比約為8:1:2

結果對比如下:

1)輸入:rand(隨機初始化) + 訓練過程:static

準確率:73.1%

2)輸入:rand(隨機初始化) + 訓練過程:nonstatic

準確率:74.4%

3)輸入:預訓練word2vec + 訓練過程:nonstatic

準確率:79.6%

4)輸入:預訓練word2vec(平滑處理) + 訓練過程:nonstatic

準確率:80.2%

二、關鍵字提取方面

看完了劉知遠老師的博士**-基於文件主題結構的關鍵字提取方法,在寫了一篇閱讀筆記。

三、pytorch coding group學習

週六去工大聽word2vec的報告,主要學習了兩種模型(cbow模型和skip-gram模型)、兩種加速方法(負取樣、層次化softmax),來訓練生成詞向量。

四、聽討論班王潛公升講圍棋ai相關知識

週報 7月12日

週報 支浩宇 7.12 1.本週工作 1 與英傑 討論確定了廣告流量表結構和http介面規格。2 與彭.濤討論,初步制定了流量轉化做法。3 修復離職員工雷.龍 黎元.的遺留問題,都是.7.20要上線的 按照隱藏 刪除 三個狀態篩選.在此之前.不支援隱藏.即使.中心設為隱藏,仍然會顯示。公眾可見的頁面...

週報 3月25日 29日

週報 支浩宇3月25日 29日 這星期我的網路情況比之前好了很多,每天斷網的次數控制在5次以內,而且斷了之後一般可以較快連上。經過這個月以來的反覆斷網,我已經培養出了敏銳的觀察力,知道斷網的徵兆有哪些,如何應對。例如今天中午,在趕著提交檔案的時候,滑鼠一下子變成 忙 的形狀,我看到滑鼠的形狀,在0....

深圳9月3日

四月份來到深圳,轉眼間已經過去快半年時間了。有過傷心,有過焦慮,有過開心。過的還算是有點兒生活的味道。這半年裡,越來越覺得不安,有時候自己總覺得無所事事,不知道接下來究竟該幹什麼,迷茫空虛。我是想成為乙個技術大牛,還是要成為乙個企業管理人員,還是要成為乙個什麼社會知名專家什麼的。我想成為技術大牛,但...