2020 1 6 學習筆記

2021-10-01 22:45:21 字數 452 閱讀 3263

調整分類閾值,使得更傾向與類別少的資料。

選擇合適的評估標準,比如roc或者f1,而不是準確度(accuracy)

過取樣法(sampling):來處理不平衡的問題。分為欠取樣(undersampling)和過取樣(oversampling)兩種。

過取樣:重複少數類資料,實際上沒有為模型引入更多資料,過分強調正比例資料,會放大少數類噪音對模型的影響。由於隨機過取樣採取簡單複製樣本的策略來增加少數類樣本,這樣容易產生模型過擬合的問題,即使得模型學習到的資訊過於特別(specific)而不夠泛化(general)。

欠取樣:丟棄多數類資料,會丟失資訊。

資料合成:smote(synthetic minority oversampling technique)即合成少數類過取樣技術,它是基於隨機過取樣演算法的一種改進方案,smote演算法的基本思想是對少數類樣本進行分析並根據少數類樣本人工合成新樣本新增到資料集中。

學習筆記 雜湊學習筆記

hash基本原理 hash就是乙個像函式一樣的東西,你放進去乙個值,它給你輸出來乙個值。輸出的值就是hash值。一般hash值會比原來的值更好儲存 更小 或比較。那字串hash就非常好理解了。就是把字串轉換成乙個整數的函式。而且要盡量做到使字串對應唯一的hash值。它的主要思路是選取恰當的進製,可以...

學習筆記 CentOS 學習筆記01

簡單的做個課堂筆記 虛擬機器用的是vmware,系統是centos cd etc sysconfig network scripts pwdls 顯示列表 cat ifcfg eth0 檢視檔案內容 vi ifcfg eth0 進入vi編輯器 onboot no 原始設定 x逐字刪除 d刪除整行 a...

筆記 spring cloud 學習筆記

1 spring cloud 是什麼 spring cloud為開發人員提供了快速構建分布式系統中一些常見模式的工具 例如配置管理,服務發現,斷路器,智慧型路由,微 控制匯流排 分布式系統的協調導致了樣板模式,使用spring cloud開發人員可以快速地支援實現這些模式的服務和應用程式。他們將在任...