機器學習之隨筆

2022-08-04 00:36:14 字數 975 閱讀 3618

以下全部是自己理解。。。希望大神們可以給予指導,萬勿噴我,,玻璃心。。謝謝!

1.什麼是手動標註?

人為的對資料進行手動標註,給予其「類標號」

2.什麼是ground truth?

就是資料的真是類標號、標籤。

3.什麼是監督?

就是資料有自己的真實類標號。

4.什麼是無監督?

資料沒有自己的真實的類標號。

5.什麼是半監督?

有的資料有標號,有的沒有標號。(需要用到聚類,將那些沒有標號的通過聚類,給予其標號)

6.什麼是弱監督?

其實弱監督包括半監督學習與多標記學習。

7.什麼是bovw?

實際上就是bow。

鏈結於8.協方差?

協方差矩陣的對角線的元素表示的是各個維度的方差,而非對角線上的元素表示的是各個維度之間的相關性,因此,在pca中,我們盡量將非對角線上的元素化為0,即將矩陣對角化,選特徵值較大的維度,去掉特徵值較小的維度,來獲得主方向,並且使主方向與其他方向的相關性盡量小。

9.harris角點檢測?

在我們解決問題時,往往希望找到特徵點,「特徵」顧名思義,指能描述物體本質的東西,還有一種解釋就是這個特徵微小的變化都會對物體的某一屬性產生重大的影響。而角點就是這樣的特徵。

觀察日常生活中的「角落」就會發現,「角落」可以視為所有平面的交匯處,或者說是所有表面的發起處。假設我們要改變乙個牆角的位置,那麼由它而出發的平面勢必都要有很大的變化。所以,這就引出了影象角點的定義

「如果某一點在任意方向的乙個微小變動都會引起灰度很大的變化,那麼我們就把它稱之為角點」 。引用於tiffanyzhou的harris角點檢測演算法。

關於角點的具體描述可以有幾種:

1.一階導數(即灰度的梯度)的區域性最大所對應的畫素點;

2.兩條及兩條以上邊緣的交點;

3.影象中梯度值和梯度方向的變化速率都很高的點;

4.角點處的一階導數最大,二階導數為0,指示物體邊緣變化不連續的方向。

機器學習隨筆1

1.dropout技術 在訓練深度學習網路的過程中,按照一定概率將一部分神經網路單元丟棄掉,即從原始的網路中找出乙個更瘦的網路。2.機器學習主流的學習演算法分為無監督學習和監督學習。3.監督學習下的回歸問題主要 連續值得輸出,而分類問題 離散值的輸出。4.m 訓練樣本的數量 x 輸入變數 特徵 y ...

機器學習隨筆(1) 交叉驗證

基本思想 交叉驗證的基本思想是把在某種意義下將原始資料 dataset 進行分組,一部分做為訓練集 train set 另一部分做為驗證集 validation set or test set 首先用訓練集對分類器進行訓練,再利用驗證集來測試訓練得到的模型 model 以此來做為評價分類器的效能指標...

《美團機器學習實踐》隨筆(一)

特徵選擇 工具eda 探索性資料分析 採用各種技術 大部分為視覺化技術 在盡量少的先驗假設條件下,探索資料內部結構和規律的一種資料分析方法或理念 數值特徵 資料應滿足模型的一些隱式或者顯示的假設,例如 線性回歸訓練使用平方損失函式等價於假設 誤差服從高斯分布。類別特徵 時間特徵 空間特徵 文字特徵 ...