機器學習3 什麼是好的特徵

2021-07-26 20:17:30 字數 826 閱讀 8789

本章比較簡單,直接貼**和

# coding=utf-8

# 什麼是好的特徵(feature)

# 要求判斷狗是灰狗還是拉布拉多

# 現在的資料有2個feature,乙個是身高,乙個是眼睛的顏色

# 首先說身高

# 灰狗的身高大概在28cm,正負4cm

# 拉布拉多的身高大概在24cm,正負4cm

# 我們來模擬一些隨機資料

import numpy as np

import matplotlib.pyplot as plt

# 生成500個資料

greyhounds = 500

labs = 500

grey_height = 28 + 4 * np.random.randn(greyhounds)

labs_height = 24 + 4 * np.random.randn(labs)

plt.hist([grey_height,labs_height],stacked=true,color=['r','b'])

plt.show();

# 可以看到影象中間段,這些區間讓我們無法很好的判斷狗的種類

# 所以我們需要更多的特徵

# 由於狗的品種跟狗的眼睛的顏色沒有直接關係,所以"眼睛的顏色"是個"壞"的特徵

藍色為拉布拉多 紅色為灰狗

機器學習 什麼是特徵提取

通常來說,將資料想象成 是很有用的。你想要處理的每乙個資料點 每 一封電子郵件 每一名客戶 每一次交易 對應 中的一行,描述該資料點的每一項屬 性 比如客戶年齡 交易金額或交易地點 對應 中的一列。你可能會從年齡 性別 賬號建立時間 在你的購物 上的購買頻率等方面來描述使用者。你可能會用每乙個畫素 ...

什麼是機器學習

機器學習 machine learning 是研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。它是人工智慧的核心,是使計算機具有智慧型的根本途徑,其應用遍及人工智慧的各個領域,它主要使用歸納 綜合而不是演譯。學習能力是智慧型行為的乙個非常重...

什麼是機器學習

廣州的天氣總是陰晴不定,經常上午陽光燦爛,下午突然烏雲密布,狂風亂作,然後就是傾盆大雨。每次看見烏雲和大風,人們就知道要下大雨了。為什麼我們看見烏雲感受到大風,就知道要下雨了呢?我們能做出這些有效的預判,是因為我們已經積累了許多經驗,而通過對經驗的利用,就能對新情況做出有效 那麼,這樣利用經驗做出判...