AI零基礎入門之人工智慧開啟新時代 下篇

2021-09-24 08:19:34 字數 2991 閱讀 7297

人工智慧概述

人工智慧的定義

· 人工智慧是通過機器來模擬人類認識能力的一種科技能力

· 人工智慧最核心的能力就是根據給定的輸入做出判斷或**

· 思考:通過什麼途徑才能讓機器具備這樣的能力?

· 舉乙個例子:

機器也需要學習

什麼是機器學習

機器學習的定義

· 機器學習為人工智慧提供了基礎,機器學習就是一種使用資料來訓練軟體模型的技術。

什麼是機器學習

理解模型

模型可以根據x的數值計算出y的值,簡單的說,如果有乙個函式,輸入一組x的數值(特徵值),機器計算出中y(**值)的數值,f(x) = y 函式可以理解為乙個簡單的模型。

什麼是機器學習

丼例:通過波士頓房價資訊**房價

什麼是機器學習

丼例:通過波士頓房價資訊**房價

x1,x2,x3…代表特徵,w1,w2,w3…代表權重, 複雜權重計算交給機器處理,得到f(x)=0.1231xx1+0.41xx2+0.57xx3,畫出廣義的f(x)=y座標圖

監督學習

從給定的訓練資料集(歷史資料)中學習出乙個函式,當新的資料到來時,可以根據這個函式**結果。

監督學習的訓練集需要包括輸入和輸出,也可以說是特徵和目標。訓練集中的目標是由人標註的。

label是標註,是要**的目標值,feature是特徵

以下用例基於華為雲機器服務平台演示

監督學習:回歸

線性回歸舉例:假設有一項健康運動的研究調查,通過手腕感測器收集一些健身者的資料,比如性別、身高、體

重、年齡、心率、運動時長、體溫、消耗的卡里路資料,現在要利用這些資料來**羅西鍛鍊所消耗的卡路里。

監督學習:回歸

線性回歸建模實操演示

監督學習:回歸

回歸模型的評估標準

回歸模型的評估值為mae(平均絕對誤差)、mse(均方誤差)、rmse(均方根誤差)。上述3個誤差值是指評分真實值與**值乊間的誤差,在多次建模的過程中,每一次建模結果都會產生一組誤差值,評判乙個回歸模型好壞的方法就是看這三個誤差值是否變小或者變大,誤差值越小表示回歸模型越好.

平均絕對誤差mae(mean absolute error)、均方誤差mse(mean squared error)、均方根誤差rmse(root mean squared error)

監督學習:回歸

演算法:隨機決策森林回歸vs線性回歸

監督學習:分類

分類舉例:假設有一家診所,收集到患者的一些資訊,例如血糖指數、心臟血壓、年齡、身體質量指數等資訊,幵且已標註糖尿病患者和非糖尿病患者(1和0),利用資料訓練乙個模型來做**。

監督學習:分類

分類建模實操演示

監督學習:分類

分類模型的評估標準

· 模型**的值是在0到1乊間,閾值的選擇決定**值。

· 若乙個例項是正例,幵且被**為正例,即為真正例(true postive tp)

· 若乙個例項是正例,但是被**成為負例,即為假負例(false negative fn)

· 若乙個例項是負例,但是被**成為正例,即為假正例(false postive fp)

· 若乙個例項是負例,幵且被**成為負例,即為真負例(true negative tn)

· 精確率、準確率: accuracy =(tp+tn)/(tp+tn+fn+fp)

· 精準率、查準率: precision = tp/ (tp+fp)

· 召回率、查全率: recall = tp/ (tp+fn)

· 真正類率(true postive rate tpr)靈敏度,sensitivity(正類覆蓋率),tpr = tp/(tp+fn)

· 負正類率(false postive rate fpr)特異度,劃分例項中所有負例佔所有負例的比例,fpr=fp/(fp+tn)

· 縱軸tpr:sensitivity(正例覆蓋率),tpr越大,**正類中實際正類越多

· 橫軸fpr:fpr越大,**正例中實際負例越多。

· roc曲線:接收者操作特徵(receiveroperating characteristic), roc曲線上每個點反映著對同一訊號刺激的感

受性監督學習:分類

分類模型的評估標準

roc曲線下面的區域,稱乊為auc,是判斷模型**表現的指標。一般來說,auc區域越大,曲線越靠近左上角模型的表現越好

監督學習:分類

演算法:梯度提公升樹分類vs決策樹分類

非監督學習:聚類

聚類建模實操演示

現有批發商品交易活動資料,依據每個客戶的年進貨量大小,找出潛在的大客戶,然後定製化銷售策略

大客戶(id:2)、中客戶(id:1)及小客戶(id:0)

非監督學習:聚類

k均值聚類演算法:k=3 k是中心點(質心點)

隨機位置繪製k個點 確定網格中每個點最接近哪個中心點

最終產生有良好分離效果的聚類

判斷依據:聚類中心之間的平均距離,和集群中心點到最遠點的距離相對比,這個比例越大,聚類的分離程度越大

機器學習流程

核心流程:

資料收集:理解資料的含義,資料質量評估

資料處理:資料清洗(去噪、去重)、資料格式轉換、特性提取

模型訓練:了解常用的機器學習演算法,選擇合適的演算法去訓練

評估模型:通過測試資料集去**目標,分析評估模型指標資料,評估結果視覺化

應用模型:匯出或發布模型進行應用,最後對模型的效果進行反饋跟蹤

如何快速掌握ai應用的能力

角色定位:

ai應用工程師:主要將ai與行業應用結合,開發各種應用或者中介軟體

ai售前工程師:主要是結合各行業,提出各種ai應用的場景,向客戶提供解決方案

ai整合工程師:主要是與ai產品**商合作,提供整體整合解決方案,包括實施和運維

ai產品經理:主要是將ai 功能落地到產品上,提公升產品互動體驗,增強產品競爭力

ai研發工程師:主要負責核心ai技術的研發工作(演算法、模型)

從零學習人工智慧,開啟職業規劃之路!

作者介紹 海濤,演算法工程師,前供求世界網路科技運營總監,csdn專家博主,概率與數理統計碩士,數十次獲得建模獎項,全國研究生數學建模競賽一等獎得主,熱衷分享。對ai的態度 對於 ai,不用嘲笑,也不要過譽!人工智慧 artificial intelligence,英文縮寫為ai 的話題隔一段時間就...

我是如何利用AI人工智慧開啟月賺6000美金的

本人今年32了,算一算在這個社會上已經摸爬滾打十多年了。這十多年裡各種酸甜苦辣都品嚐過。然而最重要的是,十年過去了。除了積累了點出國經驗,其他依然一無所有。再踏入 前仍是三無人員 無房 無車 無物件 面對這種現狀,但凡有點慾望的人又有誰會甘心呢?我一直認為有慾望不是罪,人沒有慾望就沒有前進的動力,只...

零基礎學習人工智慧 01 什麼是機器學習

1.什麼是機器學習?1.1.本質 根據歷史看到的樣本,總結規律。1.2.機器學習vs專家規則 機器學習 專家規則 說明樣本 全量樣本 抽樣樣本 優點 最少資料獲得最多資訊 缺點 很難做到絕對隨機,隨機取樣的誤差不好控制 規律海量規則 微觀級的事物描述 10e9 10e12 特徵更多,規律更精細 幾百...