R概率分布函式使用小結

2021-09-06 10:46:23 字數 439 閱讀 8799

記要

今天在計算分類模型自行區間時,用到了r中正太分布的qnorm函式,這裡做簡單記要,作為備忘。

r中自帶了很多概率分布的函式,如正太分布,二次分布,卡放分布,t分布等,這些分布的函式都有乙個共性,每個分布擁有4個帶有d,p,q,r字首的函式。比如正太分布,有dnorm,pnorm,qnorm和rnorm。這幾個字首的意義如下:

心得體會

最近在學習資料探勘中的一些分類模型,由於才入門不久,以前總認為概率在資料探勘在沒多大用處,直到昨天才知道原來挖掘模型的精度評估和比較可以

建立在統計學分析框架上。比如評估乙個分類模型,計算其準確度的自行區間就是通過二項分布近似到正太分布計算。再比如,評估兩個模型是否有差異,這個通過假設檢驗和卡放分布驗證。

參考:《資料探勘導論》 pang-ning tan 4.6節

(R語言)概率分布

8.1 r是乙個統計表集合 略讀 8.2 檢測資料集的分布 函式summary和fivenum這兩個函式可以給出摘要,後者只給出數值 函式stem可以將數值統計結果以類似直方圖的方式顯示出來 函式hist 可以繪製直方圖 函式density和line可以獲得更漂亮的密度圖 功能包fun中的ecdf函...

R概率函式

概率函式形式 dpqr distribution abbreviation d 密度函式 density p 分布函式 distribution function q 分位數函式 quantile function r 生成隨機數 正態分佈 norm logistic分布 logis 指數分布 ex...

概率分布函式, 概率密度函式與概率質量函式

p x p rob x p x prob x p x prob x x x x可以是連續的,也可以是離散的隨機變數.為連續隨機變數定義的 p x p x p x p x p x p x x 它本身不是乙個概率值,可以大於1.在x x x上積分後才是概率值.x x 在數學中,連續型隨機變數的概率密度函...