資料集的基本資訊(二)

2021-06-29 14:48:18 字數 964 閱讀 3914

基本的介紹一些分布指標,稀疏性,缺失值和相關性。

分布指標:  主要就是兩個指標 ------- 偏度和峰度

,kurtosis

()兩個函式計算得到

偏度:  它用於衡量資料的偏倚程度,也就是資料的對稱程度。

skewness( insurance[,4:5]  )     #  當其值在[-1,1]是認為沒有完全的偏移,絕對值大於1時,認為有顯著的偏移

#   小於-1時,有明顯的左偏趨勢,反之,亦然

峰度: 用於衡量分布形態的陡峭程度,值的大小代表其與正態分佈的差異程度,值越小,差異越小。

值很大,說明有較為陡峭的峰部,極可能存在異常值。

稀疏性:一種生成稀疏資料集的方法。

使用sparsematrix()生成      # dims是設定維度的方法

缺失性:

使用md.pattern()來得到需要觀測的值

#  54的意思代表用54個資料是完整的 最左邊的代表這樣的個數有多少個 最右邊的代表,它缺失的屬性個數

#  最下邊的代表缺失該屬性的個數  右下角為缺失個數的統計

使用cor( ) 實現起來很簡單,但是還有些細節問題要去更加的公升入,另外相關係數的絕對值高於0.75,我們就認為它們的相關係數很高,但是不是絕對的,要看具體的問題。

相關性的展示用plotcorr()這個函式。

Lua的基本資訊除錯(二)

前面說過,在我們的專案中使用的是luabind。呼叫lua函式的介面是 call function m lua,func name,player 如果func出錯了,lua會丟擲異常,c 程式捕捉到後程式可能會崩掉 就看有沒有對異常的丟擲做反映 所以光寫call function這個函式的話是看不到...

openresty資料之基本資訊

openresty 的核心組成部分 1.nginx 高效能的web 伺服器 2.luajit 高效的lua 語言直譯器 編譯器 3.ngx lua http lua 處理http 協議,讓lua 程式嵌入在nginx 裡執行 4.stream lua 與ngx lua 類似,但處理的是tcp udp...

資料庫的基本資訊

資料庫 db 資料庫管理系統 dbms mysqsl屬於關係型資料庫 資料庫 db data bases mysql是資料庫管理系統 特點 免費,小型,輕量級 輕量級指可移植性強 開源資料,客戶 伺服器 c s client server 的模式實現的 資料庫是 儲存管理資料的倉庫,資料不存在資料庫...