Python 資料探勘 工具包整理

2021-09-07 09:50:31 字數 4082 閱讀 4198

類別

python

rmysql

mysql-connector-python(官方)

rmysql

oracle

cx_oracle

roracle

mongodb

pymongo

rmongo, rmongodb

odbc

pyodbc

rodbc

類別python

rexcel

xlsxwriter, pandas.(from/to)_excel, openpyxl

openxlsx::read.xlsx(2), xlsx::read.xlsx(2)

csvcsv.writer

read.csv(2), read.table

json

json

jsonlite

piljpeg, png, tiff, bmp

類別python

r描述性統計彙總

scipy.stats.descirbe

summary

均值scipy.stats.gmean(幾何平均數), scipy.stats.hmean(調和平均數), numpy.mean, numpy.nanmean, pandas.series.mean

mean

中位數numpy.median, numpy.nanmediam, pandas.series.median

median

眾數scipy.stats.mode, pandas.series.mode

未知分位數

numpy.percentile, numpy.nanpercentile, pandas.series.quantile

quantile

標準差scipy.stats.std, scipy.stats.nanstd, numpy.std, pandas.series.std

sd方差

numpy.var, pandas.series.var

var變異係數

scipy.stats.variation

未知協方差

numpy.cov, pandas.series.cov

cov(pearson)相關係數

scipy.stats.pearsonr, numpy.corrcoef, pandas.series.corr

cor峰度

scipy.stats.kurtosis, pandas.series.kurt

e1071::kurtosis

偏度scipy.stats.skew, pandas.series.skew

e1071::skewness

直方圖numpy.histogram, numpy.histogram2d, numpy.histogramdd

未知類別

python

r普通最小二乘法回歸(ols)

statsmodels.ols, sklearn.linear_model.linearregression

lm,廣義線性回歸(gls)

statsmodels.gls

nlme::gls, mass::gls

類別python

rt檢驗

statsmodels.stats.ttest_ind, statsmodels.stats.ttost_ind, statsmodels.stats.ttost.paired; scipy.stats.ttest_1samp, scipy.stats.ttest_ind, scipy.stats.ttest_ind_from_stats, scipy.stats.ttest_rel

t.test

pearson相關係數檢驗

scipy.stats.pearsonr

cor.test

類別pythonrar

statsmodels.ar_model.ar

ararima

statsmodels.arima_model.arima

arima

varstatsmodels.var_model.var

未知類別

python

r支援向量分類器(svc)

sklearn.svm.svc

e1071::svm

非支援向量分類器(nonsvc)

sklearn.svm.nusvc

未知線性支援向量分類器(lenear svc)

sklearn.svm.linearsvc

未知 基於臨近

類別python

rk-臨近分類器

sklearn.neighbors.kneighborsclassifier

未知半徑臨近分類器

sklearn.neighbors.radiusneighborsclassifier

未知臨近重心分類器(nearest centroid classifier)

sklearn.neighbors.nearestcentroid

未知類別

python

r樸素貝葉斯

sklearn.*****_bayes.gaussiannb

e1071::*****bayes

多維貝葉斯(multinomial ***** bayes)

sklearn.*****_bayes.multinomialnb

未知伯努利貝葉斯(bernoulli ***** bayes)

sklearn.*****_bayes.bernoullinb

未知類別

python

r決策樹分類器

sklearn.tree.decisiontreeclassifier

tree::tree, party::ctree

決策樹回歸器

sklearn.tree.decisiontreeregressor

tree::tree, party::tree

隨機森林分類器

sklearn.ensemble.randomforestclassifier

randomforest::randomforest, party::cforest

隨機森林回歸器

sklearn.ensemble.randomforestregressor

randomforest::randomforest, party::cforest

類別python

rkmeans

scipy.cluster.kmeans.kmeans

kmeans::kmeans

分層聚類

scipy.cluster.hierarchy.fcluster

(stats::)hclust

類別python

rapriori演算法

apriori(可靠性未知,不支援py3), pyfim(可靠性未知,不可用pip安裝)

arules::apriori

fp-growth演算法

fp-growth(可靠性未知,不支援py3), pyfim(可靠性未知,不可用pip安裝)

未知類別

python

r神經網路

neurolab.net, keras.*

nnet::nnet, nueralnet::nueralnet

深度學習

keras.*

不可靠包居多以及未知

類別python

rtokenize

nltk.tokenize(英), jieba.tokenize(中)

tau::tokenize

stem

nltk.stem

rtexttools::wordstem, snowballc::wordstem

stopwords

stop_words.get_stop_words

tm::stopwords, qdap::stopwords

中文分詞

jieba.cut, smallseg, yaha, finalseg, genius

jiebar

tfidf

gensim.models.tfidfmodel

未知

Python工具包以及資源包

pip install whl 適用於2.x pip3 install whl 適用於2.x,3.x easy install python 官網 非官方 注意 如果安裝python安裝成功之後出現 dll引入錯誤問題 通常的做法,找到python安裝位置裡lib site pakage 相應的檔案...

python安裝wxpython工具包

wxpython是python語言的一套優秀的gui圖形庫,允許python程式設計師很方便的建立完整的 功能鍵全的gui使用者介面。wxpython是作為優秀的跨平台gui庫 wxwidgets 的python封裝和python模組的方式提供給使用者的。就如同python和wxwidgets一樣,...

python語言識別工具包

langid包 相當強大!def langidfunc print langid.classify we are family print langid.classify questa e una prova print langid.classify 我們都有乙個家 identifier lang...