sklearn包中的分析演算法對 資料進行處理

2021-08-02 02:30:32 字數 1902 閱讀 1037

import xlrd  

import json

import re

#開啟excel檔案  

excel = xlrd.open_workbook('c:\data.xlsx')  

#獲取第二個sheet  

sheet = excel.sheets()[3]

arr_r=[0,0,0,0,0,0]

arr_all = [[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0],[0,0,0,0,0,0]]

j=0k=0

#red1 =

#redshow1 = 0

#blueshow1 = 0

red0=sheet.row_values(0)

#str = red0[0]

#arr = str.split(' ')

#red0[i].split(' ')[j]

#print(int(arr[0])==12)

for i in range (0,30):

red0 = sheet.row_values(i)

str = red0[0]

arr = str.split(' ');

for j in range(0,6):

k = int(arr[j]);

arr_all[i][j] = k

print(arr_all[i][j])

//使用sklearn包中的分析演算法對  arr_all[i][j] 包含紅球資訊 資料進行處理  

#for i in range(0,6):

#j = int(arr[i]);

#arr_all[0][i] = j

#print(arr_all[0][i])

#arr_r[i]=

#for i in range(0,33):

#    if(red0[i]==(i+1)):

#        redshow1=redshow1+1

#print(redshow1)

#print(red0[33])

#for j in range(33,49):

#if(red0[j]==(j-33+1)):

#       #blueshow1=blueshow1+1

#print(red0[j])

#print(blueshow1)

在cmd命令列中,輸入  python  "檔案路徑+檔名";

**演算法核心:f(x球資料)

1.根據最近三十條資料,得出最近中獎的資料   矩陣a

2.根據最近三十條資料,得出每個數字出現次數間隔之和(每一列中,不等於當前列值的數字之和),用於統計冷門的狀態  矩陣b

3.根據最近三十條資料,得出每個數字出現次數之和(每一列中,等於當前列值的數字之和),用於統計熱門的狀態   矩陣c

4.根據矩陣a 進行線性回歸,得出目標的取值範圍。

5.將最熱門,最冷門的資料加入到最後的取值範圍。

6.md5演算法隨機取值

x球資料 : 紅球資料、藍球資料

Anaconda中sklearn包不全

起因 一開始在一台伺服器上單獨安裝了sklearn,用於訓練模型,生成pkl檔案。後來由於發現anaconda中整合了包含sklearn在內測好多安裝包,於是打算將程式移植到anaconda上,並且保留原先的模型pkl檔案。結果在除錯的時候發現了錯誤。主要是在載入pkl檔案的時候,出現錯誤。排查過程...

利用sklearn包中的k 近鄰演算法進行分類

剛開始學習機器學習不久,這也是我第一次寫部落格。就先寫個簡單的,利用sklearn包中的knn分類器進行分類,分類的資料集為皮馬印第安人糖尿病資料集 pima indians diabetes.data.csv 廢話不多說,直接上 寫的不完善的地方,望大家指正。coding utf 8 create...

sklearn中的gbdt原始碼分析

簡單看了一下sklearn中的gbdt原始碼 在這裡記錄一下,目前來說還不能把gbdt的所有理論都搞清楚 sklearn有兩個類似於gbdt的實現 gradientboostingclassifier gradientboostingregressor乙個用於分類,另乙個用於回歸 這兩個類其實區別只...