python資料處理

2021-10-04 16:32:32 字數 625 閱讀 5013

遇到乙個問題,需要讀取乙個csv檔案,然後取其中一列,然後求這一列每個資料出現的概率,然後求其資訊熵。

import numpy as np;

import math

import pandas as pd;

df=pd.read_csv("table10.csv") #讀取檔案

h=df.loc[:,'firstseensrcip'].value_counts(normalize=true) #求出其概率

valuelist=list(h.values) #概率輸出位series陣列,將其轉化為list

def entropy(list): #此函式求資訊熵,將list作為引數傳入即可

result=-1;

if(len(list)>0):

result=0;

for x in list:

result=((-x)*math.log(x,2)+result)

return result;

print(entropy(valuelist)) #列印

Python 資料處理

將檔案切分,存入列表 strip split with open james.txt as jaf data jaf.readline james data.strip split 資料檔案為 2 34,3 21,2.34,2.45,3.01,2 01,2 01,3 10,2 22 print ja...

Python 資料處理

本場 chat 為 python 資料處理課程,包括 python 基礎知識 極簡教程 提公升 python 執行效率的方法 爬蟲簡介 scrapy selenium 自動化測試框架 簡易分布式 redis 分詞程式設計 jieba 資料儲存 本地資料上傳 hive 通過本場 chat 讀者可學到以...

Python資料處理

用傳統的電子 來處理資料不僅效率低下,而且無法處理某些格式的資料,對於混亂或龐大的資料集更是束手無策。本書將教你如何利用語法簡單 容易上手的python輕鬆處理資料。作者通過循序漸進的練習,詳細介紹如何有效地獲取 清洗 分析與呈現資料,如何將資料處理過程自動化,如何安排檔案編輯與清洗任務,如何處理更...