python 字典處理的一些坑

2021-09-28 15:14:58 字數 731 閱讀 5121

處理任務:

幾十萬資料,目標,把重複資料的top,找出來。

類似這樣

dict =
這樣建字典太慢了,幾十萬更本處理不過來

第二次:

if num not in num_dic.keys():

num_dic[num] = 1

else:

num_dic[num] +=1

還是太慢,主要原因是dic.keys()返回乙個列表…

第三次:使用get方法

ifnum_dic.get(num) != none:

num_dic[num] +=1

else :

num_dic[num] = 1

之後

sorted_x = sorted(dict.items(), key=lambda x: x[1], reverse=true)
通過根據值排序,生成list,再把list列印即可:

table = prettytable(["num","pv"])

table.align["num"] = "l"

able.padding_width = 1

for tup in sorted_x:

table.add_row([tup[0],tup[1]])

python 字典(dictionary)一些方法

1 python 字典 dictionary keys 函式以列表返回乙個字典所有的鍵。keys 語法 dict.keys 2 setdefault 方法 python字典setdefault 函式和get 方法類似,如果鍵不存在於字典中,將會新增鍵並將值設為預設值 dict.setdefault ...

python 遇到的一些坑

lst 1,2,4 print lst.iter next 列印出來的是 1 print lst.iter next 列印出來的是 1 呼叫 iter 方法的時候,生成乙個迭代器物件 如上,第二次呼叫,先生成物件,然後返回的是該物件的第乙個值 第二次和第一次列印的是兩個不同的例項的next 方法,但...

Xgboost的一些坑

這兩天做乙個競賽,用xgboost作為工具來做了一些事情。主要的框架是 xgboost的python擴充套件。然後這過程中花了不少時間在解決各種xgboost的error上。大部分的問題都在這個函式裡 dtrain xgb.dmatrix train.txt dtest xgb.dmatrix te...