Datawhale 第一次打卡

2021-10-25 12:40:36 字數 1295 閱讀 2107

開源內容

1. enumerate:

enumerate is a built-in function of python.

my_list =[,

'banana'

,'grapes'

,'pear'

]for c, value in

enumerate

(my_list,1)

:print

(c, value)

#類似於對錶進行排列,方便讀取

2. 列表推導式巢狀迴圈:

unique_categories =

set(

[i for l in

[x.split(

' ')

for x in data[

"categories"]]

for i in l]

)#用x在categories 現進行迴圈,然後split

#首先是temp = [x.split(' ') for x in data["categories"]]就是對於每乙個data["categories"]中的元素按照空格進行split,這對應乙個*****的多個類別,是乙個list[list],外層的list是每乙個*****,內層是每乙個*****的類別。

#然後 for l in temp 是將每乙個*****分開

#for i in l 是對於乙個分離得到乙個*****的多個種類再使用set去除重複的str

(感覺看懂了 卻不會運用)

list1 =

for l in

[x.split(

' ')

for x in data[

'categories']]

:for i in l:

list1

(此為複雜化描寫)

3. 正則操作:

re.

phone =

"2000-4923-3792 # this is number"

num = re.sub(r'('\d')

," "

,phone)

#可以去除符號

檢測正則

最後成果

Datawhale 資料探勘 第一次打卡

題目理解 混淆矩陣 confuse matrix 用 t f p n 來判斷結果 第乙個字母t f,表示 的正確與否 第二個字母p n,表示 的結果為正例或者負例。如tp就表示 對了,的結果是正例,那它的意思就是把正例 為了正例 準確率 accuracy 準確率是常用的乙個評價指標,但是不適合樣本不...

爬蟲第一次打卡

url data headers response requests.post url,data data,headers headers 發起請求 json data response.json print json data import requests from bs4 import bea...

python第一次打卡

號 表示注釋,作用於整行 多行注釋,用三個雙引號 運算子分為算術運算子 比較運算子 邏輯運算子 位運算子 三元運算子 其他運算子 運算子的優先順序 一元運算子優於二元運算子,先算術運算,後移位運算,最後位運算,邏輯運算最後結合。is,is not 對比的是兩個變數的記憶體位址 對比的是兩個變數的值 ...