Notes 學術前沿趨勢分析

2022-02-19 23:03:49 字數 928 閱讀 8816

[學習資料github]

目標:自己pandas用得很少,這個task主要練習pandas基礎

學習notes:

data = pd.dataframe(data) #將list變為dataframe格式,方便使用pandas進行分析

data.shape #顯示資料大小

data.head() #顯示資料的前五行

for idx, line in enumerate(f): #遍歷文件每一行,包括它的index

data.rename(columns=, inplace=true) # 修改列名

d =  #獲取dataframe格式的d中指定的一些列

data["categories"].describe() 

粗略統計**的種類資訊:

data["year"] = pd.to_datetime(data["update_date"]).dt.year 

#將update_date從例如2019-02-20的str變為datetime格式,並提取處year

data.reset_index(drop=true, inplace=true) #重新編號

data.merge(df_taxonomy, on="categories").query("group_name == @group_name") 

#使用 merge 函式,對於兩個dataframe 共同的特徵 categories 進行合併

【未完待續】

資料分析 學術前沿趨勢分析 task5

作者關聯 資料建模任務 對 作者關係進行建模,統計最常出現的作者關係。主要目標資料,作者 author 構建圖關係,挖掘作者關係 拿到資料集,先看下特徵量,找到與 類別相關的特徵 作者 author 提取出來處理成常用人名格式 用pandas看下資料結構 展示前幾行,有個大致輪廓 第一作者與其他作者...

Notes鎖定機制

notes鎖定機制是 r6 的乙個新功能,軟鎖 是存在使用者的客戶端 記憶體中,只允許乙個使用者同時編輯文件。去掉軟鎖辦法 notes client的notes.ini引數中增加乙個edit no soft locks 1 或者寫 更改dim session as new notessession ...

國際經管學院舉辦計量經濟學術前沿研討會

6月10日,由首都經濟 大學國際經濟管理學院組織的 計量經濟學術前沿研討會 在博遠樓三號報告廳舉辦。此次研討會匯集海內外知名學者,校長付志峰出席活動並致辭。付志峰在致辭向遠道而來的國內外專家學者表示歡迎。他講到,首都經濟 大學高度重視科學研究在高校辦學中的地位,作為學校科學研究的重要平台,國際經管學...