資料探勘 學習日誌

2021-09-28 12:16:18 字數 492 閱讀 2802

主要知道每乙個函式的返回值是什麼

set是乙個無序不重複的序列

tolist 列表裡面套列表

temp_list = df["genre"].str.split(",").tolist() #[,,]

疑惑:這個迴圈不太懂

genre_list = list(set([i for j in temp_list for i in j]))#用雙重迴圈來獲得總的電影分類
這樣居然可以統計每一列的和

zeros_df.sum(axis=0)

陣列合併 

join(按照行索引進行合併)要有行索引是一樣的,事實證明列是不可以overlap的,行可以

merge(按照列索引進行合併)

跟著老師敲了一遍**,後面還有根據不同型別分類沒寫。

Oracle logminer 日誌挖掘

3.新增需要分析的檔案 4.開始分析檔案 5.開始分析內容 6.結束日誌分析 logmnr 可以用來分析redo 日誌和歸檔檔案。將redo日誌或者歸檔檔案中的內容提取出來,供dba進行操作分析歷史操作,比如進行誤刪除操作的恢復。logmnr 分析日誌,需要建立乙個資料字典,這個資料字典可以儲存在外...

oracle日誌挖掘

oracle日誌挖掘是一種十分強大的資料恢復技術,只要你保障你的歸檔日誌和重做日誌是完整的,那麼就可以將你的資料恢復到任何時刻。簡單敘述一下日誌挖掘的基本原理,然後進行乙個簡單的小實驗。日誌挖掘時基於redo日誌和歸檔日誌的基礎之上來進行日誌載入並進行恢復,挖掘,挖掘,挖的就是你的redo日誌和歸檔...

資料探勘學習(一)

資料探勘 從大量資料中抽取出 隱含的 有潛在用途的 未知的 人們可以理解的 有價值的資訊和模式的過程。2.建立目標資料集 資料選擇 3.資料清理和預處理 4.資料簡化和變形 5.選擇資料探勘功能 6.選擇資料探勘演算法 7.資料探勘 尋找有趣的模式 8.模式評估和知識展示 9.知識發現的使用 方法 ...