某象資料分析 資料探勘與分布式爬蟲全套合集

2021-09-08 16:53:05 字數 1203 閱讀 3516

【課程內容】

1 《python資料分析》 公升級版 第二期

第一課 工作環境準備及資料分析建模理論基礎

第二課 資料分析工具pandas

第三課 探索性資料分析及資料視覺化

第四課 機器學習及scikit-learn

第五課 金融時間序列

第六課 量化分析

第七課 影象資料處理及分析

第八課 深度學習及tensorflow

第九課 文字資料分析

第十課 專案實戰

2 《分布式爬蟲實戰》第二期

第一課 靜態網頁爬蟲:爬蟲的基礎技術

第二課 登入及動態網頁的抓取

第三課 微博的抓取

第四課 多執行緒與過程序的爬蟲

第五課 微博資料的儲存:分布式資料庫及應用

第六課 多機並行的微博抓取:分布式系統設計

第七課 分布式系統高階:複雜的分布式機制

第八課 微博資料查詢:分布式資料庫系統的優化及負載均衡

第九課 pagerank、網頁動態重拍及應對反爬蟲技術的手段

第十課 驗證碼的處理,京東、**的資料抓取及儲存案例

第十一課 網頁內容排重

第十二課 自動摘要及正文抽取

第十三課 網頁分類與針對文字的機器學習應用

第十四課 資訊檢索、搜尋引擎原理及應用

3《資料分析和資料探勘》

第一課 一小時理解資料和資料分析與挖掘

第二課 統計基礎

第三課 資料預處理

第四課 理解樣本資料

第五課 探索變數之間的關係

第六課 回歸分析和基於模擬的分析

第七課 分類和**

第八課 鄰近度和聚類

第九課 事務型資料和關聯分析

第十課 豆瓣資料案例

第十一課 時間序列分析和金融資料

第十二課 金融資料分析案例

4 《金融資料分析》第二期

第一課 資料分析基本知識複習

第二課 銀行信貸客戶的聚類分析-非監督式聚類

第三課 銀行信貸客戶的聚類分析-非監督式聚類(續)

第四課 銀行信貸客戶的聚類分析-半監督式聚類和聚類整合

第五課 行為評分卡模型的簡介

第六課 行為評分卡模型的特徵構造

第七課 行為評分卡模型使用

第八課 行為評分卡的構建

第九課 行為評分卡模型的驗證、監控和調優

第十課 組合評分卡模型

資料分析與資料探勘

一 常用資料探勘方法 1 關聯方法 2 人工神經網路 3 決策樹 4 異常分析 5 聚類分析 6 arima測試 二 資料分析師 國內兩種資料分析師認證 資料分析師cda 專案資料分析師cpda cda 1 統計概率基礎 2 資料分析模型方法 3 工具的運用 spss,modeler 三 資料分析的...

資料分析與資料探勘

資料分析是指採用適當的統計分析方法對收集到的資料進行分析 概括和總結,對資料進行恰當的描述,並提取出有用的資訊的過程。資料探勘是指從海量的資料中通過相關的演算法發現隱藏在資料中的規律和知識的過程。知識發現的過程如下。1.資料清理 清除資料中的雜訊。3.資料選擇 從資料庫中選擇與任務有關的資料。4.資...

資料分析與挖掘

學習 實戰記錄 實戰專案1 智取樂食 從大量資料 包括文字 中挖掘出隱含的 未知的 對決策有潛在價值的關係 模式和趨勢,並用這些知識和規則建立用於決策支援的模型,提供 性決策支援的方法 工具和過程,就是資料探勘。資料探勘的基本任務包括利用分類 聚類分析 關聯規則 時序模式 偏差檢驗 智慧型推薦等方法...