2020 3 8 周學習進度報告

2022-08-17 08:24:09 字數 965 閱讀 8823

這周主要是學習數學了,關於python的學習並不多。

prml 的學習基本上是學十得一。

關於機器學習這方面的內容就目前的學習狀況而言是實在不能建空中樓閣,還是需要穩紮穩打。所以這周主要還是看了prml這本書的序章部分。

說是序章其實以及給了個深度學習的大概了,甚至還過了一遍大二學習的概率論。學習強度還是有點大。

首先還是乙個簡單的例子來引出深度學習。這是乙個簡單的回歸問題,假設資料集由函式 sin

(2πx

)'>sin(2πx)

sin(2πx) 產生。目標變數帶有隨機的雜訊。為了保證資料集的全部擬合,作者使用多項式來進行:si

當然以書中內容而言,擬合過程複雜而結果也令人沮喪,不過得出了乙個重要結論:

從直覺上講,我們看到有著更大的m值的更靈活的多項式被過分地調參,使得多項式被調節成了與目標值的隨機雜訊相符。

這也就是為什麼尋找模型對於機器學習來說是如此重要了

之後就是幾乎完整的過了一遍概率論,包括概率密度、期望和方差、貝葉斯概率和高斯分布這些。

1. 知識抽取。

知識抽取技術,從一些公開的半結構化、非結構化的資料中提取出實體、關係、屬性等知識要素。

這方面就是關於實體的識別了,目前還處於嘗試各種工具的階段。。

2. 知識表示。

知識表示形成的綜合向量對知識庫的構建、推理、融合以及應用均具有重要的意義。

基於三元組的知識表示形式受到了人們廣泛的認可,但似乎目前圖資料庫更為流行和方便,所以下乙個目標就定在學習neo4j 方面。

假期周進度報告01

本週進行了電腦的清理以及整理以及oracle的安裝工作,經過整理以及清理電腦看起來特別舒服。下面是總結的oracle安裝步驟以及截圖 1.這兩個壓縮包一起解壓,必須同時解壓,不能單獨解壓否則會覆蓋檔案。2.初始化環境,當出現如圖的警告時選擇繼續安裝,忽略。3.去掉 我希望。以及忽略後面的警告 4.保...

暑假周進度報告(七)

hdfs檔案操作 使用hadoop 使用者登入 linux 系統,啟動 hadoop hadoop 的安裝目錄為 usr local hadoop 為hadoop 使用者在hdfs 中建立使用者目錄 user hadoop 接著在hdfs的目錄 user hadoop 下,建立 test 資料夾,並...

暑假周進度報告(四)

hdfs體系結構 冷備份 發生故障以後,先停止一段時間,把一些資料從第二名稱節點慢慢恢復過來,恢復過來後再提供對外服務。hdfs儲存原理 冗餘資料儲存的問題 乙個資料塊會被預設儲存3份 可並行操作同一資料,加快資料傳輸速度 很容易檢查資料錯誤,有參照 保證資料可靠性 資料儲存策略的問題 2 資料讀取...