NLP學習筆記15 生成句子

2021-10-17 16:11:47 字數 632 閱讀 4558

本文屬於nlp學習筆記系列。

當乙個模型訓練好後,我們可以利用這個模型來生成一些資料,就是生成模型。例如:生成句子,**,影象,程式等。

當然還有判別模型。

語言模型屬於生成模型,所以可以生成句子。

下面的例子,假如有個詞庫,然後每乙個詞對應的概率已經訓練好了,然後用unigram來生成乙個句子:

由於unigram是不考慮上下文的,所以這個句子完全就隨機根據單詞的概率取的下乙個詞。這種不一定符合人的邏輯。

下面看bigram如何生成一句話。

先根據詞庫寫出每個詞後面接另外乙個詞的概率矩陣,大小是7*7,包含了6個單詞和乙個終止符(yesterday之後就認為終止)

如果第乙個單詞取樣到i,那麼可以從矩陣上可以看到,i後面跟like的機率最大。這樣以此類推,直到取樣到句號為止。

取決於bigram 的質量,如果bigram的模型訓練得很好,通過取樣得到的語句是比較通順的。

接下來的課程,老師要講機器學習相關的。

NLP 基礎知識 004 生成模型

使用語言模型生成句子 語言模型 生成模型 生成新的資料 文字.unigram model nlp,i,like,studying,course,yesterday vocab 0.1,0.3,0.2,0.3,0.35,0.05 不考慮上下文,可能生成下面句子 i,study,nlp,course,i...

Docker學習筆記3 生成映象

通過編寫dockerfile檔案,我們可以利用docker來製作自己的映象檔案。命令格式如下 docker build t 映象名 dockerfile檔案所在資料夾路徑 t表明後面引數是映象的映象名。執行完該命令就根據dockerfile中的配置生成了我們需要的映象檔案。dockerfile詳解 ...

Python學習筆記(2) 生成隨機數

python中的random模組提供了一些很有用的方法來幫我們生成隨機數。接下來我們來看一下random模組中都包括哪些方法。randint方法接收兩個整型引數a和b,其中第乙個引數必須小於第二個引數 可以等於,但是沒有意義 然後返回乙個大於等於a且小於等於b的隨機整數。下面可以生成0到5的隨機整數...