主題 03 如何設計模型

2021-10-25 08:31:04 字數 433 閱讀 3438

模型是一種將事物形象化的有效手段,利用模型可將現實世界中的事物及事物之間的關係準確地表達出來。模型設計本質上就是系統地實施抽象的過程。

很多時候,工程師面對的需求都是以具象的現實世界事物概念來描述的,遵循的是人類世界的語境。為了將需求落地,工程師需要開展一系列的工作,其中,模型設計尤為重要,可劃分為以下幾個步驟:

從上述步驟可以看出,整個模型設計的過程是乙個從整體到區域性、從高層模型設計到細節逐步細化的過程。在實踐中,模型設計過程可以分為:概念分析、邏輯設計、物理設計三個階段。每個階段的輸出都是下一階段的輸入,每個階段完成後,都要進行階段性評審。並根據評審結果修改輸出,若修改範圍涉及上一階段輸出,就應該返回修改上層輸出,保證上下層設計的一致性。這就是乙個自上而下設計、自下而上驗證並且不斷迭代完善的過程。同時,在每個階段內部,同樣遵從上面的原則與方法。

2.1 概念 &

主題模型的分類和設計原則

topic model 的介紹性文章已經很多,在此僅做粗略介紹,本文假設讀者已經較為熟悉 topic medel。topic model lda 認為乙個離散資料集合 如文件集合,集合,為行文方便,本文統統以文件集合作為描述物件,其他的資料集合只需換掉對應的術語即可 是由隱含在資料集合背後的 top...

LDA主題模型

先定義一些字母的含義 lda以文件集合d作為輸入 會有切詞,去停用詞,取詞幹等常見的預處理,略去不表 希望訓練出的兩個結果向量 設聚成k個topic,voc中共包含m個詞 lda的核心公式如下 p w d p w t p t d 直觀的看這個公式,就是以topic作為中間層,可以通過當前的 d和 t...

主題模型LDA

某隨機實驗如果有k個可能結局a1 a2 ak,分別將他們的出現次數記為隨機變數x1 x2 xk,它們的概率分布分別是p1,p2,pk,那麼在n次取樣的總結果中,a1出現n1次 a2出現n2次 ak出現nk次的這種事件的出現概率p有下面公式 p x1 n 1,xk nk n n1 nk pn1 1.p...