統計文字中每個單詞的序列 和 出現次數

2021-06-08 06:42:00 字數 1610 閱讀 1411

統計文字中每個單詞的序列

使用stl

/*統計文字中出現的單詞的序列*/

#include #include #include #include using namespace std;

int main()

//輸出

for (it = distinctwordset.begin();it != distinctwordset.end();it++)

in.close();

//輸出

for (it = wordcountmap.begin();it != wordcountmap.end();it++) };

class countstr

;countstr::countstr()

/*如字串abc的hash值為(97 *31 + 98) * 31 + 99*/

unsigned int countstr::hashindex(string str)

return index % nhash;

}void countstr::insertword(string str)

} p = new strnode(str);

//使用頭插法插入節點

p->next = bin[index];

bin[index] = p;

}void countstr::initstr(string filename)

}void countstr::print()

};/*定義類trie*/

class trie

;trie::trie()

trie::~trie()

/*注意*/

void trie::insert(const char* str)

if (null == ploc->nextbranch[index])

ploc = ploc->nextbranch[index];

} if (null != ploc->word)//單詞已經出現過

else //單詞沒有出現過,應該插入單詞 }

void trie::print()

/*輸出所有的單詞*/

void trie::print(trienode* proot)

//輸出單詞

if (null != proot->word) }

/*銷毀trie樹*/

void trie::destory(trienode* proot)

for (int i = 0;i < maxbranchnum;i++)

//銷毀單詞占得空間

if (null != proot->word)

delete proot;//銷毀結點

proot = null;

}int main(int argc, char *argv)

{ string str;

trie t;

ifstream in("word.txt");

//把單詞輸入字典樹

while(in >> str)

{ transform(str.begin(),str.end(),str.begin(),::tolower);//大寫變小寫

//cout<

python 計算文字中每個單詞的出現頻率

計算文字中每個單詞的使用頻率,並從高到低進行排序 from string import punctuation 開啟資料匯入 text open text.txt def count text dic dict 建立新字典 for line in text word line.split 將字串分割...

用hash表統計文字檔案中每個單詞出現的頻率

閒來無事,敲兩行 解解愁。今天介紹一種用自已建立的hash表 hash鍊錶 來統計乙個輸入文字檔案中每個單詞出現的頻率,hash表的構造詳見 程式設計珠璣 第15章。一 主體思路 1 建立乙個hash表 a hash函式 除留取餘法,h key key size 2 讀取文字檔案word.txt,每...

對文字中不同單詞出現的次數統計

對一篇文章中所有不同的單詞出現的次數進行統計,主要的思想步驟是 1 建立乙個帶有計數的結構 class words int count 出現的次數 string word words next 2 方便找同樣的單詞,每次需要在已有的單詞庫里搜尋比較,可以使用鍊錶的資料結構,每增加乙個新單詞便在鍊錶尾...