歡迎使用CSDN markdown編輯器

2021-07-29 15:28:08 字數 1345 閱讀 8531

本markdown編輯器使用[stackedit][6]修改而來,用它寫部落格,將會帶來全新的體驗哦:

先參考 在本地把分詞程式跑起來。

本地分詞的目錄結構如下:

artifacts配置如下,記得勾選include in project build

modules 配置如下,所有的jar檔案都在hadoop的安裝包的share/hadoop/下面

-program arguments第一行就是剛才定義的jar包生成的位置第二行工程入口

/users/cinba/documents/idea/paodingfenci/out/artifacts/paodingfenci/paodingfenci.jar

org.znufe

.cnwc

.cnwordmain

input/

output/

jar包反編譯後的結構如下

這裡面沒有剛才工程下lib的jar包,也沒有modules中的任何類

這樣執行下面的指令就會成功執行啦

hadoop jar ./share/hadoop/mapreduce/paodingfenci.jar org.znufe

.cnwc

.cnwordmain input output

只是分詞出來的結果:

看起來也不是很有意義!需要做進一步處理。

歡迎使用CSDN markdow

本markdown編輯器使用stackedit修改而來,用它寫部落格,將會帶來全新的體驗哦 markdown 是一種輕量級標記語言,它允許人們使用易讀易寫的純文字格式編寫文件,然後轉換成格式豐富的html頁面。維基百科 使用簡單的符號標識不同的標題,將某些文字標記為粗體或者斜體,建立乙個鏈結等,詳細...

歡迎毛毛與妞妞使用CSDN markdown編輯器

建立乙個自定義列表 如何建立乙個註腳 注釋也是必不可少的 katex數學公式 新的甘特圖功能,豐富你的文章 uml 圖表 flowchart流程圖 匯出與匯入 你好!這是你第一次使用markdown編輯器所展示的歡迎頁。如果你想學習如何使用markdown編輯器,可以仔細閱讀這篇文章,了解一下mar...

歡迎使用CSDN markdow1n編輯器

本markdown編輯器使用stackedit修改而來,用它寫部落格,將會帶來全新的體驗哦 markdown 是一種輕量級標記語言,它允許人們使用易讀易寫的純文字格式編寫文件,然後轉換成格式豐富的html頁面。維基百科 使用簡單的符號標識不同的標題,將某些文字標記為粗體或者斜體,建立乙個鏈結等,詳細...