Hadoop Linux下txt檔案亂碼

2021-07-05 11:22:47 字數 675 閱讀 7928

第一種情況

一問題產生

在linux作業系統下,我們有時開啟在windows下的txt檔案,發現在windows下能正常顯示的txt檔案出現了中文亂碼。

二分析問題

出現這種情況的原因為兩種作業系統的中文壓縮方式不同,在windows環境中中文壓縮一般為gbk,而在linux環境中為utf8,這就導致了在windows下能正常顯示而在linux環境下開啟呈現了亂碼狀態。

三 解決方案:

在linux用iconv命令,如亂碼檔名為1-5.txt, 在終端輸入如下命令:

$  iconv -f gbk -t utf8 1-5.txt > 1-5.txt.utf8 

發現重新生成了乙個1-5.txt.utf8檔案,開啟之後就能正常顯示中文了。

四 檢視結果:

$cat  1-5.txt.utf8

放入集群中

$hadoop  fs -put     1-5.txt.utf8   /market

第二種情況

當 第一種方式無法解決時

首先excel**轉化為txt格式

用txt編譯器開啟該txt檔案 另存為utf-8格式即可

Hadoop Linux 開發環境搭建

官網relsease版本 開發環境搭建 1.安裝hadoop wget hadoop 2.7.2 hadoop 2.7.2.tar.gz tar xzvf hadoop 2.7.2.tar.gz 3.測試hadoop 檢視hadoop版本號 hadoop version 4.配置 hadoop每乙個...

linux下TXT顯示亂碼

一句話解決linux顯示windows中文txt亂碼的問題2009年12月03日 星期四 10 49前提是你的linux可以正常顯示中文,只是開啟windows txt檔案會有亂碼。原因是 linux下用的編碼一般是utf 8 windows 一般是gb2312 那麼只需要簡單的轉換下就可以正常顯示...

ubuntu下開啟txt檔案亂碼問題

ubuntu下開啟txt檔案,顯示亂碼,解決方法如下 方法一 終端輸入gconf editor調出gconf edit 如若沒安裝請用 sudo apt get install gconf editor 命令安裝 ps 輸入gconf editor即可,前面不需要加sudo 依次點開 在雙擊彈出對話...