python 中英文 分離 中英文分離

2021-10-21 03:17:49 字數 1689 閱讀 8561

由於沒有安裝 numpy

根據部落格提示,成功安裝了numpy ,

執行之後沒有錯誤,可是嘛,我看不到結果。也就隨它去了。

主要有兩個問題,乙個是執行的時候出現的

valueerror: need more than 0 values to unpack  ,對於空行就會報錯。不機智。於是加了個判斷。讓它一直走下去。

解決方案。

大概就兩個問題,可是我還是沒有實現自己想要的中英文分離的功能,我都沒看到。醉了。應用在實踐工作中才有用啊。****。

看來這個事情沒我想的那麼簡單啊

importnumpy as np

filename= r'd:\fisrt\11\test.txt' #txt檔案和當前指令碼在同一目錄下,所以不用寫具體路徑

pos =

efield=

with open(filename,'r') as file_to_read:whiletrue:

lines= file_to_read.readline() #整行讀取資料

if len(lines.split()) <=25:break

passp_tmp, e_tmp= [float(i) for i in lines.split()] #將整行資料分割處理,如果分割符是空格,括號裡就不用傳入引數,如果是逗號, 則傳入『,'字元。

efield =np.array(efield)pass

同事寫的,只能說不錯。

path = "c:/users/ys2566183/desktop/test.txt"file= open(path,'r',encoding="gb2312")for line infile.readlines():if len(line)>1: (這個什麼意思)#(判斷這line的長度,空行肯定是零了,不是空行所以進行下面的處理),****

index= line.index("z")

line=line[index:]

index= line.index(" ")

line=line[:index]

name= line.split("__")[1] # 取分隔完陣列之後的,第二個。print(name)

原始檔:

省份** z0fwddm__z0provinc char 006

自己老是編碼有問題,太不舒服了。

很煩,同一段**。老是這裡那裡出點問題。難受

import time

try:

path = r'd:\fisrt\11\柏喜.txt'

outh = r'd:\fisrt\11\yes.txt'

files = open(path,'r')

yes = open (outh,'w')

for line in files.readlines():

if len(line)>1:

name =line.split()[1]

name = name.split('__')[1]

print name

yes.write(name+'\n')

finally:

files.close()

print '關閉檔案'

因為用的是2.7, line.split(),裡面不用加任何的  「」,單雙引號。預設的就是空格分割。

其次就是寫入檔案,先前面開啟。然後重複迴圈的寫入進去。這次才是正確的事。

總算完成了。

識別中英文

問 c語言的char的陣列中有中文和英文 怎麼取出來 文字是從文字檔案讀取出來的,放進去,怎麼取出來不出現亂碼?中文是兩個位元組,英文是乙個位元組,如果取到英文再去取中文,中文就會亂碼。怎麼解決這個問題?問題補充 一次全部列印沒問題,但是我現在的問題是需要把它截斷顯示,功能是電子書的分頁,所以分頁的...

python 詞頻統計 中英文

calhamletv1.py 英文統計程式 def gettext txt open hamlet.txt r read txt txt.lower for ch in txt txt.replace ch,將文字中特殊字元替換為空格 return txt hamlettxt gettext wor...

實現介面中英文

乙個支援多種語言的程式 一般都是由主程式和多個語言包 資源檔案 組成。執行時,根據不同的語言設定 來讀相應的資源檔案。結合自己開發 resourceworkshop net 資源檔案生成器 的體會,覺得應該注意下面幾個問題 1 字型 字型大小的選擇。一種方法,窗體 控制項的字型全部採用預設的字型,即...