python批量翻譯推特資料集

2021-09-27 19:29:30 字數 2457 閱讀 2263

直接貼上**分析

# 要翻譯的語言

tolang =

'zh'

# 要得到的語言

str1 = q.split(

"\t"

) salt = random.randint(

32768

,65536

)# 鹽值1]

+str

(salt)

+ secretkey # 簽證

m1 = hashlib.md5(

)# 使用hashlib的md5來加密(單獨的md5模組在py3中已被廢棄)

m1.update(sign.encode(

'utf-8'))

sign = m1.hexdigest(

)#拼接請求鏈結

# response是httpresponse物件

# 將json格式的結果轉換成python的字典結構

except exception as e:

print

'loads json error.'

print

ekey = u"trans_result"

if key in js:

dst = js[

"trans_result"][

0]["dst"

]# 取得翻譯後的文字結果

outstr = str1[0]

+"\t"

+ dst

else

: outstr = q

# 追加寫入檔案中

)# 開啟要翻譯的檔案

f =open

('e:\\deeplearning\\si650winter11\\training.txt'

,'r'

, encoding=

'utf-8'

)# 逐行讀取整個檔案

lines = f.readlines(

)for line in lines:

transf(line)

#這裡設定了每秒呼叫一下,太頻繁,,,api會報錯。

time.sleep(1)

print

f.tell(

)# print f.readline()

f.close(

)

如何爬蟲推特資料

1 首先你要有翻牆軟體 3 然後你將會得到 consumer key consumer secret access token access token secret 這4個資訊非常重要 4 然後在github上搜尋 twitteroauth download 下來 5 接下來你只要寫乙個index...

Python批量翻譯英語單詞(三十七)

用途 本 實現 實現網頁中所有英語單詞的翻譯 涉及技術 1.讀取英語 漢語翻譯詞典檔案 詞典檔案來自 使用步驟 解壓master.zip,然後解壓其中的 stardict.csv檔案 import pandas as pd df dict pd.read csv d tmp ecdict maste...

批量處理total text資料集格式

total text資料集的格式不同於ctw 1500和icdar家族,後者是直接以座標的形式存放在.txt檔案中的,而total text的標註格式長這樣,取其中一張圖的gt為例 x 115 503 494 115 y 322 346 426 404 ornt u m transcriptions...