python處理谷歌翻譯歷史記錄

2021-10-25 08:43:59 字數 1199 閱讀 6593

看**有很多生詞不會,這時候就需要谷歌翻譯查詞,查完詞又懶得記,一開始想爬取谷歌翻譯的歷史記錄,但是使用爬蟲開啟網頁後沒有任何歷史記錄,所以歷史記錄是留在本地的,無法爬取,只能手動複製網頁**進行處理。

首先開啟谷歌的歷史記錄頁面,並在開發者模式中找到如圖,複製途中class="tlid-history-entry-list entry-list"項,儲存在txt檔案中。

然後使用python處理資料,將其中的單詞和對應的解釋處理。

with open(u'c:/users/wu/desktop/翻譯歷史記錄.txt', 'r',encoding="utf-8") as f:

pattern1 = re.compile(r'tl-input">([a-z]+)

([\u4e00-\u9fa5]+)')

pattern2 = re.compile(r'tl-input">([a-z]+) ([a-z]+)

([\u4e00-\u9fa5]+)')#匹配中文

str = f.read()

m1 = pattern1.findall(str)

m2 = pattern2.findall(str)

m1 = list(set(m1))

m2 = list(set(m2))

# print(m1)

# print(m2)

with open(u'c:/users/wu/desktop/**單詞1.txt','a',encoding='utf-8') as f:

for var in m1:

# print(var)

f.write(var[0]+" "*(40-len(var[0]))+var[1]+"\n")

for var in m2:

f.write(var[0]+" "+var[1]+" "*(40-len(var[0])-len(var[1]))+var[2]+"\n")

**會自動生成乙個名為**單詞1的txt,其中就是單詞和對應的翻譯,這裡**只能處理乙個單詞或者兩個單詞中間為空格的情況,其他情況可以自己新增。

python 呼叫谷歌翻譯

coding utf 8 import requests import json from fake useragent import useragent from bs4 import beautifulsoup import execjs 必須,需要先用pip 安裝,用來執行js指令碼 clas...

python使用谷歌翻譯

俺寫指令碼向來喜歡直接copy然後修改,看網上使用谷歌翻譯api還要自己去破解的,這不是直接造輪子麼。所以我選擇安裝googletrans 模組。直接 pip install googletrans 就完事了。實際操作發現不用 不行,我想應該是host問題,看了原始碼之後發現加引數service u...

python3實現谷歌翻譯

quad 中文轉英文的翻譯 from googletrans import translator def trans text translator translator return translator.translate text,dest en text if name main res t...