簡單的解析Google Scholar資料

2021-06-19 03:36:39 字數 1491 閱讀 8370

現在只是簡單的查詢一篇文章,但是可以給python小白使用者(比如像我這樣的

import urllib2

import re, random

from bs4 import beautifulsoup

def googlescholartitle(querytitle):

user_agents = ['mozilla/5.0 (windows nt 6.1; wow64; rv:23.0) gecko/20130406 firefox/23.0',\

'mozilla/5.0 (windows nt 6.1; wow64; rv:18.0) gecko/20100101 firefox/18.0',\

'(khtml, like gecko) element browser 5.0',\

'ibm webexplorer /v0.94', 'galaxy/1.0 [en] (mac os x 10.5.6; u; en)', \

'mozilla/5.0 (compatible; msie 10.0; windows nt 6.1; wow64; trident/6.0)', \

'opera/9.80 (windows nt 6.0) presto/2.12.388 version/12.14', \

'version/6.0 mobile/10a5355d safari/8536.25', \

'chrome/28.0.1468.0 safari/537.36', \

'mozilla/5.0 (compatible; msie 9.0; windows nt 6.0; trident/5.0; theworld)']

querytitle = urllib2.quote(querytitle.replace(' ', '+'))

## querytitle = querytitle.replace(' ', '+')

## print querytitle

url = '' % querytitle

request = urllib2.request(url)

index = random.randint(0, 9)

user_agent = user_agents[index]

request.add_header('user-agent', user_agent)

response = urllib2.urlopen(request)

html = response.read()

result = beautifulsoup(html)

print result

googlescholartitle(title)

寫的挺好的。只是需注意這個url千萬別多寫空格,但是這個hl=zh-cn不明白是啥東西,而且直接搜這篇文章會多加好多東西,比如&btng=&lr=,也不知道啥意思。

參考:關於python抓取google搜尋結果的若干問題 

extern C 的簡單解析

1.揭密extern c extern c 包含雙重含義,從字面上即可得到 首先,被它修飾的目標是 extern 的 其次,被它修飾的目標是 c 的。首先來看一下 extern 的含義 a.在乙個檔案內,如果外部變數不在檔案的開頭定義,其有效範圍只限定在定義到檔案的結束處。如果在定義前需要引用該變數...

qsort簡單解析

編譯器函式庫自帶的快速排序函式。使用qsort 排序並用 bsearch 搜尋是乙個比較常用的組合,使用方便快捷。qsort 的函式原型是 void qsort void base,size t num,size t width,int cdecl compare const void const ...

LinkedHashMap簡單解析

原始碼版本1.7 本文參考 1 內部結構 節點的結構 整體結構 插入過程 1 從table的角度看,新的entry需要插入到對應的bucket裡,當有雜湊衝突時,採用頭插法將新的entry插入到衝突鍊錶的頭部。2 從header的角度看,新的entry需要插入到雙向鍊錶的尾部。刪除過程 1 從tab...