匯入網頁資料到 Google Sheet

2021-09-07 12:16:15 字數 1500 閱讀 8820

資料沒有用,我們需要的是資料所反映出來的東西。增長率,排名,佔比等。而這些結果是通過分析資料得到的。

從網上蒐集到資料後,匯入到**程式中便可以進行方便地分析處理了。下面介紹將網頁中的**資料匯入到 google sheet 中的操作。

利用importhtml公式可以輕鬆實現將網頁中的資料匯入到我們的工作表當中。

該公式需要三個入參,分別是:

我們以 [list of countries by gdp](這個來自 wikipedia 的國家 gdp 排名頁面為列,將其中的**資料進行匯入。

![來自 wikipedia 的國家 gdp 排名

在需要匯入的單元格裡輸入以下公式:

=importhtml("","table",3)
然後執行。資料載入完成後,頁面中第三個 table 的資料就被匯入了。

回顧上面的引數,第乙個 url 沒問題,就是瀏覽器位址列裡的,直接複製貼上。

第二個引數自不必多說,我們需要匯入的不是列表,而是table

而最後個引數為什麼是3?因為如果是1的話匯入的資料並不正常,所以頁面的 html **中有隱藏的用於布局的table,我們需要跳過,嘗試到3的時候有資料了。

對於沒有網頁程式設計相關經驗的人來說,總之可以從1開始試,通過匯入的結果便可知道是否是想要的資料。

當資料在專業的**程式中的時候,分析處理起來就很得心應手了。譬如我們覺得**資料不夠直觀,可以快速簡單點兩下就能插入乙個地區圖。

假設我們想要觀察 gdp 排名前20的國家在地圖上的分布。首先選中所需資料。

選擇insert->chart...

在彈出的圖表編輯框中,指定圖表型別為geo chart

資料一下子就直觀起來了!

但通過看出問題來了,也就是少了些很重要的經濟體,譬如兔子,戰鬥民族。

回頭看**中的資料,china 的名字似乎不對,將資料複製一分出來到sheet2,將名字更正一下,再重複上面的步驟。

這是完工後的工作表,前往參觀。

清洗網頁資料

ascii american standard code for information interchange美國標準資訊交換碼 只能表示128個字元 這個大家都是很熟悉的,從32是空格,然後是一堆符號,然後是48 57表示0 9,65 90是a z,97 122是a z。就是很少,也只有英文本母...

python 抓取網頁資料

利用python進行簡單的資料分析 1 首先要進行分析網頁的html,我們所要抓取的資料是根據銷量排名的手機資訊,所以主要需要抓取手機的型號 銷量,按照 由小見大 的方法來獲取所需要的html資訊,如下圖所示 由上可以看出手機型號所在的html標籤是 h3 手機 是在div中的class屬性為 pr...

網頁資料抓取 爬蟲

資料抓取其實從字面意思就知道它是抓取資料的,在網際網路世界中,資料量是乙個非常大的。有時候靠人為去獲取資料這是乙個非常不明智的。尤其是你需要的資料來自很多不同的地方。網路爬蟲是是一種按照一定的規則,自動地抓取網際網路 資訊的程式或者指令碼。它主要抓取形式有兩種 1種是抓取網頁鏈結,通過url鏈結得到...