百度站長平台 新增資料標註工具

2022-10-05 01:06:09 字數 2511 閱讀 7395

乙個**的頁面內容,例如人物、事件、餐廳、產品、電影、軟體、評論、不僅要給使用者看,還要讓搜尋引擎可識別,而目前要讓其知會特定內容含義,我們需要使用結構化資料,結構化資料也是為了方便搜尋引擎識別特別頁面內容而產生的,有特定的規範,有特定的格式。

搜尋引擎都支援標準的結構化資料,以便為使用者提供更好的搜尋體驗。百度、谷歌、360都支援**結構化資料的提交,結構化微資料可以讓搜尋引擎提供更豐富的搜尋結果摘要展現,讓搜尋使用者直接在搜尋結果中程式設計客棧看見你商品的重要資訊,例如:商品的**、名稱、庫存狀況(商品是否有貨)、評論者評分和評論等。這些豐富網頁摘要可幫助使用者了解**與他們的搜尋內容是否相關,可以讓網頁獲得更多點選,提公升**的形象和流量。

百度新增資料標註工具(來自百度站長平台)

近日,百度站長平台為了方便**更好的實現結構化資料提交,特別推出資料標記工具。

百度站長平台資料標註工具,是一種快速將**結構化資料提交給百度的方式。只要用滑鼠簡單的划選,百度就可以快速學習如何從你**中提取結構化資料,之後這些資訊能在百度搜尋結果中以富摘要的形式展現,提公升**的形象和流量。

如何使用百度站長平台資料標註工具?

以軟體**站為例,除了各種軟體分類列表頁外,軟體**站的主要頁面為軟體**頁,包含了許多結構化資料。例如「百度瀏覽器**頁」,頁面含有軟體名稱、大小、更新時間、評分、**鏈結等結構化資料。其他軟體**頁,和這個頁面包含的資訊類似。

1、選擇此網頁為典型**,作為百度學習提取結構化資料的起始網頁。

如下圖,我們若要告知百度網頁哪部分內容代表軟體名稱,只要用右鍵划選「百度瀏覽器」,在彈出選單中選擇「名稱」即可,其他資訊採用類似的方式標註。其他結構化資料同樣如此選擇。

頁面右側列出了描述軟體資訊的字段,希望將網頁中有的資訊都標註完整。有些右側帶「重要」標識,這些欄位是出富摘要的必要字段,需特別關注。

2、此頁面標註完成後,點「繼續標註」進入建立網頁集頁面。

網頁集是指一類相似頁面的集合,通過**模式來圈定。對於**結構良好的**來說,乙個**模式可以代表一類網頁,此模式覆蓋的網頁,網頁結構是類似的。百度將結合對你**結構的理解,根據你標註的第乙個頁面,自動推薦乙個模式。

3、接下來到驗收百度學習成績時候了

大部分情況下,百度的學習是不錯的。百度會根據網頁集模式,隨機抽樣符合此模式的網頁,並自動標註網頁內容。

你需要詳細檢查百度的資料標註,並給予反饋:

如果隨機抽樣的網頁,頁面結構程式設計客棧和首次標註的典型網頁不一樣,需點選「忽略」;

如果有些字段,沒有自動抽取出來,需要用滑鼠划選標註;

如果有些字段,自動標註的內容錯了,需要刪除,重新划選標註。

4、標註完成後,回到工具首頁可以了解資料處理的狀態和進度。

如果資料處理沒問題,最終你的**將獲得類似下圖的富摘要展現效果。

此工具目前處於邀請內測階段,只支援軟體類,之後逐步開放電影、遊戲等類別。若要使用請傳送郵件至[email protected]申請許可權。

再看谷歌資料標記工具

雖然百度站長平台資料標記工具才出來,並且還在內測,只適合軟體類,我沒怎麼用,但谷歌站長平台的資料標記工具已經出來很久了,這個還是用得比較多的。據我的了解,這2個資料標記工具功能基本上是一致的(從名字上就知道了),而且谷歌的是要更甚一籌。

谷歌資料標記網頁的過程也非常簡單,無需更改自己**的 html。只需使用滑鼠突出顯示資料條目並選擇它們的型別即可,和百度是一樣的。谷歌下次抓取你的**時,活動資料將可用於搜尋結果頁上的豐富網頁摘要。

進入谷歌站長管理工具,點選資料標記工具,輸入你要標註的商品頁url,谷歌資料標記支援的資料型別有10種之多,非常豐富。這裡以產品型別為例。

進入標註頁面之後就簡單了,和百度的資料標記一樣,選擇需要的專案然後設定對應的屬性就可以了,可以發現商品屬性主要是名稱、、定價、評論之類的。在所有的標註設定好之後,記住要進行發布,之後在谷歌再次抓取後如果標註沒問題就會被展示。

當然谷歌程式設計客棧資料標記工具也可以進行頁面集的標註,一次性標記一組類似的網頁。

首先標記乙個普通的網頁。資料標註工具將會自動為你標記同型別網頁,並且與你**的更新內容保持同步。自動標註的頁面你可以自行修改,如需向資料標註工具說明你**上的哪些網頁包含同類資料,你可以建立乙個或多個網頁集。網頁集是**上始終顯示資料的一組網頁。

谷歌蜘蛛每次在你的**上抓取網頁時,資料標註工具會提取資料並將資料用於豐富網頁摘要。如果你對網頁顯示資訊的方式或**的**做出重大更改,則應刪除原始網頁集,並向資料標註工具說明你**的新結構。這一點谷歌有先見之明,用百度站長平台資料標記工具的朋友也一定要注意這一點。

總而言之

既然是資料標記工具,那麼就是快速地簡單地將**的結構化資料提交給百度,而且是自動標記,無需更改**或專門提交結構化資料,節省了大量的時間和技術成本,不像專門編寫資料**並且提交那麼麻煩。每位站長只要有對應的資料型別就可以很方便的進行提交,這不僅可以提公升**的形象,而且可以大大提高網頁在搜尋結果的點選率。而且對於搜尋引擎,這樣搜尋結果更加豐富,使用者能得到更多的資訊並找到更好的搜尋結果,大大提供搜尋體驗。

所以,結構化資料的標記,無疑,是一箭三鵰,站長贏、使用者贏、搜尋引擎也贏。

**請註明木木seo部落格,

本文位址: /news/exp/54562.html

百度官方工具 百度站長平台

1 的提交和驗證 2 死鏈結提交 再也不用使用robots乙個乙個遮蔽死鏈結,直接在站長平台提交死鏈結就可以,如果死鏈結過多可以做成文件的形式,直接提交文件在根目錄的路徑就可以了。3 改版 改版功能是提供給站長改版時新老路徑替換的功能,方便將曾經的路徑跳轉到新的路徑,並且傳遞老路徑的權重。5 外鏈分...

百度站長平台新增抓取診斷工具

近日,站長平台新增抓取診斷工具,該工具可以讓站長從蜘蛛的視角檢視抓取內容,自助診斷蜘蛛看到的內容,和預期是否一致,可以非常便利的排查 的一些問題,這個工具還站長工具的模擬搜尋引擎工具類似,但是模擬搜尋引擎工具只是顯示蜘蛛抓取的文字資訊,而的抓取診斷工具會完完整整的展現所有蜘蛛會抓取 能抓取 抓取到的...

百度站長平台體驗分享

站長目前還在內測中,先讓大家一睹為快,看看sitema程式設計客棧p 到底好不好。還是保持簡介的作風 看下如何新增 更新資料 清晰一目了然,更精確到哪小時哪分,可自由定製!一定要是xml格式哦,如果不會生成xml的可以到程式設計客棧上搜尋下,有很多 生成的。看我新增後的樣式 站長平台其實就那麼簡單,...