近,百度站長(zhǎng)平臺(tái)又增加了一個(gè)新的抓取診斷工具,可以讓站長(zhǎng)從百度蜘蛛的角度來(lái)查看內(nèi)容,自我診斷百度蜘蛛看到的內(nèi)容,以及是否符合預(yù)期,并且很方便的對(duì)網(wǎng)站的一些問(wèn)題進(jìn)行故障排除。這個(gè)工具類似于站長(zhǎng)工具的模擬搜索引擎工具,但是模擬搜索引擎工具只顯示蜘蛛抓取文本信息,百度的抓取診斷工具會(huì)完整完整地顯示蜘蛛抓取、抓取和抓取的所有信息,包括文本、代碼、標(biāo)簽、頭文件,等等,這能更好地幫助網(wǎng)站管理員檢查網(wǎng)頁(yè)。
不過(guò),目前,每個(gè)網(wǎng)站的百度爬行診斷工具一個(gè)月可以使用300次,而爬行結(jié)果只顯示前200KB的百度蜘蛛可見(jiàn)內(nèi)容。
這個(gè)工具使用起來(lái)很簡(jiǎn)單。抓取診斷工具只能用于網(wǎng)站管理員驗(yàn)證的網(wǎng)站。然后在grab診斷工具界面中輸入要抓取的邊的地址。如果為空,則表示獲取主域名。單擊抓取按鈕,抓取狀態(tài)將顯示在下面。單擊grab success查看搜索引擎捕獲的完整信息。
診斷捕獲的內(nèi)容是否符合預(yù)期,比如很多產(chǎn)品細(xì)節(jié)頁(yè)面,價(jià)格信息是通過(guò)JavaScript輸出的,對(duì)百度蜘蛛不友好,價(jià)格信息很難在搜索中應(yīng)用。故障排除后,可以使用診斷工具再次獲取測(cè)試。
診斷網(wǎng)頁(yè)是否添加了黑鏈和隱藏文本。如果網(wǎng)站是黑色的,可能會(huì)添加隱藏的鏈接。這些鏈可能只有在百度抓到它們時(shí)才會(huì)出現(xiàn),這需要用這個(gè)抓取工具來(lái)診斷。雖然它可以在源代碼中直接查看,但是很麻煩,而且它也可以被站長(zhǎng)工具仿真搜索引擎直接抓取,但是仿真工具看不到與文本對(duì)應(yīng)的詳細(xì)鏈接,不容易識(shí)別,而且都是密麻麻文本。
檢查網(wǎng)站與百度的連接是否順暢。如果IP信息不一致,可以通過(guò)報(bào)錯(cuò)的方式通知百度更新IP。單擊上面的可查看搜索引擎捕獲的完整信息。它還包括以下信息。如果不正確,可以單擊報(bào)告錯(cuò)誤
如果網(wǎng)站有新頁(yè)面或者頁(yè)面內(nèi)容已經(jīng)更新,百度蜘蛛已經(jīng)很久沒(méi)有訪問(wèn)過(guò)了,可以通過(guò)這個(gè)工具邀請(qǐng)它快速抓取,相當(dāng)于URL提交工具。
為什么每個(gè)核查點(diǎn)每月只有300次?為什么只有200KB的內(nèi)容?
也許目前百度對(duì)服務(wù)器等資源的使用會(huì)有限制,或者次數(shù)會(huì)受到限制。未來(lái),百度會(huì)推出VIP站長(zhǎng)俱樂(lè)部嗎?更多的時(shí)間和規(guī)模,以服務(wù)高品質(zhì)的VIP網(wǎng)站?
就寫(xiě)這么多。我相信你用的時(shí)候會(huì)知道的。如果你沒(méi)什么事可做,就趕緊去拿熱乎乎的手。打開(kāi)這個(gè)工具可以讓站長(zhǎng)提高自己頁(yè)面的質(zhì)量,有利于網(wǎng)站的整體質(zhì)量和體驗(yàn)。不過(guò),別激動(dòng)。每個(gè)網(wǎng)站一個(gè)月只有300個(gè)抓取會(huì)議,所以你可以節(jié)省一點(diǎn)。