蜘蛛爬行相當(dāng)于遍歷網(wǎng)絡(luò)的有向圖,因此一個(gè)結(jié)構(gòu)簡單清晰的網(wǎng)站一定是它,并盡量保證蜘蛛的可讀性。
(1) 樹形結(jié)構(gòu)的結(jié)構(gòu)是“首頁-頻道-詳情頁”;
(2) 從平面首頁到細(xì)節(jié)頁的層次盡可能小,便于抓取,能很好地轉(zhuǎn)移權(quán)重。
(3) 網(wǎng)狀網(wǎng)保證每個(gè)頁面至少有一個(gè)文本鏈接指向,可以使網(wǎng)站盡可能全面地被抓取收錄,對(duì)鏈的構(gòu)建也可以起到積極的排序作用。
(4) 導(dǎo)航為每個(gè)頁面添加了一個(gè)導(dǎo)航,這使得用戶很容易知道自己在哪里。
(5) 相信有大量的站長對(duì)子域和目錄的選擇有疑慮。我們認(rèn)為,當(dāng)內(nèi)容較少,內(nèi)容相關(guān)性較高時(shí),建議以目錄形式實(shí)現(xiàn),有利于權(quán)重的繼承和收斂;當(dāng)內(nèi)容較多,與主站相關(guān)性稍差時(shí),建議以子域形式實(shí)現(xiàn)。
(1) 在網(wǎng)站中,同一內(nèi)容頁面只對(duì)應(yīng)一個(gè)的URL,過多的URL形式會(huì)分散頁面的權(quán)重,目標(biāo)URL存在被系統(tǒng)過濾的風(fēng)險(xiǎn);
(2) 動(dòng)態(tài)參數(shù)盡量少,URL盡量短;
(3) 美學(xué)使用戶和機(jī)器能夠通過URL判斷頁面內(nèi)容的主題;
我們推薦以下幾種URL形式:URL應(yīng)該盡量簡短易讀,以便用戶快速理解,例如使用拼音作為目錄名;系統(tǒng)中相同的內(nèi)容只產(chǎn)生一個(gè)與之對(duì)應(yīng)的URL,去掉無意義的參數(shù);如果無法保證URL,盡量對(duì)目標(biāo)URL制作不同形式的url301;防止用戶在主域名中輸入錯(cuò)誤的備用域名301。
(1) 別忽視那些倒霉的機(jī)器人檔案。默認(rèn)情況下,一些系統(tǒng)機(jī)器人被搜索引擎抓取。網(wǎng)站建立后,及時(shí)檢查和編寫相應(yīng)的機(jī)器人文件,在日常維護(hù)過程中注意定期檢查;
(2) 建立網(wǎng)站地圖文件和死鏈文件,及時(shí)通過百度站長平臺(tái)提交;
(3) 一些電子商務(wù)網(wǎng)站存在地域跳躍的問題。建議做一個(gè)統(tǒng)一的頁面來識(shí)別頁面中是否有商品。如果此區(qū)域沒有商品,請(qǐng)勿返回?zé)o效頁面。由于spider導(dǎo)出的限制,無法包含正常頁面。
(4) 合理使用機(jī)器人、站點(diǎn)地圖、索引量、爬行壓力、死鏈提交、網(wǎng)站改版等站長平臺(tái)提供的工具。