被老板抱进办公室揉我胸|娇妻互换被高潮了三次|女人被添全过程A片添|巜被褥里的人妻HD中字|娇妻4P被八个男人伺候电影|被迫躺在调教椅上扩张在线视频

SEO數(shù)據(jù)分析蜘蛛爬行訪問效果

文章來源:優(yōu)幫云SEO 2021-08-24

這里我想解釋一個(gè)有些人會(huì)混淆的問題。為什么我要故意解釋上面文章和網(wǎng)頁的數(shù)量?這是因?yàn)槲恼碌臄?shù)量肯定不等于網(wǎng)頁的數(shù)量。然而,有些人在檢查錄音音量時(shí)忽略了這一常識。如果一個(gè)網(wǎng)站上的文章數(shù)量(或單個(gè)信息的數(shù)量)是300000,如果你去搜索引擎并使用站點(diǎn)和其他語法進(jìn)行查詢,收錄量是290000,你會(huì)覺得你的收錄量幾乎相同,但實(shí)際情況可能更糟。

因?yàn)橐粋€(gè)頁面將派生許多其他頁面。如果打開一個(gè)文章頁面并計(jì)算其中的URL,則仍有一些URL僅在當(dāng)前頁面上可用,即從該頁面派生。URL對應(yīng)于一個(gè)頁面,因此網(wǎng)站上的頁面數(shù)是網(wǎng)站上信息量的幾倍,有時(shí)甚至十倍或二十倍。

因此,在查看這個(gè)“總體爬網(wǎng)”之前,您需要計(jì)算您的網(wǎng)站中可能包含的頁面數(shù)。您可以使用lynx online提取每種類型頁面上的URL。已知網(wǎng)頁的總數(shù),然后與“總爬網(wǎng)”進(jìn)行比較,就可以知道數(shù)據(jù)是好是壞。我認(rèn)為基本上,如果谷歌爬蟲抓取的頁面數(shù)量是網(wǎng)站頁面數(shù)量的兩倍以上,那么爬蟲數(shù)量就可以被認(rèn)為是合格的,百度爬蟲需要更多。因?yàn)槭聦?shí)上,很多搶奪都是重復(fù)搶奪;此外,與前一天相比,每天都沒有多少新的頁面抓取。

這三個(gè)數(shù)據(jù):“訪問量”、“總停留時(shí)間”和“總抓取量”都是數(shù)字越高,對網(wǎng)站越有利,因此我們需要想出很多方法來改進(jìn)它們。大多數(shù)時(shí)候,看它們的***值是沒有用的,但是看當(dāng)前和過去的比較值。如果你每天都能跟蹤這些數(shù)據(jù)的變化,你就能發(fā)現(xiàn)有多少因素影響這些數(shù)據(jù)。

有時(shí),當(dāng)前數(shù)據(jù)的值不一定有意義,但長期跟蹤數(shù)據(jù)的變化可以發(fā)現(xiàn)有多少因素相互影響。

然后是“目錄抓取”的數(shù)據(jù):

此“目錄”抓取的數(shù)據(jù)是“抓取總量”的細(xì)分。網(wǎng)站必須有關(guān)鍵頁面和非關(guān)鍵頁面。這些數(shù)據(jù)可以讓您看到抓取的頁面類型更多,并及時(shí)進(jìn)行一些調(diào)整。

然后是“頁面抓取”的數(shù)據(jù):

在“爬蟲IP排名”數(shù)據(jù)中,計(jì)算每個(gè)爬蟲IP的訪問狀態(tài):

如果你分析許多網(wǎng)站,你會(huì)發(fā)現(xiàn)爬蟲對某個(gè)站點(diǎn)的訪問將集中在特定時(shí)間的某個(gè)C段上。這是由搜索引擎的原理決定的。感興趣的朋友可以查詢相關(guān)書籍。要知道,有時(shí)可以使用此功能。

報(bào)表中有查詢IP地址的功能,可以查詢爬蟲IP是否為真。例如,上面紅色框中的IP是偽裝成谷歌爬蟲的收錄器。

此數(shù)據(jù)與上述所有數(shù)據(jù)相同。通過比較之前和之后,可以找到更多信息。

以下是關(guān)鍵字分析的數(shù)據(jù):

只要您的網(wǎng)站日志完整,使用日志拆分功能,此功能就相當(dāng)于擁有一個(gè)數(shù)據(jù)倉庫。此時(shí),瀏覽網(wǎng)站的數(shù)據(jù)是:只有你想不到它,沒有什么是它找不到的。

我還建議您拆分爬蟲的爬網(wǎng)路徑,拆分爬蟲IP的爬網(wǎng)路徑,觀察其爬網(wǎng)路徑,然后對應(yīng)網(wǎng)站上的URL,您可以了解爬蟲爬網(wǎng)的很多規(guī)律。

事實(shí)上,應(yīng)該開發(fā)一個(gè)日志合并功能,但是這個(gè)功能太簡單了。通常,我們可以通過在DOS中使用copy命令來解決此問題:

通過這種方式,你可以在一周、一個(gè)月甚至半年的時(shí)間內(nèi)對網(wǎng)站的日志進(jìn)行合并和分析?!豆饽闟EO日志分析系統(tǒng)支持無限日志的分析,只要你有時(shí)間。

在“設(shè)置”-“性能設(shè)置”中,有兩個(gè)地方需要注意。一個(gè)是“蜘蛛計(jì)算間隔”,它表示蜘蛛沒有活動(dòng)的時(shí)間,即使它離開。應(yīng)該注意的是,每次都應(yīng)該在同一時(shí)間進(jìn)行比較分析,因?yàn)檫@里的時(shí)間會(huì)發(fā)生變化,爬行動(dòng)物訪問次數(shù)的計(jì)算也會(huì)發(fā)生變化。二是“分析顯示項(xiàng)目數(shù)”。現(xiàn)在,您可以定義要在報(bào)告中顯示的數(shù)據(jù)行數(shù)。默認(rèn)情況下,只有5個(gè)項(xiàng)目。

本文標(biāo)簽:seo網(wǎng)站分析數(shù)據(jù)
屏东市| 咸宁市| 梅河口市| 博野县| 新郑市| 剑川县| 福鼎市| 龙陵县| 垣曲县| 江阴市| 华阴市| 富顺县| 永州市| 青神县| 宁陕县| 汝阳县| 永登县| 阿克陶县| 凉山| 新建县| 湖北省| 盱眙县| 绥滨县| 五峰| 彰化市| 日土县| 富源县| 兴宁市| 满洲里市| 金湖县| 玛沁县| 贡山| 夏津县| 南木林县| 陈巴尔虎旗| 太仓市| 抚州市| 柘城县| 孟连| 辉南县| 扶风县|