搜索引擎是一種特殊的計(jì)算機(jī)程序。它按照一定的策略從互聯(lián)網(wǎng)上收錄信息,對(duì)信息進(jìn)行處理,為用戶提供檢索服務(wù),并將檢索結(jié)果顯示給用戶。
SEO(SEO)是指利用搜索引擎規(guī)則來提高網(wǎng)站在搜索引擎中的自然排名。為了獲得更多的免費(fèi)流量,讓其在行業(yè)中占據(jù)更高的優(yōu)勢(shì),獲得更多的收益。
只有深入了解搜索引擎的原理,才能熟悉信息采集策略,掌握搜索引擎自然排名的規(guī)律,做好SEO工作。綜上所述,搜索引擎有兩個(gè)功能:一是主動(dòng)從互聯(lián)網(wǎng)上抓取網(wǎng)頁,經(jīng)過處理后存儲(chǔ)在數(shù)據(jù)庫中,等待用戶檢索;二是響應(yīng)用戶檢索數(shù)據(jù)庫,并按照一定的規(guī)則顯示給用戶。具體如下圖所示:
搜索引擎主動(dòng)抓取網(wǎng)頁,經(jīng)過內(nèi)容處理,建立索引,存儲(chǔ)數(shù)據(jù)庫,其過程一般如下。
1發(fā)送spider將網(wǎng)頁抓取回搜索引擎服務(wù)器,并按照一定的策略存儲(chǔ)原始網(wǎng)頁;
2鏈接分離、內(nèi)容處理、噪聲消除、主文本提取和分詞統(tǒng)計(jì);
3刪除重復(fù)網(wǎng)頁,建立網(wǎng)頁索引和關(guān)鍵詞映射;
搜索引擎根據(jù)一定的規(guī)則響應(yīng)用戶的搜索請(qǐng)求并返回查詢結(jié)果。過程一般如下。
1接收到用戶查詢請(qǐng)求后的搜索詞處理,收錄指令處理、中文分詞、停止詞刪除、拼音校正等;
2根據(jù)用戶區(qū)域和搜索日志的特點(diǎn),充分了解用戶需求、集成觸發(fā)、搜索框提示等;
3搜索引擎首先搜索歷史緩存。如果它已經(jīng)存在,大多數(shù)數(shù)據(jù)可以直接返回。同時(shí)對(duì)更新進(jìn)行調(diào)整,對(duì)返回的查詢結(jié)果進(jìn)行整合;
4如果緩存不存在,則檢索關(guān)鍵字索引庫,并根據(jù)頁面權(quán)重、內(nèi)容相關(guān)性(關(guān)鍵字用法、詞密度、詞位置、錨定鏈接等)、用戶體驗(yàn)(頁面結(jié)構(gòu)、信任度、點(diǎn)擊率、評(píng)論率、評(píng)論數(shù)等)返回排名結(jié)果集。過濾和微調(diào)后,反作弊策略將顯示給用戶。同時(shí),緩存關(guān)鍵字搜索結(jié)果并記錄用戶行為日志,以便下次快速響應(yīng)用戶查詢。