1、收錄頁面:
一般收錄頁面需要有百度蜘蛛抓取完成,通過抓取算法來決定收錄那些頁面,在百度的算法調(diào)整后,對于偽原創(chuàng)、采集站點予以強烈的打擊,所以百度在收錄頁面方面變得更加的嚴(yán)格了,高質(zhì)量內(nèi)容頁面以及權(quán)重高的站點一般收錄頁面的幾率會高很多。對于收錄頁面這方面相信很多的站長都是很清楚,每天百度蜘蛛都在分分秒秒不停地收錄著,但是你會發(fā)現(xiàn)其實大部分的站點的收錄都減少了,這是為什么呢?因為百度需要過濾頁面。
2、過濾頁面:
很多頁面被百度收錄之后,百度認(rèn)為該頁面對用戶沒有太大的價值,或者是質(zhì)量度比較低的頁面,百度必然就會過濾,這也是用戶體驗好的一種表現(xiàn),很多站點以優(yōu)化為目的,絲毫不考慮用戶的體驗,例如一些橋頁、跳轉(zhuǎn)頁面這些就是典型,百度的k站就是一種過濾頁面的表現(xiàn),把那些作弊的站點的頁面全部的過濾掉。很多人抱怨6.22和6.28百度k站事件,尤其是那些屌絲站長們整天在論壇抱怨這個抱怨那個,為什么k你的站,很顯然你的站點真的是以用戶體驗為核心運營站嗎?做SEO的人大多都是為了優(yōu)化而運營站點,每天寫的站內(nèi)的更新、做外鏈肯定一部分是為了優(yōu)化而優(yōu)化,百度k你的站是犧牲少部分人的利益,更多的用戶是從中獲益的,要知道多少人在使用百度,如果搜索出來的信息是你為了優(yōu)化而運營的站點,低質(zhì)量的頁面,那百度其實是拿自己未來的前途給你優(yōu)化站點做鋪墊的。所以過濾頁面這方面百度非常的嚴(yán)格,大家也不要使用seo作弊技術(shù)了。
3、建立索引:
經(jīng)過了收錄頁面以及過濾頁面的工作之后,百度會對這些頁面逐一進(jìn)行標(biāo)記和識別,并將這信息進(jìn)行儲存為結(jié)構(gòu)化的數(shù)據(jù),儲存到百度的搜索的服務(wù)器中,這些儲存的數(shù)據(jù)有網(wǎng)頁的信息、網(wǎng)頁的標(biāo)題關(guān)鍵詞頁面描述等標(biāo)簽、網(wǎng)頁外鏈及描述、抓取記錄。還會將網(wǎng)頁中的關(guān)鍵詞信息進(jìn)行識別和儲存,以便與用戶搜索的內(nèi)容進(jìn)行匹配。建立完善的索引數(shù)據(jù)庫,方便呈現(xiàn)出最佳的顯示信息
4、顯示信息:
用戶輸入的關(guān)鍵詞,百度會對其進(jìn)行一系列復(fù)雜的分析,并根據(jù)分析的結(jié)論在索引庫中尋找與之最為匹配的一系列網(wǎng)頁,按照用戶輸入的關(guān)鍵詞所體現(xiàn)的需求強弱和網(wǎng)頁的優(yōu)劣進(jìn)行打分,并按照最終的分?jǐn)?shù)進(jìn)行排列,展現(xiàn)給用戶。一般顯示出最佳信息需要是最適合匹配關(guān)鍵詞相關(guān)的頁面,包括網(wǎng)站站內(nèi)優(yōu)化和網(wǎng)站站外優(yōu)化的因素。