當前位置: 首頁 > 設計知識 > 企業官網設計 > 新站為什么總是收錄過少
我將wordpress 由博客主題換成CMS主題后,發現文章收錄數量明顯增加,并由此得出一個結論:百度不愛搜錄具有博客特征的網頁。由于當時考慮不周到,發表之后,受廣州網站設計到個別網友批評指正。事實上,博客特征的網頁容易產生重復內容,高度重復才是引起百度不收錄wordpress的真正原因。經過深思熟慮,以及對蜘蛛訪問日志的觀察和分析,我對百度收錄wordpress博客異常的原因得出新的結論。
1.安裝SEO插件后,百度不收錄頁面。
很多采用wordpress建站的朋友都接觸過All in One SEO這個插件。這個插件可以讓新手一鍵搞定wordpress的站內優化。事實證明,這款插件對google優化非常的完美,但百度卻總容易出現不收錄的情況。我曾經一度懷疑百度會認為All in One SEO 插件存在優化過度的問題,從而導致網站降權,不收錄。實際上,All in One SEO 的網頁并沒有被百度降權,導致百度不收錄的罪魁禍首是它的noindex設置。
noindex標簽的作用是向搜索引擎申明該網頁禁止被搜錄和索引,谷歌蜘蛛爬行到這樣標簽的頁面,會自動丟棄掉該頁并繼續爬行其他頁面,從而減小文章重復度,利于站內目標文章頁權重的集中。百度蜘蛛遇到noindex標簽的頁面后,同樣會丟棄掉該頁。與谷歌不同的是,百度蜘蛛一般不再爬行該頁面包含的文章鏈接,直接返回上一級目錄。由于包含在該頁中的文章無法被百度蜘蛛爬行到,所以頁目錄之下的文章將不會被索引。
解決辦法:
取消All in One SEO 中 noindex設置。
2.wordpress模板導致的原因。
wordpress之所以流行,與其強大的插件擴展能力和數量豐富的主題模板密不可分。我曾經說過,使用wordpress建站的人,百分之99%都直接采用現成的主題來建站。同樣的模板必然導致網絡中出現大量高度重復網站結構和內容。百度不喜歡重復的內容,這些重復內容當然也包含網站模板的HTML代碼。
SEOer通常會選擇一些使用人數較少的模板來做SEO博客,同時還會對代碼部分做一些更改,如ID部分名稱,title 描述,CSS名稱等等。這些操作的目的,是使得網頁模板代碼盡量避免與其他網站重復,從而更有利于文章的搜錄。當博客正文內容字數越少時,模板重復對收錄的影響就會變得越大。
解決辦法:
1).增加文章字數。
2).選擇非熱門wordpress主題。
3).對現有主題進行修改。
3.wordpress摘要設置不當造成站內文章重復。
百度也好,谷歌也罷,沒有哪一家搜索引擎喜歡重復的文章。當一篇文章出現在同一網站內多個不同的頁面中,搜索引擎將花費更多的處理時間來判斷哪一篇文章才是正文。當搜索引擎從程序上難以無法判斷主次時,會降權收錄文章第一次被索引的頁面,或者直接K掉這些重復的頁面。于是很多wordpress站長在百度里site自己的網址,然后驚訝的發現:出現在結果前面的,竟然全都是日歷頁,歸檔頁或分類目錄,而文章正文內容卻被百度隱藏而作為補充內容而存在,甚至壓根就不被索引。
導致這樣的原因是因為你在錄入文章數據的時候,既沒有采用more標簽對文章進行截斷,也沒有手動添加摘要。wordpress默認情況下,會將more標簽之前的內容作為摘要輸出到首頁,標簽目錄,分類目錄,歸檔目錄,日歷目錄下。如果沒有用more標簽進行截斷,也沒有手動輸入摘要,那么文章正文會同時出現在首頁,幾個目錄頁,以及文章頁中。由于首頁比目錄頁權重高,目錄頁比文章頁權重高,百度以為文章頁權重最低,便優先舍棄掉了。google的真正從技術上實現了文章的篩選機制,能保文章頁被正常的收錄,而百度這方面的技術尚需進一步完善。
解決辦法:
1).每個文章前一兩段后添加more標簽。
2).手動添加文章摘要,不能與more標簽之前相同。
3).精簡標簽數量。
4.URL設置不合理,不利于收錄。
在很多SEO教程里,都提出過目錄不宜過深。受到這一思想影響,許多站長就將目錄頁,文章頁都控制在二級目錄以內,以為這樣可以讓網頁更好的被收錄。殊不知,這樣的URL方式其實并不利于SEO。搜索引擎蜘蛛爬行算法不光包含URL深度,同時還包括URL的重復度。當蜘蛛需要爬行一個網站時,首先需要根據網站的權重算出索引的深度和重復數,當網站權重越高時,蜘蛛爬行的深度就越深,允許的重復數就越大。蜘蛛在索引某一網站的時候,當深度操過一定層次后就會終止爬行其子目錄。在爬行某個層次鏈接的過程中,URL重復數度超過一定數量,就會結束對該層目錄的爬行。
如果你的站內除了根目錄就是2級頁面,文章數量少時還好,如果文章數量一多,便會加大搜索引擎引擎服務器的負荷,從而引起蜘蛛反感。
解決辦法:
一般而言,搜索引擎對于新站爬行層次都在三層左右。最佳的目錄設置方案應當是目錄/時段/正文。雖然這樣的分類方式在建站初期收錄處在劣勢,但對網站(尤其是對靠長尾關鍵詞取勝的站點)的長期發展百利而無一害。我個人認為,這種目錄結構是對搜索引擎最友好的,最容易被收錄的結構。
廣州最專業的網站建設公司,為你提供最好的營銷方案,幫助你獲得更多的訂單。
全國統一服務電話:4000-882-993
上一篇:企業該如何利用好網絡營銷軟件
下一篇:百度快照不更新的原因是什么
掃一掃關注古柏
GOOBAI AD.
Brand Whole Case Design
4000-882-993
www.gurisutorappu.com
微信加好友咨詢
廣州古柏廣告策劃有限公司
地址:廣州市天河區東圃長盛商務大廈B213-215
Copyright?2004-2020 GOOBAI Inc.All rights reserved
粵公網安備: 44010602001481號
備案號:粵ICP備09222445號
與古柏對話
關注古柏