一個seo工作人員,特別是那些大型網站的seo人員來說,能獨立分析網站日志是一種必不可少的技能,因為大型的網站欄目結構以及頁面非常的繁雜,蜘蛛也是少不了會頻繁訪問,從蜘蛛給網站留下的一些痕跡上面能夠掌控網站不少的信息,這對網站優化運營是一種非常必要的參考,前面小星星的文章里面也對蜘蛛狀態碼也進行了初步的介紹,這篇文章也對網站日志能讀取到的信息作出了總結:
分析網站日志能獲取到的信息總結:
一、可以看出網站頁面有哪些搜索引擎的蜘蛛抓取
從網站日志里面可以看出網站被哪些蜘蛛所抓取,每個類型的蜘蛛也都屬于自己的特殊標頭,各大搜索引擎的標頭特征如下所示:
百度蜘蛛:baiduspider
谷歌蜘蛛:Googlebot
360蜘蛛:360Spider
SOSO蜘蛛:Sosospider
雅虎蜘蛛:“Yahoo! Slurp China”或者Yahoo!
有道蜘蛛:YoudaoBot,YodaoBot
搜狗蜘蛛:Sogou News Spider
MSN蜘蛛:msnbot,msnbot-media
必應蜘蛛:bingbot
提醒:網站的日志里面也有可能會出現一些其它私人開發的抓取器所抓取,由此我們可能會發現一些奇怪的蜘蛛抓取痕跡。另外百度也有屬于自己的匿名蜘蛛,我們也要注意區分注意。
二、可以統計網站目錄蜘蛛抓取的總量
通過抓取總量的分析可以對比出網站哪個目錄更受搜索引擎的關注,一般來說蜘蛛抓取越頻繁的目錄,site網站此目錄的排名會相對靠前,我們也可通過目錄的蜘蛛訪問量來適當調整目錄的結構,對于那些抓取壓力較大但是不怎么重要的目錄也可適當縮減鏈接入口,以免阻礙給其它重要目錄的抓取。
三、網站頁面的抓取。
可以從中看出哪個頁面蜘蛛是否抓取了一些沒有被收錄價值的頁面,或者老是重復的抓取了這些頁面等,那么同理要先采取措施予以頻閉,要么是運用到nofollow標簽,要么是robots文件等,這樣就會降低因為搜索引擎抓取到大量相關性低或者質量度差的頁面而影響到頁面的權重傳遞這樣的不利影響。
四、蜘蛛平均抓取頁面的次數、頁面平均停留時間以及抓取的數量。
(1)、平均每次抓取頁面數=總抓取量/訪問次數
(2)、單頁抓取停留時間
(3)、頁面平均停留時間=總停留時間/訪問次數
從以上的分析能夠很清晰的看出蜘蛛是否頻繁關注自己的網站,而且抓取的頁面越多,深度越足也能反映出網站的活躍度高,而且在停留的時間上面也能初步看出網站的頁面和文章是否新穎或者原創,這是頁面質量度的一個體現。
五、可以一覽蜘蛛方面各網頁的狀態碼
狀態碼是網站日志里面最重要的一個方面了,這是蜘蛛對于網站頁面狀態最直觀的反映,從這些狀態碼中可以看出更多詳細的信息。
六、了解網站日志蜘蛛的來訪時間
對網站日常日志分析總結中,可以很直觀的看出每天具體是哪個時間段是蜘蛛訪問的高峰時期,我們為了迎合搜索引擎,也可以相應調整網站的更新時間,爭取在蜘蛛活躍度最高的時間段更新文章,這樣對自己網站的收錄會有非常大的幫助,甚至還有可能達到秒收的效果!
總之,分析網站日志是一個非常有意義的技能,特別是網站建立的初期和運營遇到狀況的時候,分析日志這個方面就更是尤為重要,當然再碰到信息量特別大的時候,單手動看效果是不好的,這里推薦光年日志分析工具,功能非常強大,基本能很好的滿足一般網站的分析需求。