搜索引擎蜘蛛是搜索引擎的一個自動程序。它的作用是訪問互聯網上的網頁、圖片、視頻等內容,建立索引數據庫,使用戶能在搜索引擎中搜索到您網站的網頁、圖片、視頻等內容。
一般用法為“ spider+URL”,后面的URL(網址)是搜索引擎的痕跡,如果要查看某搜索引擎是否來爬取過你們的網站,可查看服務器的日志里是否有該URL,同時還能查看來的時間、頻率等…
1、百度蜘蛛:可以根據服務器的負載能力調節訪問密度,大大降低服務器的服務壓力。根據以往的經驗百度蜘蛛通常會過度重復地抓取同樣的頁面,導致其他頁面無法被抓取到而不能被收錄。這種情況可以采取 robots協議的方法來調節。
2、谷歌蜘蛛:谷歌蜘蛛屬于比較活躍的網站掃描工具,其間隔28天左右就派出“蜘蛛”檢索有更新或者有修改的網頁。與百度蜘蛛最大的不同點是谷歌蜘蛛的爬取深度要比百度蜘蛛多一些。
3、雅虎中國蜘蛛:如果某個網站在谷歌網站下沒有很好的收錄,在雅虎下也不會有很好的收錄和爬行。雅虎蜘蛛的數量龐大,但平均的效率不是很高,相應的搜索結果質量不高。
4、微軟必應蜘蛛:必應與雅虎有著深度的合作關系,所以基本運行模式和雅虎蜘蛛差不多。
5、搜狗蜘蛛:搜狗蜘蛛的爬取速度比較快,抓取的數量比起速度來說稍微少點。最大的特點是不抓取 robot. text文件。
6、搜搜蜘蛛:搜搜早期是運用谷歌的搜索技術,谷歌有收錄,搜搜肯定也會收錄。2011年搜搜已經宣布采用自己的獨立搜索技術,但搜搜蜘蛛的特性和谷歌蜘蛛的特點還是有著相似的地方。
8、有道蜘蛛:和其他搜索引擎蜘蛛一樣,凡是高權重網站的鏈接一般都能將其收錄。爬行原理也是通過鏈接之間的爬行。