0731-55587844
其他(360、58、霸屏、搜狗、小程序)等代理合作請發(fā)郵箱254596208@qq.com
站內(nèi)公告:  如果您有其它業(yè)務(wù)聯(lián)系,請發(fā)郵件至yaner@y1web.com郵箱,謝謝您的配合!
營銷型網(wǎng)站建設(shè)第一品牌——優(yōu)度網(wǎng)絡(luò)
現(xiàn)在的位置:首頁 > 發(fā)布營銷型網(wǎng)站建設(shè) > 新聞資訊 > 搜索引擎收錄網(wǎng)站的原理
搜索引擎收錄網(wǎng)站的原理
信息來源:優(yōu)度網(wǎng)絡(luò)  發(fā)布日期:2009/3/17 瀏覽數(shù)量:1313
文章導(dǎo)讀:

控錄蜘蛛和控尋機器人

搜索引擎要知道網(wǎng)上的新生事物,就是派人出去搜集。但是靠人工是不可能完成這個任務(wù)的。所以,搜索引擎的發(fā)明者就設(shè)計了計算機程序,派它們來執(zhí)行這個任務(wù)。

探測器有多種叫法,也叫crawler(爬行器)、spider(蜘蛛)、robot(機器人).這些形象的叫法是描繪搜索引擎派出的蜘蛛機器人爬行在互聯(lián)網(wǎng)上探測新的信息。Google把它的控測器叫做googlebot,百度就叫Baiduspider,MSNMSNbot,Yahoo則稱為Slurp.這個控測器實際上是人們編制的計算機程序,由它不分晝夜地進入訪問各個網(wǎng)站,取回網(wǎng)站內(nèi)容、標(biāo)簽、圖片等,然后依照搜索引擎的算法給它們制定成索引。所以,這可不是“爬行”而是以光速來訪問的。

一個搜索引擎會同時派出許多控測器。這些“機器人”或者從站主直接呈遞的網(wǎng)站URL去訪問,或者由一個網(wǎng)絡(luò)用戶所裝的搜索引擎工具欄(比如GOOgle工具欄)得知用戶去的網(wǎng)站,或者是從一個網(wǎng)站中指向另一個網(wǎng)站的鏈接過去?販y器不一定是從網(wǎng)站的首頁進入訪問,所以,如果你要探測器訪問你其他的網(wǎng)頁,那么這個進入頁就需要和其他網(wǎng)頁相連。達到這個目的最容易的辦法就是在每一頁都加入指向首頁的鏈接。

但是,探測器對許多網(wǎng)站是不能完整取回信息的,這個大多是由于網(wǎng)站的設(shè)計沒有按照搜索引擎控測器的思路來進行優(yōu)化。比如,如果一個網(wǎng)頁比較大,控測器也只能截取網(wǎng)頁的首部,而且只能跟著少量的鏈接走。Google目前能夠吸收100KB的文件,Yahoo會多一點。這個可以通過實驗來檢驗。將一個搜索關(guān)鍵詞放在一個很長的網(wǎng)頁(約160KB)最后部分,然后看Google的緩存(cache)中顯現(xiàn)網(wǎng)頁的大小是多少。如果不出意料,Googlecache說這個網(wǎng)頁只有101KB。很顯然,一部分內(nèi)容沒被Google抓走。

這個現(xiàn)象告訴我們不要將網(wǎng)頁設(shè)計得很長、很大。將大的網(wǎng)頁拆成若干小的網(wǎng)頁具有很多的好處:

1、  使得網(wǎng)頁容易被探測器抓取。

2、  更容易建立合理的網(wǎng)站內(nèi)部鏈接關(guān)系。

3、  每個網(wǎng)頁可以更加集中在重要的關(guān)鍵詞語。

4、  節(jié)省服務(wù)器的帶寬。

5、  方便瀏覽者的閱讀。

相關(guān)信息
  • 網(wǎng)絡(luò)營銷培訓(xùn)
  • 微網(wǎng)站
  • 掃二維碼
  • 1
  • 2
  • 3
  • 最新上傳
  • 精品案例
  • 自動流水線嘉
  • 湖南省湘江重
  • 湘潭家居\建
  • 湘潭學(xué)校微網(wǎng)