合肥市高新區(qū)長江西路與科學大道交口5F創(chuàng)業(yè)園A座309
136 5560 1775

淺談搜索引擎蜘蛛的工作原理

發(fā)表日期:2010-03-27 瀏覽次數(shù):2388次

  大家經常都在講,文章被搜索引擎抓起。那么搜索引擎他的工作原理到底是什么呢,合肥網站建設根據(jù)自己的理解今天和大家說說,搜索引擎的數(shù)據(jù)庫,是一個龐大復雜的索引數(shù)據(jù)庫。搜索引擎在取網站頁面后,會被怎樣索引,搜索引擎為你的這個頁面建立什么樣的頁面文件嗎?

    1、首先,你的頁面是”新”的,也就是原創(chuàng)與偽原創(chuàng)。

  2、搜索引擎蜘蛛抓取了您的網站后,讀取頁面編碼,作者,創(chuàng)建時間等屬性信息。

  3、抓取網站內容信息,及我們常用的搜索引擎抓取模擬工具得出來的文字內容。

    4、將內容按切詞技術,包括正反向切詞,正向切詞,反向切詞,關鍵字最少話切詞,反饋切詞技術等,得到一系列目標關鍵字

    5、抓取關鍵字出現(xiàn)的位置,在第3段模擬抓取中,我們可以看到title keywords與description,及頁面內容。這可以很明顯得看出關鍵字出現(xiàn)的位置。

    6、將第4段得到的目標關鍵字與第5段得到的位置信息形成一個數(shù)組文檔。

  7、當有人搜索目標關鍵字的時候,搜索引擎將讀取所有關于關鍵字的數(shù)組,根據(jù)一系列復雜的算法,得到這些頁面的排名順序,展現(xiàn)給訪客。

    以上基本上就是一般的搜索引擎蜘蛛爬行你網頁后的結果。合肥網站建設也是根據(jù)一些資料得出這個結果的。因為說真的,搜索引擎他的工作原理一般情況下不會輕意的給說出來的。我們也只是一種猜想。

 


將文章分享到:

版權所有:啟邁科技-合肥網站建設 皖ICP備19009304號-1 皖公網安備 34010402702162號

網站建設,網站設計公司啟邁科技,為眾多企業(yè)提供網站建設,網站制作,響應式網站設計,手機網站建設,微網站,模板建站,企業(yè)郵箱等一站式互聯(lián)網解決方案和建站服務10年。