• 英迈思集团
  • 首页
  • 应用商店
  • 代理合作
  • 客服中心
  • 资讯中心
  • 深圳VIP热线
    0755-2801 8888
  • 销售热线
    4000-998-667
  • 售后热线
    0755-88856856
  • 最热文章
  • 最新文章
  • 好文推荐
相关文章

搜索引擎的排名原理

日期: 2015-09-02
浏览次数: 339

了解搜索引擎的几个工作原理,是搜索引擎优化的前提。搜索引擎大致上可以分四个步骤进行工作的。

 

搜索引擎的排名原理 

1.爬行和抓取

 

搜索引擎派出一个能够在网上发现新网页并抓取文件的程序,这个程序通常被称为蜘蛛(spider)或者机器人(robot)。搜索引擎蜘蛛从数据库中已知的网页开始出发,就像正常用户的浏览器一样访问这些网页并抓取文件。

 

同时搜索引擎蜘蛛会跟踪网页上的链接,访问更多网页,这个过程就叫作爬行(carwl)。当通过链接发现有新的网址时,蜘蛛将把这些新网址记录入数据库等待抓取。跟踪网页链接是搜索引擎蜘蛛发现新网址的最基本方法,所以反向链接成为搜索引擎优化最基本的因素之一。没有反向链接,搜索引擎连页面都发现不了,就更谈不上排名了。搜索引擎蜘蛛抓取的页面文件与用户浏览器得到的完全一样,抓取的文件存入数据库。

 

2.索引

 

搜索引擎索引程序把蜘蛛抓取的网页文件分解、分析,并以巨大表格的形式存入数据库,这个过程就是索引(index)。在索引数据库中,网页文字内容,关键字出现的位置、字体、颜色、加粗、斜体等相关信息都有相应记录。搜索引擎索引数据库存储巨量数据,主流搜索引擎通常都存有几十亿级别的网页。

 

3.搜索词处理

 

用户在搜索引擎界面输入关键词,单击"搜索"按钮后,搜索引擎程序即对输入的搜索词进行处理,如中文特有的分词处理,对关键词词序的分别,去除停止词,判断是否需要启动整合搜索,判断是否有拼写错别字等情况。搜索词的处理必须时分快速。

 

4.排序

对搜索词进行处理后,搜索引擎排序程序开始工作,从索引数据库中找出所有包含搜索词的网页,并根据排名算法计算出哪些网页应该排在前面,然后按一定的格式返回"搜索"页面。

 

排序过程虽然在一两秒之内就能完成并返回用户所要的搜索结果,实际上这事一个非常复杂的过程。排名算法需要从索引数据库中找出所有相关页面,实时计算相关性,加入过滤算法,其复杂程序是外人无法想像的。


搜索引擎是当今规模最大、最复杂的计算机系统之一。然而即使是最好的搜索引擎,在鉴别网页上也无法与人相比,这就是为什么网站需要搜索引擎优化。没有网站推广人员的帮助,搜索引擎常常不能正常返回最相关性、最权威、最有用的信息。