flight cases商品网浅析搜索引擎的流程
时间:2010-12-10 来源:filghtcasessupplier
一:建立信息索引
搜索引擎自然是依靠自己的程序扫描整个互联网上的网页的,这个扫描程序往往被我们形象的称为蜘蛛或者探寻机器人,它们的主要工作就是去收集各种网页,努力的带回大量的信息,把这个信息放到蜘蛛的仓库后,基本上是无序的,只有在用户提出搜索请求的时候才会对这些信息进行加工,然后把加工好的网页提供给客户,如果信息不进行加工,而只是简单的呈献给客户,那么客户要想找到自己想要的东西就会很困难,自然就没有办法获得用户的青睐了,而这个加工过程就是给网页建立索引过程,通过搜索引擎对网页质量的评判有资格的才能够进入索引,没资格的就踢出去,建立索引的就是被搜索引擎收录了!
举个例子来说明一下,比如搜索引擎建立了一个索引叫做“搜索引擎优化”,然后程序就会在蜘蛛的仓库中找和搜索引擎优化有关的网页,然后把他们放在搜索引擎优化这个标签的下面,等待有用户进行搜索搜索引擎优化这个关键词的时候,程序就会在这个索引里面找出有用的信息提供给用户了!
那么建立好的索引又是如何把好的内容提供给用户的呢?一般通过三种方法,一种是内容索引,这里的内容就是我们常说的关键词,标题和描述语句以及链接源头文字等,第二种就是结构索引,这里主要是有价值的信息,比如收集回来的网页连接等等,第三种就是索引时的特别索引,这要是集中图片,PDF文件等提供搜索问询的!
二:搜索引擎的信息反馈工作
比如广大的用户在百度的搜索框里面输入仔猪价格这个关键词后,搜索引擎就要开始以光子的速度开始工作了,正确在几百万分之一秒的时间里面给大家提供有关仔猪价格的信息结果出来,而百度执行的时间一般控制在半秒之内,当然从搜索到提供给客户看了这段时间,可见效率是惊人的!
那么百度是如何做到这一点的呢?如果是把自己收集到的网页通过临时的计算然后再反馈给用户时间远远不止这么多,因为我们往往搜索一个关键词的时候会出现很多的页面,因此搜索引擎在内容索引和结构索引的过程中都会有个预备计算,如果在搜索引擎执行了计算之后在过去如果出现和仔猪价格这个关键词排名条件的网页太多的时候往往就会出现网页排版错误或者其他的提示来,如今这个问题已经解决了,就是把相关的网页信息提供到现在专有的排名程序,然后请排名程序将相关的信息按照和关键词最相关的和不相关的顺序进行排列,排名程序于是就能够从预备计算过的索引里面进行排列,大大缩短了计算的时间,从而能够迅速的提供一份综合的排名给用户!
上面仅是flight cases商品网对搜索引擎的工作原理进行了简单的介绍,当然其中的程序算法和具体的工作原理如果不用几本书是没有办法讲清楚的。