搜索引擎的工作原理是什么

 杭州seo优化   2014-08-15 17:10   185 views 人阅读  0 条评论

每位站长都希望搜索引擎每天都能够来到网站,恨不得一天24小时都待在自己的网站。那么,搜索引擎究竟是怎么工作的呢???它是怎么抓取我们网站的内容呢???今天,花满楼就给大家说说搜索引擎的工作原理。

杭州seo优化

什么是搜索引擎爬虫?

想要了解搜索引擎的工作原理,首先要了解搜索引擎爬虫。所谓搜索引擎爬虫就是搜索引擎抓取网页的一个程序,一般认为搜索引擎爬虫都是没链接爬行的,所以管他叫爬虫。它在各个搜索引擎中的叫法不同,在谷歌中叫robot机器人,百度叫做蜘蛛,crawler爬行器等等。

前面说完了搜索引擎爬虫,下来说说搜索引擎是怎么工作的?

1、爬行和抓取。

每天,搜索引擎都会派出手下的蜘蛛去各个网站,蜘蛛通过追踪网站上的链接而访问网页,从一个页面到下一个页面。就好像蜘蛛在蜘蛛网上爬行一样,这就是蜘蛛的由来。蜘蛛爬过网页之后,将数据返回到数据库。

2、预处理

蜘蛛将数据返回数据库后,下来就是预处理的过程。预处理也叫做索引。搜索引擎抓取的原始页面不能够直接参与参与排名,而是经过搜索引擎预处理,为后面的排名做好准备。

预处理共包括提取文字、中文分词、去停止词、消除噪声、去重、正向索引、倒排索引、链接关系计算和特殊文件处理等九个环节。

3、排名

经过搜索引擎抓取页面和预处理后,下来就是排名了。用户在搜索框中输入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程是与用户直接互动的。

以上就是搜索引擎的工作原理,也是我们seoer必定要掌握的知识。今天只是大概的给大家讲解了一下,下次博主会把预处理和排名的详细过程写上来,分享给大家。

写在结尾:以上就是搜索引擎的工作原理是什么的详细内容,更多请关注【杭州SEO博客】其它相关文章!
本文地址:http://seo.huashi123.cn/47.html
版权声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系我们。


 发表评论


表情