搜索引擎的构成有哪些组件

 杭州seo优化   2021-05-04 12:11   50 views 人阅读  0 条评论
搜索引擎的构成有文档管理器、索引构建器、索引管理器、索引检索器四个组件
搜索引擎的构成及工作流程
图:搜索引擎的构成及工作流程
文档管理器
文档管理器是管理文档数据库的组件,文档数据库中储存着作为检索对象的文档。文档管理器会先从文档数据库中取出与查询相匹配的文档,然后再根据需要从该文档中提取出一部分内容作为摘要。
由于文档管理器的结构非常简单,只是对应着文档特定的ID(文档编号)来保存文档的内容。我们经常能看到有人将数据库管理系统(DBMS)和基于二级存储的数据库管理器(DBM)等用作文档管理器。
由文档管理器管理的文档数据库既可以在构建索引的阶段随索引一同构建,也可以提前构建。
索引构建器
索引构建器是从作为检索对象的文本文档中生成索引的组件。索引构建器会先通过解析将文本文档分解为单词序列,然后再将该单词序列转换为索引结构。在搜索引擎中,将生成索引的环节称为索引构建(IndexConstruction)。
索引管理器
索引管理器组件的作用是管理带有索引结构的数据,索引结构是一种用于进行高速检索的数据结构。对索引的访问也是通过索引管理器进行的。
索引管理器通常是将索引作为二级存储上的二进制文件来进行管理的。而且,还经常会通过保存经过压缩的索引来达到减少从二级存储加载的数据量,提升检索处理效率的目的。
索引检索器
索引检索器是利用索引进行全文搜索处理的组件。索引检索器根据来自检索应用程序用户的查询,协同索引管理器进行检索处理。在大多数情况下,索引检索器都会根据某种标准对与查询相匹配的检索结果排序,并将排在前面的结果返回给应用程序。
另外,查询和信息需求视为同义词。所谓查询是指“由1个以上的单词或词组组成的对搜索引擎的询问”。
写在结尾:以上就是搜索引擎的构成有哪些组件的详细内容,更多请关注【杭州SEO博客】其它相关文章!
本文地址:http://seo.huashi123.cn/9383.html
版权声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系我们。

 相关文章  关键词:

 发表评论


表情