首页 > 知识

一文读懂知识搜索背后的逻辑(附图解)

更新时间:2024-11-27 07:23:15 阅读: 评论:0

一文读懂知识搜索背后的逻辑(附图解)

十年前,当你在搜索引擎上检索不懂的名词,比如“什么是避雷针”,你需要一个一个点开搜索结果,进入页面自己去寻找避雷针的定义;

十年后的今天,当你在搜索引擎上再次检索“什么是避雷针”,已经可以直接推荐出“避雷针是用来保护建筑物、高大树木等避免雷击的装置。”

搜索引擎是如何实现的呢?这背后有一个强大的技术:知识网络。在我们进行搜索的时候,搜索引擎将会主动理解我们的搜索意图,并根据知识网络中的关联关系,给我们推荐出最终所需的答案。

那么,有没有办法让企业内的搜索引擎也可以理解员工的搜索意图,并快速精准地推荐出大家所想所需的结果呢?这就不得不提爱数AnyDATA 的知识搜索技术了。

知识搜索是什么所谓知识搜索,就是基于搜索发展智能化背景下,建立在用户需求基础上的知识整合传播。它可以通过意图理解与知识关联等功能,帮助用户快速找到所需知识,解决当前企业全文检索的搜索引擎“搜不到、搜不准”两大难题。

知识搜索通过知识关联,可以扩充搜索结果,让用户不再“遍搜无物”;通过实体识别,可以理解搜索意图,确保用户“搜有所获”。

举个例子,当你想在企业内部搜索高教行业项目的案例,但是直接搜索“高教行业”,可能因为项目文档中并没有包含“高校行业”这一关键词,而检索不到内容。这种情况下,只能逐一回忆案例细节,进行多次尝试,费时费力。

通过 AnyDATA 知识搜索,仅需搜索一次“高教行业”,就能精准推荐出高教行业项目的案例文档。

知识搜索如何理解用户搜索意图知识搜索之所以能快速精准地推荐出我们想要的结果,得益于它的用户意图理解,那么,AnyDATA 是如何在搜索前、搜索中和搜索后准确理解用户搜索意图的呢?搜索前,先你所想1、实体识别:发现搜索关键词中的实体。比如,当你搜索“财政”时,它可能是一个行业,也可能是一门学科。通过实体识别,发现关键词中的实体(在AnyDATA知识网络中有“行业”这一类别,其中包含了“财政”),将会提示你进行选择,从而让搜索结果更专注于某一类领域。

2、实体补全:输入关键词,提示包含该关键词的实体。比如,当你在搜索框中只输入“财”时,将会根据关键词匹配,提示以“财”开头的实体“财政 行业”(包含实体名称、实体所属类别),直接点击提示的关键词进行检索,省时省事。

3、关联实体:输入关键词,根据实体的关联关系,提示相关联的实体。如输入关键词“财政”后,识别其中包含实体“财政”,根据知识网络的关联关系,“财政”行业关联了许多客户,如“XXX财政局”,因此可以在提示框中显示“XXX财政局”,并显示其所属的类别为客户。

4、共现实体:输入关键词,提示搜索时与该关键词共现的实体。比如,当大家经常将“世贸”与“文档云”一起进行搜索时,输入关键词“世贸”,将会自动提示“文档云”,并提示“文档云”所属类别为一个标签(即label,AnyDATA知识网络中内置文档知识模型,label为其中一个点类别)。

搜索中,想你所想1、通过实体链接实现精准目标搜索:如输入关键词“包含灾备的文件夹”,AnyDATA 通过意图理解,发现“包含”是一个限制条件,“灾备”是一个标签,“文件夹”是文档知识模型中的“folder”(folder为AnyDATA知识网络内置的文档知识模型中一个点类别,表示文件夹),从而实现精准推荐。

2、通过属性识别实现范围搜索:如输入关键词“什么是避雷针”,通过意图理解,发现“什么是”是文档知识模型中的desc(desc为AnyDATA知识网络内置的文档知识模型中一个点类别,表示实体概念描述),“避雷针”是一个label,最终将“避雷针”这一实体的desc属性值推荐给用户。

搜索后,如你所愿搜索完成后,AnyDATA将会根据搜索结果评分进行排序,进一步提升搜索体验。影响搜索结果排序的因素包括:

1、关联实体在知识网络中的权重:权重的来源分为两方面,一方面是关联实体在文档中存在的位置,如文档标题的权重会高于文档内容的权重;另一方面是关联实体在文档中出现的次数,出现的次数越多,相关联性也就越大,权重也会有所增加。

2、搜索关键词与关联实体的关联程度:当前可显示一度关联和二度关联的搜索结果,且一度关联的权重高于二度关联的权重。

一度关联就是直接命中的实体,比如搜索关键词为“意图理解”,而关联的实体也为“意图理解”;

二度关联则是搜索关键词为“意图理解”,而“意图理解”在知识网络中关联了“知识搜索”,最终显示与“知识搜索”、“意图理解”相关联的所有文档。

3、搜索关键词关联的实体数量:关联的实体数量愈多,则权重愈高。比如,一篇文档关联了一个实体,另一篇文档关联了三个实体,前一篇文档的评分就会高于后一篇文档。

除此之外,AnyDATA还将提供基于子图(知识网络中与搜索结果相关的部分图谱)的搜索结果解释,让用户不仅能获得结果,还能理解结果被推荐出来的原因,知其然更知其所以然。总而言之,AnyDATA 知识搜索基于知识网络,通过对用户搜索意图的理解,可以实现搜索前、搜索中、搜索后的全环节智能化。

在搜索前为用户推荐相关搜索关键词;搜索中理解用户想要检索的内容;搜索后为用户精准推荐搜索结果。

本文发布于:2022-09-08 04:45:49,感谢您对本站的认可!

本文链接:https://www.bsyshop.com/ask/xinxi/82/269147.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:一文   读懂   逻辑   知识
相关文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 站长QQ:55-9-10-26