(12)发明专利申请
(10)申请公布号 CN 112818102 A(43)申请公布日 2021.05.18
(21)申请号 202110137707.7(22)申请日 2021.02.01
(71)申请人 杭州微洱网络科技有限公司
地址 311121 浙江省杭州市余杭区仓前街
道文一西路1382号601-5(72)发明人 詹威
(74)专利代理机构 杭州裕阳联合专利代理有限
公司 33289
代理人 张解翠(51)Int.Cl.
G06F 16/332(2019.01)G06F 16/33(2019.01)G06F 40/211(2020.01)G06F 40/35(2020.01)
权利要求书1页 说明书3页 附图1页
(54)发明名称
基于上下文的FAQ知识库的快速问答方法(57)摘要
本发明公开了一种基于上下文的FAQ知识库的快速问答方法,该方法包含以下步骤:接收用户输入的问题;对问题进行信息补全;根据补全后的问题从FAQ数据库中进行检索得到若干匹配答案;对若干匹配答案进行排序得到最佳答案;将最佳答案作为最终答案发送至用户。本发明的基于上下文的FAQ知识库的快速问答方法,具有上下文自动识别能力,能够对用户的提问进行自动补充,能够更好的识别用户的意图,从而更加准确的回答用户提出的问题。
CN 112818102 ACN 112818102 A
权 利 要 求 书
1/1页
1.一种基于上下文的FAQ知识库的快速问答方法,其特征在于,包含以下步骤:接收用户输入的问题;对所述问题进行信息补全;
根据补全后的所述问题从FAQ数据库中进行检索得到若干匹配答案;对若干所述匹配答案进行排序得到最佳答案;将所述最佳答案作为最终答案发送至用户。
2.根据权利要求1所述的基于上下文的FA知识库的快速问答方法,其特征在于,对所述问题进行信息补全的具体方法为:获取与该用户之前沟通的历史记录,所述历史记录包含该用户之前提出的所有问题以及对这些问题的回复;
根据所述历史记录对所述问题进行信息补全。
3.根据权利要求2所述的基于上下文的FAQ知识库的快速问答方法,其特征在于,对该用户分配一个用户ID,根据所述用户ID识别该用户的所述历史记录。4.根据权利要求2所述的基于上下文的FQ知识库的快速问答方法,其特征在于,通过缓存对该用户的历史记录进行保存;
当需要对所述问题进行信息补全时从所述缓存中调取所述历史记录。5.根据权利要求4所述的基于上下文的AQ知识库的快速问答方法,其特征在于,所述缓存为Redis缓存。
6.根据权利要求4所述的基于上下文的FQ知识库的快速问答方法,其特征在于,所述根据所述历史记录对所述问题进行信息补全的具体方法为:对所述问题和所述历史记录进行语义分析;
根据语义分析结果自动从所述历史记录中获取补充信息对所述问题进行信息补全。7.根据权利要求6所述的基于上下文的FA知识库的快速问答方法,其特征在于,所述语义分析包含句法分析、句子成分分析和指代消解。
8.根据权利要求1所述的基于上下文的FAQ知识库的快速问答方法,其特征在于,在所述将所述最佳答案作为最终答案发送至用户之前,所述基于上下文的FAQ知识库的快速问答方法还包括:
通过意图识别模型识别补全后的所述问题的意图;根据识别出的意图匹配预先设置的话术答案
所述将所述最佳答案作为最终答案发送至用户的具体方法为:
根据预先设置的优先级配置从所述最佳答案和所述话术答案中选择一个作为所述最终答案发送至用户。
9.根据权利要求8所述的基于上下文的AQ知识库的快速问答方法,其特征在于,所述优先级配置为:
当同时得到所述最佳答案和所述话术答案时,将所述话术答案作为所述最终答案发送至用户。
2
CN 112818102 A
说 明 书
基于上下文的FAQ知识库的快速问答方法
1/3页
技术领域
[0001]本发明涉及一种基于上下文的FAQ知识库的快速问答方法。
背景技术
[0002]随着人工智能的发展和普及,智能客服机器人在各个行业的应用也越来越多了。对于所有领域的智能客服机器人来说,常见问答库是不可或缺的。常见问答库即给出了很多的问答对,如何根据真实的人工客服历史聊天记录的问答对,自动构建出基于知识库给出准确、有效答案的客服机器人,是智能客服机器人的研究热点和难点。
[0003]由于现有的FAQ机器人很多都是采用关键字等字面信息检索(如浏览器信息检索、电商商品检索等),或则规则模板式的检索对答案进行排序并返回。此种方式存在很大的语义鸿沟问题,很多时候检索出来的答案并不是用户需要的答案。现有FAQ机器人回复精度差、经常性的答非所问,而且没有上下文能力理解与推理能力,这些都是现有FAQ机器人的缺陷。
发明内容
[0004]本发明提供了一种基于上下文的FAQ知识库的快速问答方法,采用如下的技术方案:
[0005]一种基于上下文的FAQ知识库的快速问答方法,包含以下步骤:[0006]接收用户输入的问题;[0007]对问题进行信息补全;
[0008]根据补全后的问题从FAQ数据库中进行检索得到若干匹配答案;[0009]对若干匹配答案进行排序得到最佳答案;[0010]将最佳答案作为最终答案发送至用户。[0011]进一步地,对问题进行信息补全的具体方法为:[0012]获取与该用户之前沟通的历史记录,历史记录包含该用户之前提出的所有问题以及对这些问题的回复;
[0013]根据历史记录对问题进行信息补全。[0014]进一步地,对该用户分配一个用户ID,根据用户ID识别该用户的历史记录。[0015]进一步地,通过缓存对该用户的历史记录进行保存;[0016]当需要对问题进行信息补全时从缓存中调取历史记录。[0017]进一步地,缓存为Redis缓存。[0018]进一步地,根据历史记录对问题进行信息补全的具体方法为:[0019]对问题和历史记录进行语义分析;
[0020]根据语义分析结果自动从历史记录中获取补充信息对问题进行信息补全。[0021]进一步地,语义分析包含句法分析、句子成分分析和指代消解。[0022]进一步地,在将最佳答案作为最终答案发送至用户之前,基于上下文的FAQ知识库
3
CN 112818102 A
说 明 书
2/3页
的快速问答方法还包括:
[0023]通过意图识别模型识别补全后的问题的意图;[0024]根据识别出的意图匹配预先设置的话术答案;
[0025]将最佳答案作为最终答案发送至用户的具体方法为:
[0026]根据预先设置的优先级配置从最佳答案和话术答案中选择一个作为最终答案发送至用户。
[0027]进一步地,优先级配置为:
[0028]当同时得到最佳答案和话术答案时,将话术答案作为最终答案发送至用户。[0029]本发明的有益之处在于所提供的基于上下文的FAQ知识库的快速问答方法,具有上下文自动识别能力,能够对用户的提问进行自动补充,能够更好的识别用户的意图,从而更加准确的回答用户提出的问题。
附图说明
[0030]图1是本发明的基于上下文的FAQ知识库的快速问答方法的流程图。
具体实施方式
[0031]以下结合附图和具体实施例对本发明作具体的介绍。
[0032]如图1所示为本发明的一种基于上下文的FAQ(Frequently Asked Questions,常见问题解答)知识库的快速问答方法,主要包含以下步骤:S1:接收用户输入的问题。S2:对问题进行信息补全。S3:根据补全后的问题从FAQ数据库中进行检索得到若干匹配答案。S4:对若干匹配答案进行排序得到最佳答案。S5:将最佳答案作为最终答案发送至用户。通过以上步骤,能够对用户的提问进行自动补充,能够更好的识别用户的意图,从而更加准确的回答用户提出的问题。以下具体介绍上述步骤。[0033]对于步骤S1:接收用户输入的问题。[0034]具体的,用户通过智能终端向智能机器人发送问题。[0035]对于步骤S2:对问题进行信息补全。
[0036]对问题进行信息补全的具体方法为:获取与该用户之前沟通的历史记录,历史记录包含该用户之前提出的所有问题以及对这些问题的回复。根据历史记录对问题进行信息补全。
[0037]具体的,每个用户均被分配一个用户ID,根据用户ID识别该用户的历史记录。当用户与智能机器人进行沟通时,通过缓存对用户的历史记录进行保存。当需要对问题进行信息补全时从缓存中调取历史记录。在本发明中,缓存为Redis缓存。[0038]其中,根据历史记录对问题进行信息补全的具体方法为:对问题和历史记录进行语义分析。根据语义分析结果自动从历史记录中获取补充信息对问题进行信息补全。其中,语义分析包含句法分析、句子成分分析和指代消解等。[0039]对于智能机器人的上下文能力评估,需要抽取出大量包含省略句、指代句的对话数据,以对话的形式评测其上下文信息处理与推理能力。以对话数据为单位,统计出智能机器人能够正确处理的上下文的对话数作为精度值,即机器人的上下文处理能力。[0040]对于步骤S3:根据补全后的问题从FAQ数据库中进行检索得到若干匹配答案。
4
CN 112818102 A[0041]
说 明 书
3/3页
具体的,将收集到的所有FAQ数据写信息检索工具库,如ES(Elasticsearch)等,通
过ES字面检索、模糊查询等方式召回若干与问题相关性大的FAQ数据,即若干匹配答案。[0042]对于步骤S4:对若干匹配答案进行排序得到最佳答案。[0043]在步骤S3的基础上,再通过如孪生网络Siamese Network、基于交互矩阵的Match Pyramid等深度语义匹配方式打分,还可以加上词移距离相似度得分、编辑距离得分、关键词得分等各种得分进行结果归并和重排序,最后得到得分最高的最佳答案。[0044]在本发明中,对于检索结果的评价,可以采用平行语料的方式给予评价。平行语料构建方法如下:对于知识库里的每一条知识的问题,构建N条相似问句,从N条相同语义的问句中随机挑选一条作为用户的问题,其他的数据作为FAQ知识库的内容,这样对于每一个问题即可计算出基于信息检索与语义重排序的答案的TOP精度与top N精度值。可以以计算出的TOP精度与top N精度值作为评价标准。[0045]对于步骤S5:将最佳答案作为最终答案发送至用户。[0046]将步骤S4中得到的最佳答案发送至用户。[0047]作为一种可选的实施方式,在将最佳答案作为最终答案发送至用户之前,基于上下文的FAQ知识库的快速问答方法还包括:通过意图识别模型识别补全后的问题的意图。根据识别出的意图匹配预先设置的话术答案。具体而言,将所有的FAQ数据进行特征抽取、语义聚类等抽取出FAQ数据中的头部经常询问的问题,并归纳出一些头部问题对应的意图和对应的代表性数据,以此构造出一个训练集训练意图识别模型。为了提高意图识别模型的效果,增加人工数据清洗、打标工作。对于头部的高频问题,可以通过意图识别的方案在每个意图下配置一个高质量的话术作为答案,以增加用户使用体感。意图识别模型即为一个多分类器,可以采用分类常用的指标准确率、召回率、F1值等指标作为评估标准。[0048]此时,步骤S5的将最佳答案作为最终答案发送至用户的具体方法为:根据预先设置的优先级配置从最佳答案和话术答案中选择一个作为最终答案发送至用户。[0049]作为一种优选的实施方式,优先级配置为:当同时得到最佳答案和话术答案时,将话术答案作为最终答案发送至用户。
[0050]以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该
凡采用等同替换或等效变换的方式所获得的了解,上述实施例不以任何形式限制本发明,
技术方案,均落在本发明的保护范围内。
5
CN 112818102 A
说 明 书 附 图
1/1页
图1
6
因篇幅问题不能全部显示,请点此查看更多更全内容