更改

微软小冰主要框架和流程及相关技术

删除10字节, 2020年12月30日 (三) 22:58

无编辑摘要

{{5}}主要是看了知乎上面一位作者写的解析，然后自己在看的过程中顺带记录一下，流程差不多，自己写的话复习比较直观快速

[[文件:小冰框架和流程01.~~jpeg~~jpg]]

2、DM（对话管理模块）层：

[[文件:小冰框架和流程02.~~jpeg~~jpg]]

这一模块分为：状态追踪（对句子进行处理CQU+UU+SU）+对话策略（确定使用后续哪个功能）

通用闲聊：图示就是说的检索+排序

[[文件:小冰框架和流程03.~~jpeg~~jpg]]

检索主要是产生response候选集，这些候选集再由排序模块进行排序。方法有三种：Paired-Data based Retriever(PDR)+Neural Response Generator(NRG)+Unpaired-Data based Retriever(UDR)

然后把v注入到解码器的每个时间点。

[[文件:小冰框架和流程04.~~jpeg~~jpg]]

NRG使用beam search产生20个response。覆盖面广，效果差，生成文本一般比较短。

对于每个话题，从KG中检索出20个最相关的话题。最相关是利用boosted tree模型排序得到，模型的训练数据是人为标注。

query中的所有topic和上一步检索的topic一起作为检索输入，从收集的unpaired的数据集中检索出400个最相关的句子作为候选response。

UDR的候选质量没有PDR好，但覆盖面更广。UDR的结果比NRG生成的结果包含更多文字。

排序：PDR\UDR\NRG生成所有的候选response，利用boosted tree模型统一排序，最终的response基本是最高的那一批结果。=局部凝聚力（DSSM）+全局凝聚力（DSSM）+同理心匹配（计算期望eR之间的匹配度）+检索匹配（BM25、TF-idf、DSSM）

任务完成：

[[文件:小冰框架和流程05.~~jpeg~~jpg]]

16,819

个编辑