16,819
个编辑
更改
无编辑摘要
{{5}}主要是看了知乎上面一位作者写的解析,然后自己在看的过程中顺带记录一下,流程差不多,自己写的话复习比较直观快速
[[文件:小冰框架和流程01.jpegjpg]]
2、DM(对话管理模块)层:
[[文件:小冰框架和流程02.jpegjpg]]
这一模块分为:状态追踪(对句子进行处理CQU+UU+SU)+对话策略(确定使用后续哪个功能)
通用闲聊:图示就是说的检索+排序
[[文件:小冰框架和流程03.jpegjpg]]
检索主要是产生response候选集,这些候选集再由排序模块进行排序。方法有三种:Paired-Data based Retriever(PDR)+Neural Response Generator(NRG)+Unpaired-Data based Retriever(UDR)
然后把v注入到解码器的每个时间点。
[[文件:小冰框架和流程04.jpegjpg]]
NRG使用beam search产生20个response。覆盖面广,效果差,生成文本一般比较短。
对于每个话题,从KG中检索出20个最相关的话题。最相关是利用boosted tree模型排序得到,模型的训练数据是人为标注。
query中的所有topic和上一步检索的topic一起作为检索输入,从收集的unpaired的数据集中检索出400个最相关的句子作为候选response。
排序:PDR\UDR\NRG生成所有的候选response,利用boosted tree模型统一排序,最终的response基本是最高的那一批结果。=局部凝聚力(DSSM)+全局凝聚力(DSSM)+同理心匹配(计算期望eR之间的匹配度)+检索匹配(BM25、TF-idf、DSSM)
任务完成:
[[文件:小冰框架和流程05.jpegjpg]]