欢迎访问广东工业大学数据挖掘与信息检索实验室!

一种基于强化学习网络的目标引导型个性化对话方法与系统

作者:DMIR    发表时间:2018-01-05    浏览量:39


发明人:叶志豪;蔡瑞初;廖朝辉

申请时间:2018年1月5日

专利申请号:201610192686.8

申请状态:实质审查


说明:本发明公开了一种基于强化学习网络的目标引导型个性化对话方法与系统,包括用于协调控制整个对话过程的控制器、对话训练以及对话识别;其中,所述控制器用于控制整个对话流程;所述对话训练用于训练迭代优化强化学习网络;所述对话识别利用强化学习网络识别输出相对应的对话策略动作。本发明利用强化学习网络形成策略梯度神经网络系统,在对话训练过程中根据模拟用户建立个性属性模型并迭代优化强化学习网络,在对话识别中获取对话信息以及用户个性化属性后输入到强化学习网络,然后强化学习网络能够结合用户的个性化属性搭建统一输出模型,解决了传统方法模型不能有效的对个性化进行建模的缺陷,提高了该对话系统的智能化效率。