文本生成领域的深度强化学习研究进展
来源期刊:工程科学学报2020年第4期
论文作者:徐聪 李擎 张德政 陈鹏 崔家瑞
文章页码:399 - 411
关键词:深度强化学习;自然语言处理;文本生成;对话系统;机器翻译;图像描述;
摘 要:谷歌的人工智能系统(AlphaGo)在围棋领域取得了一系列成功,使得深度强化学习得到越来越多的关注.深度强化学习融合了深度学习对复杂环境的感知能力和强化学习对复杂情景的决策能力.而自然语言处理过程中有着数量巨大的词汇或者语句需要表征,并且在对话系统、机器翻译和图像描述等文本生成任务中存在大量难以建模的决策问题.这使得深度强化学习在自然语言处理的文本生成任务中能够发挥重要的作用,帮助改进现有的模型结构或者训练机制,并且已经取得了很多显著的成果.为此,本文系统阐述深度强化学习应用在不同的文本生成任务中的一些主要方法,梳理其发展的轨迹,分析算法特点.最后,展望深度强化学习与自然语言处理任务融合的前景和挑战.
徐聪1,2,李擎1,张德政2,3,陈鹏1,崔家瑞1
1. 北京科技大学自动化学院2. 材料领域知识工程北京市重点实验室3. 北京科技大学计算机与通信工程学院
摘 要:谷歌的人工智能系统(AlphaGo)在围棋领域取得了一系列成功,使得深度强化学习得到越来越多的关注.深度强化学习融合了深度学习对复杂环境的感知能力和强化学习对复杂情景的决策能力.而自然语言处理过程中有着数量巨大的词汇或者语句需要表征,并且在对话系统、机器翻译和图像描述等文本生成任务中存在大量难以建模的决策问题.这使得深度强化学习在自然语言处理的文本生成任务中能够发挥重要的作用,帮助改进现有的模型结构或者训练机制,并且已经取得了很多显著的成果.为此,本文系统阐述深度强化学习应用在不同的文本生成任务中的一些主要方法,梳理其发展的轨迹,分析算法特点.最后,展望深度强化学习与自然语言处理任务融合的前景和挑战.
关键词:深度强化学习;自然语言处理;文本生成;对话系统;机器翻译;图像描述;