简介概要

一种利用知识迁移的卷积神经网络训练策略

来源期刊：控制与决策2019年第3期

论文作者：罗可周安众罗潇

文章页码：511 - 518

关键词：卷积神经网络;知识迁移;过拟合;梯度弥散;预训练;微调;

摘要：针对深层卷积神经网络在有限标记样本下训练时存在的过拟合和梯度弥散问题,提出一种从源模型中迁移知识训练一个深层目标模型的策略.迁移的知识包括样本的类别分布和源模型的低层特征,类别分布提供了样本的类间相关信息,扩展了训练集的监督信息,可以缓解样本不足的问题;低层特征包含样本的局部特征,在相关任务的迁移过程中具有一般性,可以使目标模型跳出局部最小值区域.利用这两部分知识对目标模型进行预训练,能够使模型收敛到较好的位置,之后再用真实标记样本进行微调.实验结果表明,所提方法能够增强模型的抗过拟合能力,并提升预测精度.

详情信息展示

一种利用知识迁移的卷积神经网络训练策略

罗可，周安众，罗潇

长沙理工大学计算机与通信工程学院

摘要：针对深层卷积神经网络在有限标记样本下训练时存在的过拟合和梯度弥散问题,提出一种从源模型中迁移知识训练一个深层目标模型的策略.迁移的知识包括样本的类别分布和源模型的低层特征,类别分布提供了样本的类间相关信息,扩展了训练集的监督信息,可以缓解样本不足的问题;低层特征包含样本的局部特征,在相关任务的迁移过程中具有一般性,可以使目标模型跳出局部最小值区域.利用这两部分知识对目标模型进行预训练,能够使模型收敛到较好的位置,之后再用真实标记样本进行微调.实验结果表明,所提方法能够增强模型的抗过拟合能力,并提升预测精度.

关键词：卷积神经网络;知识迁移;过拟合;梯度弥散;预训练;微调;

<上一页 1 下一页 >

相关论文

基于卷积神经网络的图像识别过拟合问题分析与研究

基于深度卷积神经网络的宫颈细胞涂片的病变细胞分类

基于卷积神经网络的大地电磁反演

基于深度时空域卷积神经网络的表情识别模型

一种基于改进的卷积神经网络的人脸表情识别方法

基于反卷积特征提取的深度卷积神经网络学习

基于卷积神经网络的水墨画合成方法

基于改进卷积神经网络的车牌识别方法

一种基于卷积神经网络的矿井视频图像降噪方法

用于卷积神经网络图像预处理的目标中心化算法

相关知识点

空间定量预测分析方法中机器学习的卷积神经网络

RBF神经网络的第一阶段学习

神经网络的基本模型

RBF神经网络的泛化能力

分类器选择的原则

神经网络法

断裂构造环境评价的人工神经网络方法

采矿系统工程中使用的神经网络

基于信息准则的RBF神经网络电阻率成像反演

基于最小二乘反演结果的神经网络反演

有色金属在线官网 | 会议 | 在线投稿 | 购买纸书 | 科技图书馆

中南大学出版社技术支持版权声明电话：0731-88830515 88830516 传真：0731-88710482 Email:administrator@cnnmol.com

互联网出版许可证：（署）网出证（京）字第342号京ICP备17050991号-6 京公网安备11010802042557号