基于GCC-NMF的语音分离研究
来源期刊:江西理工大学学报2020年第5期
论文作者:吴君钦 王迎福
文章页码:65 - 72
关键词:盲源分离;非负矩阵分解;听觉场景分析;广义互相关;字典学习;
摘 要:为了使盲源分离算法能更好地应用于一些实际噪声和训练数据较少且不需要做标记的环境,文章提出了一种无监督的非负矩阵字典学习方法。该方法对混合信号进行字典学习,随后在每个时间点上根据其空间源对字典原子进行分组来实现分离。通过从SiSEC获取语音和现实噪声的两通道混合信号作为数据集,使用PEASS和BSS Eval工具包分别基于感知、基于SNR和PEMO-Q的度量来量化性能。此外,还评估模型了参数对分离质量的影响,并将该方法与其他无监督和半监督的语音分离方法进行比较。结果证明,GCC-NMF是一种灵活的源分离算法,在3种评估参数中的每个参数均胜过特定任务的方法,包括盲源以及需要先验知识或信息的多种已知方法。
吴君钦,王迎福
江西理工大学信息工程学院
摘 要:为了使盲源分离算法能更好地应用于一些实际噪声和训练数据较少且不需要做标记的环境,文章提出了一种无监督的非负矩阵字典学习方法。该方法对混合信号进行字典学习,随后在每个时间点上根据其空间源对字典原子进行分组来实现分离。通过从SiSEC获取语音和现实噪声的两通道混合信号作为数据集,使用PEASS和BSS Eval工具包分别基于感知、基于SNR和PEMO-Q的度量来量化性能。此外,还评估模型了参数对分离质量的影响,并将该方法与其他无监督和半监督的语音分离方法进行比较。结果证明,GCC-NMF是一种灵活的源分离算法,在3种评估参数中的每个参数均胜过特定任务的方法,包括盲源以及需要先验知识或信息的多种已知方法。
关键词:盲源分离;非负矩阵分解;听觉场景分析;广义互相关;字典学习;