简介概要

基于统计的汉英法律文献亚句子级对齐

来源期刊:东北大学学报(自然科学版)2003年第1期

论文作者:吕学强 李清隐 任飞亮 姚天顺

文章页码:23 - 26

关键词:双语语料库;汉英法律文献;亚句子级对齐;统计方法;评价函数;参数计算;标准正态分布;

摘    要:基于统计的句子对齐是根据双语句子的长度在所有可能的对齐中找出概率最大的一个·提出两种对齐汉英语料的参数计算方法,使对齐模型中的评价函数满足标准正态分布·参数s2的值是对训练语料中的所有点(l1,(l2-cl1)2)进行线性回归分析所得直线的斜率,s2的另一种求法是直接计算方差·实验结果表明汉英法律文献亚句子级对齐的正确率为98 8%,召回率为99 2%·

详情信息展示

基于统计的汉英法律文献亚句子级对齐

吕学强,李清隐,任飞亮,姚天顺

摘 要:基于统计的句子对齐是根据双语句子的长度在所有可能的对齐中找出概率最大的一个·提出两种对齐汉英语料的参数计算方法,使对齐模型中的评价函数满足标准正态分布·参数s2的值是对训练语料中的所有点(l1,(l2-cl1)2)进行线性回归分析所得直线的斜率,s2的另一种求法是直接计算方差·实验结果表明汉英法律文献亚句子级对齐的正确率为98 8%,召回率为99 2%·

关键词:双语语料库;汉英法律文献;亚句子级对齐;统计方法;评价函数;参数计算;标准正态分布;

<上一页 1 下一页 >

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号