现代电子技术

2019, (10) 27-30

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

不同维度下维吾尔语N-gram语言模型性能分析

毛丽旦·尼加提;古丽尼尕尔·买合木提;艾斯卡尔·艾木都拉;

摘要(Abstract):

针对当前维吾尔语语言模型存在的语料库数据稀疏问题以及困惑度较高等问题,在SRILM和MITLM两种工具生成的2-gram,3-gram,…,9-gram语言模型做了对比实验,试图找出在一定规模的维吾尔语语料条件下使困惑度最低的N-gram语言模型。通过对比分析最终得出结论,对于基于维吾尔语句子的N-gram模型,维度N取在介于3~5之间较宜,困惑度和计算复杂度等因素考虑N=3为较优。这一结论将有助于维吾尔语自然语言处理的发展。

关键词(KeyWords): N-gram语言模型;性能分析;SRILM;MITLM;困惑度;平滑算法;机器翻译

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金项目:面向汉维机器翻译性能优化的关键技术研究(61562081)

作者(Author): 毛丽旦·尼加提;古丽尼尕尔·买合木提;艾斯卡尔·艾木都拉;

Email:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享