首页 > 科技 > 业界动态 > 正文

字节跳动火山翻译上新 38 个稀有语种,翻译能力再升级

卡饭网 Echo 2021-12-31 11:38:03

12月31日消息:2021年12月,字节跳动旗下的火山翻译官方网站增加了38种罕见语言的新翻译,包括世界语、塔希提语和鞑靼语。目前,火山翻译具备94种语言和8742种语言,包括汉语英语、阿拉伯语、俄语、法语、西班牙语,整体bleu (机器翻译质量自动评价指标) 达到33.45,处于行业领先水平。

字节跳动火山翻译上新 38 个稀有语种,翻译能力再升级

据了解,通过自行开发的mRASP多语言模型,火山翻译仅使用一个模型就完成了上述38种语言与英语之间的双向翻译,它突破了传统的双语翻译模式,分别训练每种语言,分别推出服务,大大降低了机器学习的培训和服务成本。

“一般来说,训练76个语言双语模型需要150-200天。在相同的硬件条件下,训练多语言模型只需30天。”火山翻译团队介绍,“对于小请求的语言,使用mRASP模型集中式服务可以大大节省计算资源,只有一半的用于深度学习培训的Tesla T4显卡能够满足38种语言的所有翻译要求,与双语翻译所需的资源相同。“

目前,火山翻译有三大产品:火山同传、机器翻译和视频翻译,支持飞书、今日头条、西瓜视频等业务的翻译需求,并通过字节跳动旗下的企业级技术服务平台火山引擎对外提供翻译服务。