Meta已开发闽南语AI翻译,解决非文字语言翻译难题-600学习网
600学习网终身会员188,所有资源无秘无压缩-购买会员
最近,Meta宣布推出一个口语翻译系统。Meta首席执行官扎克伯格(Zuckerberg)在Facebook上发布了一部演示影片,他第一次通过翻译系统与员工在线交谈。
在演示影片中,扎克·伯克会说英语,来自台湾的Meta工程师会说闽南语。通过这个口语翻译系统,两个人可以无障碍地交流,而且翻译非常真实。
Meta表示,将闽南语翻译成英语的系统是第一个人工智能驱动的”为非文本语言开发的语音翻译系统”。
在全球范围内,有许多语言像闽南语一样被使用,但没有标准化的书写方法。人工智能翻译系统需要依赖大量的标记示例,例如语音标签或字符,将信息”馈送”给机器进行学习。
Meta的研究团队表示:”我们使用普通话作为中间语言来建立伪标签。首先,我们将英语(或闽南语)语音翻译成普通话文本,然后将其翻译成闽南语(或英语),并将其添加到培训数据中。”
目前,该系统允许讲闽南语的人与讲英语的人交谈,尽管它非常僵硬。该模型一次只能翻译一个完整的句子,但扎克伯格相信,这项技术最终可以应用于更多的语言,并将得到改进,以提供实时翻译。
Meta宣布将开放一个大型语料库,以便研究人员能够建立更多”非书面语言”的翻译系统。业内人士认为,良好的翻译工具对于元世界的发展是不可或缺的。
【开源人工智能模型,200多种语言的准确翻译】
今年7月,Meta宣布将免费开源其人工智能系统NLLB-200。该系统是世界上第一个能够翻译200种不同语言的单一人工智能模型,将为超过10亿人提供高质量的翻译内容。
Meta表示,它将向外界开放NLLB-200,并向非营利组织提供20万美元的补贴,以开发该技术并将其应用于更多应用。
德国慕尼黑大学的计算机语言学家亚历山大·弗雷泽认为,这个模型的主要贡献是数据,包括100种新语言。
目前,市场上的许多翻译工具不支持晦涩难懂的语言,也就是说,不到100万人使用的语言。NLLB-200解决了这个问题。
[“不要省略任何语言”]
世界上有几十亿人,但还没有能够翻译数百种语言的高质量翻译工具。他们不能通过自己的语言或母语浏览互联网上的内容,也不能参与在线社区的讨论。特别是在非洲.亚洲和其他地区,数亿人使用不同的语言。
为了突破网络上的语言障碍,促进元世界的发展,元人工智能研究人员在早期成立了NLLB项目,开发人工智能模型,为世界提供高质量的翻译功能。
据报道,NLLB是”无语言掉队”的缩写。人工智能系统可以高质量地翻译世界上多达200种语言,包括55种非洲语言和其他少数民族语言,以及主流语言。
在许多指标中,NLLB-200的翻译质量比其他现有翻译工具高44%。在一些非洲和印度语言中,这一增幅比最新的翻译系统高出70%。
此外,Meta还与维基百科基金会合作,希望NLLB-200能够提供维基百科的翻译服务,改善维基百科翻译系统。通过双方的合作,NLLB-200继续学习其他翻译人员无法翻译的语言,人工智能模型可以学习语言本身的文本系统,以获得更准确的翻译结果。
可以想象,一旦”通用语音翻译系统”在元宇宙中实现,世界各地不同语言的用户就可以在元宇宙的虚拟空间中交流.举行会议和玩游戏,这将比现实中更加方便,并将进一步实现元宇宙的发展目标。
600学习网 » Meta已开发闽南语AI翻译,解决非文字语言翻译难题-600学习网