Meta免费开源AI模型NLLB-200!可精准翻译超过200种语言-600学习网

600学习网终身会员188,所有资源无秘无压缩-购买会员

最近,Meta宣布将免费开源其人工智能系统NLLB-200。该系统是世界上第一个能够翻译200种不同语言的单一人工智能模型,将为超过10亿人提供高质量的翻译内容。

Meta表示,它将向外界开放NLLB-200,并向非营利组织提供20万美元的补贴,以开发该技术并将其应用于更多应用。

德国慕尼黑大学的计算机语言学家亚历山大·弗雷泽认为,这个模型的主要贡献是数据,包括100种新语言。

目前,市场上的许多翻译工具不支持晦涩难懂的语言,也就是说,不到100万人使用的语言。NLLB-200解决了这个问题。

[未省略任何语言]

世界上有几十亿人,但还没有能够翻译数百种语言的高质量翻译工具。他们不能通过自己的语言或母语浏览互联网上的内容,也不能参与在线社区的讨论。特别是在非洲.亚洲和其他地区,数亿人使用不同的语言。

为了突破网络上的语言障碍,促进元世界的发展,元人工智能研究人员在早期成立了NLLB项目,开发人工智能模型,为世界提供高质量的翻译功能。

据报道,NLLB是”无语言掉队”的缩写。人工智能系统可以高质量地翻译世界上多达200种语言,包括55种非洲语言和其他少数民族语言,以及主流语言。

在许多指标中,NLLB-200的翻译质量比其他现有翻译工具高44%。在一些非洲和印度语言中,这一增幅比最新的翻译系统高出70%。

此外,Meta还与维基百科基金会合作,希望NLLB-200能够提供维基百科的翻译服务,改善维基百科翻译系统。通过双方的合作,NLLB-200继续学习其他翻译人员无法翻译的语言,人工智能模型可以学习语言本身的字符系统,以获得更准确的翻译结果。

[多语言翻译系统]

近几年来,人工智能语言翻译系统发展迅速。Meta曾指出,目前绝大多数人工智能翻译系统都属于”双语言模式”,只有一对一的翻译能力,如英汉语.英日语等,但Meta希望开发一个”多语言翻译系统”,突破一对一语音翻译,使得多种语言的用户可以在同一聊天室中立即彼此通信。

去年,元人工智能实验室发布了一个多语言模型,这为人工智能翻译带来了巨大的进步。11月,Meta的多语言模型赢得了2021 WMT国际机器翻译比赛的冠军。

Meta的模型开发策略分为三部分:大规模数据挖掘.模型扩展和计算资源的有效利用。

1.大规模数据挖掘:为了培养多语言模型,Meta研发团队采用了两种方法:从任何语言到英语,从英语到任何语言。Meta应用并行数据挖掘技术收集爬虫获取的网站翻译材料,降低人工翻译成本。

2.模型扩展:为了提高多语言模型设计的能力,模型规模从150亿个参数增加到520亿个。在此基础上,该公司最新的GPU内存节省解决方案-完全共享数据并行已被用于将大规模培训的速度提高五倍。

3.计算资源的有效使用:为了节省模型的计算成本,Meta采用了一套新的计算方法,允许模型在不同的训练场景中仅使用模型的一部分,而不是整个,从而更有效地使用硬件资源。

Meta的多语言模式的特点是培训资源很少或语言翻译很少。在测试中,多语言模式超过了市场上最好的.经过专门训练的双语模式。Meta认为,这种多语言模式为”通用语音翻译系统”奠定了基础。

Meta的愿景是,该系统可以被全球公众广泛使用,但它也将成为Meta的VR/AR和其他可穿戴设备的sha手级应用。

可以想象,一旦”通用语音翻译系统”在元世界中实现,来自不同语言的用户就可以在元世界的不同语言环境中进行语音翻译

免责声明: 1、本站信息来自网络,版权争议与本站无关 2、本站所有主题由该帖子作者发表,该帖子作者与本站享有帖子相关版权 3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和本站的同意 4、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责 5、用户所发布的一切软件的解密分析文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。 6、您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。 7、请支持正版软件、得到更好的正版服务。 8、如有侵权请立即告知本站,本站将及时予与删除 9、本站所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章和视频仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。
600学习网 » Meta免费开源AI模型NLLB-200!可精准翻译超过200种语言-600学习网