当听障人士实现手语自由:手语AI平台的产业狂想-600学习网
600学习网终身会员188,所有资源无秘无压缩-购买会员
展望未来,展望未来,春天的步伐即将到来,舒隆隆终于正式上任,迎来了他的主场-2022年北京冬季残奥会。
本届冬奥会不仅是运动员的竞技舞台,也是科技公司”展示实力”的绝佳舞台。在众多科学和技术亮点中,你可能已经注意到Bing Dwen Dwen和Sheey Rhon Rhon有一个共同的”同事”-手语数字人。
在2月4日晚开幕的冬奥会上,中央电视台新闻人工智能手语主持人正式上任,陪同听力受损者观看精彩比赛。在即将到来的冬季残奥会上,这位手语数字人也有义务穿上他的斗篷,让听力受损的人实时感受冰雪运动的魅力。
创造丰富的冬奥会遗产将给国家.主办城市和人民带来长期和积极的利益。这也是成功举办奥运会的重要标志之一。在日常生活中,手语数字人能否继续发光并为聋人提供服务?
我们注意到,3月3日,央视新闻人工智能手语主播百度人工智能云道(Baidu AI Cloud Daw)发布了”人工智能手语言平台”,该平台通过生成分钟级手语合成视频和手语主演实时直播的能力,为手语服务的普及提供了新的解决方案。
与此同时,百度AI云西陵还发布了”AI手语平台一体机”,允许一些需要硬件交互的场景,如医院.银行.车站等公共场所,接入提供手语服务,并快速部署无障碍窗口。
平台和软硬件合作的创新使手语数字人走上了一条与社会价值观长期相连并共同成长的进化道路。
科技巨头正在积极打造手语数字人,反映潮流的方向?数字生活和智能技术的温暖正在加速成为现实,这意味着什么?
数字生活何时觉醒:手语数字人的能力体系
百度AI云西陵平台给手语数字人提供了哪些特殊能力?我们不妨看看人类手语教师的标准。
有一种”困难”。朱光泉,一位手语老师,想实时准确地翻译朱光泉的俏皮话。有时,数千名被选中的CCTV手语教师也很着急。在之前与朱光泉的在线pk中,由”百度人工智能云西陵”创建的第一个人工智能手语锚能够立即响应朱光泉持续的超快速叮当声,显示出流畅准确的业务能力。
综上所述,冬奥会手语主持人的出涩技能和扎实的服务来自百度AI云西陵平台提供的三项基本能力:
1.理解能力。
在现实世界中,很容易受到噪声的干扰。人类手语教师必须清楚地听到和理解新闻内容,否则翻译它可能是错误的。它像老虎一样凶猛,但无法投入使用。
如果你想听清楚,你需要领先的语音识别能力。百度AI云西陵平台集成了百度自然语言处理技术,成熟且领先的全双工ASR(自动语音识别)语音识别模型,近场普通话识别准确率可达98%以上。
处理各种语音内容很容易,即使小丑朱光泉能以神速说话,这为随后的数字人手语翻译奠定了坚实的基础,使人工智能手语平台一体机更好地用于不同场景。
2.翻译能力。
除了感知之外,手语教师还应分析和总结重要信息,根据句子的整体含义提炼和调整词序,并将其转换为手语。
由一些制造商开发的手语数字人直接使用”中文材料用于标志”,这具有无需重新标记.节省时间的优点。问题是,他们根据说话顺序以一种僵硬的方式连接手语手势,这不是”高质量的人类手语”。
例如,”我想回家”不是
3月3日,百度AI云西陵发布了AI手语平台和”AI手语言平台一体机”,这可能会给手语数字人带来产业起飞的翅膀。
你为什么这么说?虽然手语数字人很好,但技术产业化的难度不可低估。至少前面有几座山:
第一座山是效率之谜。
对于新兴的手语数字人类领域,生产难度大,周期长,技术门槛高,服务群体相对较小。许多行业和企业都会担心,在引入之前,他们是否需要大量的人力和财力成本,是否会无效和无用。考虑过之后,他们会等着看。为了让全社会的聋人享受到技术红利,仍然需要尊重产业法,降低应用新技术的门槛,真正让手语数字人的生产”降低成本,提高效率”。
百度AI云Xiling的手语数字人类平台出现在正确的时间。”AI手语平台”有四个功能:”视频手语合成”.”直播手语合成).”文本手语”和”语音手语”。它可以实现多种效果,例如将普通视频合成到手语视频中,在实时直播中添加手语图片,将文本添加到手语中,以及将实时语音添加到手语言中。AI手语平台可以搭载在各种APP.网站和applet中,让听障人士轻松实现在线社交.娱乐.休闲.课程学习等需求。
与此同时,百度AI云西陵还建立了三个平台,使手语数字人能够快速.标准化和高效地生产和交付。例如,在人员编制管理平台上,根据不同的场景设置不同的人员编制设置。例如,银行引入的手语数字人可以是专业而严谨的,而景区使用的手语数码人则友好而活泼,满足了数千个行业的需求。
平台化.标准化和系统化的能力使得人工智能驱动的2D数字人的生产周期只需几个小时,3D虚拟偶像可以在一两周内开发出来,轻松飞越效率之山。
第二座山是经验的困难。
你可能已经注意到,在百度AI云西陵发布”AI手语平台一体机”之前,几乎所有手语数字人都以软件的形式存在。真的有必要建立一个手语数字人类硬件吗?
从根本上讲,我们知道的所有生命形式都有生物”硬件”的载体。一些技术人员认为,处于”生命3.0″阶段的数字生活不仅应该具有设计自己软件的进化能力,而且还应该设计自己的硬件。
许多银行和医院正在引入仿人智能机器人,以增加用户的体验。具体而言,作为未来社交网络.电子商务.直播.客户服务.导游等领域的服务载体,企业仅通过软件与听力受损用户互动显然不方便。
然而,人形手语机器人的开发涉及相当长和复杂的产业链,这很容易让企业望而却步。
百度AI云西陵此次发布的全线下一体机V3和端云一体机P3均具备”AI手语平台”的核心功能。人工智能手语数字人可以像手机和电脑一样快速大规模生产,并在离线生活的各个角落为聋人服务。
其中,本地全离线一体机仍然可以在一些网络条件较差的地区,如偏远村庄.风景名胜区等地进行手语翻译.肖像绘制等操作,并提供文本到手语.语音到手语等服务。
端云与一体机的结合,还可以通过云计算+本地渲染灵活实现手语服务。
第三座山是进化的困难。
衡量数字生活的标准之一是学习.适应和
600学习网 » 当听障人士实现手语自由:手语AI平台的产业狂想-600学习网