百度打造国内首个可交互超写实明星数字人,背后技术有多高深?-600学习网
600学习网终身会员188,所有资源无秘无压缩-购买会员
近日,百度APP正式推出了基于明星龚骏的数字人声搜索助手。据报道,这是中国第一个能够在APP上实现用户交互的超现实数字人。进入此功能界面后,用户可以与”宫军”实时交互,如询问天气等问题。”龚军”将快速识别和搜索,并语音广播第一个搜索结果。此外,用户还可以命令”宫军”完成APP中的一些控制功能,如打开夜间模式.进入书架页面等。
据媒体报道,百度使用4D扫描技术捕捉龚骏在数字人物模型上的讲话和日常表达中的细微变化,从而实现对自己的超现实恢复。在语音识别方面,百度为其提供了超高精度语音识别技术,准确率为98%。它还可以准确识别各种语音,如中英文混合.罕见字符.方言等。此外,在语音合成方面,依靠TTS(文本到语音)技术,这个数字人可以无限接近原始声音。
从专利角度来看,根据Smart Bud的数据,百度及其附属公司在全球126个国家/地区拥有1700多项与”语音识别”相关的专利申请。其中,有效专利840多项,授权发明专利730多项。根据以上所有专利的分析,百度在语音识别技术领域的专利布局主要集中在
语音交互.语音信息.人工智能.语音信号.语音合成.语音控制等相关技术领域。
目前,虚拟偶像市场十分火爆,许多企业和机构都发布了自己的虚拟偶像,如DOTA2官方虚拟偶像渡渡鸟.清华大学虚拟学生华志兵.湖南卫视虚拟主持人肖扬和之前在动漫圈中遭遇火灾的罗天一。
根据量子比特发布的《虚拟数字人深度产业报告》,虚拟数字人的应用可分为服务虚拟人和身份虚拟人。取代直播服务中的虚拟锚和虚拟IP中的虚拟偶像是当前市场的热点。该报告预测,到2030年,中国虚拟数字人的总体市场规模将达到2700亿。基于身份的虚拟数字人约为1750亿。面向服务的虚拟数字人总规模超过950亿。目前,该市场仍处于培育的早期阶段。
(注:Smart Bud全球专利数据库中包含的数据包括在126个国家/地区发布的专利。一般来说,专利可以从申请到发布进行查询,这需要4到18个月)
600学习网 » 百度打造国内首个可交互超写实明星数字人,背后技术有多高深?-600学习网