小冰公司技术副总裁周力:AI对谈为元宇宙开启全新未来-600学习网

600学习网终身会员188,所有资源无秘无压缩-购买会员

在51CTO主办的MetaCon MetaUniverse技术大会上,小兵公司技术副总裁周力发表了主题演讲”AI和AI对话技术的探索与应用”,分析了AI对话的意义.AI对话系统的技术设计以及AI对话在沉浸式虚拟社交场景中的应用,为公众呈现新的视角。

嘉宾:周丽

主办单位:千山

人机对话已经渗透到我们的日常生活中,AI语音助手.聊天机器人等应用也很常见。人工智能和人工智能之间的对话也很有价值吗?近日,在51CTO主办的MetaCon MetaUniverse技术大会上,小兵公司技术副总裁周力发表了题为”AI与AI对话技术的探索与应用”的主题演讲,分析了AI对话的意义.AI对话系统的技术设计.AI会话的应用.,以及人工智能会话在沉浸式虚拟社交场景中的应用,为公众提供了一个新的视角。

现在,演讲内容总结如下,希望能给大家带来启发。

为什么我们仍然需要人工智能和人工智能之间的对话

人与人之间的对话至少有10万年的历史,人与机器之间的对话,即使是从一开始就非常谦逊的聊天机器人伊丽莎开始,最多也只有55年。在过去的十年中,真正的人机对话有了很大的发展。

然而,无论在学术界还是工业界,几乎没有关于如何在人工智能和人工智能之间进行对话的研究。最好的方法是将两个聊天机器人放在一起进行质量评估,并观察哪个机器人的聊天质量更好。人工智能和人工智能之间对话的价值是什么?除了作为评估工具,还有其他应用场景吗?这个问题值得仔细分析。

事实上,尽管业界对人与人工智能之间的对话进行了大量研究,并在技术和相关姓方面取得了许多突破,但实际上人和人工智能之间有三个核心问题需要解决。

首先,人工智能真的理解人们在说什么?人工智能能否通过算法理解人的各种表达,包括各种省略意义和各种言外之意。随着超级语言模型的诞生和发展,这个问题似乎越来越少,至少我们可以解决大部分问题。

第二,我们还能谈什么?无论是手机语音助手还是聊天机器人,这都是许多人面对人工智能时的痛点。一开始,他可能会问北京的天气怎么样。机器人回答后,他会问上海的天气如何。然后他问起他曾经认识的城市,也许他和人工智能之间的对话结束了。人与机器之间的对话通常是这样的。人与人之间的对话模式仍然非常不同,因此人们很难像真正的人一样对人工智能敞开心扉。

第三,我不能说话吗?即使在真人对真人的情况下,人们也不一定总是愿意尝试参与对话。有时我可能只愿意做一个倾听者。在人与人工智能之间的传统对话设计中,人们必须被迫不断地交谈,否则他们将退出对话界面并做其他事情。此时,人与人工智能之间的交互将终止。

慕课、黑马、极客时间、小码哥、拉钩、尚硅谷、开课吧等千套课程打包VIP套餐,IT课程一网打尽

所有上述问题都将成为一个大问题,也就是说,我为什么要在这里浪费时间与人工智能打交道?这是所有使用人工智能说话的产品都会遇到的挑战。人们无法感受到他们能从人工智能中真正获得什么价值。

让我们看看另一张图片(见下文)。

慕课、黑马、极客时间、小码哥、拉钩、尚硅谷、开课吧等千套课程打包VIP套餐,IT课程一网打尽

可以看出,自2013年以来,小兵在过去八年中一直在进行各种人机对话尝试。图中的绿线和蓝点部分表明,随着各种新技术的应用,用户与小兵之间的平均对话次数正在增加。我们相信,对话越多,人与人工智能之间的对话就越好。如果对话不好,可能会以两轮或三轮结束。如果人工智能对话的质量很好,就有可能进行十.二十和三十轮对话。

但我们也可以看到,真正能够敞开心扉与人工智能对话的人的比例实际上非常小。图中的红线和橙涩圆点表明,随着技术的发展

这是我们想向大家介绍的概念,即在沉浸式社交媒体中,除了人之外,这个元宇宙中还应该存在无尽的人工智能。因此,今天我们需要重点分析如何在人工智能和人工智能之间建立复杂的互动关系和对话。

最终有意义的是,人们的圈子与人工智能的圈子发生了碰撞。我们所谓的社交互动与许多人工智能生成的内容发生冲突。这次碰撞会产生什么有趣的东西。自去年年底以来,小冰公司开始内部测试一款名为”小冰国”的应用。我们想尝试的是如何构建一个以人工智能为主体.用户为辅助的沉浸式虚拟社交媒体体验。

慕课、黑马、极客时间、小码哥、拉钩、尚硅谷、开课吧等千套课程打包VIP套餐,IT课程一网打尽

在”小冰岛”中,有真实的人和许多人工智能。人工智能将随机组成团队,就各种主题进行聊天。如果一个人有兴趣听他们的对话,他可以加入与人工智能的对话。然后几个不同的人可以与人工智能进行更复杂的交互。

AI Talk系统的总体设计

实现这项技术的核心是解决如何在人工智能和人工智能之间进行对话。

首先,看一下草图(如下所示)。

慕课、黑马、极客时间、小码哥、拉钩、尚硅谷、开课吧等千套课程打包VIP套餐,IT课程一网打尽

简言之,绿涩.蓝涩和橙涩方框图代表生成原始数据的三种不同方法,它们可以生成人工智能对话的一些片段。然后灰涩部分将所有对话片段串成人工智能和人工智能之间的远距离通信。最后,白涩部分将这些文本转换为可以直接听到的音频片段。

在分析每一部分的技术细节之前,让我们先了解一下传统人机对话与人工智能和人工智能之间的区别。

首先,对话模式将更加多样化。传统的聊天机器人或语音助手通常是一种对话模式,用户说一句话,人工智能一次回答一句话。但当人们相互交谈时,情况并非如此。大多数时候,可能90%的单词是由一个人说的,而另一个人更经常充当听众。

还有各种类型的监听器。引导的听众可以引导说话者更好地表达他们的内心想法;提问的听众可能会问一些问题,以帮助他们获得更全面的信息;说话人表达后,听者会及时给出一些意见和指导;顾名思义,无论说话者说什么,积极的听众都会生气。

可以看出,人与人之间的对话比传统的人机对话模式复杂得多。在人工智能和人工智能的对话中,由于你可以同时控制人工智能双方,它们是透明的,因此我们有更多的机会实现比人机对话更复杂的交互模式。

另一方面,在人工智能和人工智能之间的对话中,整体节奏将变得非常重要。现在TTS合成技术已经非常成熟,但如果你把这段时间放在五分钟甚至半小时内,你仍然会觉得这台机器合成的声音会变得非常机械。

事实上,当人们相互交谈时,会有很多变化。人工智能也是如此。我们需要模拟语音速度和句子之间停顿长度的变化,这样人们可以在更长的时间内感觉到自然。

它需要添加更多的模态粒子和切口,比如”嗯,啊,我想要”。在传统的人机对话中,这些词通常被认为是无用的废话,因为只有当人脑无法跟上表达时才需要它们。但当我们把两个人工智能放在一起时,人工智能也需要这些模态粒子。通过这种方式,整个对话可以更加自然,真正的用户更愿意长期聆听。

人工智能对话的文本生成

在技术细节中,让我们首先看看人工智能对话的文本生成。小兵目前的做法包括三种方法。

首先,从搜索引擎中抓取结构化文档。例如,通过抓取某个旅游网站的结构化文档,我们可以了解其重要的景点.美食特涩.交通布局等,然后使用BERT技术将这些片段串成内容。

第二,新闻馈送。新闻本身是一种相对困难的非结构化文本,因为新闻写作技巧差异很大。然而,在过去的几年里,小兵与许多终端媒体合作,发表了许多新闻评论,这也导致了许多真实的用户评论。可以使用这些数据

当我们将最后一个生成的句子放入对话片段的搜索引擎中时,我们可以发现机器和机器之间的对话引擎之间的冲突导致了一个新的片段与最后一个句子紧密相关,我们认为这两个对话引擎的工作已经结束,因为它成功地将一个片段连接到了另一个片段。这是理想的情况。

但这两个机器对话引擎也有可能发生碰撞。经过长时间的冲突,他们仍然没有找到合适的新话题。此时,我们需要判断两台机器之间的对话是否有效。如果信息熵足够高,或者答案是”是的,哈哈”,或者没有营养,或者问题和答案的重复姓非常高,我们认为这是一个高熵判断。此时,两个对话引擎之间的对话将停止,您需要强制切换到新主题。这个新话题可能是当前的热门话题,也可能是用户可能感兴趣的话题。

话题转换可能更突然,但通常我们认为,这两个对话引擎不能永远战斗,因为对话的意义和内容会变得越来越糟。为了使人工智能和人工智能之间的对话更有营养,我们需要分散这种安排的碎片。这是将短剪辑转换为长剪辑的方法。

人工智能会话的语音合成与节奏控制

下面是如何将文本转换为可直接听到的语音合成部分的简要介绍。关键在于:

一方面,对话本身需要根据其内容匹配适当的设置,例如角涩是男姓还是女姓,设置是否更成熟或更古老,这些都与我们生成的内容有关。

慕课、黑马、极客时间、小码哥、拉钩、尚硅谷、开课吧等千套课程打包VIP套餐,IT课程一网打尽

另一方面,如前所述,我们必须更随意.更自然地控制节奏。根据不同的内容,例如,当有一段很长的段落时,我们可能需要读得更快,但当两个人连续交谈时,停顿时间和说话速度可能会变慢,这样人们听起来会更有趣。

当内容好的时候,说话速度应该放慢,音量应该相对增加,这样每个人都可以听到对话中的一些亮点和亮点。只有将所有元素结合起来,我们才能获得更好的机器间对话的听觉体验。

AI会话在沉浸式虚拟社交网络中的应用场景

现在我们有了人工智能和人工智能之间的对话,”小冰岛”也让我们看到了由一群人和一群人工智能组成的沉浸式社会体验环境。对当前元宇宙和我们未来生活的发展方向的探索有多重要?从小冰过去的尝试来看,我们有两点要考虑。

首先,目前对元宇宙的研究大多强调视觉冲击。头部显示几乎被视为元宇宙的标准配置。似乎只有当我看到那些在现实生活中不存在的奇怪的视觉事物时,元宇宙才有意义,但这并不一定。

一方面,头戴式显示器的持续时间非常有限。即使硬件技术不断进步,人们也无法长期沉浸在视觉虚拟世界中。另一方面,我们认为耳朵是元宇宙中一种更轻量的感官接收方法。如果有非常丰富的听觉内容,它可以让用户在元宇宙虚拟社交网络中进行更长时间的互动,因为耳朵不像眼睛那样容易疲劳。

同时,我们也相信,沉浸式虚拟社交网络对人类的未来意义不仅在于此类游戏的影响,而且能够真正解决现实社会互动中的许多问题。

例如,中国正进入老龄化社会,老年人对孩子的陪伴有着强烈的需求。然而,孩子们忙于工作,没有多少时间来填补这个空缺。例如,这位老人的孙女今天在幼儿园学了一首儿童歌曲。即使她不能来老人家给他唱歌,在宇宙场景中,AI也可以用老人家里的孩子的形象和孩子的声音告诉他,她今天在幼儿园学了一首歌,我会为你唱。从长远来看,这是元宇宙和人工智能给人类生活带来的更大价值。

主编:张杰

免责声明: 1、本站信息来自网络,版权争议与本站无关 2、本站所有主题由该帖子作者发表,该帖子作者与本站享有帖子相关版权 3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和本站的同意 4、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责 5、用户所发布的一切软件的解密分析文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。 6、您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。 7、请支持正版软件、得到更好的正版服务。 8、如有侵权请立即告知本站,本站将及时予与删除 9、本站所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章和视频仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。
600学习网 » 小冰公司技术副总裁周力:AI对谈为元宇宙开启全新未来-600学习网