阿里大模型也来了!聊聊我的几点看法

人工智能等各类编程培训资料整理,所有资源无秘无压缩-购买会员

作者桑明强

距离阿里大模型推出时间越来越近,市场上的声音也比较杂,由于近期张勇刚刚宣布了阿里巴巴成立24年来最重要的组织变革决定,大模型隶属的云智能集团由逍遥子直接负责,这件事就变得更加微妙起来。

《新眸》也第一时间拿到了阿里大模型的测试邀请码,体验下来最直观的感觉是,可圈可点,反应速度还不错,但无论是百度还是阿里,大模型还停留在transformer水平,并没有涌现出对于文本出色的理解能力。

总体上说,通义千问和文心一言在能力上还是旗鼓相当,但这才刚刚开始,相比文本问答能力,其实我们更好奇“通义千问”接下来的动作。

因为就行业层面来看,由于字节跳动节奏感未知(原阿里M6大模型带头人现加入字节AI Lab),第一梯队的关注点更多落在了腾讯、百度、阿里和华为身上,一是这几家公司都有这方面的底蕴和人才技术储备,二是因为从业务上看,这几家大厂都需要大模型的支持。

现在百度已经勇敢地迈出了第一步,发布了初阶版本的文心一言,但囿于当时百度比较激进的品牌打法,导致外界对于阿里大模型的期望更大了,但据《合纵投研》披露出的信息,现在阿里大模型仍处于追赶GPT 3.5的阶段,距离GPT 4还有一段路要走。

造成这种“卡脖子”的关键因素主要有3块:一是数据量,这个权重占比30%左右;二是大模型结构的创新性,目前国内还做不成高层级的架构,这个权重占比在40%-50%左右;最后的30%权重是工程化落地,现在这块国内也没有比较好的参照。

再联想到Open AI以及它背后的GPT的进化逻辑,大家已经开始意识到,这次的AGI较量已经不单单是财力和人力上的比拼,而是从理论、到工程、到产品,再到商业、人文上的全面的颠覆,回到阿里大模型这件事上,或许我们更应该把关注点放在大模型和阿里现有业务模块的应用上。

清华大学智能产业研究院院长、中国工程院院士张亚勤曾在近期聊到过这个话题,他认为可以把GPT这个系列的生成式AI模型看作一个由大模型组成的AI操作系统,和当年PC上的windows,以及移动的安卓、IOS基本具有相似的意义。

而一个新的操作系统的诞生,往往意味着下面的硬件、上面的应用都会被重构,形成一个全新的生态。甚至他还断言,如果说PC互联网的生态价值是1X,移动互联网的生态价值是10X,那么AI生态至少是100X。

张亚勤的判断很大程度上来源于微软和Open AI的结合,有了GPT 4的加持,微软曾经一度式微的业务板块都变得富有想象力,其中就包括此前被打得节节败退的搜索业务Bing。

这也解释了为什么包括百度、阿里、华为在内的大厂们都纷纷押注大模型,说白了,chatGPT就是一个钩子,如果你还把目光放在大模型会如何颠覆搜索场景,那我只能说你不仅不懂大模型,而且不懂商业玩法,这也是很多大厂选择下场的真正原因,即便它现在看起来还比较模糊。

确切地说,这和几年前被资本催熟的“假风口”有着本质上的不同,LLM、包括AGI是已经得到微软验证的真风口,甚至还一度被埃隆-马斯克警告——人工智能正在朝着人类不可控的方向演进。

很显然,马斯克的担忧更多的是伦理和道德层面上的,这也是人工智能这门科学最让人敬畏的地方,一旦被别有用心的人和公司操纵,它极有可能带来比较大的灾难。但如果我们在规范和法律标准下看LLM和AGI,它明显是个很好的工具,就像是一个人类智慧收纳盒,通过大模型的方式进行能力输出。

结合目前微软的动作来看,大模型在云计算、文本办公、搜索领域都有着很好的契合点。不难推测,国内的大模型方向也会依葫芦画瓢,先从这几个方面开始试点,巧合的是,这几块业务阿里都有,云有阿里云、文本办公有钉钉、搜索有夸克。

更重要的是,阿里还有微软手上没有的底牌——电商。电商是阿里巴巴的根基,但就像亚马逊之于贝索斯,面对直播电商、兴趣电商等各种势力的崛起,地盘被冲击,这块一直是阿里巴巴这些年难以言说的“心病”。

所以对于阿里来说,大模型得做、而且必须要做,即便增收路径模糊,但它也有可能是一个很好的智能工具,而且,要远比前些年搭建的数据中台想象力更高一些,前端的灵活性,其实可以让阿里找到新的增长可能性。

关于LLM和AGI,现在大家的想法还是比较局限的,就比如针对“大模型究竟会颠覆什么”这个问题,我们在给出答案时,可能更倾向于回答“大模型不能颠覆什么”。造成这种局面的原因,既有大众认知水平的因素,也有行业发展现状的因素。

这就跟看科幻片同一个道理,早在10几年前,我们就能在美国大片里看到各种智能的场景,但事实上,即便发展至今,我们距离所谓的AGI还有很长一段路要走,但可以确定的是,以百度、阿里为首的大厂纷纷下场后,真正的人工智能浪潮已经开启。

在长达10年的移动互联网浪潮中,生活中很多场景被颠覆,衣食住行,无一例外。但如果你深究的话,这种变化的根本原因其实是由供需端在成本因素上推动的,总有性价比更高的方案出现,然后替代掉老旧的方案,这是数字经济时代的新法则。

所以如果我们把视角放在大模型的供需视角来看,会发现,这个市场还远未被很好地开发。就像在特斯拉出来前,没有人会想到当年的全球霸主丰田汽车会受到如此大的挑战,按照这个逻辑推演的话,现在市面上所有的判断,都不可信,或者说不可全信。

也许再过一年后,随着这些大厂陆续把大模型应用起来,做到既好用,又实惠,可能我们对大模型的理解或许会更客观些。

最后聊聊大家最关心的失业话题,这个问题很显然过于杞人忧天了。

很多时候,我们往往过度高估了人工智能,而低估了我们自己的创造力。

免责声明: 1、本站信息来自网络,版权争议与本站无关 2、本站所有主题由该帖子作者发表,该帖子作者与本站享有帖子相关版权 3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和本站的同意 4、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责 5、用户所发布的一切软件的解密分析文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。 6、您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。 7、请支持正版软件、得到更好的正版服务。 8、如有侵权请立即告知本站,本站将及时予与删除 9、本站所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章和视频仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。
600学习网 » 阿里大模型也来了!聊聊我的几点看法