300字范文,内容丰富有趣,生活中的好帮手!
300字范文 > 群模大战: WAIC 世界人工智能大会参展有感

群模大战: WAIC 世界人工智能大会参展有感

时间:2024-06-01 08:16:09

相关推荐

群模大战: WAIC 世界人工智能大会参展有感

作为连续参加了两届WAIC的“幸运儿”,两届直接对比是最容易看清行业趋势的。的主题是元宇宙,“元生无界”,但因为众所周知的原因,参展观众和厂商并不多。而生成式大模型红得发紫,AI又有重大突破,展会的主题亦非常贴切:“智联世界,生成未来”。

本次大会展区面积大了一倍,设有两个场馆,同时增加了大量AI相关的创投,金融和行业应用等共计133场主题论坛,增加了大量新公司新面孔, 即使是在周五工作日,也拥有堪比北京车展的人流量和热度。

本次展会,生成式大模型是绝对的主角。发布大模型的厂商有三十多家,本文也一分为二,GPT & others。others包括训练推理硬件,无人机,行业应用等领域。

GPT大模型:群模大战

笔者参加了阿里云冠名的大模型行业论坛, 某一嘉宾的观点是:以chatGPT的出现为分水岭, 之前是AI时代1.0,模型解决单一任务,开发周期长投入高。 现在进入了AI 2.0时代,一个模型能解决多个,甚至没有见过的新问题(涌现),也是AI赋能千行百业的iphone时刻。

本次参展笔者有三个感受,总结如下:

1. 大模型百家争鸣,但重量级应用尚未出现

首先是大模型发布数量极多,包括盘古(华为),商量(商汤),文心一言(百度),混元(腾讯)等等,百花齐放。

这里包括阿里的通义大模型,通义千问是问答机器人,而通义听悟有现场体验,开会神器,一键导出区分发言人的文字稿。

百度的重点是其AI全栈布局,包括去年也是主角的文心大模型(文心一言,文心一格),还重点介绍了将芯片部门拆分独立融资的AI昆仑芯。

商汤的商量(SenseChat)大模型,这个是可以现场体验的,很想和工作人员仔细聊聊技术,但奈何实在是挤不进去,里里外外全是人。

AIGC今年则是遍地开花,比如商汤的秒画,去年可能只有百度的文心展示了这功能。

Together公司在展会的分论坛上发布了其7B大模型:RedPajama-7B,开源可商用,效果比LLaMA-7B和Falcon-7B效果更好。

大量企业都希望能通过大模型,深度赋能行业。但生成式大模型目前还是以聊天对话为主。

在展区,笔者只看到了华为的盘古大模型应用在B端行业,如矿业,铁路,政务等等,“不做诗,只做事”。盘古气象大模型在Nature上发表了《三维神经网络用于精准中期全球天气预报》,通过适应地球坐标系统的3D Earth-Specific Transformer能够提供秒级全球气象预报。但其具体实现架构则没有在展会公开。

除此之外,笔者暂时没看到其他大模型拳头应用。大家都在讲科普和规划,但缺少真实落地场景。我们设计了一个发动机,但把它装进车里肯定只是时间问题。

目前很接近3G移动互联网刚刚兴起, 当时有人觉得3G用起来足够,没想到4G带来了极其繁荣的移动互联网发展。展会上大模型创新创业的大赛和点子特别多,虽然真实商业落地虽少,和GPT3.5也有距离。但可以预见,大模型一定能带来下一步的行业大红利。

2. 模型驱动的AI开发:MaaS会大放异彩

阿里大模型除了展现其“大”之外,就重点强调MaaS(Model as a Service)的研发模式。以笔者粗浅的理解,由于自然语言冗长且不准确,大模型在工业界的落地方式肯定不是对话聊天。大模型的通用性很强,通过将模型的高级能力封装成一个个的函数,再让大模型去自动生成调用这些函数的函数,并让大模型生成测试任务来自动化回归。这样既满足了可控性,又大大提升了研发的效率。AI从手工作坊进入工厂车间。

基于以上思路,在展会上阿里推出了模型库modelscope(魔搭,正好和达摩反过来,开源了十来个百亿参数大模型), 和DashScope灵积模型服务平台, 通过API的方式进行调用。和OpenAI的 LangChain有一定相似之处:

目前现有的思维链(COT)解决复杂问题的案例并不多, 例如让通用大模型跟人下象棋,因为游戏规则难以表达,状态太多, 还是很困难的。但可见的未来,这些问题一定会被解决。

3. 大模型时代,可信AI变得更加重要

企业担心大模型导致的数据泄露和合规问题,上班族担心大模型替代工作,甚至变成T-800。因此可信AI变得非常重要,成为行业关注的重点。

例如蚂蚁集团今年宣传的重点,从隐语变成了大模型可信度分析(蚁鉴,今年的镇馆之宝之一)。和工作人员讨论后, 并不是大模型来校验大模型,而是用大模型生成攻击训练语料,再用普通文本分类模型来做多分类。

同时信通院、清华大学、蚂蚁集团等多家单位共同发布了《可信AI技术和应用进展白皮书()》:

蚂蚁在安全和风控领域进行了大量的投入。 支小宝也开发了基于生成式AI的2.0版本。 而绿色计算,TuGraph大规模图计算系统, OceanBase这些往年的常客自然不在话下。 蚂蚁还是很细致地准备了很多互动, 点赞。

其他:虚拟人/硬件/无人机/VR

大模型时代,训练和推理卡是最重要的生产资料,算力是王道,先说这个。

训练和推理加速

展位最大,出现次数最多的是华为昇腾,据说已经应用在国产的近一半的大模型创新上,已有集群规模已经达到万张。比如下面是基于昇腾芯片的宝德自强AI训练服务器:

除此之外,本次展览还有AI芯片公司燧原科技, 登临科技,和大量的板卡和集群服务商。 直接将AI芯片和安防视频处理集成在一个盒子里,实现边缘计算:

不过稍显不足的是,整个行业的芯片算力相比去年没有显著提升。很多芯片和产品都是去年出现过的,比如这颗阿里云的含光800:

让笔者耳目一新的是的墨芯科技的稀疏推理技术,按照工作人员的说法,可以提升6倍推理速度,功耗减半。 其原理就是矩阵运算中,大量0元素和无效元素进行删除(可能和GroupLasso很像),但需要使用他们的软件框架Moffett NNKit。 墨芯坚信“稀疏化才是未来”。 这里的难点是,现有的GPU硬件是很难实现高倍率稀疏化的, 笔者很好奇其效果如何和实现的细节。

笔者认真参观了每一个推理硬件展台,和不少工作人员讨论了我国自研和NVIDIA有多大的差距,基本结论是“NVIDIA占据了95%以上的AI计算市场份额, 自研芯片能用且用起来了,但和A100,H100这种级别相比,制程和设计能力相差较远”, 而且也没有CUDA这样的软件生态,基本上是自研的SDK,但未形成业界影响力和标准。”

虚拟人效果比肩真人

展会上除了可以以假乱真的2D虚拟人外,更多的是3D虚拟人,除了有一点感官上不自然之外,效果真是突飞猛进。日常教学和直播带货绝对没问题。

腾讯云发布了“智能小样本数智人”, 24小时制作数字智能人。

机器人和无人机

特斯拉把擎天柱人型机器人搬到了现场。达闼科技的云智能机器人跳了《隐形的翅膀》:

但机器人感觉暂时没有享受到大模型的红利,我们几个观众在它面前嘘寒问暖,但人机交互上依然很蠢萌。

美团无人机去年没有参展,不过这才是黑科技。六轴飞行器,可负载5公斤,电池续航可飞行五公里来回。并提供从飞控,到管理系统的一整套解决方案。但问及单次飞行的成本时,工作人员无可奉告,估计短期内送30元的打工仔外卖是不可能了。

语音识别和合成已经达到了非常准确的程度。手术和日常门诊,医生口述即可一键生成病历,demo上还是非常厉害的。自动驾驶方面,除了整车展示,还有很多激光摄像头和集成解决方案的展示。因为篇幅问题不再展开。

最后

整个看下来,笔者收获非常大, 也非常感慨。

首先,大模型百花齐放,但是怎么提升国产自研大算力AI芯片的竞争力是关键。 本身模型架构和数据都不再成为瓶颈时,算力和GPU生态就成为最大的制约。期待国产AI芯片能像SSD存储那样,颠覆整个产业界; 其次,相比于去年的红火,整个VR行业似乎进入了阶段性调整期,本次展会,头显和vr成了排队游玩的玩具,一帮孩子们排成长队; 最后,我们还处在大模型革命的前夜,明年WAIC,一定会有更多的革命性创新和落地,一起期待!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。