300字范文 > 群模大战： WAIC 世界人工智能大会参展有感

群模大战： WAIC 世界人工智能大会参展有感

时间：2024-06-01 08:16:09

作为连续参加了两届WAIC的“幸运儿”，两届直接对比是最容易看清行业趋势的。的主题是元宇宙，“元生无界”，但因为众所周知的原因，参展观众和厂商并不多。而生成式大模型红得发紫，AI又有重大突破，展会的主题亦非常贴切：“智联世界，生成未来”。

本次大会展区面积大了一倍，设有两个场馆，同时增加了大量AI相关的创投，金融和行业应用等共计133场主题论坛，增加了大量新公司新面孔，即使是在周五工作日，也拥有堪比北京车展的人流量和热度。

本次展会，生成式大模型是绝对的主角。发布大模型的厂商有三十多家，本文也一分为二，GPT & others。others包括训练推理硬件，无人机，行业应用等领域。

GPT大模型：群模大战

笔者参加了阿里云冠名的大模型行业论坛，某一嘉宾的观点是：以chatGPT的出现为分水岭，之前是AI时代1.0，模型解决单一任务，开发周期长投入高。现在进入了AI 2.0时代，一个模型能解决多个，甚至没有见过的新问题（涌现），也是AI赋能千行百业的iphone时刻。

本次参展笔者有三个感受，总结如下：

1. 大模型百家争鸣，但重量级应用尚未出现

首先是大模型发布数量极多，包括盘古（华为），商量（商汤），文心一言（百度），混元（腾讯）等等，百花齐放。

这里包括阿里的通义大模型，通义千问是问答机器人，而通义听悟有现场体验，开会神器，一键导出区分发言人的文字稿。

百度的重点是其AI全栈布局，包括去年也是主角的文心大模型（文心一言，文心一格），还重点介绍了将芯片部门拆分独立融资的AI昆仑芯。

商汤的商量(SenseChat)大模型，这个是可以现场体验的，很想和工作人员仔细聊聊技术，但奈何实在是挤不进去，里里外外全是人。

AIGC今年则是遍地开花，比如商汤的秒画，去年可能只有百度的文心展示了这功能。

Together公司在展会的分论坛上发布了其7B大模型：RedPajama-7B，开源可商用，效果比LLaMA-7B和Falcon-7B效果更好。

大量企业都希望能通过大模型，深度赋能行业。但生成式大模型目前还是以聊天对话为主。

在展区，笔者只看到了华为的盘古大模型应用在B端行业，如矿业，铁路，政务等等，“不做诗，只做事”。盘古气象大模型在Nature上发表了《三维神经网络用于精准中期全球天气预报》，通过适应地球坐标系统的3D Earth-Specific Transformer能够提供秒级全球气象预报。但其具体实现架构则没有在展会公开。

除此之外，笔者暂时没看到其他大模型拳头应用。大家都在讲科普和规划，但缺少真实落地场景。我们设计了一个发动机，但把它装进车里肯定只是时间问题。

目前很接近3G移动互联网刚刚兴起，当时有人觉得3G用起来足够，没想到4G带来了极其繁荣的移动互联网发展。展会上大模型创新创业的大赛和点子特别多，虽然真实商业落地虽少，和GPT3.5也有距离。但可以预见，大模型一定能带来下一步的行业大红利。

2. 模型驱动的AI开发：MaaS会大放异彩

阿里大模型除了展现其“大”之外，就重点强调MaaS（Model as a Service）的研发模式。以笔者粗浅的理解，由于自然语言冗长且不准确，大模型在工业界的落地方式肯定不是对话聊天。大模型的通用性很强，通过将模型的高级能力封装成一个个的函数，再让大模型去自动生成调用这些函数的函数，并让大模型生成测试任务来自动化回归。这样既满足了可控性，又大大提升了研发的效率。AI从手工作坊进入工厂车间。

基于以上思路，在展会上阿里推出了模型库modelscope（魔搭，正好和达摩反过来，开源了十来个百亿参数大模型），和DashScope灵积模型服务平台，通过API的方式进行调用。和OpenAI的 LangChain有一定相似之处：

目前现有的思维链(COT)解决复杂问题的案例并不多，例如让通用大模型跟人下象棋，因为游戏规则难以表达，状态太多，还是很困难的。但可见的未来，这些问题一定会被解决。

3. 大模型时代，可信AI变得更加重要

企业担心大模型导致的数据泄露和合规问题，上班族担心大模型替代工作，甚至变成T-800。因此可信AI变得非常重要，成为行业关注的重点。

例如蚂蚁集团今年宣传的重点，从隐语变成了大模型可信度分析（蚁鉴，今年的镇馆之宝之一）。和工作人员讨论后，并不是大模型来校验大模型，而是用大模型生成攻击训练语料，再用普通文本分类模型来做多分类。

同时信通院、清华大学、蚂蚁集团等多家单位共同发布了《可信AI技术和应用进展白皮书（）》：

蚂蚁在安全和风控领域进行了大量的投入。支小宝也开发了基于生成式AI的2.0版本。而绿色计算，TuGraph大规模图计算系统， OceanBase这些往年的常客自然不在话下。蚂蚁还是很细致地准备了很多互动，点赞。

其他：虚拟人/硬件/无人机/VR

大模型时代，训练和推理卡是最重要的生产资料，算力是王道，先说这个。

训练和推理加速

展位最大，出现次数最多的是华为昇腾，据说已经应用在国产的近一半的大模型创新上，已有集群规模已经达到万张。比如下面是基于昇腾芯片的宝德自强AI训练服务器：

除此之外，本次展览还有AI芯片公司燧原科技，登临科技，和大量的板卡和集群服务商。直接将AI芯片和安防视频处理集成在一个盒子里，实现边缘计算：

不过稍显不足的是，整个行业的芯片算力相比去年没有显著提升。很多芯片和产品都是去年出现过的，比如这颗阿里云的含光800：

让笔者耳目一新的是的墨芯科技的稀疏推理技术，按照工作人员的说法，可以提升6倍推理速度，功耗减半。其原理就是矩阵运算中，大量0元素和无效元素进行删除（可能和GroupLasso很像），但需要使用他们的软件框架Moffett NNKit。墨芯坚信“稀疏化才是未来”。这里的难点是，现有的GPU硬件是很难实现高倍率稀疏化的，笔者很好奇其效果如何和实现的细节。

笔者认真参观了每一个推理硬件展台，和不少工作人员讨论了我国自研和NVIDIA有多大的差距，基本结论是“NVIDIA占据了95%以上的AI计算市场份额，自研芯片能用且用起来了，但和A100，H100这种级别相比，制程和设计能力相差较远”，而且也没有CUDA这样的软件生态，基本上是自研的SDK，但未形成业界影响力和标准。”

虚拟人效果比肩真人

展会上除了可以以假乱真的2D虚拟人外，更多的是3D虚拟人，除了有一点感官上不自然之外，效果真是突飞猛进。日常教学和直播带货绝对没问题。

腾讯云发布了“智能小样本数智人”， 24小时制作数字智能人。

机器人和无人机

特斯拉把擎天柱人型机器人搬到了现场。达闼科技的云智能机器人跳了《隐形的翅膀》：

但机器人感觉暂时没有享受到大模型的红利，我们几个观众在它面前嘘寒问暖，但人机交互上依然很蠢萌。

美团无人机去年没有参展，不过这才是黑科技。六轴飞行器，可负载5公斤，电池续航可飞行五公里来回。并提供从飞控，到管理系统的一整套解决方案。但问及单次飞行的成本时，工作人员无可奉告，估计短期内送30元的打工仔外卖是不可能了。

语音识别和合成已经达到了非常准确的程度。手术和日常门诊，医生口述即可一键生成病历，demo上还是非常厉害的。自动驾驶方面，除了整车展示，还有很多激光摄像头和集成解决方案的展示。因为篇幅问题不再展开。

最后

整个看下来，笔者收获非常大，也非常感慨。

首先，大模型百花齐放，但是怎么提升国产自研大算力AI芯片的竞争力是关键。本身模型架构和数据都不再成为瓶颈时，算力和GPU生态就成为最大的制约。期待国产AI芯片能像SSD存储那样，颠覆整个产业界；其次，相比于去年的红火，整个VR行业似乎进入了阶段性调整期，本次展会，头显和vr成了排队游玩的玩具，一帮孩子们排成长队；最后，我们还处在大模型革命的前夜，明年WAIC，一定会有更多的革命性创新和落地，一起期待！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。