算力不足、算法难创新,仍是横亘在国产大模型面前的现实难题
编者按:本文来自微信公众号 (ID:),作者:,创业邦经授权转载,头图来源摄图网
3月下旬,英伟达在美国加州总部举办了面向软件开发者的年度技术峰会GTC。会上,创始人黄仁勋发布了专用于大语言模型部署的GPU推理平台——H100 NVL, 其或将在推理阶段实现比现有最先进的A100快10倍的速度。
(资料图片)
但如此先进的GPU却无法运往国内,去年8月,美国监管机构以国家安全为由,对NVIDIA A100、H100两款GPU实施禁令,不得销售给国内企业,意在通过“卡脖子”的方法来降低国内AI模型的传输速度,拖延中国人工智能发展。
而目前也确实对国内AI企业产生了较大的影响,在算力的大需求之下,呈现出了“一卡难求”的情况,就连阉割版的A800也一直处于缺货的状态。
但与GPU硬件窘迫的境况不同的是,在继3月16日百度发布文心一言大模型后,国内众多科技、AI巨头都相继公布了各家大模型的发布会时间:4月8日华为盘古大模型发布、4月10日商汤大模型发布、4月11日阿里大模型发布、4月14日同花顺举办AI产品发布会,国内大模型的“百家争鸣”与GPU被禁运后的“惨淡”状况,也形成了鲜明的对比。
这个4月,成为国产大模型混战期。
那么,在GPU受限的情况下,国内AI行业发展境况如何,能否交出属于他们自己的答卷?未来的发展是否会与国外越差越大?
本文,奇偶派以已经发布或近期即将发布的大模型与相关AI应用的企业为例,通过专家访谈等方式,研究和分析各企业AI大模型的发展状况。
2、手握巨大算力的商汤大模型,未来有隐忧
紧接着华为盘古大模型发布后,商汤科技的大模型也即将登场。
不过,由于上市公司相关信披原因,目前公司正处于发布大模型之前的静默期,所以没有办法披露过多的大模型相关内容。但是,作为最早把人工智能大模型写入招股说明书的公司,商汤确实是有着足够的实力,来推出独属的大模型。
而在近期的相关交流中,商汤相关人士还是回答了一些与算力相关的问题。
首先是大众最关注的算力资源方面,商汤拥有极为充足的GPU储备,对方表示,在去年停售之前就有1万张A100芯片了,完全可以覆盖训练一个千亿参数量的语言模型的消耗。
而除了英伟达专用显卡外,商汤也有采购国内的GPU,专家表示:“比如说寒武纪与海光,最近这两家公司可能很多投资人都很关注,想了解他们的产品是否进入了大规模试用阶段。但是,如果大家在去年有去参观我们商汤的大装置的话,就应该看得到我们在大装置里面已经适配了很多寒武纪和海光的GPU卡,我们也是寒武纪最大的客户之一”。
而在谈及国产替代方面时,专家也坦言,“我们很早就开始与国产GPU厂商合作,去适配国产GPU卡,但坦白来说,当前的大模型训练,确实是只有A100与A800能够胜任,国内GPU卡的易用性与性价比都无法去比较,但在推理阶段,寒武纪最新款的GPU在大模型领域也有了不错的表现,期待未来会更好。”
而在被问及H100出现是否会对国内AI企业产生影响时,专家表示,H100加速芯片的出现,确实在性价比上有十分显著的提高。但如果不考虑性价比的话,当前已有的芯片是完全可以胜任的。
而在算力的使用技术方面,商汤较众多AI企业来说有着极为明显的优势。
在A100存量优先的情况下,如何利用仅有的资源去做更多的事情,成为了商汤需要解决的一大问题。
专家表示,商汤科技在过去五年中,有着丰富的千卡并行的训练经验,最大的单任务训练可以同时调动4000张A100的GPU卡,等效算力为1万张A100,已经达到了训练GPT3甚至GPT4的门槛。
而在国产GPU的优化适配上,商汤也同样有丰富的经验,“目前有10%左右的算力,是由国产GPU卡提供了,商汤也一直在进行适配,无论是规模比较大的寒武纪、海光,或是当前规模比较小的昇腾,都有着相应的适配支持”。
也正是因为多年的训练经验,让商汤获得了较为明显的优势,“我们目前的算力规模可以支持20个千亿参数量超大模型共同计算,同时训练,对客户的技术迭代有十分明显的帮助。”
但被问及当下的挑战之时,专家再次重点提到了国产GPU的适配问题。即当前国产GPU不太能够支持超大模型的训练,还需要投入更多去进行优化。此外,虽然国产GPU已经展现了一定的能力,但依然任重道远。
总的来说,商汤科技作为最早一批的AI企业,有着极为深厚的训练经验,也在禁运之前拿到了上万张A100显卡,这让其在当前的AI大战中拥有了极强的竞争力。
但从另外一个角度来看,短期内高端GPU禁运的影响还可以通过丰富的训练经验、更大的成本投入来进行掩盖,但从长期来看,如何能持续获得高端GPU,才是商汤需要考虑的问题。如果禁运依旧存在,并且国产GPU无法适配超大模型的训练,那么与国际尖端AI企业、与最先进的大模型之间的距离,将会被持续拉开。
4月4日,B站一则阿里版ChatGPT全网首测视频流出,引爆全网,同日下午,阿里正式宣布将于4月11日的阿里云峰会上推出大模型。
从视频中看,阿里大模型超出大家预期的主要有两点:
一是“音色”“文风”“情绪”都可改变,定制化属性显现,受众面大幅增加,视频中UP主先是运用了脱口秀演员“鸟鸟”的声音作为模型交流,然后并要求ChatGPT接下来用“猫娘”的身份进行后续对话, 整体定制化特征明确,不再局限于固定形式,代表着后续每个人可根据自己的需求定制属于自己的“性格”不同的ChatGPT,几乎可满足所有受众群体。
二是阿里GPT的成熟程度超出预期,15个问题中有10个问题的回答都明显好于国内已经公布的竞品,并且突破了双工对话,整体带入性更强。
而就在发布前的一周,也有相关内部专家接受了采访,回答了“国内语言大模型与ChatGPT有多大差距”的相关问题。
专家表示,起码在未来的一年到一年半之间,国内是绝不可能出现对标GPT4的产品的,只有先把ChatGPT(GPT-3.5)追上,才有资格去谈GPT4。目前,国内大多仍然都是以文本、图像、视频等单模态的方式发布的,并且文本大模型已经进入商用阶段,百度走出了第一步,其他的众多AI企业和科技企业也都会在年中或者下半年进行发布。
而在追赶GPT-3.5的过程中,也有着三个核心瓶颈:
一是数据量的不足,只有拥有了足够多的数据,才能继续训练,而公有的数据大家都可以买到,所以核心竞争点是如何获得足够多的私有数据,权重占比达到了三成左右。
二是模型结构的创新性,国内的语言大模型目前做不成高层级的架构,也就没办法做海量的数据训练,也是最大的瓶颈,权重达到了四成左右。
第三便是工程化的能力,在工程落地的时候,大家都知道需要预训练、调优训练与推理训练,但在真正部署的时候,是完全要靠自身去摸索的,包括数据的处理,模型的训练,模型优化,模型的部署和运用,都需要投入大量的时间、精力与财力,这方面的权重与数据量类似,也是达到了三成的权重。
但这一切的前提是算力充足,阿里是当前国内拥有A100 GPU最多的企业,在当下阶段算力并没有多大阻碍,但未来伴随着禁运的持续与算力需求的增加,也将面临高端运算卡不足的情况。
而在追赶ChatGPT之外,电商作为阿里起家的领域,也让人好奇阿里大模型将会为电商领域带来多大的改变。
专家表示,在电商场景中,比较主要的还是推荐算法与营销图案、文本的生成。未来,阿里大模型将会包揽营销图案、产品介绍、产品描述等工作。
“实际上,去年我们就已经让一些商家使用这个技术了,我们挑选了上百个商家,预计要花数百万去请广告公司去做的营销图案,阿里大模型的AI都可以胜任,cover 40%的工作量。”
“而在营销之外,还有虚拟直播等许多场景可以被替代,包括仓储预测、物流信息的挖掘,都需要一步步找场景渗透,慢慢将老一代的技术进行替代,帮助中小企业,最终达到双赢”。
总的来说,阿里大模型作为一个庞大集团下的一条项目线,看起来并不像其他AI科技企业那么出彩。但目前,阿里的文本大模型进度在国内也已经位属前列,并且其他模型也在有序推进之中。
不过,这一切的前提是算力的充足,伴随着技术的推进与数据量的增加,在未来,算力可能仍是迈不过的那道坎。
而在AI巨头与科技公司之外,各行各业的企业其实早已经将AI应用于实际业务中,而同花顺就是其中一员,4月14日,同花顺也将举办AI产品发布会。
实际上,同花顺的AI产品,早就已经应用,主要包括i问财、基于AI技术的增值服务产品与B端AI产品。
其中,同花顺主打的便是i问财这款AI产品。i问财是目前财经领域落地较为成功的自然语言交互问答系统,而公司也在2022年进一步加大对其研发投入,采用全新的语义解析方案,结合AI大模型、小样本学习等技术的应用,有效提升 i 问财服务效率,可将服务场景从财经领域扩展到通用领域,从中文场景扩展到多语言场景。
通过i问财机器人,我们可以获得相关资讯、数据以及AI的点评;还可以准确地提供A股公司的基本面及板块情况,并通过多类图表的形式显现出来;还可通过向问财机器人提问,实现条件选股,是市面上成功的一款财经AI。
而在AI之风的推动之下, 同花顺的股价也节节走高。自3月17日以来,在短短12个交易日中,股价便从115.57元上涨至最高的239.22元,完成快速翻倍。
在股价飙涨的背后,同花顺能否发布更有含金量的AI应用,我们还无从得知。但如果仅仅以目前的AI应用水平,是绝无可能撑起如此高的市值的。
而同花顺的AI含金量究竟如何,或许只有当其产品发布之时,我们才能知晓吧。
5
写在最后
纵观国内已经发布的文本大模型或者AI应用,亦或是与各企业相关专家进行交流,我们都能发现一个问题,那就是国内的大模型水平,实际上才刚刚起步。
在硬件方面,英伟达高端GPU遭受禁运,国内只能拿着为数不多的A100与阉割版的A800进行训练和推理。当前尚可通过丰富的训练经验,更高的资本投入来短暂掩盖国内算力严重不足的事实。但若是站在更高处,GPU发展严重落后,终将成为杀死中国AI的一把利刃。
而在算法层面,国内AI企业也面临着极为尴尬的局面,让一群善于应用创新的企业直接去做底层创新,无异于赶鸭子上架。在国外AI企业不再开源
算法后,如何找到模型开发的创新点,才是最困难的。对于一直停留在64层的众多国内GPT模型来说,想要对标ChatGPT甚至GPT-4,无异于痴人说梦。
不可否认,应用层面的“软实力”,可以让一家AI企业快速找到盈利的目标,但在真正的国产AI战争打响之后,硬件和算法层面的“硬科技”,才是我们当前最缺乏的能力。
若只重视应用层面而忽略硬件与算法层面造出来的商业辉煌,就像井中月、水中花一般,虽然美丽,但一经波澜便稍纵即逝。也只有真正拥有算力、算法层面的能力,才是中国AI发展历程中真正的进步。
我们的算力之战和算法之战刚刚拉开序幕。
此刻,中国AI的翻身之战,需要一些真正的“硬核武器”,才能正式打响。
Copyright @ 2015-2022 快报网版权所有 备案号: 豫ICP备20009784号-11 联系邮箱:85 18 07 48 3@qq.com