在电脑刚刚诞生时,IBM总裁曾预测全世界只需要5台计算机。他所指的并非你我家中都有的电脑盒子,而是整个互联网,也就是云。以现在大模型的角度来看,各种云层出不穷,但全球确实在向“5朵云”靠拢,因此,整个行业都在大胆预测,也许十年后,全球就只剩下5个大模型。
训练大模型的各种超级计算机是不折不扣的“吞电兽”,耗费的电能可以达到兆瓦级,此外,它也需要投入大量的资金和人力资源,正如行业中流行一句话“人工智能每收获1块钱投资,就有6毛钱流向了大模型”,这样的类比并不夸张。所以,在能源有限的前提下,产业逐渐集中化会是必然的趋势。
大模型的风,在中国吹了将近一年。截至2023年10月,我国拥有10亿参数规模以上大模型的厂商及高校院所达到了254家,这其中既有通用大模型(AGI),也有垂直大模型。换句话说,就是每隔几天,国内就会官宣一个新的大模型。
随着“百模大战”的号角响起,大模型的混战走到后半场。在寻求更多智能与商业化的路上,行业过滤分层会更为剧烈,泥沙俱下,只有手握硬核实力和资源的企业才会活下去。最终,大模型究竟要实现何种价值,在实现价值之前,我们要突破哪些困难?
大模型的另一片蓝海复盘最近一年,大模型的热点已经换了三次了。
起初,ChatGPT证明了大模型的能力,彼时行业人士提出,未来AI大模型的能力会像水电一样,随取随用。同时,也有人提出,大模型会成为未来互联网竞争的门槛。打个比方来说,大模型之于AI行业,犹如操作系统之于互联网产业,是不折不扣的“基础设施”,无论是短期红利还是长期前景,其全新的交互形式都会掀起一次新的生产力革命。
而后,面对“谁会为闲聊的玩具买单”这样的灵魂拷问,行业掀起了垂直大模型的热潮。彼时行业认识到,过热的大模型赛道虹吸了过多本该投放于应用层的资源,“重复造轮子”的问题拖累了应用层的木桶板。因此,大模型发展主线变成了两条,一条依然面向to C,另一条则聚焦to B,实现更多商业化落地。
最近一两个月,自从GPTs问世,更智能成为国内新风向。简单解释,就是让大模型更懂人类,不只是在提出请求时才作出反应,而是能够主动提出建议。比如,当你想要旅行,它会知道你喜欢什么样的目的地,会为你推荐兴趣活动,为你预订喜爱的餐厅。就像《钢铁侠》中的贾维斯,或是《星际穿越》中的塔斯机器人,只要动动嘴说出需求,它们就能理解你的意图,从而自动操作。这些功能需要更大算力支撑,此时,算力就成了竞争关键。
将近一年时间,此时此刻,对国产大模型来说,绝非能不能做出来大模型的问题,无论大模型如何变迁,任何玩家都有一个共同的课题,那就是落地,行业交出的答案就是更快地理解to B行业,使能垂直领域创新。
而这正与互联网产业所追求的类似。将近30多年发展里,中国互联网在个人领域的渗透率已经超九成,这意味着消费互联网日益接近流量天花板。随着红利空间减缓,互联网行业的航线正从to C驶向to B,即产业互联网。
最近,多家互联网公司密集发布面向行业的新品。比如,美图去年就面向工作场景推出ToB产品,今年3月又与华为云共创,上线AI模特试衣SaaS应用。汽车之家开发了基于全链路智能营销的 AIGC 模型,覆盖了文案策划、创意视频内容定制等营销环节,可以帮助车企降本增效,带来更高的销售转化率。
为了提升在生产、销售等环节的效益,越来越多的企业产生了数字化转型升级的需求,产业互联网行业迎来了较为明确的发展机遇。
在云计算、大数据、大模型技术浪潮下,互联网正加速获取产业能力。这意味着,大模型与产业互联网正在双向奔赴:对大模型来说,产业互联网将会是新蓝海、新机遇;而对互联网企业来说,大模型能够为自己拓展产业边界,拥有新浪潮带来的第二增长曲线。
诚然,互利共赢的时代已至,但在此之前,对于绝大多数的互联网企业来说,想要利用大模型实现一次成功的产业升级,必然会面临算力与能力两方面的关键资源的约束。
算力之困,大模型何解互联网企业选择大模型合作伙伴之时,首要考虑的因素是算力。
大模型本身就是巨量参数“力大砖飞”的结晶,也就是说大模型与大算力密不可分。
发展到今天,国内的大模型在对话层面,已经与GPT-3.5接近,但在复杂指令层面与GPT-3.5或是GPT-4有着很大的差距。专家们预测,明年二季度末或三季度初,国内会涌现一批能力逼近GPT-4的大模型,届时中国不必再跟着OpenAI和谷歌的路径行走,而创造中国独特的打法。
向上升级就意味着也要有相匹配的算力,正如AI行业2012年至2023年算力需求翻了数十万倍一般,以GPU(图形处理器)为核心的AI芯片掌握着大模型企业的发展命脉。如果没有坚实的算力底座,无论是大模型发展,还是产业互联网升级,都会变为空谈。
但与之相悖的是,此时此刻,国内厂商提升算力拥有重重阻碍。即便不关注大模型的人,都对“算力缺乏”有所耳闻,你我都知道,供不应求意味着抢单和涨价。这意味着,本就有大批企业并无过多财力购买上千甚至上万张GPU,进一步用高价换取算力,最终分摊到下游客户身上的成本,一定会影响客户对于大模型产品的选择。
不止如此,受制于复杂国际环境博弈影响,英伟达GPU一卡难求,高端AI芯片进一步受限。国内厂商的 “算力焦虑”一时难解,成为横亘在产业互联网升级间的一座大山。
华为是国内最早布局大模型的云服务商之一,早在 2021年就已经发布了盘古大模型,今年7月份发布盘古大模型3.0。其核心关注点之一就是算力,算力强则底座强,只有大模型的底座站稳脚跟,才能支撑中国人工智能事业的发展。
而华为云在9月正式上线昇腾AI云服务,让企业一键接入即可获取AI算力。华为云已布局贵安、乌兰察布、芜湖3大主节点及30多分节点,让AI算力即开即用。同时,它支持超过10万卡大规模集群,支持超大规模训练,广泛兼容业界AI框架,满足用户开发偏好。
这意味着,企业无需单靠“买卡”这一条路,也不用担心算力可持续的问题,澎湃AI算力在云上即开即用。
得技术者强,得产业者胜互联网企业选择大模型布局时,首先考虑的因素是技术能力。
互联网向产业升级,是技术的升级变革,更是更深层次的业务变革与商业变革。与烧钱就能快速做大规模的消费互联网不同,产业互联网更趋向”理性”,更强调价值,而非规模。
在转型过程中,流量为先的互联网产品思维不再适用,而是要综合技术能力、行业理解、商业模式升级、安全合规为一体,换句话说,就是既要技术能力强,又要懂行业。
反观当前中国互联网研发投入不足,缺乏具有自主知识产权的核心技术,相比国际领先企业,中国互联网企业技术创新能力和速度仍有差距,产品和服务同质化现象严重。
为助力互联网企业迈向产业智能化,华为云凝练了2大支撑、4大能力,为互联网企业提供一整套可行、可靠的解决方案。
具体而言,2大底座是昇腾AI云服务和盘古大模型,前者为互联网企业提供随取随用的AI算力,后者提供了超过100种技能,或超过100个的主流开源大模型,既可以直接拿来使用,也可以根据企业的个性化需求,快速训练出专属模型。
4大能力则聚焦互联网面向产业升级的业务侧需求,包括:第一,坚持技术创新,基于数智化能力和大模型行业能力,助力互联网持续技术创新,用AI重塑千行百业;第二,弥补能力鸿沟,华为云以丰富行业经验,赋能互联网更快理解to B行业,帮助互联网企业快速进入新行业;第三,重塑产业生态,依托华为全球产业生态资源,助力互联网深入产业链上下游,激发企业商业模式创新;第四,跨越区域边界,共建产业出海圈,让中国科技服务全球市场。
华为云的上述能力,来源于三方面的积累和建设。
首先在于生态。大模型发展需要融合产业力量,与厂商一同前行,华为云通过开源,正在打造一个开放的生态,形成公共联合体和商业闭环,加快软、硬、边、端、云等全面融合。目前,昇腾AI云服务已与行业头部客户联创20多个行业大模型,打造了专属的模型社区,与此同时,鲲鹏、昇腾生态已汇聚超过440万开发者,合作伙伴逾6000家,解决方案认证超17000个,并建设72个产教融合人才基地,持续携手业界伙伴打造坚实的算力底座
其次在于服务需求。大模型做好落地,需要从具体行业场景与业务场景找痛点,与技术相结合。目前,华为云已成立多模态人工智能产业联合体、智能遥感开源生态联合体和智能流体力学产业联合体,未来还计划在智慧育种、AI生物制药等领域牵引成立联合体,促进大模型产业聚合发展。
最后在于出海。任何技术发展都不是封锁的,要与世界有链接。华为云依托华为20多年全球化经验优势,提供全球一张网、安全合规、本地运营、流量聚合、跨境独立站等服务能力,让企业出海更稳健。截至目前,华为云已帮助4000+客户成功出海。
当前,伴随更多互联网企业深入产业,互联网企业从“比流量”、“比用户量”的“野蛮增长阶段”进入到“比实力”、“比耐力”、“比竞争力”的新时期。新时期下,华为云会是互联网产业升级的最佳伙伴,从华为云公布的数字中也可以窥见这一点,目前,中国已有90%的互联网企业选择了华为云。
走向产业不是单打独斗,大模型为互联网提供了全新的工具,而互联网向产业转型升级的过程中,安全可靠的生态构建也是必经之路。
来源:虎嗅APP 作者:莫桑
评论