财经新闻网消息:
经过一年多的“百模大战”,AI大模型自5月初以来几乎毫无征兆地掀起了“降价潮”,阿里、百度、腾讯等纷纷加入战局。“钱多、牌多、算力足”的大公司不怕价格战,用惯用的免费模式吸引用户和开发者。中小型大模型创业公司普遍还在勒紧裤腰带、苦苦打造爆款应用,不得不仓促接受挑战。
大机型价格战将“滚”向何方?在《科创板日报》的行业采访观察中,大厂商告别“烧钱创奇迹”心态,做强做实基础机型,尽快缩小与国外技术的差距;初创企业垂直纵深探索,做“精准”“前沿”的大机型行业应用,或许才是国内大机型生态可持续发展的出路。
▍算法创新与模型优化才是价格战的真正驱动力
令人想不到的是,在国内率先发动大规模模型价格战的,是一家“不专业”的量化私募巨头——欢方。
近年来,国内金融量化交易异军突起,环方通过先进的量化交易在国内市场赚得盆满钵满。尝到甜头的环方将赌注全部押在了AI驱动的量化交易上,因此斥巨资从和AMD采购了大量GPU。业内一度有传言称“环方的 H100芯片储备量比各大厂商都多”。
5月6日,魔方发布了GPT-V2,售价仅为GPT-4-Turbo的近百分之一,这是大型号降价趋势中的第一张多米诺骨牌。
5月11日,智普GLM-call个人版价格大降5倍,5月15日,字节跳动主力机型企业市场降价至0.0008元/千元。
随后,阿里统一千文、百度文心易研加入战局。阿里云统一千文9款模型降价,GPT-4级别主力模型Qwen-Long降价97%。百度智能云则直接宣布文心大模型两款主力模型ERNIE Speed和ERNIE Lite免费。
最新的是,两大模型厂商科大讯飞、腾讯也加入到“价格战”中。科大讯飞宣布,讯飞Spark API能力免费开放,讯飞Spark Pro/Max API最低至0.21元/万个。而腾讯云主力模型之一的混元-lite模型价格则由0.008元/千个调整为完全免费。
不过《科创板日报》记者采访获悉,欢方及大厂商的降价,并不完全是因为“钱太多、任性”,更多的是因为大模型推出近两年来,在算法上的革新和模型的优化上。
国内一家领先的大规模模型创业公司的负责人向科创板日报记者表示,从目前来看,算法框架创新的思路主要有两条:轻量化、线性化。他特别提到了其公司刚刚发布的千亿级参数的MoE架构模型。MoE架构基于多专家并行机制,推理时只激活部分专家,以稀疏性压缩参数数量和推理成本。“这样可以大大节省算力消耗。”
率先掀起价格战的Magic Cube-V2通过架构创新,实现了大模型成本尤其是推理成本的降低。据提供运维技术支持的AMD人员介绍,Magic Cube-V2采用稀疏MoE架构,并做出共享专家等改进,节省了42.5%的训练成本。
无问新琼创始人王宇曾用公开数据估算过算力成本的数量级,假设GPT-4 Turbo每天为10亿活跃用户提供服务,一年的算力成本可能超过2000亿,这还不包括模型训练的投入。
因此,通过算法创新、模型优化降低推理成本将成为未来人工智能应用发展的重要“驱动力”。
▍除了抢用户,还要抢“开发者”
在宣布降价时,阿里云智能集团高级副总裁、公有云业务部总裁刘伟光明确表示,“(降价)目的一定是惠及市场”,“真正加速推动市场前期爆发”。
对于此轮大机型降价,猎豹移动董事长兼CEO傅盛评论称,大机型降价的目标并不是为了直接给用户用,而是为了吸引开发者。
短期来看,大模型的性能已经到达瓶颈,“谁也走不到谁的前面,谁也搞不出杀手级的功能,降低推理成本,降低价格,成了各家公司的头等大事。”
“现在大模型APP基本都是免费的,从本质上来说,各种大模型APP的用户量并没有增加,最近有些大模型APP的推广成本特别高,ROI很难计算……我们要让更多的开发者参与进来,开发出更方便用户使用的应用。”
他还认为,大机型降价的核心原因,除了大机型厂商本身内部竞争激烈之外,也是苹果、微软、高通、联想等设备商在本土化AI算力、本土大机型投入巨资的结果。AI PC、AI Phone将成为主流,一般大机型的使用场景将受到极大限制。
对于这场混乱的价格战带来的影响,傅盛表示,这波大机型降价对企业用户影响有限,开源小参数大机型加上应用套件就能满足大部分企业的需求,虽然谁也省不下定制套件的费用,但私有化大机型的成本已经很低了。
工信部信息通信经济专家委员会委员盘和林认为,降价是为了扩大客户群,未来大机型领域竞争激烈,能存活下来的企业并不多,因此占领规模是长远考虑,目标是在大机型领域取得领先地位。
“目前中国大屏的市场空间有限,不可能所有大屏都成功。尤其是作为生态产品,大屏要么赢家通吃,要么灰溜溜退出。目前价格战的背后,是目前国内大屏应用大同小异的现状,没有一家企业做出明显的差异化,彼此差距也不大,只能打价格战。”
对于大模型行业的“降价趋势”,科尔尼咨询全球合伙人宋旭军认为,主要受到供需和成本两个因素影响。第一是供需变化,竞争加剧促使厂商主动降价抢占用户。第二是成本降低,随着算力成本的降低和模型算法的优化,模型厂商自身的成本也在下降,典型的例子就是 GPU、 TPU、华为等芯片性能的快速提升。
▍比拼技术、比拼实现、比拼解决行业痛点
阿里巴巴原副总裁贾扬清在朋友圈表达了自己的看法,“从整个AI行业来看,降价是一个简单的策略,可以随心所欲地实施,但真正的To B业务成功则比较困难。”
贾扬清现在是一位AI创始人,他引用了一位世界级咨询公司CIO的话:“今天企业使用AI,已经不是成本驱动了。”“不是API贵了没人用,而是企业要先搞清楚‘怎么用才能产生商业价值’,否则再便宜也是浪费。而今天,这一层落地是缺失的。”
他指出,过去几年,各大云厂商都被“项目制”和“咨询服务”的商业模式吓到了,但在新兴技术落地过程中,必要的咨询服务还是需要的。在贾扬清看来,“或许不是商战中赢得最便宜的办法,但却是赢得利润最切实可行的办法。”
元始智能COO罗宣对科创板日报记者表示,目前的降价、免费服务,并没有解决当前大模型落地的核心问题。关键在于模型计算效率要提高10-100倍,计算芯片特别是推理的成本要降到1/10-1/100,还有可解释性问题要解决。这三点限制了大模型的落地。“现阶段单纯降价,只是烧钱形成垄断,劣币驱逐良币。”
盘和林分析,此轮头部云厂商降价无疑将给大机型创业公司带来竞争压力。
“中小型模特企业、创业公司进入这个领域成本比较高,如果不做差异化,在规模上就没有机会。”盘和林说。
多位业内人士告诉《科创板日报》记者,AI大模型不能只拼价格,还要拼技术、拼实施、拼解决行业痛点。大公司告别“烧钱创造奇迹”心态,加强夯实基础模型,尽快缩小与国外技术的差距;创业公司则纵向深挖,做“精准”“前沿”的大模型行业应用。单纯靠降价带来的收益有限,大模型在实施、模型计算效率等方面还需要进一步提升。
值得一提的是,在被问及大模型降价对创业公司的影响时,国内AI圈两位顶级人物李开复和王小川的表述耐人寻味。
百川智能创始人王小川认为,(大的模式)如果针对的是B端企业客户,那么未来就是直接卖云服务的方式,中间的应用层会繁荣起来,会有很多新的机会。
不过王小川也认为,免费价格是优势,但不一定是竞争优势。“百川不会卷入价格战,因为To B不是公司的主要业务模式,价格战影响有限。公司会把更多的精力放在超级应用上。”
创新工场董事长、零一科技CEO李开复谈及价格战时表示,零一科技目前没有降低YI系列模型API价格的计划,并认为零一科技的性能和性价比都很高,疯狂降价是两败俱伤的局面。零一科技最新的千亿参数模型Yi-Large以总排名第七的成绩进入全球权威的LMSYS盲测竞技场排行榜。
李开复说:“我认为我们的价格是合适的,值得的。如果中国未来的竞争如此激烈,每个人都宁愿失去一切、两败俱伤,也不愿让你赢,那么我们就会去国外市场。”
相关报告
0.35 美元 vs 5 美元:硅谷巨头的代币价格战!比的不仅是“量”的价格,还有推理速度
免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.com