财经新闻网消息:
大模型的本质是情报的大规模集中供给
生成式人工智能在很多方面与传统人工智能不同。 一方面,顾名思义,生成式人工智能擅长生成新内容,而传统人工智能仅限于解释现有数据或做出预测。 投资机构a16z认为:“微芯片将计算的边际成本降至零,互联网将发行的边际成本降至零,大型模型将创造的边际成本降至零。” 另一方面,人们基于自然语言的计算机交互界面,生成式人工智能具有技术民主化的特征。 正如麦肯锡的 Lee 所说:“用户不需要任何数据科学或机器学习专业知识即可有效利用生成式人工智能来完成工作。 这就像大型机被技术专家使用,而个人电脑被每个人使用。” 掌握。”
不过,本文强调的是生成式AI能够灵活应对各种非预设任务的能力,这与传统AI需要根据预设任务进行专门设计不同。 要理解这一点,请考虑一下传统人工智能公司面临的商业模式困境。 以AI四小龙为代表的“传统”AI企业虽然在技术上投入巨资,但无法摆脱为企业客户提供定制化服务的低扩展模式。 这是因为为了将AI算法与特定的任务场景相匹配,技术供应商必须提供大量低自动化的工程服务,这既降低了利润率,又降低了可扩展性。 相比之下,经历过的人很容易同意大型模型就像百科全书一样,可以轻松应对几乎所有领域。 虽然模型在专业领域需要“微调”,但正如“微调”二字所暗示的那样,定制化程度远低于传统AI项目,这表明经济效益更好。
能力多功能性与另外两个经济属性一起实现了大模型的基础设施地位。 一方面,大型模型具有规模经济。 众所周知,极其昂贵的训练成本是大型模型多功能性所付出的代价。 其规模经济性体现在模型参数规模超过某一临界值后,其智能性能随参数规模非线性增长。 作为这条定律的提出者和坚定信仰者,我在扩大模型参数规模的道路上盲目奔跑。 另一方面,大型模型是生成式的()。 大型模型提供商本身并不能完全实现其价值,但各种针对真实用例的应用可以在其上“生长”,从而实现难以估量的长尾价值。
大模型的本质是情报的集中供给。 作为基础设施,“集中供应”并不新鲜。 新鲜的是“智能集中供给”。 我们需要区分基础设施的智能和智能的基础设施。 智能手机、智能网络、智慧城市、智能电网等词语描述了给定基础设施的智能化,指的是异构基础设施(手机、网络、城市、电网等)的个性化调度和规模经济的外部性。 )多元化发展。 情报的基础设施是指情报的生产和供给本身就具有基础设施属性。
智力似乎与聪明、不可复制和富有创造力的大脑有着天然的联系。 如何以基础设施为基础? 如果它真的是基础设施的话,这意味着什么? 虽然这在人类历史上似乎是第一次,但历史告诉我们,基础设施集中化的每一次过程都深刻地影响了当时的生产力和生产关系。 正如电力的集中生产和大规模供应推动了第二次工业革命,智能的大规模集中供应有望将数字时代推向新的高潮。
大模型促进数据与智能解耦
作者将这一新高潮命名为“大智能时代”,以区别于大数据时代。 在大数据时代,投资者通常会问企业,你有数据吗? 即使有些人意识到拥有数据的公司不一定能够获得其价值,但几乎所有人都同意,如果没有数据,他们就无法从情报中受益。 基于数据和智能紧密耦合的商业思维深刻影响着商业实践。 相关概念包括曾鸣教授提出的“数据智能”、源自亚马逊飞轮效应的“数据飞轮”、移植自平台经济学的“数据网络效应”等。
这些概念经常被引用作为例子。 我们经常被美国反垄断机构约谈的原因之一就是所谓的数据网络效应:搜索引擎的市场份额越大,它拥有的用户数据就越多,由数据训练的机器算法变得越来越智能,从而进一步改善其用户体验,从而获得更大的市场份额。 基于阿里巴巴的类似经验,曾鸣教授提炼出基于“数据智能”的“智慧商业”方法论。
首席经济学家哈尔认为,中国的地位并非来自于数据资源本身,而应归功于其优秀的数据科学和工程能力,更好地释放了数据资源的价值。 能力优势和数据网络效应都能带来竞争优势和份额,但前者是稀缺性创造的李嘉图租金,后者是市场地位创造的垄断租金。 他的潜台词是,你无法培养出优秀的能力是你的事,所以不要给我贴上垄断的标签。 很多人可能会嗤之以鼻,认为哈尔的屁股决定了他的脑袋。 但他的迅速崛起表明他可能是对的。 搜索面临的挑战并不依赖于数据优势。 GPT3.0之前的所有训练数据都将公开,但这并不妨碍其在大模型能力方面处于领先地位,并威胁到其搜索业务。
真正重要的不是比较它有多强大,而是它有多强大,可以提供给外界使用,而不是像那样专门用于自己的服务。 当然,这方面更厉害的是Meta(即),它开源了模型的参数,并且免费支持商业使用。 大型模型就像一个中央发电厂。 它不断提炼几乎所有的人类知识(数据),然后输出给公众,从而使智能不需要在低水平上重复开发。 这挑战了大数据时代“没有数据就没有智能”的常态——企业的智能业务并不一定需要整合自身的数据。 基于大模型的底层参数,企业只需要小数据对模型进行微调,就可以开展“智能业务”。
值得强调的是,“数据与智能脱钩”并不意味着数据不重要,而是数据的重要性在行业的不同方面分布并不均匀。 数据作为智能原材料的地位是不可动摇的。 变化在于,大型模型在使用这种原材料方面比其他模型效率更高,因此渴望“智能业务”的公司可能会在构建自己的数据飞轮时失去经济性。 数据飞轮或数据网络效应的逻辑仍然成立,但问题是:当所有公司都试图旋转自己的数据飞轮时,为什么你脱颖而出? 当国家电网能够稳定输出电力的时候,为什么还要在工厂旁边建一个小发电厂呢? 当然可能需要备份或补充,但那是另一个逻辑。
释放智慧红利,驱动经济结构性增长
数据与智能解耦带来的经济效益,就是我所说的智能红利。 强调创造内容的边际成本为0,这对消费者来说是一个红利。 通过对比传统的内容创作流程和基于生成式AI的内容创作流程就不难理解了。 然而,经济的发展主要取决于企业生产力的提高。 智慧红利体现在这一方面:企业本来需要精心构建和维护自己的数据供应链,以实现“智慧商业”所需的“数据智能”,但大规模集中供应情报可能会大大节省投资这个过程中需要的。 、时间和精力,让企业能够专注于业务创新。
上述智能红利是推动数字经济结构性增长的有力工具。 中国经济发展面临诸多挑战,区域和行业发展不平衡的结构性潜力是经济持续增长的潜在源泉之一。 众所周知,小微企业受制于IT基础设施相对落后、数据基础薄弱、预算有限,数字化转型进程落后于大中型企业。 那么,要实现数字经济的结构性增长,就需要思考如何弥合企业侧的数字鸿沟。
与其他数字技术相比,生成式人工智能在实现这一目标方面具有独特的优势。 一方面,生成式AI应用对企业自身的数字化准备度要求相对较低。 消费者能用,小微企业为何不能? 另一方面,在采用生成式人工智能应用方面,小微企业具有“赤脚不怕穿鞋”的优势。 许多阻碍大中型企业采用生成式人工智能的因素(例如数据泄露)可能对小微企业影响不大。 而且,大中型企业需要解决新旧IT融合的问题,而小微企业则没有这个负担。 总之,智慧红利并非大中型企业的专属,而是小微企业站在智慧同一起跑线上的历史性机遇。
有两种方法可以访问生成式人工智能应用程序。 首先,企业先微调自己独特的大模型,然后在私有或混合环境中赋能自己的各种应用; 其次,他们直接使用现有大型模型提供商的API(例如基于GPT)来开发生成式AI。 应用程序,供您自己使用或作为服务出售给客户。 两者都受益于智力的集中供给,但小微企业更容易通过后者获得智力红利,这也蕴藏着应用开发者的创业机会。
结论
生成式人工智能和大型模型的诞生纯属偶然。 它就像一颗从天而降的陨石,无理地改变了原有的产业结构和历史文脉。 作为数字行业的参与者、观察者和研究者,作者勾勒出一种变革的可能性。 遵循这个逻辑,我们可以对当前的一些热点话题得出不同的看法,这将在后面讨论。
免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.com