财经新闻网消息:
图片来源@视觉中国
文字| 科技新闻
经过漫长的等待和猜测,华为盘古大模型的最新进展已经悄然发布。
7月7日,华为云在年度开发者大会上隆重揭开了盘古大模型3.0的面纱。 华为常务董事、华为云CEO张平安高呼“不写诗,只做事”,正式给盘古进行模型调优。
此前,外界猜测华为的大机型可能会与锋线竞争。 在中文语言处理(NLP)大模型领域,华为可能会打造一个主要面向消费者的对话式AI聊天应用。
不过,华为内部人士很快就辟谣了。 他透露,华为官方并未提及将发布一款可以与华为相媲美的产品。 华为不会采用“盘古聊天”这样的名称,也不会“对标”任何具体产品。
上述人士还透露,华为主要从事针对行业的B端业务,因此将大模型应用到这些领域会更合适。 虽然语言处理很重要,但他承认这不是华为的强项。 如果业务不是主攻方向,华为现阶段可能会暂时暂停研发,将更多精力放在保证公司的生存和发展上。
从这次会议的内容来看,确实如此。 华为已经明确将盘古模型定位为面向各行各业的B端产品。 他们试图通过投资大模型的能力来赋能各个行业。
又一行业大典范
据4月8日人工智能大型模型技术高峰论坛显示,盘古大型模型并未突破预期。
在该次论坛上,华为云人工智能领域首席科学家田奇出席并详细介绍了华为云盘古模型的发展过程及其在实践中的应用。 因此,本次华为云发布会的内容实际上是之前信息的延伸。
在前述论坛中,田奇首次提出了类似自动驾驶的分类方法,将大模型的发展阶段划分为“L0到L2”,分别对应基础通用模型、行业模型和细分场景任务。 具体型号。
这就是华为盘古大模型3.0的核心理念,即通过三级模型设计,实现大模型在各行业的应用。
具体来说,一楼L0就是盘古地基的大型模型所在的地方。 这一层有五个技术领域的大模型,分别是NLP(自然语言处理)大模型、CV(机器视觉)大模型、多模态大模型、预测大模型和科学计算大模型。
第二层L1,侧重于大行业模型的构建。 华为为行业客户提供基于公共领域行业数据训练的全行业大模型。 此外,我们还协助客户利用自己的数据来训练行业大模型,从而形成自己的大模型。
第三层L2,关注更垂直的细分领域,专注于解决某个细分领域的应用问题,这往往需要大模型和深度技术的紧密结合。 在这个层面上,华为为客户提供开箱即用的大规模模型服务,并致力于解决更深入的技术问题。
发布大型模型产品对于行业来说并不是什么新鲜事。 对此,田奇指出,行业大量业务场景迫切需要更专业的大规模模型和专业的AI应用来解决问题,从而填补通用大规模模型在行业中的短板。行业。
他认为,通用大模型应用于行业时,面临专业、技能、数据安全合规三个方面的挑战。
首先,通用大模型虽然应用范围广泛,但在专业性方面相对较弱,需要行业专业知识才能给出专业、准确的答案。 其次,通用大模型虽然知识基础广泛,但缺乏技能,企业场景的复杂性要求模型具备多种技能。 最后,数据安全和合规性也是一个重大挑战。 数据是企业的核心资产之一。 因此,在训练和使用大型模型时,必须保证数据的安全性和合规性。
为了解决这些挑战,华为云根据实践经验构建了分层、解耦的大规模模型架构,也就是前面提到的三层结构,以加速大规模模型在各行业的应用。
至于如何将基础模型细化为大的行业模型,田奇介绍了华为的四项关键举措:积累行业知识、提炼行业技能、与专业工具对话、确保安全合规。
另一方面,计算能力是构建大型模型的核心。 会上,华为云正式发布华为 AI云服务。 该服务基于单集群2000P Flops算力,在华为云乌兰察布、贵安AI算力中心同步上线。
华为基于鲲鹏和升腾构建了AI算力云平台,包括升腾的计算引擎CANN、AI框架、AI开发平台,形成大模型的解决方案。
为什么没有C端市场?
华为在大机型领域已经有数年的积累。
从2020年11月的盘古项目开始,到2021年4月发布的盘古NLP大模型、盘古视觉大模型、盘古科学计算大模型,到现在的盘古3.0。 华为在人工智能方面的深入研发和实际应用已逐步显露出来,但核心策略更倾向于服务B端市场而非C端市场。
从本次发布会来看,盘古大模型主要由L0层的5个模型组成,分别是CV、NLP、多模态、科学计算、预测。 但这五个方向的发展成熟度却完全不同。
显然, Large Model的服务更侧重于B端客户,尤其是更加成熟的CV领域。 这从两次会议上对CV大模型的关注程度就可以看出。 至于类似备受业界关注的大型NLP模型,华为发布的相关细节相对较少。
对此,张平安表示,全球已发布数百款大型模型,国内已发布80余款,To C应用百花齐放。 很多To C大尺度模特都能写诗、画画。 华为盘古大型模型不会写诗,只会做事。 他们致力于深化行业,为行业带来价值。
这些言论看似贬低了代表性语言模型,但也暴露了华为盘古模型在应用广度和丰富度上可能存在的缺陷。
业内人士表示,华为在NLP领域还比较薄弱,其生成性最多只能应用在一些封闭场景的客户服务上。 语义理解可以应用于舆情控制、法律司法文件的理解、审计文件的理解等。 在可输出性和内容生成方面,盘古模式之前并没有将其作为发展重点。
客观地说,这其实和应用场景有关。 NLP大模型的应用场景主要是自然语言、智慧旅游、金融领域。 CV大模型的应用场景主要是机器视觉,比如交通行业的高速检测; 电力行业日常巡检,设备缺陷识别; 制造中的缺陷识别等
华为能找到的高价值数字赋能场景主要是基于视觉的,所以这也是为什么盘古模型更多的研发项目主要集中在这个领域。 但NLP的实力并不强,主要是缺乏业务驱动。 华为在开始发展AI时并没有把重点放在C端。
此外,这也与企业独特的基因生态结构密切相关。
华为、腾讯、百度等大型先行者虽然在战略构建和商业模式实施的实施上有一些相似之处,但真正区别开来的核心还是在于各自的生态系统。
作为互联网巨头,百度和腾讯凭借其广泛的C端用户业务网络所拥有的丰富业务,例如百度深入的搜索引擎业务以及腾讯在社交网络、视频游戏和营销领域的强大阵容。 在产品系列中获得超越竞争对手的显着优势。
华为对B端行业的深入理解领先于两者。 盘古模式已经在很多行业得到应用,所以主要关注点更多在B端市场。
“不写诗,只做事”的局限性
“不写诗,只做事”的“行业优先”策略满足了一部分市场需求——为特定行业解决特定问题。 但需要深思的是,当华为只专注于行业的AI应用时,可能会失去更广泛领域的发展机会。
事实上,AI技术的潜在应用价值远远超出了我们现在看到的“做事”。 如果人工智能的应用范围仅限于特定行业,这种偏见可能会限制在其他领域寻找人工智能的价值。
以诗歌创作为例,人工智能诗歌创作不仅是艺术领域的创新形式,也是技术的展示。 这样,AI的学习能力、自然语言处理能力等各种能力就可以向公众展示。 这不仅将拓宽人工智能的应用领域,也将吸引更多公众对人工智能技术的关注和了解。
此外,人工智能的创新与实际应用并不冲突,反而可能相互促进、相辅相成。 艺术与技术的融合长期以来一直是推动创新的重要力量,其中包括图像识别和自然语言处理等技术。 通过将人工智能运用到艺术创作中,可以更深入地理解和优化这些基础技术,从而提高人工智能在实际应用中的效果。
例如,这样一个大型模型凭借其强大的语义理解和推理能力,以及提供个性化和情境化响应的能力,受到了广泛的关注和讨论。 这种强大的自然语言处理能力使得AI模型不仅能够在行业任务中发挥价值,还能在C端市场提供更加人性化、有趣、富有创意的服务。
事实上,C端市场对于AI模型的发展至关重要。 很多创新技术和产品往往先在C端市场被接受和普及,然后逐渐渗透到B端市场。 因此,大型模型产品如果只注重行业应用,可能会错失与C端市场建立更深层次连接、提供更加个性化、情境化体验的机会。
华为本身就是一个很好的例子。 虽然华为之前的产品已经在一些B端企业使用,影响力并不大,但通过人气的爆发,已经家喻户晓。
随着AI技术的不断发展和普及,越来越多的普通消费者开始接触和使用AI产品。 在此背景下,那些具有良好用户体验和人性化交互能力的产品将拥有更大的市场需求和发展空间。
总的来说,如果华为的盘古模式只注重“低着头做事”,也可能在一定程度上忽视了人工智能的普适性、创新性和人性化。 一个优秀的AI模型不仅能“做事”,还能“作诗”,从而实现真正的均衡全面发展。
免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.com