财经新闻网消息:
月球的暗面不再是“黑暗”的。 近日,该公司打造的大型模型应用Kimi引起了广泛关注。 Kimi的效应已经从大模特圈蔓延到资本市场,本周Kimi概念股应运而生。 用户数量激增,突然涌入的巨大流量甚至导致Kimi服务器一度崩溃。
Kimi在本轮大模型应用中取得突破。 其核心优势在于长文本阅读和解析能力。 十分巧合的是,22日晚,阿里巴巴高调宣布统一钱文将开放千万字文字能力。 当晚360紧随其后,宣布360智能大脑已正式测试500万字长文本处理功能,并将很快纳入360AI浏览器中。
据《科创板日报》报道,百度下个月还将开放200万至400万条的长文本产能。
阿里巴巴、百度等互联网巨头纷纷部署和升级其大模型产品,强化长文本处理能力,这正在引发业界重新审视长文本处理在大模型领域的必要性和重要性。 随着Kimi的崛起,大模型的讨论焦点已经从大模型本身转移到了应用端。 2024年会是AI大模型应用落地元年吗?
需要长文本吗?
与其他大型模型应用相比,Kimi的优势在于长文本分析、在线搜索、文档处理等功能。 尤其是在深度分析厚重的书籍内容方面,其表现远远超过其他模型。 3月18日,《月之暗面》甚至将无损上下文的长度一次性增加了十倍,达到200万字。
从目前的用户体验来看,Kimi并不是一个全能选手。 一些用户报告说,对于一些更困难的任务,包括结构化信息处理和图像中潦草文本的识别,Kimi 在对话连续性方面仍然表现出一些缺陷。 在生成和语音能力方面,Kimi还没有添加这些模式。
尽管如此,长文本能力的重要性是不言而喻的。 目前,针对市场上的大型模型应用,GPT--128k发布了约10万个汉字的文本范围和约16万个汉字的上下文。
某上市AI公司大模型架构业务人士告诉记者,由于模型训练结构的限制,过去大模型的文本范围不是很长,但复杂的任务和行业知识通常很长。 在这种情况下,他们只能分道扬镳。 输入问题,但这可能会导致输出结果不连贯、不合逻辑。 长文本可以用来连贯地理解整个文本的上下文,满足理解和问答的需要。 长文本能力此时就具有优势。
国内各大厂商正在长文本领域快速布局。
《科创板日报》记者从知情人士处获悉,百度下个月将升级文心一言,还将开放长文本能力,文本范围在200万到500万之间。 目前,《温馨一言》的最大文本限制为 32,000 条。
而阿里已经领先了。 22日晚,阿里巴巴统一钱文正式宣布升级,向大家免费开放千万字长文档处理功能。 用户可以通过统一钱文网站和APP快速阅读研究报告、分析财务报告、阅读科研论文、研究案例情况、阅读医学报告、解读法律条款、分析检测结果、总结深度文章。
360紧随其后,当晚宣布360智能大脑正式测试500万字长文本处理功能,并将很快纳入360AI浏览器。
Kimi率先得手,阿里巴巴、百度、360相继争夺长文。 长文本功能是否会成为未来大型机型的差异化竞争点?
上述大模型架构师表示,长文本能力的训练和效果还存在一些难点,比如如何避免丢失细节。 事实上,也可以通过RoPE等算法技术来扩展文本长度,但此时细节会严重丢失,从而导致输出结果不准确。 因此,核心标准是看输出结果的准确性和连贯性,而不是文本越长越好。
另一位大模型行业人士也告诉记者,长文字其实是大模型的基本能力。 只要算力资源充足,长文本理论上可以无限长。 “但如果使用场景根本不需要长文本,那么这个长文本就没有任何意义。”
2024年是大规模模型应用元年吗?
Kimi的火爆也在一定程度上反映了目前国内大型车型从基础设施建设到应用落地的发展阶段。 那么,2024年是否会成为AI模型大规模应用落地元年呢?
兰州科技CEO周明认为,从长远来看,人工智能正在逼近AGI。 经过近一年的发展,大模型已经能够落地,企业侧也积累了很多业务实施场景。 再加上国家政策的推动,2024年将是大车型落地元年。
灵异物联合创始人齐瑞峰也表达了类似的观点,但他关注的是B端场景。 目前,内容生成、理解、总结和对话等应用仍然占据主导地位。 但随着新一代模型推理、决策和执行能力的提升,预计AI技术将更快地植入企业业务系统,真正开启大模型的赋能。 起飞。
电子商务是人工智能应用最具代表性的领域之一。 魔发科技目前是阿里妈妈、淘宝直播生态指定的官方3D超逼真虚拟直播服务商。 旗下拥有3D虚拟人直播AIGC产品“有光”。
魔发科技CEO柴金翔在接受科创板日报记者采访时表示,电子商务是公司AI产品应用最重要的行业。 从现有使用效果来看,多家知名头部美妆品牌在使用魔发科技提供的3D虚拟人后,在午夜6小时直播时段内,累计实现了千万级的年GMV增量。 3D虚拟直播午夜超级直播广告投放量高于行业平均水平2倍以上,投资回报率5倍以上。
尽管对2024年寄予厚望,但各方仍保持谨慎乐观的态度。
齐瑞峰认为,在C端市场,目前成本还很高,商业模式还没有完全成熟。 即使对于现在能够产生收入的B端市场,周明认为,要想实现产品标准化和完整交付,培训和部署成本、行业适应性、幻象问题、数据安全等问题仍然需要解决。
梦瀚科技CTO曹俊涛在接受科创板日报记者采访时表示,虽然人工智能在电商行业的应用有巨大的想象空间,但梦澜也在通过重构业务场景GPT大型模型,包括解决模型图像生成问题。 、材质差异化、时装秀、AI创作助手、聊天室导购等问题。
“但现阶段,基础设施还不完善。” 曹俊涛告诉记者,梦凯去年为创作者搭建了AI创作平台。 虽然可以生成模型图片,但是图片渲染率不高,还需要技术升级以及内部的技术提示和算法模型调优,目前这个平台还没有开放。 “现在大家都在寻找应用场景,估计从2024年开始我们会看到更多AI和大模型带来的改变。”
据42章创始人曲凯介绍,2024年仍将是技术不断突破的一年。 大规模实施难度较大,场景较多。 不过,无论是B端还是C端,另一方面,我们预计今年会看到更多的应用开始出现。 与此同时,应用端项目今年也将更加受到投资者的青睐。
“去年大家在大模型本身上投入了大量的资金和精力,如果我们想把这个故事继续下去,就需要有一个落地,所以我们会在应用端继续探索,找到PMF(Fit,产品市场契合度)。” 曲凯说道。
相关报道
AI重磅消息!苹果盯上百度AI技术Kimi模型也受欢迎
免费开放千万字长文档功能! 阿里巴巴统一钱文基准测试 Kimi
国产大模Kimi走红!龙头企业连续3次涨停20CM 这些上市公司均与Kimi合作或参股。
免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.com