财经新闻网消息:
呼唤已久,终于“新”了。
北京时间5月14日凌晨1点,直播发布了产品更新。 在半个小时的线上会议上,Mira首席技术官Mira 宣布了对GPT-4的一系列升级。 会议主要亮点如下:
推出了新型号GPT-4o,其中“o”代表“omni”(全面、无所不能)。 同时,GPT-4o是免费的,并向所有用户开放。
新模型具有强大的多模态交互能力。 在发布会演示中,GPT-4o具备文字、图片、视频和语音的能力,可以流畅流畅地与人类沟通,理解屏幕信息。
桌面应用程序已经发布,目前可用于 macOS,并将于今年晚些时候推出版本。
AI助手初具规模
发布会前,记者注意到,官网对GPT-4的描述已由“最先进型号”改为“最先进型号”,为GPT-4o的发布提前做好准备。
作为目前最先进的模型,GPT-4o 的特殊之处在于它可以接受文本、音频和图像的任意组合作为输入,并以上述方式生成内容。 这意味着GPT-4o已经具备了AI助手的基本雏形,在通用人工智能的道路上又向前迈进了一步。
发布会上,与前沿研究负责人Mark Chen、后培训团队负责人Zoph一起演示了实时语音对话功能。 从示范效果来看,GPT-4o与人类的互动变得更加及时、自然。 据介绍,GPT-4o可以在232毫秒内响应音频输入,这接近人类对话的反应时间。 在此之前,使用语音模式与用户通信,平均延迟为2.8秒(GPT-3.5)和5.4秒(GPT-4)。 GPT-4o不仅可以实时响应对话,不会出现令人尴尬的长时间延迟,还可以生成具有多种不同情感风格的语音。
例如,当被问到“你好吗?”时,GPT-4o 除了说“我很好”之外,还问“你好吗?” 当“被要求讲一个关于机器人和爱情的睡前故事”时,GPT-4o开始讲话后,他被打断,并被要求以更加情感和戏剧性的方式讲述这个故事。 后来,GPT-4o讲故事时的声音和语调变得更加起伏,更加情绪化,甚至唱歌。 结束谈话。
从此,父母哄孩子入睡变得如此容易。
不仅如此,GPT-4o还具有视觉+语音交互功能,可以查看图解方程。 Zoph打开手机视频通话,对GPT-4o说道:“我要在一张纸上写下一个线性方程,不要告诉我答案,只给我求解的过程。” 然后,Zoph写下3x+1=4的方程询问如何解决这个问题。 GPT-4o利用贴心的提示,在Zoph寻求帮助和提问时不断给出下一步的建议,从而得到x=1的正确结果。
从此以后,父母辅导孩子做作业变得更加容易了。
此外,GPT-4o可以实时读取屏幕信息,帮助回答代码问题和分析图表; 它可以跨语言实时翻译。 当说话者用意大利语和英语说话时,它会立即翻译成相应的语言,并且还可以模仿说话者的语气; 能够识别和分析人类的情绪。 当演讲者展示一张自拍照并要求他判断自己的情绪时,GPT-4o 分析道,“你看起来很高兴,也许有点兴奋,你的心情应该很好。” 好的。”
尽管首席执行官萨姆·奥尔特曼没有出席发布会,但他在个人社交平台上实时报道了最新动态。 发布会结束后,他发了一条动态,只写了“她”两个字。 据外媒此前报道,奥特曼曾表示,他最喜欢的人工智能电影是《她》,他的最终目标是开发一款与电影中类似的虚拟AI助手,并力争将现有的语音助手如Apple 的 Siri 助手变得更有用、更智能。
“斩断”谷歌向苹果示好
早在一周前,就有不少新品发布的消息传出。 有消息称GPT-5即将发布,也有消息称基于GPT-5的AI搜索引擎即将发布,向发起冲击。 5月11日,奥特曼在个人社交平台上否认了上述传闻,称:“它不是GPT-5,也不是搜索引擎,但我们一直在努力开发一些我们认为人们会喜欢的新东西!感觉对我来说就像魔法一样!”
值得注意的是,谷歌将于5月14日召开I/O开发者大会,宣布、谷歌搜索等方面的更新。 选择在I/O开发者大会前一天举行发布会,无疑是不想让谷歌抢了风头。 这并不是第一次发生这种情况。 今年2月16日,索拉·文森特视频模型在没有任何预热的情况下发布,引起了全世界的关注。 当时谷歌刚刚升级了Pro大型机型,却被Sora的受欢迎程度盖过了风头。
如今再次宣战,压力直接落在了即将正面迎战的谷歌身上。 华孚证券研报显示,海外主流AI大模型中,访问总量仍位居第一。 在其他大型模型中,访问量. 环比下降1.4%。 可见,谷歌在大机型的竞争中面临着越来越激烈的竞争。
相比之下,本次新品发布会的幕后赢家无疑是苹果。 记者注意到,整个发布会都是以Pro和Mac桌面版本进行,这似乎暗示他们将与苹果合作,将大型机型集成到苹果设备中。
事实上,从之前的一些动作和媒体新闻中就已经看到了这次合作的端倪。 据彭博社 5 月 10 日报道,苹果公司正在与苹果公司进行谈判敲定协议,并计划今年在中国引入大型模型技术。 通过这笔交易,苹果将能够提供由苹果提供支持的“聊天机器人”,作为 iOS 18 中人工智能功能的一部分。不过,报道还指出,苹果也一直在与谷歌就授权聊天机器人进行谈判,但尚未达成一致。达成协议。
近日,奥特曼参加播客《All-in》,在节目中他谈到了人工智能的诸多热点和方向。 他表示,将继续提高语音功能的质量,并“相信语音交互可能是未来交互方式的重要线索”。 当主持人问他是否与 Jony Ive(“神父”,苹果前首席设计师)合作过时, 也表示,“是的,我们正在交换一些想法。”
今年2月,苹果CEO蒂姆·库克透露,公司正在开发生成式AI软件功能,并将在iOS 18中引入大语言模型支持的新Siri功能,但没有提及是否会与苹果有任何合作。 。 据悉,苹果将于 6 月举办 WWDC 全球开发者大会,展示 iOS、macOS、tvOS 和 Apple 的前沿创新。
分析人士认为,如果苹果能够与苹果合作,不仅可以缩短产品研发周期,还可以快速提升自家产品的智能化水平。 在生成式AI时代落后太远的苹果能否通过将全球领先的大型模型融入到自己的硬件中来打好“翻身仗”,答案或许也将在6月份揭晓。
免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.com