财经新闻网消息:
推出了一项新技术,发布了大型视频模型Sora,它已经发展到可以通过文字描述直接生成高度逼真的视频,而不仅仅是动画。
可以说,空一出道就是王者。 它可以根据用户的一句话生成一分钟的视频,视频的流畅度和稳定性都在标准之上。
目前官网已更新48个视频演示。 在这些演示中,Sora不仅可以准确地呈现细节,还可以理解物理世界中物体的存在并生成情感丰富的角色。 该模型还可以根据提示、静态图像生成视频,甚至填充现有视频中缺失的帧。
Gen 2和Pika等AI视频工具仍在几秒钟内突破连续性,并且已经达到了史诗般的记录。
与AI Video、Pika、Meta等主流播放器相比,Sora的特点是:
1. 能够生成具有多个角色、特定类型的动作和主题背景的复杂视频,长度最多1分钟。
2. 可以在单个生成的视频中创建多个镜头,模拟复杂的摄像机运动,同时准确保持角色和视觉风格。
3. 最重要的是,它不仅能理解用户在提示中要求的内容,还能自行理解这些东西在现实世界中是如何存在的。
周四,首席执行官 (Sam)要求 X 网站上的平台用户提交他们想要给 Sora 的文字描述。 然后他分享了索拉根据这些描述生成的视频。
“我们想向您展示 Sora 的能力,”他在 X 上写道。“如果您的要求太详细或太困难,请不要担心!”
有人要求“一段海上自行车比赛的视频,其中各种动物作为运动员骑自行车,使用无人机视角。” 奥特曼的回应是发布了一段由 Sora 生成的企鹅、海豚和其他水生生物骑自行车的视频。
另一段视频显示,一位穿着围裙、微笑的白发女子邀请观众进入她的厨房。 索拉在有人向奥特曼索要一段视频,内容是“由一位祖母般的影响者主持的自制面疙瘩烹饪课程,以质朴的托斯卡纳乡村厨房为背景,配有电影灯光”后,索拉产生了这个视频。 人工智能视频。
网友直言要失业了!
甚至有人开始“哀悼”整个行业!
Sora目前的弱点
也不能回避 Sora 目前的弱点:该模型可能在准确性方面存在困难,并且可能无法理解因果关系的具体实例。
例如,“五只灰太狼幼崽在一条偏僻的碎石路上互相追逐玩耍。” 狼的数量会发生变化,有的会凭空出现或消失。
该模型还可能混淆线索的空间细节,例如左和右,并且可能难以准确地描述随时间变化的事件,例如遵循特定的相机轨迹。
例如,在提示词“篮球穿过篮筐并爆炸”中,篮球没有被篮筐正确挡住。
现在,Sora 正在向选定的成员开放,以评估关键领域的潜在危险或风险。
表示该技术还存在一些缺陷,包括一些空间问题。
该公司表示,它意识到 Sora 有可能制造错误信息和仇恨内容等。 研究人员表示,人工智能驱动的深度造假已经成为一种风险,可能会在 2024 年总统选举之前让公众感到困惑。
选择测试 Sora 被滥用方式的专家组将提供有关如何加强系统保护的反馈。
该公司表示:“我们还在开发工具来帮助检测误导性内容,例如可以判断 Sora 何时生成视频的检测分类器。”
免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.com