财经新闻网消息:
事实上,在Sora出现之前,还有其他类似的AI视频模型。 例如,谷歌去年12月21日发布了新的视频生成模型,可以进行包括文本转视频、图像转视频、视频风格化等操作。Meta有一个模型叫Emu。 一夜爆红的文森特视频软件Pika也掀起了AI视频应用的热潮。
浙商证券认为,短期内,Sora及同类产品可显着提升图像和短视频的生产效率,改变创意生产和营销工作流程,提高短视频产品的生产力。 对于更复杂的长视频和游戏,它们受限于模型目前无法完全理解因果关系等技术困难。 现阶段可能主要是提供艺术灵感支持。 中长期来看,Sora及同类产品将参与改变信息生产和传播两大方面的过程。 PGC(专业制作内容)将广泛使用AI工具辅助制作,UGC(用户生成内容)将逐渐被AI工具取代。 PGC。 在此期间,AI生成视频工具的商业化将加速。 目前,Sora尚未公布其收费标准。 参考以往文森特视频工具的收费情况,定价相对较高。 鉴于Sora采用的世界模拟器技术路径,边际成本可能会降低。
从相关受益细分行业来看,浙商证券列出的下游应用包括但不限于视频美化、广告营销、短剧、游戏、办公软件等。 具体投资标的,建议关注美图公司(大视觉模型+大DAU形象应用)、中文在线(海外短剧+IP)、阅文集团(IP)、金山、三星等; 从上游需求的增加来看,建议关注等算法和算力指标。
东方证券早前的一份报告认为,从技术突破的角度来看,下一阶段的重点进攻方向必然是多模态技术。 只有能够真正处理和应用多模态AI能力,才能真正突破物理世界与数字世界的壁垒,用最基本的感知世界的能力直接生成操作,实现最自然的交互与物质世界。 因此,多模态应用场景仍需不断探索。 AI视频生成只是多模态技术路径中的一个小方向,多模态领域的时刻还没有到来。
东方证券建议关注海康威视、大华科技、萤石网络、中科创达、虹软科技、科大讯飞、万兴科技等公司。
中泰证券研报指出,跨代文森视频机型有望进一步拉动硬件需求。 Sora根据图片生成长视频,然后生成视频。 与文本和图片模型的推理相比,所需的令牌(文本处理的最小单位)数量预计会增加几个数量级。 判断Sora将刺激推理算力需求,并将持续下去。 上升。 此外,推理端代币的增加以及对算力的需求也对显存和带宽提出了更高的要求。 预计将增加400G光通信技术在以太网中的应用,并有望推动800G甚至1.6T光通信技术的应用。 。
哪些A股公司有计划?
据不完全统计,已有十几家A股上市公司此前布局了与AI视频相关的多模态大模型或研发。
海康威视去年4月20日在回答投资者提问时透露,公司几年前就开始研发大视觉模型,目前已达到多模态大模型的研发阶段,包括视觉、语音和文字。 状态信号的融合训练和处理。
大华股份于2023年10月发布“星瀚大模型”,融合点云、语音、图像等输入,构建多模态融合行业视觉模型。
大华股份在1月15日的投资者问答中介绍,公司多模态一体化行业视觉模型(大华星汉模型)是基于公司过去丰富的行业和细分场景业务经验,面向未来。 在以视觉为核心的智能物联网领域,通过融合图像、点云、文本、语音等多模态数据构建,极大提升了视觉分析能力。 该模型是一个分析型大模型,与市场上的其他生成模型类似。 大型模型存在显着差异。
万兴科技此前发布了大型音视频多媒体模型万兴“顶屏”。 据了解,万兴科技的“天幕”是基于音视频生成AI技术的多媒体创作垂直模式。 它由视频模型、音频模型、图片模型和语言模型组成。 它专注于数字创意垂直模型。 创建场景。
2月2日,万兴科技在互动平台表示,大型遮阳篷模型主要是基于公司二十年在数字创意领域的产品研发和运营经验而打造的音视频多媒体大型模型。 它拥有多媒体、垂直解决方案和计算能力。 数据和应用本地化等特性,以更智能、更沉浸的功能效果和产品体验,赋能全球内容创作者的创意表达。
博慧科技1月9日在回答投资者提问时表示,公司利用人工智能、大数据等技术对采集到的数据进行分析、特征学习和样本训练,构建智能监管模型,提高对文本的理解、理解能力对图像、音频、视频等多模态数据进行处理和分析,进一步强化核心技术优势,提高产品竞争力。
一点天下2月4日在投资者互动平台上表示,公司AIGC创作平台可以帮助企业实现从剧本编写、语音克隆、个性化数字人选型到口语视频输出的基于AI的全链路闭环内容制作。 。
数视互动平和1月4日表示,公司多年来一直积极自主研发和积累AI技术。 龙旗在视频内容制作领域持续探索AIGC生成技术,并与智能审核技术和多模态智能搜索进行合作。 等,实现全媒体行业的媒体资产管理,打造新型音视频服务。
汉王科技互动平台2023年12月31日表示,公司多年来致力于文本、图像、视频、生物识别、语音等多状态识别、文本理解和利用等技术,已形成智能终端产品和行业解决方案。 目前正在开发的AI模型仍属于新兴技术,文本生成、生成内容的控制和审核等技术细节仍在进一步完善中。
当红科技互动平台1月5日表示,公司拥有自主研发的AIGC工具集,发布静态照片生成三维体积视频的解决方案,并通过点云模型转换压缩实现高达800倍视觉无损压缩算法。 实现不同模式之间的相互切换。 公司AIGC视频内容智能生成系统集成大模型技术,帮助用户在新闻传播、视频内容创作等多个领域打造优质视频内容。
东方国信互动平台去年12月27日表示,在AI多模态方面,公司拥有针对文本、语音、图像、视频等非结构化数据类型的AI分析的应用产品和实施案例。 视觉范畴以图像生成能力为基础,其他视觉大模型应用还在探索技术路径和应用场景。
新思电子2023年12月26日在互动平台表示,经过多年在人工智能领域的积累,公司已突破远距离全天候复杂场景激光热成像联动入侵检测技术,掌握非结构化数据基于深度学习的处理和视频。 分析、语音对话、知识管理和云平台技术。 公司正在研究基于文本的图像、基于图像的文本、基于视频的文本、基于文本的数据等多模态数据的收敛特性,以支持多种场景下的生成大模型应用如训练、检索、推荐和目标跟踪。
银赛集团2023年12月25日在互动平台表示,公司拥有文胜文、智能视频剪辑、图胜视频等功能,目前正在开发文胜视频功能。 在图胜视频等现有技术框架下,目前已经可以生成20秒以上的视频。 在文森特视频目前的逻辑流程中,图像和视频大模型首先与图像抠图等各种算法结合,然后与音频模型结合,最后经过整体渲染后合成为完整的视频。
Torsi于2023年12月14日在互动平台表示,公司在架构方面积极跟踪行业最新技术,将根据技术研发和业务需求的实际情况,及时采用类似的架构。
国脉文化去年12月12日在互动平台表示,公司内部为文森视频开发了基于大模型的AIGC数字内容生成平台。 该平台采用多模态技术,利用自有版权内容生成文字、音频、图片、视频等影视素材进行内容创作和生产,目前正在内部试用。
嘉都科技2023年12月11日在互动平台表示,-M多模态大模型可以理解脚本、图像、视频等多种模态的信息,并根据用户需求进行描述、提示或描述。 转换成命令代码,它是一个非常“智能”的交通信息助手。
相关报道
Sora如何降维打败其他文森特视频大模型?记者实测对比
Sora助力估值飙升!多家巨头拟布局AI基础设施
Sora的诞生,世人惊呼:现实已不复存在!多家A股公司积极布局视频生成模式赛道
至少有14家券商发布了19份Sora研究报告。 在AI视频进入大应用的前夜,算力有望成为新的投资热点。
Sora为何一亮相就碾压主流AI视频模型:文森特最长视频记录,全面了解世界
免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.com