- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
OpenAISora专题
Transformer扩展优势凸显,视频理解与
生成能力提升
2024年2月
核心观点
事件:2024年2月16日,OpenAI发布文生视频模型——Sora及其技术报告《Videogeneration
modelsasworldsimulators》。
从Sora模型看文生视频的技术路径:技术路径尚未收敛,Transformer扩展特性优势凸显。市场大
多认为扩散模型是图像和视频生成领域的主流路径,但没有重视Transformer架构scaleup的能力。
OpenAI技术报告指出,Sora是基于扩散模型,但更强调,Sora是一个基于Transformer架构的扩散
模型,其优秀的生成能力离不开Transformer架构优秀的scaling特性。当前,为构建性能更优、效
率更高的视频生成模型,已出现多种结合DiffusionModel和Transformer架构的构建方式。
从Sora模型看文生视频的最新能力(假设展示视频可以代表Sora的一般性表现):1)强大的理解
能力:Sora模型不仅可以理解Prompt的内容,还能理解事物在物理世界中的存在方式,突出的语言
理解能力是其能够准确生成视频的前提。2)优秀的生成能力:①长度:可生成60s视频;②复杂度
2
:能够生成包含多个角色、多种主题、多类运动形态的复杂场景;③逼真度:能够呈现更多的视觉
细节,具备更高清的画质,为用户提供逼真的视觉体验;④连贯性&一致性:可以生成同一角色的多
个镜头,保持其在整个视频中的外观,在角度移动和切换情况下,人物和场景元素在三维空间中的
位置关系能够保持一致的运动;⑤可控性:在某一Prompt基础上只改动一个关键词仍能生成优质的
视频,具备较好的可控性。3)其他能力:图生视频,视频扩展/编辑/拼接/模拟等。
从Sora模型看文生视频的行业影响:目前OpenAI已向部分视觉艺术家、设计师和电影制作人提供访
问权限,以获取专业的反馈。我们认为,以Sora为代表的视频生成模型有望给广告/设计/短视频/游
戏等行业带来变化。从中短期来看,视频生成模型将更多的作为创作工具对相关行业进行赋能。
投资建议:随着文生视频模型的迭代升级和未来的大规模应用,算力需求有望增长,云服务有望成
为算力的重要补充,视频传输也将带动高带宽、高性能的光通信需求,建议关注算力、云服务和光
通信领域投资机会。相关标的:英伟达(NVDA.O)、超威半导体(AMD.O)、微软(MSFT.O)等。
风险提示:技术进展不及预期风险;行业竞争加剧风险;应用开发不及预期风险。
1
目录
1从Sora看文生视频模型的技术路径
1.1发展现状:视觉生成热潮兴起,路径探索仍在继续
1.2路径对比:扩散模型占据主流,自回归模型潜力可期
1.3未来趋势:transformer优势凸显,多种模型构建方式有望呈现
2从Sora看文生视频模型的最新能力
2.1模型背景:团队成员年轻有为,相关技术积累深厚
2.2理解能力:领会并细化提示词,学习及模拟物理世界
2.3生成能力:视频长度优势明显,连贯性及可控性提升
2.4其他能力:图生视频,视频扩展/编辑/拼接/模拟等
3从Sora看文生视频模型的影响
3.1算力端:参数扩展提升训练算力消耗,应用落地拉动推理算力增长
3.2应用端:文生视频模型拓宽应用广度,前期有望以助手角色落地
3.3其他:云服务将成算力重要补充,多媒体传输带动光通信需求
2
sUlWpV8WdYiYfXnMqRbR9RaQ
您可能关注的文档
- 2023年中国零售地产行业市场前景及投资研究报告:踔厉奋发,龙行龘龘.pdf
- 2024年抖音房产生态市场前景及投资研究报告:静水流深,向阳而生,踔厉奋发,龙行龘龘.pdf
- 2024年家电行业投资策略分析报告:低估值高股息,把握改革转型.pdf
- 2024年稀土行业市场前景及投资研究报告:供需格局展望,供给侧改革,需求端提振.pdf
- 半导体行业市场前景及投资研究报告:光刻机,现代工业集大成者,亟待国产化.pdf
- 倍加洁-市场前景及投资研究报告-口腔护理ODM龙头,内生外延,成长可期.pdf
- 伯特利-市场前景及投资研究报告:线控底盘,全球化进程加速.pdf
- 菜百股份-市场前景及投资研究报告:京圈珠宝老字号,全直营,差异化竞争优势.pdf
- 出版行业市场前景及投资研究报告:国有出版,进可攻退可守,高股息防御价值,新业务长期增量.pdf
- 川投能源-市场前景及投资研究报告-雅砻江成长空间,大渡河量价齐升.pdf
- 计算机行业市场前景及投资研究报告:标准体系,新一代工业软件体系,国产厂商换道超车,OpenAI Sora.pdf
- 康冠科技-市场前景及投资研究报告-IFPD&TV代工龙头.pdf
- 传媒行业OpenAI Sora市场前景及投资研究报告:Transformer扩展优势,视频理解,生成能力提升.pdf
- 菜百股份-市场前景及投资研究报告:京圈珠宝老字号,全直营,差异化竞争优势.pdf
- Unit 3 Celebrations 语法点之被动语态课件-2023-2024学年高中英语北师大版(2019)必修第一册.pptx
- 2024届高三英语二轮复习应用文写作通知课件.pptx
- Unit 5 Music Discovering Useful Structures 现在分词作状语解题步骤课件-2023-2024学年高中英语人教版(2019)必修第二册.pptx
- 乾坤未定,吾皆黑马 课件-2024届高三百日誓师主题班会.pptx
- 2024届高考散文阅读复习之特定信息及(段)意概括题.pptx
- 非谓语动词 复合句写作导练(一) 课件-2024届高考英语作文复习专项.pptx
文档评论(0)