行业动态

Sora能否颠覆LED虚拟拍摄？行业龙头这么看

2024-02-24 23:47

　　新锐OpenAI推出的Sora火爆全球，不仅显著提升了AI在视频生成领域的表现和应用潜能，传统影视和多媒体创作流程也被认为面临颠覆式影响。

　　洲明科技(300232)作为A股LED虚拟拍摄头部上市公司，已经提出了+AI战略。日前，集团内容创意执行总裁、副总裁刘俊在接受证券时报·e公司记者专访时表示，剖析了Sora相较过往视频生成模型的关键突破点，并表示一旦Sora对外开放接口，有望第一时间使用到全球最先进的视频生成技术。他还预计，伴随Sora类应用降低专业门槛以及屏幕成本降低，虚拟拍摄将从当前工业级市场拓展到广阔的企业级和消费级市场。

　　虽然文生视频并非应用，但Sora在模拟能力突出。刘俊指出， Sora不仅模拟动态的视觉效果，还能捕捉到更深层次的，与日常生活经验一致的互动模式。据介绍，模拟要体现在3D一致性、长期一致性、世界交互模拟三个方向。

　　“尽管在处理复杂的物理交互和长时间一致性上仍存在挑战，但Sora在模拟简单世界互动方面已经展现出了显著的能力，为未来AI技术的发展开辟了新的路径，特别是在理解和模拟真实世界动态这一领域。”刘俊表示。

　　在语言理解与视频生成方面，Sora利用先进的文本解析技术，能够准确理解用户的文本指令，并给予指令生成富含细节和情感色彩的角色，以及生动的场景。除了文本提示外，Sora还能够接受静态图像或已有视频作为输入，进行内容延伸、填充缺失帧以及风格转换等操作。

　　另外，Sora可支持多样化视频格式和更长的视频，无论是宽屏的1920x1080p视频、垂直的1080x1920视频，Sora都能够应对自如，视频长度达一分钟。

　　“Sora还改进了视频构图和框架，即便宽屏格式的视频也可以确保主要内容始终处于观众视线中，而不会像某些模型那样，只显示主题的一部分。” 刘俊表示，这提高了生成视频的视觉质量，也改善了观看体验。

　　“多模态将是2024年AI大模型领域最主要的边际变化。” 刘俊向记者表示，从ChatGPT 4.0到Sora，生成式在从大语言模型向多模态模型演，这背后离不开算力和数据支持。作为数据驱动的物理引擎，Sora模型同样需要大量算力和数据支持。

　　“OpenAI的创始人Sam Altman计划全球融资7万亿美元以投入AI芯片领域，这就表明算力的发展还会有很长的发展历程。” 刘俊也指出，所有AI问题本质是数据空间的问题，但数据是没有穷尽的，人类发展史所创造的数据还有很多等待挖掘，这是目前AI还未触达的数据范围，还有很长一段路去发展。

　　不过，考虑算力禁售问题、研发投入、技术储备和人才等因素，刘俊认为，中国版的Sora具体可实现效果还是值得期待的。

　　Sora作为一款高度先进的AI视频生成模型，影视制作与视频剪辑行业被普遍认为是领先的。但刘俊向记者表示：“按照Sora现有技术，可以提高虚拟拍摄的效率，但短期内难以替代真人表演的效果。”

　　LED虚拟拍摄利用大面积的高分辨率LED显示屏，能够创建动态和逼真的虚拟场景作为拍摄背景。在LED虚拟拍摄棚中，屏幕可以显示预先渲染好的CGI（计算机生成图像）内容或者实时渲染的3D场景，这些内容与演员和实物道具交互，共同构成最终的镜头画面。

　　目前通过其虚拟拍摄系统UniStudio，可提供一站式虚拟拍摄解决方案。据最新数据统计，全球数字影棚大概有160个，洲明科技及其旗下ROE公司(雷迪奥)参与建设的有130个左右，并且公司积极拥抱，提出了LED+AI战略，在光显行业成为首个获得微软独立软件开发商（ISV）认证的企业，同时获得了OpenAI官方接入许可。

　　“未来一旦Sora开放接入，洲明科技有望第一时间使用到全球最先进的视频生成技术。”刘俊表示，过去洲明为客户服务时，往往面临内容制作周期长、创新创意不足等问题，而Sora的出现可以有效解决这些问题，极大地丰富LED屏幕所承载的内容表现形式。

　　在刘俊看来，文生视频等AI应用加持下，虚拟拍摄的专业门槛将随之降低，未来有望加速普及到企业级和消费级市场。

　　“当前数字影棚发展还处于影视工业级，接下来在Sora这些AI应用推动下，虚拟拍摄效率将提升，专业门槛将降低。”刘俊预计，未来虚拟拍摄将工业级制作门槛将降低；另一方面随着LED屏幕进入企业和家装应用，虚拟拍摄将从当前百计影视工业级市场进入万计企业级市场，甚至渗透亿计消费级市场，最终实现全民创作。