美国人工智能公司OpenAI近日宣布正式推出其新一代的“文生视频”大模型Sora,该消息在科技圈内引发了广泛的讨论和热议。不少用户急于体验该模型的功能,直接导致了OpenAI官方网站的暂时瘫痪。相较于今年2月首次亮相时所展现出的从文本到视频的强大转化能力,的Sora又在多大程度上进行了性能提升?这场“视频生成工具革命”究竟将带来什么样的深刻影响以及潜在风险?《环球时报》记者采访了多位人工智能领域的专家。
核心优势在于用户基础的强大
根据公开介绍,Sora Turbo版本现已上线,用户可以通过文本生成时长最长可达20秒、分辨率为1080P的视频,成为全球范围内生成时长最长的视频模型之一。Sora支持三种生成模式:“文本到视频”“文本+图像到视频”和“文本+视频到视频”。这一灵活性使用户能够仅凭文本描述生成完整视频,或结合文本和具体的图像/视频,以更加精准地展现创作者的构思。
尽管Sora在功能上表现不俗,但OpenAI技术团队也承认其局限性。社交媒体上相关测试视频显示,Sora在遵循物理规律方面存在不足,常常导致物体穿透或凭空出现等现象。对此,清华大学的沈阳教授指出,尽管Sora在文生视频领域中占据一定地位,但与其他领先的生成模型如可灵AI、Runway相比,尚未形成巨大差距。尤其是后两者在近期的更新迭代中,已探索出了多项先进的功能,而这些在Sora中并未得到充分体现。
新技术打破传统影视制作技术壁垒
“不能简单地将Sora的上线视作一次工具的革命。”北京邮电大学的刘伟教授认为,Sora虽具备一定的创新性,但其冲击力与首次亮相时相比并不显著。他呼吁关注文生视频模型的发展趋势,以借鉴国际技术革命的成果,并综合评估优缺点。
沈阳教授进一步指出,当前AI视频生成技术逐渐降低了普通人进入传媒行业的门槛。特别是像可灵AI这样的在过去半年里涌现出许多爆款视频,许多首次接触短视频创作的用户,其作品短短数十秒便能够获得数百万的播放量,这正是人工智能赋能所带来的新创作模式。
Sora的发布标志着视频生成技术逐步成为影视制作、广告、内容创作等领域的重要手段,许多传统制作流程正面临重塑。据悉,全球首部完全由AI制作的长篇电影《终结者2重制版》已于今年3月在好莱坞上映。广告短片、公益宣传片等短视频创作领域也逐渐开始尝试采用Sora等AI技术。
增强创作的效率与灵活性
沈阳教授强调,近一年来,AI视频生成技术在灵活性和效率上的提升已经为创作流程带来了实质性的进展。Sora等多模型的出现意味着,人工智能不仅在理论上存在,更在实际创作中发挥出了不可小觑的力量。值得一提的是,这项技术不仅限于高端制作,日常创作也因其智能化而变得更加简易,推动了行业的转型。
随之而来的隐患也不能被忽视。刘伟表示,虽然Sora等模型显著降低了创意视频制作的门槛,但也提高了普通用户辨别假视频的难度。这在一定程度上可能会导致电信诈骗等社会问题的加剧。结合法律法规、技术手段对不良内容的传播进行有效治理,将是保障技术安全应用的必要措施。
他还提醒关注深度伪造技术的滥用,这可能对国家安全带来隐患。随着这种技术在社交网络上的使用不断增多,相关监管应加强,以维持社会的公正与安全。
OpenAI推出的Sora是目前视频生成技术的一项重大进展,虽然面临着其他竞争者的挑战,但其强大的用户基础和广泛的应用潜力,仍使其具备了成为行业领头羊的可能。随着技术的不断发展,AI在内容创作中必将扮演越来越重要的角色,推动整个行业走向高效、个性化与智能化的未来。但与此并存的风险也需得到重视,以确保技术的健康发展与合理应用。