“一个美丽的动画展示了一只狼对着月亮嚎叫,感到孤独,直到找到狼群。视频通过蓝色的背影和狼的剪影,极好地展现出了狼的孤独,剧情上从一匹狼到多匹狼过渡自然,镜头语言上全景和中景、特写交替切换”。这是通过文本指令直接输出长达60秒的AI视频。

2月16日,Op­e­n­AI宣布推出全新的生成式人工智能模型So­ra,文本生成视频包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色,继文本、图像之后,AI技术拓展到视频领域,降低了视频创作门槛、提高了创作效率和质量,为各领域带来无限可能。

一、技术创新

1、理解现实。以往文生视频软件在2D平面上对图形元素操作,So­ra实现了对现实世界的理解和对世界的模拟两层能力,模拟真实物理世界,对内容创作、娱乐和影视制作行业带来前所未有的机遇。

2、深度学。能够理解并解析输入的文字描述,捕捉其中的关键信息和意图,自动生成符合描述要求的视频内容,在视频创作中具有更高的灵活性和可定制性,满足不同领域、不同需求的创作者。

二、应用场景

1、影视制作。为编剧、导演等创作者提供丰富的视频素材和灵感来源,极大地提高影视制作的效率和多样性,推动影视产业的快速发展。

2、广告创意。通过输入广告文案和创意点,生成多个不同风格的视频广告方案,提高广告创意的效率和多样性,降低制作成本,为广告主带来更多的商业价值。

3、教育培训。教师可以根据学生的学进度和反馈,调整视频的内容和难度,实现个性化教学。

4、社交媒体。降低了视频创作的门槛,使得更多人能够参与到视频创作中来。无论是专业创作者还是普通用户,都可以通过So­ra模型轻松生成高质量的视频内容,推动社交媒体的持续发展。

三、存在问题

1、常见失误。无法精确模拟像玻璃破碎这样的基本物理互动,比如吃东西,并不总能正确反映物体状态的改变,长时间视频样本中出现的不一致性或物体的突然出现等问题。

2、版权问题。模型生成视频内容可能侵犯他人版权,需要制定相应的法律法规和技术手段来确保生成的视频内容不侵犯他人版权。

3、隐私问题。模型在生成视频内容时需要收集用户的个人信息或敏感数据,那么我们需要确保这些数据得到妥善保管和使用,避免泄露和滥用。

结语:文本、图片都已经被AI攻占,AI视频这个人类最后的堡垒,在So­ra攻势下已经很难再分清AI和现实的界限。So­ra 所展现的能力证明了持续扩大视频模型的规模是一个充满希望的方向,将助力物理和数字世界及其中的物体、动物和人类能够有更加精确的模拟。