春节后AI视频的开年大招,一定是OpenAI的首个文生视频模型Sora吧!
它不仅可以根据文字生成包含多镜头、多角色、切换场景视频,而且生成视频时长也有了前所未有的突破,可以丝滑到60秒视频一镜到底!
官宣推文两天浏览破八千万,更是引起行业内如Runway、Stability AI、Pika等头部企业创始人的重视。
这个Sora模型究竟是怎样做到的?我们先来了解一下。
️
Sora
Sora是一种通用的视觉数据模型,能够生成各种持续时间、宽高比和分辨率的视频和图片,甚至长达一分钟的高清视频。
基于DALL·E和GPT模型的研究成果,Sora采用了Transformer架构和DALL·E 3的重标注技术。
Sora为理解和模拟现实世界的模型奠定了基础,对此OpenAI认为这是实现通用人工智能(AGI)的重要步骤。
先欣赏以下Sora生成视频作品:
一列火车穿越东京郊区时,窗户上反射出的迷人景象。
Prompt: Reflections in the window of a train traveling through the Tokyo suburbs.
无人机从空中俯瞰大苏尔加雷角海滩附近的崎岖悬崖,海浪冲击着岩石,形成白色的浪尖,落日的金色光辉照亮了岩石海岸。远处有一个小岛上立着灯塔,悬崖边缘覆盖着绿色植被。从道路到海滩的陡峭下降和悬崖边缘凸出的景象,展现了海岸的原始美丽和太平洋海岸公路的崎岖风景。
Prompt: Drone view of waves crashing against the rugged cliffs along Big Sur’s garay point beach. The crashing blue waters create white-tipped waves, while the golden light of the setting sun illuminates the rocky shore. A small island with a lighthouse sits in the distance, and green shrubbery covers the cliff’s edge. The steep drop from the road down to the beach is a dramatic feat, with the cliff’s edges jutting out over the sea. This is a view that captures the raw beauty of the coast and the rugged landscape of the Pacific Coast Highway.
雪后的东京熙熙攘攘。镜头穿过繁忙的街道,跟随着几位享受着美丽雪景和在附近摊位购物的人们。美丽的樱花瓣伴随着雪花在风中飘舞。
Prompt: Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.
以上,都是Sora根据提示词所呈现的视频画面,不仅能看到多镜头切换,人物还能保持连贯性,这是在以前的AI视频中没有办法做到的。
并且创作形式也有很大不同,仅靠一段文字提示生成视频,还可以用语言完成视频修改需求,这确实大大降低了创作门槛,未来稳定后无需依赖传统拍摄和制作手段就能创作出高质量的内容。
与其他AI视频工具的对比
为了验证SORA的效果,业界大佬
Gabor Cselle把它和Pika、RunwayML和Stable Video进行了对比。
首先,他用了OpenAI示例中相同的Prompt。
结果显示,其他主流工具生成的视频都大约只有5秒钟,而SORA可以在一段长达17秒视频场景中,保持动作和画面一致性。
随后,他将SORA的起始画面用作参照,努力通过调整命令提示和控制相机动作,尝试使其他模型产出与SORA类似的效果。
相比之下,SORA在处理较长视频场景方面的表现显著更出色。
看到如此震撼的效果,也难怪业内人士都在感叹,SORA在AI视频制作领域确实具有革命性意义。
但是这条视频中也存在很多不合理细节,被Gemini 1.5 Pro指出:“这段视频拍摄的是日本一条下雪的街道,樱花盛开。有一些不一致的地方表明视频可能是AI生成的。首先,雪下得很大,但樱花还在盛开,樱花通常开在春天,那时天气温暖,没有雪;其次,雪以一种很均匀的方式落下,这与现实生活中的雪通常不同;第三,尽管下着雪,视频中的人没有穿任何冬天的衣服。总的来说,这段视频在视觉上很吸引人,但前后矛盾之处表明这不是真实场景。”
Sora对影视行业的影响
随着Sora在国内引起热议,关于它的出现对AI视频行业的影响猜测不断。
有很多人认为Sora对传统影视工业有很大影响和打击;同时也有很多行业人士认为Sora在未来上线后对影视工业带来的是降本增效的作用。
例如,360董事长周鸿祎就发表了自己的看法:“机器能生产一个好视频,但视频的主题、脚本和分镜头策划、台词的配合,都需要人的创意,至少需要人给提示词。一个视频或者电影是由无数个60秒组成的。对电影工业来说,Sora可以成为有力的工具,绘制布景效果、制作特效片段,繁琐的工作交给Sora做,创作者可以更聚焦创意、脑洞。人工智能不会取代人类的想象力和创造力,也无法取消人类的主观能动性。”
由于目前Sora尚未公开开放体验,还存在诸多不完善之处,按其官方说法,“仍然处于世界模型研究应用的初期阶段。”
下周,我们也会邀请十方影视后期的老师一起来分析Sora对于视频领域带来的改变和趋势,敬请期待!