今年春节期间,OpenAI 发布了文生视频 AI 模型 Sora,瞬间引爆全球网络。 4 ]% X1 T. a M" t 6 g% N0 d' ~6 g7 [) j, m* H & J3 N& x: G# c) k$ M; q% [这一大模型引来马斯克点评“人类认赌服输”;令周鸿祎预言:“这可能给广告业、电影预告片、短视频行业带来巨大颠覆。”“Sora生成视频堪比CG。”& N) D b' C7 N$ m8 Q
7 n [8 s( I1 O
文生视频的AI模型实际早已存在,Sora牛在哪里?答案是,它的语义理解能力更强。- t0 b. R- t0 ?7 ~
3 s* L0 h: @" O& A1 z首先,Sora 能创建出逼真且富有想象力的 60 秒视频; ) b5 S3 @4 }& h& q: a # C( X; e4 m L0 O在这些视频中包含精细复杂的场景、富有情感的角色表情以及复杂的多角度镜头。 ' W7 l- G( ]& S& n, l0 p 3 B; a- [, r; i$ d: b( P/ `OpenAI 官网展现了多段 Sora 制作的视频。8 `4 M, T% {1 W! H
1 F- v( N3 j, K$ z* Z0 M0 O) d- d
其中一个场景为,身着黑色皮衣、红色裙子的女性在雨后的夜晚行走在东京市区街道上。视频背景中,她身后的行人也在走动。而由于下过雨,路面留下积水,在城市彩色灯光的照射下形成镜面效果。 . d& t1 O8 {, r* j. X0 W- e% B1 f! q* k
最震撼的是视频后半段呈现的面部细节,这位女性的皮肤毛孔色沉清晰可见,如此逼真的视频令人很难一眼判断是出自 AI 之手。8 H9 H: E8 D8 ?
4 f# [. }- s( u6 u: d
在一段提示词为“一窝金毛猎犬在雪地里玩耍。它们的头从雪地里蹦出来,浑身都是雪”的视频中,甚至可以看到一粒粒的雪粒。/ h6 v' M; j" u
' J8 X6 d L7 b r$ P1 q, b其次,Sora 能通过现有的静态图像生成视频;/ d- i5 ]0 l$ K* X, X+ e8 P3 Q
: a" }7 U* L# ^' h; a! q4 `5 d7 D" H
再者,Sora 能延长已生成的视频; ) W" {" d3 s# ]$ V* \/ h/ @ P4 m" P3 `) L' b5 h9 X
通俗来讲,给 Sora 一段视频,它可以自动进行扩展、填充缺失内容。 " _- c, y, L. G1 ? e& G - L. Y" Q1 h" U. N更厉害的是,Sora 可以一次性生成不同机位、不同景别视角的视频,并进行剪辑、自动拼接。+ |: n! X0 d+ q- u! l
Q: f! J" T2 d9 p: e
比如,这组图片展示了人们在下雪天漫步、玩雪的多个角度。可见在不同的机位下,无论是广角、中景、近景、特写,视频中人物和背景的关系都一致。7 ?" g- Q' ]7 P5 ^