IT之家 12 月 1 日消息,可灵 AI 今晚通过官方公众号宣布,全球首个统一多模态视频模型 —— 可灵视频 O1 模型全量上线。
IT之家从官方介绍获悉,可灵 O1 模型构建了全新生成式底座,从而能够“打破功能割裂”,并引入 MVL(多模态视觉语言)交互架构,可在单一输入框内无缝融合多种任务。结合 Chain-of-thought 技术,模型从而具备强大的常识推理与事件推演能力。
官方更称,依托统一模型的深层语义理解力,“每一张照片、每一个视频、每一段文字,在可灵 O1 眼中皆是指令”。同时上线的还有全新创作界面,仅需简单对话,轻松使用各种素材,精准生成每一处细节。
其支持多视角构建主体,号称无论镜头如何流转,主体特征都能稳定如一,确保画面精准、连贯。同时,其支持自由组合多个主体。
参考