Midjourney 发布 AI 图片生成模型 V7,可“吟唱”生图

IT之家 4 月 4 日消息,Midjourney 公司今日于 X 上发文,宣布旗下 AI 图片生成模型开启 V7 版本 alpha 测试,主要更新了“草图模式”。

图片

根据官方介绍,在常规更新方面,V7 版本增强了文本理解能力并升级了细节纹理质感,人物肢体 / 手部 / 物体结构等连贯性都有提升,同时 V7 版本将默认启用“个性化模型”功能,该功能可学习用户偏好,实现更精准的创意解读,用户可随时开关。

图片

本次 V7 版本最大的升级是全新的“草图模式”,该模式在耗时与资源消耗方面仅为标准模式的 50%,在此模式下网页端编辑器将自动切换为“对话式交互界面”,同时可进行实时编辑(如输入“将猫替换成猫头鹰”或“转为夜景”等指令,系统可自动根据提示词调整生成新作品)。

图片

在“草图模式”下,用户还可以使用语音识别生成功能,只需要在启用“草图模式”后点击麦克风图标,即可通过语音实时塑造图片;且该模式还支持指令扩展,只需要在提示词后加入“--draft”参数,即可使用多版本迭代、批量生成等进阶功能。同时根据博主 @歸藏的AI工具箱 测试,该模式下可用中文进行语音识别生图。

图片

IT之家注意到,“草图模式”下生成的图片分辨率相比其他模式较低,且目前超分、编辑、材质替换等功能仍将调用 V6 模型,后续将逐步升级,同时 Midjourney 也承诺未来 60 天内,每 1-2 周发布一次新功能。