Midjourney 宣布推出其 V7 图像生成模型的测试版,供人工智能社区进行测试。这款新模型在文本提示理解、图像质量和特征连贯性方面都有提升。
Midjourney 解释道:“V7 是一款非常出色的模型。它对文本提示的理解更加智能,图像提示效果很棒,图像质量有显著提高,纹理精美,人物身体、手部以及各类物体在所有细节上的连贯性都有了大幅改善。”
V7 的一项关键创新是默认开启了模型个性化功能。用户首次使用时需要解锁该功能,整个过程大约需要五分钟。这一个性化功能可以随时开启或关闭,旨在大幅提升人工智能理解用户需求和审美偏好的能力。Midjourney 认为该功能为理解用户意图设立了新的标准。
Midjourney 还为 V7 图像生成模型引入了一项名为 “草稿模式” 的功能,据说该模式生成图像的速度能提高十倍,成本还能降低一半。
速度的提升使得 Midjourney 在其网页界面上实现了独特的 “对话模式”。现在,用户可以指示系统进行修改,比如把猫换成猫头鹰,或者把白天改成夜晚,人工智能会自动调整提示并启动新的图像生成任务。
“草稿模式” 还融入了语音输入功能。用户按下麦克风按钮,就能说出自己的想法,并几乎实时地看到生成的图像:
Midjourney 认为,“草稿模式” 为完善创意概念提供了一种前所未有的方式。如果生成的图像很吸引人,用户可以选择 “增强” 或 “变体” 选项,以全质量重新渲染图像。虽然草稿模式下生成的图像质量比标准模式低,但它们的表现和美学特征是一致的。
Midjourney 的 V7 图像生成模型最初将提供两种速度模式:Turbo(极速)和 Relax(普通)。标准速度模式目前还在进一步优化中,预计很快就会发布。Midjourney 明确表示,Turbo 模式的任务成本是标准任务的两倍,而草稿模式的任务成本则是标准任务的一半。
该公司还公布了其他功能的更新情况。放大、编辑和重绘纹理等功能最初仍会使用 V6 模型,未来有更新计划。情绪板和 SREF 功能目前已投入使用,预计后续更新会提升其性能。
展望不久的将来,Midjourney 制定了积极的开发计划。在接下来的 60 天里,用户每 1 到 2 周就能期待新功能上线。即将推出的一项重要功能是 V7 全新的人物和物体参考能力。
最后,Midjourney 提醒用户,V7 是一款全新的模型,有其独特的优势,也可能存在一些不足。他们鼓励用户对其功能进行测试并提供反馈,同时提醒用户,与之前的版本相比,使用 V7 可能需要不同的提示技巧。