6月11日消息,Midjourney正式将V8.1设为所有用户的默认生成模型,取代此前的V7。V8 Alpha将在两周内停用,下一代V8.2已进入内部测试。从3月17日V8 Alpha上线到6月10日V8.1转正默认,Midjourney在不到三个月内完成了V8系列的三个版本迭代——V8 Alpha、V8.1 Alpha、V8.1正式版。这个节奏在图像生成领域算快的。
速度和分辨率:两个硬指标的跃升
V8.1是Midjourney迄今最快的模型。标准任务渲染速度比此前版本提升4到5倍,HD模式比V8 Alpha快3倍、成本降低约3倍。
HD模式是V8.1最核心的新能力。它可以原生生成2K分辨率(2048×2048像素)图像,不需要额外的放大步骤。原生2K意味着更干净的纹理、更锐利的边缘和更密集的细节——这与传统的"先生成低分辨率再AI放大"的路径有本质区别。HD模式消耗1.3分钟GPU时间,标准模式消耗0.8分钟。在V8 Alpha中,HD模式消耗4倍GPU时间,V8.1把这个数字压缩到约1.6倍,成本结构完全改变。用户可以在网页端设置面板开启HD,也可以通过--hd参数手动触发。对已生成的标准分辨率图像,网页端还提供"Run as HD"按钮,用种子锁定的方式重新生成HD版本,效果类似于"带微小变化的放大"。
Midjourney团队目前正在评估是否将HD设为默认输出模式。如果实现,这将改变用户的成本计算方式——每张图的GPU消耗会增加约60%,但产出质量直接提升一个档次。
美学修正:找回V7的"摄影师"
V8.1解决的另一个关键问题是V8 Alpha引发的美学争议。V8 Alpha在3月上线后,社区反馈呈现明显的两极分化。核心矛盾在于:V8把模型从"艺术解读"模式切换到了"字面执行"模式。
V7的工作方式更像一个摄影师——给一个松散的提示词"森林中的女人",模型会自动补充光线、构图和氛围,结果经常超出用户预期。V8 Alpha转向精确执行,同样的提示词生成技术上准确但视觉上平淡的结果。Reddit上有用户的描述被广泛引用:"相机变得更精确了,但摄影师走了。"V8 Alpha还有一个明显的"AI光泽"——默认输出过于干净、过于完美,缺少V7用户依赖的有机质感。Midjourney团队自己也承认了这个问题,建议用户立即切换到--raw模式。
V8.1的美学调整试图在两者之间找到平衡。它恢复了更接近V7的标志性风格——情绪、氛围和艺术性回归,同时保留了V8在提示词遵循度上的优势。所有V7的个性化配置文件(包括全局配置文件、风格引用和情绪板)直接延续到V8.1,用户不需要重新训练审美偏好。情绪板和个性化在V8.1上的表现也比V8 Alpha更准确——生成结果更忠实于参考图的美学特征。
此外,V8.1还修复了V8 Alpha中缺失的图像提示功能,更新了Describe功能(这是自V5.2以来的首次更新),身体和手部的连贯性也有小幅改善。
竞品对标:各有所长的市场格局
2026年的AI图像生成市场已经高度分化,没有一个模型在所有维度上领先。
美学和艺术风格仍然是Midjourney的主场。V8.1在视觉冲击力和创意解读上继续领先,这是Midjourney从V5时代积累的核心优势。但在写实摄影领域,Flux 2 Pro和Google Imagen 4已经追平甚至超越。图内文字渲染方面,Ideogram V3以90%到95%的准确率独占第一梯队,Midjourney在这个维度上仍然不是首选。人像和面部生成上,Imagen 4表现最佳,Midjourney和Flux 2并列第二。
成本结构上,Midjourney的订阅制($10到$120/月)在单价上不占优势。Flux 2的API定价约$0.06到$0.08/张,适合批量生产场景。Ideogram V3仅$7/月且提供每天10张免费额度。Stable Diffusion 4完全开源免费,本地部署无需付费。
Midjourney至今没有公开API,也没有原生Mac应用。这两个缺失在2026年显得越来越突出——开发者无法将Midjourney集成到自动化工作流中,而Flux、DALL-E、Imagen都已经提供成熟的API接入。对于需要大批量生成或程序化调用的场景,Midjourney不在选择范围内。
V8.2和6月路线图
据Midjourney Office Hours(每周社区会议)透露,团队当前两大优先级是V8.2发布和新的编辑模型。V8.2主要聚焦于修复和扩展V8.1的美学系统——团队已定位到若干问题并完成修复,模型稳定性也有提升。社区预计V8.2可能在两周左右发布。
6月的路线图还包括:编辑模型更新(局部修改/扩展/重绘功能)、OREF(对象引用)功能改进、图像预览功能。更远期的方向包括实时生成系统、大批量工作流和界面重设计。Midjourney还预告了一个"秘密项目"将在6月内公布,官方描述为"不寻常的、出乎意料的、很多用户期待的东西"。
同时,Midjourney正在进行大规模基础设施迁移——关闭一个旧集群、上线新的主集群。这解释了近期发布节奏的短暂放缓,但新基础设施预计将提升研究速度并支持未来的新模型类型。公司约80%到90%的人力仍然集中在核心图像生成工作上。
局限与前瞻
V8.1转正默认是一个合理的节点——它同时解决了速度、分辨率和美学三个维度的问题,且向后兼容V7的个性化配置。但仍有几个值得观察的点。
HD模式虽然成本大幅下降,但对于高频用户来说,1.3倍GPU消耗的累积仍然可观。如果HD最终成为默认,Basic和Standard套餐用户的实际可用额度会缩水。小面积模糊、tile边框问题和部分参数缺失(如V7的某些控制参数尚未迁移)是社区当前反馈的高频问题,预计会在V8.2中逐步修复。
更深层的问题是API缺失。在Flux、DALL-E、Imagen都在争夺开发者生态的2026年,Midjourney仍然只能通过网页和Discord访问,这限制了它在商业工作流和自动化场景中的渗透。Midjourney的核心优势始终是美学品质——但当竞品在写实、文字、API接入等维度各自做到极致时,纯靠"好看"能维持多久的护城河,是一个真实的问题。