
今天知名 AI 公司 Stability AI 宣布推出其最新的基于文本生成图像的人工智能模型“Stable Diffusion”的新版本 -“Stable Diffusion 3.5”,这是他们迄今为止最强大的模型。在此次发布中,提供了三种专门针对不同用途的模型变体,以满足从研究人员到爱好者以及初创企业等广泛用户群体的需求。

AI 图像生成模型 Stable Diffusion 3.5
三种模型覆盖广泛的使用场景
六月份发布的前一个版本“Stable Diffusion 3 Medium”未能充分满足该公司设定的标准和社区的期望。吸取了这一经验教训后,Stability AI 在此次版本更新中不仅仅进行了修复,还实施了实质性的改进,以推进其对视觉媒体变革的使命。
此次发布的三个模型各有不同的特点和用途:
Stable Diffusion 3.5 Large
- 具有80亿参数的顶级模型
- 支持百万像素的高分辨率图像生成
- 优化用于专业用途
- 实现了市场最高级别的提示忠实度
- 设想用于营销活动和数字资产创建
Stable Diffusion 3.5 Large Turbo
- 保留了大型模型的高级知识同时优化处理速度
- 实现了仅需四个步骤的图像生成
- 适用于需要快速工作流程的实际操作
- 在实时图像生成或大量变化创建方面表现出强大功能
Stable Diffusion 3.5 Medium(计划于10月29日发布)
- 具有 25 亿参数的轻量级模型
- 采用改进的 MMDiT-X 架构实现高效处理
- 支持 0.25 至 2 百万像素范围内的图像生成
- 优化用于普通消费级硬件上的运行
Stable Diffusion 3.5 的技术创新和改进
此次更新引入了多项技术创新。值得注意的是,它整合了变换器块中的查询-键规范化(QKN),该技术使模型训练过程更加稳定,并简化了最终用户的微调和开发过程。
Stability AI 的首席技术官 Hanno Basse 解释说:“QK-norm 是我们一直在实验的技术,但这是首次正式采用。我们认为这种优先考虑定制的新模型适合这项技术。”
此外,设计允许在同一提示下使用不同的种子值来获得更加多样的输出。这是一种有意的设计选择,它使得基础模型能够保持广泛的知识库和多种风格。
Basse 进一步解释道:“在训练过程中,我们对每张图像使用多个版本的提示进行标记,并优先使用较短的提示。这有助于确保对于特定的文本描述,可以覆盖更广泛的图像概念分布。”
此外,由于 MMDiT-X 架构的进化,图像质量和分辨率生成能力得到了提升。通过加强多模态处理能力,实现了更加自然的图像表现。这些改进实现了资源使用的效率与高质量输出的结合。
对多样性和伦理性的深入关注
在新版中,除了技术进步之外,还加强了对多样性的关注。现在,可以自然地生成不同肤色和特征的人物,无需过度提示即可实现多样化表达。这不仅是一种政治上的考量,更是作为提高AI实用性的重要进化而受到评价。
此外,还增强了对 3D 艺术、摄影、绘画、线图等各种风格的支持,在保持一致视觉表现的同时,获得了能准确反映创作者意图的灵活风格转换能力。
许可证和使用条款
Stability AI 社区许可证旨在平衡开放使用和商业应用。非商业用途完全免费,并且不限制用于研究目的的使用。对于年收入低于一百万美元的企业,可以免费使用。这旨在支持初创企业和小型企业的成长,并促进创作者的盈利。对于年收入超过一百万美元的组织,则提供了定制的企业许可证。
您现在可以从 Hugging Face 和 GitHub 上的推理代码下载 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo 模型。
在 10 月 29 日发布 Stable Diffusion 3.5 Medium 后,还将计划实施 ControlNets 功能,从而在专业用途中实现更高级别的图像控制。除了在 Hugging Face 上发布权重外,还将能够在多种平台上使用此模型,包括稳定性人工智能 API、Replicate、Fireworks、ComfyUI 等。
此次 Stable Diffusion 3.5 的发布是 Stability AI 能重新确立其在图像生成 AI 市场地位的重要一步。特别值得一提的是,模型多样性和可定制性的增强。从拥有 80 亿参数的大型模型、专注于快速处理的增强版模型到面向普通用户的中型模型,这一系列产品阵容能够满足各种需求,值得高度赞赏。
此外,采用查询-键规范化是考虑到未来模型发展的明智选择。这将使得开发者社区更容易进行自己的改进和扩展,有望推动生态系统进一步发展。
然而,需要注意的是,提示的具体性对输出质量的影响越来越大。可以说,这是以模型灵活性为代价的权衡,但在专业用途中,这可能会要求更详细的提示工程技能。
文章名称:《Stability AI 发布最新 AI 图像生成模型 Stable Diffusion 3.5 版本》
文章固定链接:https://www.dayanzai.me/stable-diffusion-3-5.html
本站资源仅供个人学习交流,请于下载后 24 小时内删除,不允许用于商业用途,否则法律问题自行承担。
猜你喜欢
- 2023-05-19在硬盘或固态硬盘上启用文件和文件夹压缩的优缺点
- 2021-09-09闪迪官方固态硬盘工具 SanDisk SSD Dashboard 5.0.2.1 中文多语免费版
- 2019-04-01图像拼贴工具 Picture Collage Maker Pro 4.1.4 中文注册版
- 2022-08-26如何在 Windows 设备上检查 Wi-Fi 6 (802.11ax) 是否支持
- 2021-10-13下载适用于 Windows 10 v21H1、v20H2 和 v2004 的累积更新 KB5006670
相关推荐
- 2021-10-18Windows 系统隐私优化工具 WPD 1.5.2042 RC 1 中文多语免费版
- 2023-03-22Windows 开始菜单增强软件 Start Menu X 7.77 中文多语免费版
- 2025-03-01完整和灵活的备份软件 Iperius Backup 8.5.3 中文免费版
- 2025-03-21系统安全软件 Hitman Pro 3.8.44 Build 340 + x64 中文多语免费版
- 2021-06-23你可能不知道的 Windows 10 中更改用户帐户类型的四种方法