【AI】StabilityAI推出StableDiffusion3.5

近日，Stability AI 宣布推出其文生图模型 Stable Diffusion的3.5 版版本。

新版模型包括Medium、Large 和 Large Turbo 三个版本，旨在满足科研人员、爱好者、企业等广泛用户的多元需求。

Stable Diffusion 3.5 Large

Stable Diffusion 3.5 Large 拥有 80 亿个参数，是该系列目前最强的模型，专为对图像质量有严格要求的用户设计。

它能够生成 100 万像素的高清图像，在响应提示词上有更高的精度。

Large 模型非常适用于高分辨率场景，在建筑设计、时尚、广告创意等专业领域中，能实现高质量图像的稳定生成，为创意领域和行业专业人士提供了更多可选性。

Stable Diffusion 3.5 Large Turbo

Stable Diffusion 3.5 Large Turbo 在模型大小和精确度上稍逊于 Large，但在生成速度上表现更加迅速。

它可在 4 步之内完成图像生成，并保持对提示词的良好响应，因此特别适合需要快速生成图像的用户。

Large Turbo 模型的优化使其生成速度和图像质量达到更好的平衡，是初创公司和创意机构的理想选择。

Stable Diffusion 3.5 Medium

预计于 10 月 29 日发布的 Stable Diffusion 3.5 Medium，是模型的精简版，具有 25 亿个参数。

该版本采用 MMDiT-X 架构和改进的训练方法，为消费级硬件优化，使用户在个人电脑上即可以稳定生成高质量图像。

Medium 版本适用于 25 万至 200 万像素的图像生成场景，非常适合个人创意者和中小型团队，尤其是没有强大硬件设备的用户，可以实现更灵活、可定制的图像生成。

开源许可与适用范围

Stability AI 在开放模型使用许可上继续保持灵活的政策。

Stable Diffusion 3.5 可免费用于非商业用途，且年收入低于 100 万美元的小型企业也可免费使用；对于年收入超百万美元的企业，则需申请商业许可。

此外，Stability AI 允许开发者下载模型权重并通过 Hugging Face 等平台自托管模型，使用户能够在本地运行模型，这无疑为需要个性化调整的开发者提供了更多选择。

应用场景与技术进步

Stable Diffusion 3.5 在图像生成技术的精细度上有了显著提升，在图像质量、生成速度、对提示词的准确响应等方面均有优化。

模型能够理解更复杂的提示词结构，因此生成图像的细节更加丰富，特别是在色彩、光影、纹理等方面表现出色。

新模型的推出还进一步完善了分辨率处理能力，用户可以生成超高清的专业图像，这为广告创意、产品设计、时尚领域的高端图像制作带来了新的可能性。

此外，Stable Diffusion 3.5 在创意领域的运用也展示了其强大的潜力。

许多设计师和艺术家可以通过它将概念快速可视化，并且在反复尝试中不断调整细节，使创作过程更加便捷。

同时，模型的中型版本还降低了硬件的门槛，个人和小型团队可以在消费级硬件上获得较高质量的图像输出。

对此，各位读者有什么想说的？

世良情感网