StabilityAI今天发布了其新的Stable Diffusion 3.5系列AI图像模型。相比SD3,它在现实感、提示依从性和文本渲染方面都有显著提升。与最初的SD3版本一样,Stable Diffusion 3.5有三种尺寸——Large(8B)、Large Turbo(8B)和Medium(2.6B),这些模型都可以自定义,并调试以在消费级硬件上运行,同时可根据Stability AI社区许可证使用。
简而言之,这是朝着用户能够创建更加真实的AI图像迈出的重要一步。StabilityAI在新闻稿中承认,其于6月推出的Stable Diffusion 3 Medium模型“没有完全达到我们的标准或社区的期望”。该公司补充道:“在倾听了宝贵的社区反馈后,我们决定不进行快速修复,而是花时间进一步开发一个能够推进我们视觉媒体转型使命的版本。”
Stable Diffusion 3.5的新功能是什么?
Stability AI表示,3.5版模型专注于可定制性、高效性能和多样化输出。官方发言人解释道:“Stable Diffusion 3.5是我们迄今为止最强大的模型,体现了我们致力于为创作者提供既广泛可用又前沿的工具的承诺。”
这意味着图像可以被精细调整,模型能够“开箱即用”地在消费级硬件上运行,并且生成的图像感觉上更具独特性。
对SD3.5的快速测试
Tom’s Guide的AI编辑Ryan Morrison测试了SD3.5 Large,发现它速度快,非常善于精确响应提示,且风格控制能力强。相比SD3,特别是Medium版本,它是一个巨大的飞跃。SD3.5还新增了多种风格选择,包括摄影、绘画等。用户可以通过标签提示指定风格,如波西米亚风或时尚风。提示中的重点词汇也可以用来引导模型朝着特定方向发展。
StabilityAI的新闻稿中还提到:“Stable Diffusion 3.5 Large在提示依从性上引领市场,在图像质量上与更大规模的模型相媲美。”Turbo版本在推理时间上表现最快,Medium版本则提供了提示依从性和图像质量的平衡,成为高效高质量表现的首选。
Stable Diffusion 3.5模型可供非商业用途免费使用,包括科学研究和年收入低于100万美元的小型和中型企业。超过该额度的企业需要获得企业许可证。