您现在的位置是：主页>科技 >内容

科技

Stable Diffusion 3.5会更贴近你的提示并产生更多元的人

2024-10-23 09:53:49科技传统的飞鸟

Stable Diffusion 是Midjourney和DALL-E等 AI 图像生成器的开源替代品，现已更新至3 5 版。新模型试图纠正广受批评的 Stable Diffus

Stable Diffusion 是Midjourney和DALL-E等 AI 图像生成器的开源替代品，现已更新至3.5 版。新模型试图纠正广受批评的 Stable Diffusion 3 Medium 的一些错误(这可能是轻描淡写)。Stability AI 表示，3.5 模型比其他图像生成器更能遵循提示，并且在输出质量方面可与更大的模型相媲美。此外，它还针对更多样化的风格、肤色和特征进行了调整，而无需明确提示。

新款型号有三种款式。Stable Diffusion 3.5 Large 是三款产品中功能最强大的一款，质量最高，同时在快速贴合方面也处于行业领先地位。Stability AI 表示，该型号适合专业用途，分辨率为 1 MP。

同时，Stable Diffusion 3.5 Large Turbo 是大型型号的“精简版”，更注重效率而非最高质量。Stability AI 表示，Turbo 版本仍可通过四个步骤生成“高质量图像，且具有出色的快速一致性”。

最后，Stable Diffusion 3.5 Medium(25 亿个参数)专为在消费级硬件上运行而设计，在质量和简便性之间取得平衡。由于其定制起来更加容易，该模型可以生成分辨率在 0.25 到 2 百万像素之间的图像。然而，与目前可用的前两款型号不同，Stable Diffusion 3.5 Medium 要到 10 月 29 日才会上市。

继 6 月份失败的Stable Diffusion 3 Medium之后，这款新三款产品也相继问世。该公司承认，这款产品“没有完全满足我们的标准或社区的期望”，因为它在响应本不要求的提示时产生了一些可笑的怪异身体恐怖。Stability AI 在今天的公告中多次提到出色的及时遵守可能并非巧合。

尽管 Stability AI 在其公告博客文章中只是简要提及，但 3.5 系列拥有新的滤镜，可以更好地反映人类的多样性。该公司将新模型的人类输出描述为“代表世界，而不仅仅是一种类型的人，具有不同的肤色和特征，无需大量提示。”

希望它足够复杂，能够考虑到微妙之处和历史敏感性，不像谷歌今年早些时候的失败。在未经提示的情况下，Gemini 制作了一系列极其不准确的历史“照片”，比如种族多元化的纳粹分子和美国开国元勋。反对声如此强烈，以至于谷歌直到六个月后才重新纳入人类世代。

上一篇：衰减器原理（衰减器）
下一篇：Anthropic将让ClaudeAI控制你的电脑

艾巴生活网

科技

Stable Diffusion 3.5会更贴近你的提示并产生更多元的人

推荐阅读