奇客Solidot | 研究人员发现 Stable Diffusion 能压缩图像

登录注册

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

消息

本文已被查看 4378 次

研究人员发现 Stable Diffusion 能压缩图像

WinterIsComing (31822)发表于 2022年09月28日 14时42分星期三

来自炼金术战争

瑞士软件工程师 Matthias Bühlmann 发现，流行的 AI 自然语言图像合成模型 Stable Diffusion 能用于压缩位图图像，在高压缩率下比 JPEG 或 WebP 有更少的视觉瑕疵，缺陷是可能会添加原图不存在的东西。Stable Diffusion 利用互联网上数百万张图片进行训练，能根据文本描述或提示生成图像。在训练过程中，它在图像和相关词语之间进行统计关联，对每张图像提取出较少的关键信息表述，将其作为“权重（weights）”储存。绝大部分用户在使用 Stable Diffusion 时是通过文本描述去生成图像，但 Bühlmann 剔除了文本编码器，强行让图像通过 Stable Diffusion 的图像编码器进行处理，能将低精度的图像转变成高精度的潜在空间(latent space)表示，在此过程中大幅减少图像体积。测试显示一张 768KB 的图像用 JPEG 压缩到 5.68KB，用 WebP 压缩到 5.71 KB，而用 Stable Diffusion 压缩到 4.98KB。

花代价所换来的一点才智，抵过别人传授的数倍不止。

本站提到的所有注册商标属于他们各自的所有人所有，评论属于其发表者所有，其余内容版权属于 solidot.org(2009-) 所有。

京ICP证161336号京ICP备15039648号-15 北京市公安局海淀分局备案号：11010802021500

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　网上有害信息举报专区：https://www.12377.cn