百度发布了自己的自然语言图像合成模型 ERNIE-ViLG,有中国视频主播
对比了用 ERNIE-ViLG、DALL-E 2 和 Stable Diffusion 等不同模型生成的图像,认为 ERNIE-ViLG 产生了更精确的图像。百度在 Hugging Face 上发布了 ERNIE-ViLG 的
DEMO,用户很快注意到与 DALL-E 2 和 Stable Diffusion 等 AI 模型的区别:
有敏感词限制。输入某些词语会返回“存在敏感词,请重新输入”或者“输入内容不符合相关规则,请调整后再试!”