solidot新版网站常见问题,请点击这里查看。

Mistral AI 发布其首个多模模型 Pixtral 12B

人工智能
Wilson (42865)发表于 2024年09月12日 15时30分 星期四

来自燃烧的银河
法国 AI 创业公司 Mistral AI 发布了其首个多模模型 Pixtral 12B,具有语言和视觉处理能力,它能识别图像但不能生成图像。用户可通过 Hugging Face 和 GitHub 访问其源代码,源码采用 Apache 2.0 许可,用户可以不受限制的下载、微调和使用。Pixtral 12B 有 120 亿参数,模型大小 24GB。它是基于文本模型 Nemo 12B,应该能执行为图像添加文字描述和计算照片中物体数量等任务。Mistral 没有披露使用了哪些图像去训练模型。


https://techcrunch.com/2024/09/11/mistral-releases-pixtral-its-first-multimodal-model/
https://huggingface.co/mistral-community/pixtral-12b-240910
https://github.com/mistralai/mistral-common/releases/tag/v1.4.0