奇客Solidot | Stability AI 发布 RLHF 训练的开源聊天机器人 StableVicuna

登录注册

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

消息

本文已被查看 6082 次

Stability AI 发布 RLHF 训练的开源聊天机器人 StableVicuna

Wilson (42865)发表于 2023年04月29日 12时45分星期六

来自人猿泰山之智斗恐龙

ChatGPT 等 AI 聊天机器人的成功受益于两种训练范式：指令微调和基于人类反馈的增强学习(RLHF)。目前缺乏同时应用这两种范式的开源模型，大部分模型因 RLHF 的复杂性而只应用了指令微调。AI 创业公司 Stability AI 宣布发布第一种应用 RLHF 训练的大型开源聊天机器人 StableVicuna，基于 Vicuna v0 13b，而 Vicuna v0 13b 则是基于 Meta 的大语言模型 LLaMA 13b（130 亿参数）。LLaMA 模型目前不支持商业使用。

https://huggingface.co/spaces/CarperAI/StableVicuna
https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

财富并非供人拥有，而是供人享受。

本站提到的所有注册商标属于他们各自的所有人所有，评论属于其发表者所有，其余内容版权属于 solidot.org(2009-) 所有。

京ICP证161336号京ICP备15039648号-15 北京市公安局海淀分局备案号：11010802021500

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　网上有害信息举报专区：https://www.12377.cn