奇客Solidot | AI 是黑箱，而 Anthropic 正找到方法一窥黑箱内部

登录注册

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

消息

本文已被查看 5249 次

AI 是黑箱，而 Anthropic 正找到方法一窥黑箱内部

Wilson (42865)发表于 2024年05月22日 00时25分星期三

来自帽子里的天空

AI 研究员 Chris Olah 过去十年沉迷于研究人工神经网络。他先后任职于 Google Brain 和 OpenAI，目前在他联合创办的 AI 创业公司 Anthropic 工作。他一直对 AI 内部如何工作十分感兴趣。随着生成式 AI 无处不在，AI 黑箱问题日益引人关注。大模型会随意捏造信息，如果我们能了解其内部如何工作，那么将有助于让它变得更安全。Olah 相信我们正实现这一目标。他的团队正通过对大模型逆向工程去了解它们为什么会产生特定输出。根据今天发表的论文，他们已经取得了显著进展。研究人员称，他们的做法是将人工神经元视为字母，字母本身没什么意义，只有按顺序组合起来才有意义。C 没有意义，但 Car 有。他们使用了被称为字典学习的技术去解释神经网络。

https://www.wired.com/story/anthropic-black-box-ai-research-neurons-features/?utm_source=press.coop

首先他们无视于你，而后是嘲笑你，接着是批斗你，再来就是你的胜利之日。--甘地

本站提到的所有注册商标属于他们各自的所有人所有，评论属于其发表者所有，其余内容版权属于 solidot.org(2009-) 所有。

京ICP证161336号京ICP备15039648号-15 北京市公安局海淀分局备案号：11010802021500

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　网上有害信息举报专区：https://www.12377.cn