solidot新版网站常见问题,请点击这里查看。

研究人员发布开源代码生成 AI 模型 PolyCoder

人工智能
WinterIsComing (31822)发表于 2022年03月08日 21时29分 星期二

来自记忆
GitHub 的 Copilot 可能是目前最为知名的 AI 代码生成系统,只需要提示它就能根据上下文写出相应的代码,帮助开发者减少重复性的编程工作。Copilot 是基于 OpenAI 的 Codex,其训练集未公开,研究人员无法对 AI 模型进行微调或调查其可解释性。为弥补这一缺陷,卡内基梅隆大学的研究人员开发了 基于 OpenAI GPT-2 语言模型的代码生成模型 PolyCoder,它使用了 12 种编程语言的 249 GB 代码数据库进行训练。虽然在性能上比不上顶尖的代码生成器,但研究人员表示 PolyCoder 在 C 语言上其代码精度高于包括 Codex 在内的其它模型。研究人员称大型科技企业不公开模型阻碍科学研究和大型代码语言模型的大众化。他们希望自己的开源代码生成模型能说服其他人采用类似的做法。