当前业界最优秀的8个编程大模型简介

大语言模型中一个非常重要的内容就是关于代码的支持。通常,基于代码数据训练的模型不仅在代码补全方面有着更好地支持,也可能是大语言模型逻辑能力的部分来源。本文将总结目前业界专门针对代码补全(生成)方面而做的8个大模型。本文来自DataLeanre官方博客:当前业界最优秀的8个编程大模型简介:从最早的DeepMind的AlphaCode到最新的StarCoder全解析~

数据学习者官方网站(Datalearner)

需要注意的是,本文介绍的是编程大模型,并非代码补全插件,所以没有涉及AWS的CodeWhisper、Tabnine等。也欢迎大家补充~

DeepMind的AlphaCodeOpenAI的Codex/GitHub的CopilotSaleforce的CodeT5Saleforce的CodeGen/CodeGen2MetaAI的InCoder清华大学的CodeGeeXReplit的ReplitCodeBigCode的StarCoder/StarCoderBaseDeepMind的AlphaCode

DeepMind在论文《AlphaCode:NeuralCodeGenerationwithTransformerDecoders》中首次介绍了AlphaCode。论文发表在年1月的AAAI-21会议上。

AlphaCode采用的模型和数据集目前未开源。但DeepMind提供了一个在线演示,可以输入代码注释并生成对应的Python代码:


转载请注明:http://www.aierlanlan.com/tzrz/8574.html