开发者智能编码助手精选
这篇文章为大家报告了四种领先的大型语言模型的实验结果。 OpenAI 的 GPT-4、Meta CodeLlama70B、Meta CodeLlama7B和Mistral Mixtral8x7B的任务是进行编码挑战,以评估哪一个在编码助手中占据主导地位。目的是评估他们的能力,并辨别哪种大模型对编码任务最有利。 对于GPT-4,这里选择了GTP-4 Turbo的最后一个版本(gpt-4-0125-preview),因为它纠正了其前身的一些“惰性”。 测试设置 此次比较是在 Visual Studio Code 中设置的,并通过“Continue”插件进行了增强,允许与每个 LLM 直接交互。 此设置反映了 GitHub Copilot 和 AWS Codewhisperer 等其它编码助手的功能,并为你的代码提供了更多的隐私控制(例如通过在私有服务器上运行 LLM)以及切换到最佳(或更便宜)的 LLM 的选项手头的任务。 我的设置如下图所示: 请大家注意,右端是我刚刚从 CodeLlama70B 得到的答案。 测试 LLM在编码的八个关键领域进行了评估: 代码生成它们根据需求从头开始制作代码片段或完整模块的能力。 代码解释和文档:它们阐明现有代码和创建有意义的文档的能力。…