StarCoder代码生成模型

StarCoder代码生成模型

通用API
【更新时间: 2024.03.26】 StarCoder 和 StarCoderBase 是针对代码的大语言模型 (代码 LLM),模型基于 GitHub 上的许可数据训练而得,训练数据中包括 80 多种编程语言、Git 提交、GitHub 问题和 Jupyter notebook。
服务星级:5星
⭐ ⭐ ⭐ ⭐ ⭐ 🌟 🌟
浏览次数
25
采购人数
0
试用次数
0
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是StarCoder代码生成模型?

StarCoder 和 StarCoderBase 是针对代码的大语言模型 (代码 LLM),模型基于 GitHub 上的许可数据训练而得,训练数据中包括 80 多种编程语言、Git 提交、GitHub 问题和 Jupyter notebook。与 LLaMA 类似,我们基于 1 万亿个词元训练了一个约 15B 参数的模型。此外,我们还针对一个 35B 词元的 Python 数据集对 StarCoderBase 模型进行了微调,从而获得了一个我们称之为 StarCoder 的新模型。

StarCoder 的一个有趣方面是它是多语言的,因此我们在 MultiPL-E 上对其进行了评估,MultiPL-E 是 HumanEval 的多语言扩展版。我们观察到 StarCoder 在许多编程语言上与 code-cushman-001 的表现相当甚至更优。在 DS-1000 数据科学基准测试中,它以明显优势击败了 code-cushman-001 以及所有其他开源模型。好了,我们来看看除了代码补全之外,StarCoder 还能做些什么!

什么是StarCoder代码生成模型?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用StarCoder代码生成模型,从而实现程序的自动化交互,提高服务效率。
<
最可能同场景使用的其他API
>
API接口列表
<
依赖服务
>
<
最可能同场景使用的其他API
>