API Hub，已入驻5000+国内外开放性API

最新免费通用

新

专用API

Mistral Nemo

novita

企业

Mistral NeMo 12B 是由 Mistral AI 与 NVIDIA 联合开发的开源大语言模型，拥有 120 亿参数，支持最长 128K token 的上下文输入，专为多轮对话、代码生成和多语言任务优化。该模型采用 FP8 精度格式，提升推理效率，适用于企业级应用。Mistral NeMo 12B 可通过 NVIDIA NIM 微服务部署，便于在各类平台上快速集成和使用。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

Mistral 7B Instruct

novita

企业

Mistral 7B Instruct 是由 Mistral AI 发布的开源指令微调语言模型，拥有 73 亿参数，专为对话生成、代码编写和函数调用等任务优化。该模型采用 Grouped-Query Attention（GQA）机制，支持最长 32,768 个 token 的上下文输入，性能优于 LLaMA 2 13B，适用于智能问答、内容创作和多语言应用场景。Mistral 7B Instruct 可通过 Hugging Face 和 NVIDIA NIM 等平台部署使用。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

Llama3 70b Instruct

novita

企业

Llama 3.1 70B Instruct 是 Meta 于 2024 年 7 月发布的多语言指令微调大语言模型，拥有 700 亿参数，支持最长 128K token 的上下文输入。该模型采用优化的 Transformer 架构，结合分组查询注意力（GQA）机制，通过监督微调（SFT）和人类反馈强化学习（RLHF）进行训练，优化了多语言对话、代码生成、数学推理等任务，适用于智能问答、内容生成和多语言应用场景。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

Llama 3 8B Instruct

novita

企业

Llama 3 8B Instruct 是 Meta 于 2024 年 4 月发布的开源指令微调语言模型，拥有 80 亿参数，专为对话、代码生成和多语言任务优化。该模型在 15 万亿 token 上进行预训练，结合监督微调（SFT）和人类反馈强化学习（RLHF）进行训练，支持最长 8,192 个 token 的上下文输入，适用于智能问答、内容创作和企业级应用场景。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

Llama 3.2 11B Vision Instruct

novita

企业

Llama 3.2 11B Vision Instruct 是 Meta 于 2024 年 9 月发布的多模态指令微调模型，拥有 110 亿参数，支持图像与文本混合输入，输出文本结果。该模型优化了图像识别、视觉问答、图像描述和文档解析等任务，支持最长 128K token 的上下文输入，适用于内容生成、智能问答、教育辅助等场景。可通过 Hugging Face 和 Amazon Bedrock 等平台部署使用。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

Llama 3.1 70B Instruct

novita

企业

Llama 3.1 70B Instruct 是 Meta 于 2024 年发布的多语言指令微调大语言模型，拥有 700 亿参数，支持最长 128K token 的上下文输入。该模型采用优化的 Transformer 架构，结合分组查询注意力（GQA）机制，通过监督微调（SFT）和人类反馈强化学习（RLHF）进行训练，优化了多语言对话、代码生成、数学推理等任务，适用于智能问答、内容生成和多语言应用场景。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

Llama 3.1 8B Instruct BF16

novita

企业

Llama 3.1 8B Instruct BF16 是 Meta 于 2024 年 7 月发布的多语言指令微调大语言模型，拥有 80 亿参数，采用 bfloat16 精度格式，优化了推理性能和内存效率。该模型支持最长 128K token 的上下文输入，适用于对话生成、代码编写和多语言翻译等任务，适合在资源受限的本地部署和商业应用场景。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

Llama 3.1 8B Instruct

novita

企业

Llama 3.1 8B Instruct 是 Meta 于 2024 年 7 月发布的多语言指令微调大语言模型，拥有 80 亿参数，支持最长 128K token 的上下文输入。该模型采用 Grouped-Query Attention（GQA）机制，优化了对话、文本生成、代码编写和多语言翻译等任务，适用于资源受限的本地部署和商业应用场景。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

Llama 3.2 1B Instruct

novita

企业

Llama 3.2 1B Instruct 是 Meta 于 2024 年 9 月发布的轻量级多语言指令微调模型，拥有 12.3 亿参数，支持最长 128K token 的上下文输入。该模型采用优化的 Transformer 架构，结合 Grouped-Query Attention（GQA）机制，通过监督微调（SFT）和人类反馈强化学习（RLHF）进行训练，优化了多语言对话、摘要生成和知识检索等任务，适用于边缘设备和移动应用。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

Llama 3.2 3B Instruct

novita

企业

Llama 3.2 3B Instruct 是 Meta 于 2024 年 9 月发布的多语言指令微调语言模型，拥有 32 亿参数，采用优化的 Transformer 架构，结合 Grouped-Query Attention（GQA）机制，支持最长 128K token 的上下文输入。该模型通过监督微调（SFT）和人类反馈强化学习（RLHF）进行训练，优化了多语言对话、摘要生成和知识检索等任务，适用于边缘设备和移动应用。官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语等语言。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

Llama 3.3 70B Instruct

novita

企业

Llama 3.3 70B Instruct 是 Meta 于 2024 年 12 月发布的多语言指令微调大模型，拥有 700 亿参数，支持 128K 上下文长度，优化了对话、代码生成、数学推理等任务，在多个基准测试中表现优异，适用于智能问答、内容创作和多语言应用场景。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

Llama 4 Scout Instruct

novita

企业

Llama 4 Scout Instruct 是 Meta 于 2025 年 4 月发布的多模态语言模型，采用 17B 激活参数和 16 专家混合架构（MoE），总参数达 109B。该模型支持文本与图像输入，输出多语言文本和代码，具备 10M token 的上下文窗口，适用于智能问答、视觉问答、内容生成等任务。Llama 4 Scout 在多个基准测试中表现优异，性能媲美 GPT-4o，适合商业和研究应用。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

Llama 4 Maverick Instruct

novita

企业

Llama 4 Maverick Instruct 是 Meta 于 2025 年 4 月发布的旗舰多模态语言模型，采用 128 路专家混合架构（MoE），总参数达 4000 亿，每次推理激活 170 亿参数。该模型支持文本与图像输入，输出多语言文本和代码，具备 100 万 token 的上下文窗口，适用于智能问答、视觉问答、内容生成等任务。Maverick 在多个基准测试中表现优异，性能媲美 GPT-4o，适合商业和研究应用。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

Gemma 2 9B

novita

企业

Gemma 2 9B 是 Google 于 2024 年 6 月发布的开源语言模型，拥有 90 亿参数，采用高效的 Transformer 架构，结合局部-全局注意力机制和组查询注意力技术，支持最长 8192 个 token 的上下文输入。该模型通过知识蒸馏训练，性能优于同类规模模型，适用于问答、摘要、推理等任务，支持本地部署，适合资源受限的环境。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

新

专用API

DeepSeek R1 Distill LLama 70B

novita

企业

DeepSeek-R1-Distill-Llama-70B 是 DeepSeek 团队基于 Llama3.3-70B-Instruct 架构，通过蒸馏技术优化的开源大语言模型，拥有 700 亿参数，专注于数学推理、代码生成和复杂逻辑任务，性能媲美 GPT-4o 和 o1-mini，支持本地部署，适用于智能问答、教育辅助和企业级应用场景。

API详情

咨询

novita

企业

服务时间： 00:00:00至24:00:00

网页在线客服：

咨询

API分类

全部

API平台

API平台

API学院

公司

反馈问题

API分类

全部

API平台

API平台

API学院

公司