API Hub
找服务商
API知识库
我是服务商
产品和服务
关于我们
控制台
敬请期待...
×
反馈问题
×
描述
*
截图
点击或拖拽图片到此处上传(最多5张)
联系方式
API分类
全部
AI技术
生活服务
KYC认证
智能识别
信息与知识
开发者工具
区块链技术
沟通与链接
安全服务
位置服务
支付服务
网站运营
企业服务
商业软件
电子商务
金融科技
运动健康
酒店旅游
美食餐饮
数字文娱
教育服务
医疗服务
公共数据
政府机构
全部
最新
免费
通用
新
专用API
Mistral Nemo
novita
企业
Mistral NeMo 12B 是由 Mistral AI 与 NVIDIA 联合开发的开源大语言模型,拥有 120 亿参数,支持最长 128K token 的上下文输入,专为多轮对话、代码生成和多语言任务优化。该模型采用 FP8 精度格式,提升推理效率,适用于企业级应用。Mistral NeMo 12B 可通过 NVIDIA NIM 微服务部署,便于在各类平台上快速集成和使用。
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
Mistral 7B Instruct
novita
企业
Mistral 7B Instruct 是由 Mistral AI 发布的开源指令微调语言模型,拥有 73 亿参数,专为对话生成、代码编写和函数调用等任务优化。该模型采用 Grouped-Query Attention(GQA)机制,支持最长 32,768 个 token 的上下文输入,性能优于 LLaMA 2 13B,适用于智能问答、内容创作和多语言应用场景。Mistral 7B Instruct 可通过 Hugging Face 和 NVIDIA NIM 等平台部署使用。 
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
Llama3 70b Instruct
novita
企业
Llama 3.1 70B Instruct 是 Meta 于 2024 年 7 月发布的多语言指令微调大语言模型,拥有 700 亿参数,支持最长 128K token 的上下文输入。该模型采用优化的 Transformer 架构,结合分组查询注意力(GQA)机制,通过监督微调(SFT)和人类反馈强化学习(RLHF)进行训练,优化了多语言对话、代码生成、数学推理等任务,适用于智能问答、内容生成和多语言应用场景。
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
Llama 3 8B Instruct
novita
企业
Llama 3 8B Instruct 是 Meta 于 2024 年 4 月发布的开源指令微调语言模型,拥有 80 亿参数,专为对话、代码生成和多语言任务优化。该模型在 15 万亿 token 上进行预训练,结合监督微调(SFT)和人类反馈强化学习(RLHF)进行训练,支持最长 8,192 个 token 的上下文输入,适用于智能问答、内容创作和企业级应用场景。
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
Llama 3.2 11B Vision Instruct
novita
企业
Llama 3.2 11B Vision Instruct 是 Meta 于 2024 年 9 月发布的多模态指令微调模型,拥有 110 亿参数,支持图像与文本混合输入,输出文本结果。该模型优化了图像识别、视觉问答、图像描述和文档解析等任务,支持最长 128K token 的上下文输入,适用于内容生成、智能问答、教育辅助等场景。可通过 Hugging Face 和 Amazon Bedrock 等平台部署使用。
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
Llama 3.1 70B Instruct
novita
企业
Llama 3.1 70B Instruct 是 Meta 于 2024 年发布的多语言指令微调大语言模型,拥有 700 亿参数,支持最长 128K token 的上下文输入。该模型采用优化的 Transformer 架构,结合分组查询注意力(GQA)机制,通过监督微调(SFT)和人类反馈强化学习(RLHF)进行训练,优化了多语言对话、代码生成、数学推理等任务,适用于智能问答、内容生成和多语言应用场景。
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
Llama 3.1 8B Instruct BF16
novita
企业
Llama 3.1 8B Instruct BF16 是 Meta 于 2024 年 7 月发布的多语言指令微调大语言模型,拥有 80 亿参数,采用 bfloat16 精度格式,优化了推理性能和内存效率。该模型支持最长 128K token 的上下文输入,适用于对话生成、代码编写和多语言翻译等任务,适合在资源受限的本地部署和商业应用场景。
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
Llama 3.1 8B Instruct
novita
企业
Llama 3.1 8B Instruct 是 Meta 于 2024 年 7 月发布的多语言指令微调大语言模型,拥有 80 亿参数,支持最长 128K token 的上下文输入。该模型采用 Grouped-Query Attention(GQA)机制,优化了对话、文本生成、代码编写和多语言翻译等任务,适用于资源受限的本地部署和商业应用场景。
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
Llama 3.2 1B Instruct
novita
企业
Llama 3.2 1B Instruct 是 Meta 于 2024 年 9 月发布的轻量级多语言指令微调模型,拥有 12.3 亿参数,支持最长 128K token 的上下文输入。该模型采用优化的 Transformer 架构,结合 Grouped-Query Attention(GQA)机制,通过监督微调(SFT)和人类反馈强化学习(RLHF)进行训练,优化了多语言对话、摘要生成和知识检索等任务,适用于边缘设备和移动应用。
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
Llama 3.2 3B Instruct
novita
企业
Llama 3.2 3B Instruct 是 Meta 于 2024 年 9 月发布的多语言指令微调语言模型,拥有 32 亿参数,采用优化的 Transformer 架构,结合 Grouped-Query Attention(GQA)机制,支持最长 128K token 的上下文输入。该模型通过监督微调(SFT)和人类反馈强化学习(RLHF)进行训练,优化了多语言对话、摘要生成和知识检索等任务,适用于边缘设备和移动应用。官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语等语言。 
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
Llama 3.3 70B Instruct
novita
企业
Llama 3.3 70B Instruct 是 Meta 于 2024 年 12 月发布的多语言指令微调大模型,拥有 700 亿参数,支持 128K 上下文长度,优化了对话、代码生成、数学推理等任务,在多个基准测试中表现优异,适用于智能问答、内容创作和多语言应用场景。
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
Llama 4 Scout Instruct
novita
企业
Llama 4 Scout Instruct 是 Meta 于 2025 年 4 月发布的多模态语言模型,采用 17B 激活参数和 16 专家混合架构(MoE),总参数达 109B。该模型支持文本与图像输入,输出多语言文本和代码,具备 10M token 的上下文窗口,适用于智能问答、视觉问答、内容生成等任务。Llama 4 Scout 在多个基准测试中表现优异,性能媲美 GPT-4o,适合商业和研究应用。 
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
Llama 4 Maverick Instruct
novita
企业
Llama 4 Maverick Instruct 是 Meta 于 2025 年 4 月发布的旗舰多模态语言模型,采用 128 路专家混合架构(MoE),总参数达 4000 亿,每次推理激活 170 亿参数。该模型支持文本与图像输入,输出多语言文本和代码,具备 100 万 token 的上下文窗口,适用于智能问答、视觉问答、内容生成等任务。Maverick 在多个基准测试中表现优异,性能媲美 GPT-4o,适合商业和研究应用。 
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
Gemma 2 9B
novita
企业
Gemma 2 9B 是 Google 于 2024 年 6 月发布的开源语言模型,拥有 90 亿参数,采用高效的 Transformer 架构,结合局部-全局注意力机制和组查询注意力技术,支持最长 8192 个 token 的上下文输入。该模型通过知识蒸馏训练,性能优于同类规模模型,适用于问答、摘要、推理等任务,支持本地部署,适合资源受限的环境。 
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询
新
专用API
DeepSeek R1 Distill LLama 70B
novita
企业
DeepSeek-R1-Distill-Llama-70B 是 DeepSeek 团队基于 Llama3.3-70B-Instruct 架构,通过蒸馏技术优化的开源大语言模型,拥有 700 亿参数,专注于数学推理、代码生成和复杂逻辑任务,性能媲美 GPT-4o 和 o1-mini,支持本地部署,适用于智能问答、教育辅助和企业级应用场景。
API详情
咨询
×
novita
企业
服务时间:
00:00:00至24:00:00
网页在线客服:
咨询