讯飞星辰MaaS平台 API产品17
Qwen3-235B-A22B是阿里云推出的超大规模AI服务,基于2350亿参数大模型,支持多模态理解与生成。该服务提供高性能推理、微调API及企业级解决方案,具备强大的语言处理、逻辑推理和跨领域任务能力,适用于智能客服、内容创作、数据分析等场景。
llama-3-chinese-8b-instruct 模型在原版Llama-3的基础上使用了大规模中文数据进行增量预训练,并且使用精选指令数据进行精调,进一步提升了中文基础语义和指令理解能力
Gemma 是谷歌推出的轻量级先进开源模型家族,其构建所采用的研究和技术与创造 Gemini 模型相同。这些模型为仅解码器的文本到文本大型语言模型,有英文版,预训练变体和指令微调变体均开放权重。Gemma 模型适用于多种文本生成任务,如问答、摘要和推理。由于其相对较小的尺寸,可以部署在资源有限的环境中,如笔记本电脑、台式机或个人云基础设施,让每个人都能更便捷地使用最先进的人工智能模型,促进创新发展。
DeepSeek-R1-Distill-Llama-70B 是基于 DeepSeek-R1推理数据蒸馏训练的模型,基础模型为Llama-3.3-70B-Instruct。在数学推理、代码生成等复杂任务中表现卓越,尤其擅长多步推导和跨领域问题解决。
DeepSeek-R1-Distill-Llama-8B 是基于 DeepSeek-R1推理数据蒸馏训练的模型,基础模型为Llama-3.1-8B。在数学推理、代码生成等任务中表现卓越。
DeepSeek-R1-Distill-Qwen-32B 是基于 DeepSeek-R1推理数据蒸馏训练的模型,基础模型为Qwen2.5-32B。在数学推理、代码生成等复杂任务中表现卓越,尤其擅长多步推导和跨领域问题解决。
DeepSeek-R1-Distill-Qwen-14B 是基于 DeepSeek-R1推理数据蒸馏训练的模型,基础模型为Qwen2.5-14B。在数学推理、代码生成等复杂任务中表现卓越,尤其擅长多步推导和跨领域问题解决。