+ 试用
DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练,在长文本、代码、数学、百科、中文 能力上表现优秀。
+ 试用
DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能较高,能力较强。
+ 试用
GPT-4o 是 OpenAI 于 2024 年 5 月推出的多模态旗舰模型,支持文本、语音、图像等多种输入输出,具备实时推理与自然交互能力。其响应速度快,平均仅 320 毫秒,接近人类对话水平。相比前代模型,GPT-4o 在非英语语言处理、视觉理解和语音识别方面表现更优异,且成本更低。该模型广泛应用于教育、客服、创意内容生成等领域,提升用户体验与效率。
+ 试用
Qwen2.5系列编程专家32B模型,相较于 Qwen2,Qwen2.5 获得了显著更多的知识,并在编程能力和数学能力方面有了大幅提升。此外,新模型在指令执行、生成长文本、理解结构化数据(例如表格)以及生成结构化输出特别是 JSON 方面取得了显著改进。
+ 试用
Claude 3.5 Sonnet(2024年10月22日版)是Anthropic推出的先进语言模型,具备“计算机使用”功能,可通过API模拟人类操作计算机,如查看屏幕、移动光标、点击和输入。该功能仍处于测试阶段,但展示了AI在自动化办公和软件开发中的潜力。此外,模型在编码、工具使用和多步任务处理方面表现出色,适用于企业自动化、智能客服和内容创作等场景。 
+ 试用
GPT-4.1 是 OpenAI 于 2025 年 4 月发布的多模态大型语言模型,专为开发者设计,支持文本与图像输入,具备高达 100 万个标记的上下文窗口,显著提升了长文本处理能力。该模型在编码、指令遵循和多步推理方面表现优异,代码生成准确率提升至 54.6%,远超前代模型。GPT-4.1 还引入了持久记忆功能,支持跨会话上下文记忆,适用于法律分析、客户支持、内容生成等复杂任务。
+ 试用
Qwen2.5系列编程专家7B模型,相较于 Qwen2,Qwen2.5 获得了显著更多的知识,并在编程能力和数学能力方面有了大幅提升。此外,新模型在指令执行、生成长文本、理解结构化数据(例如表格)以及生成结构化输出特别是 JSON 方面取得了显著改进。
+ 试用
Qwen2.5系列编程专家14B模型,相较于 Qwen2,Qwen2.5 获得了显著更多的知识,并在编程能力和数学能力方面有了大幅提升。此外,新模型在指令执行、生成长文本、理解结构化数据(例如表格)以及生成结构化输出特别是 JSON 方面取得了显著改进。
+ 试用
Claude 3.5 Sonnet(2024年6月20日版)是一款由Anthropic推出的先进大语言模型,具备更强的语言理解与生成能力。该版本优化了逻辑推理、代码编写与多轮对话性能,广泛应用于智能客服、内容创作和企业自动化等领域,提升交互效率与智能化水平。
+ 试用
Qwen2.5系列编程专家1.5B模型,相较于 Qwen2,Qwen2.5 获得了显著更多的知识,并在编程能力和数学能力方面有了大幅提升。此外,新模型在指令执行、生成长文本、理解结构化数据(例如表格)以及生成结构化输出特别是 JSON 方面取得了显著改进。
+ 试用
Qwen2.5系列编程专家3B模型,相较于 Qwen2,Qwen2.5 获得了显著更多的知识,并在编程能力和数学能力方面有了大幅提升。
×
提示
若您已完成采购,请前往工作台进行账号配置
立即前往