|
|
|
DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练,在长文本、代码、数学、百科、中文 能力上表现优秀。
|
|
|
DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能较高,能力较强。
|
|
|
GPT-4o 是 OpenAI 于 2024 年 5 月推出的多模态旗舰模型,支持文本、语音、图像等多种输入输出,具备实时推理与自然交互能力。其响应速度快,平均仅 320 毫秒,接近人类对话水平。相比前代模型,GPT-4o 在非英语语言处理、视觉理解和语音识别方面表现更优异,且成本更低。该模型广泛应用于教育、客服、创意内容生成等领域,提升用户体验与效率。
|
|
|
【推理模型】业内首个超大规模 Hybrid-Transformer-Mamba 推理模型,扩展推理能力,超强解码速度,进一步对齐人类偏好。
|
|
|
Qwen2.5系列数学专家72B模型,相较于 Qwen2,Qwen2.5 获得了显著更多的知识,并在编程能力和数学能力方面有了大幅提升。此外,新模型在指令执行、生成长文本、理解结构化数据(例如表格)以及生成结构化输出特别是 JSON 方面取得了显著改进。
|
|
|
Claude 3.7 Sonnet(2025年2月19日发布)是Anthropic推出的混合推理AI模型,结合快速响应与逐步推理能力,适用于多样化任务。该模型支持用户根据需求选择处理深度,提升复杂问题的解决效率。其在代码生成、视觉理解、工具使用等方面表现卓越,并引入“计算机使用”功能,能够模拟人类操作完成多步骤任务。此外,Claude 3.7 Sonnet在安全性和性能上均有显著提升,适合企业级应用和高要求场景。 
|
|
|
QWEN2_5_72B 是阿里巴巴通义千问团队推出的第二代超大规模语言模型,拥有720亿参数,支持中英文文本生成、推理、数学、代码等多任务处理。该模型基于优化的Transformer架构,推理性能强劲,已开源并允许商用,适用于复杂场景下的大模型部署与应用。
|
AI数学模型
AI数学模型
|
|
DeepSeek-R1-Distill-Qwen-7B 是基于 DeepSeek-R1推理数据蒸馏训练的模型,基础模型为Qwen2.5-Math-7B。在数学推理、代码生成等复杂任务中表现卓越,尤其擅长多步推导和跨领域问题解决。
|
AI数学模型
AI数学模型
|
|
DeepSeek-R1-Distill 模型是在开源模型的基础上通过微调训练得到的,训练过程中使用了由DeepSeek-R1生成的样本数据。
|
|
|
学而思九章大模型(MathGPT)是由好未来自主研发的一款面向全球数学爱好者和科研机构的大模型,核心在于解题和讲题算法。该模型致力于提供高质量的数学问题解答和讲解服务,通过人工智能技术,帮助用户深入理解和掌握数学知识。
提示
若您已完成采购,请前往工作台进行账号配置
立即前往