2025年8月21日,DeepSeek正式发布DeepSeek-V3.1,官方称其为“迈向智能体时代第一步”。以下是关于DeepSeek-V3.1的详细介绍:模型架构与参数:DeepSeek-V3.1共有671B参数,激活参数37B,采用了混合推理架构,一个模型可同时支持推理模式和非推理模式,用户可通过官方App或网页端的“深度思考”按钮自由切换,在API接口中,deepseek - chat对应非思考模式,deepseek - reasoner对应思考模式,两者均支持128K上下文长度。性能提升: 推理效率更高:经过思维链压缩训练,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与前代模型DeepSeek-R1-0528持平,且响应速度更快。配合128K的上下文扩展和FP8精度推理,V3.1在工程层面强化了吞吐效率与能耗表现。 智能体能力更强:通过后训练优化,新模型在工具使用与智能体任务中的表现有较大提升。在代码修复和命令行任务等编程智能体场景中,能够在真实环境中完成多轮迭代修正,避免“越改越乱”的问题。在复杂搜索任务上,它可以规划搜索步骤、筛选证据并综合多源信息,在高难度的多学科题目测试中,性能已经远超前代模型。 编程能力突出:在AiderPolyglot多语言编程测试中,DeepSeek-V3.1获得71.6%的高分,超越了Claude 4 Opus等模型。在SVGBench基准测试中,其性能仅次于GPT-4.1-mini,远超DeepSeek R1。 多语言处理优化:DeepSeek-V3.1能处理超过100种语言,尤其对亚洲语言和资源较少语种的运用进行了优化。开源与生态:DeepSeek-V3.1的Base模型与后训练模型已在Hugging Face与魔搭平台开源,采用MIT许可证,允许商业使用与修改。此外,DeepSeek-V3.1增加了对Anthropic API格式的支持,用户可以轻松将DeepSeek-V3.1的能力接入其知名大模型Claude的编程框架。API价格调整:DeepSeek宣布从2025年9月6日凌晨起,对DeepSeek开放平台API接口调用价格进行调整并取消夜间时段优惠。调整后输入价格为缓存命中0.5元/百万tokens,缓存未命中4元/百万tokens;输出价格为12元/百万tokens。
|
|