迈向智能体时代"第一步" DeepSeek-V3.1 发布

xinwen.mobi · 发表于 2025-8-24 15:10:22

2025年8月21日，DeepSeek正式发布DeepSeek-V3.1，官方称其为“迈向智能体时代第一步”。以下是关于DeepSeek-V3.1的详细介绍：模型架构与参数：DeepSeek-V3.1共有671B参数，激活参数37B，采用了混合推理架构，一个模型可同时支持推理模式和非推理模式，用户可通过官方App或网页端的“深度思考”按钮自由切换，在API接口中，deepseek - chat对应非思考模式，deepseek - reasoner对应思考模式，两者均支持128K上下文长度。性能提升：推理效率更高：经过思维链压缩训练，V3.1-Think在输出token数减少20%-50%的情况下，各项任务的平均表现与前代模型DeepSeek-R1-0528持平，且响应速度更快。配合128K的上下文扩展和FP8精度推理，V3.1在工程层面强化了吞吐效率与能耗表现。智能体能力更强：通过后训练优化，新模型在工具使用与智能体任务中的表现有较大提升。在代码修复和命令行任务等编程智能体场景中，能够在真实环境中完成多轮迭代修正，避免“越改越乱”的问题。在复杂搜索任务上，它可以规划搜索步骤、筛选证据并综合多源信息，在高难度的多学科题目测试中，性能已经远超前代模型。编程能力突出：在AiderPolyglot多语言编程测试中，DeepSeek-V3.1获得71.6%的高分，超越了Claude 4 Opus等模型。在SVGBench基准测试中，其性能仅次于GPT-4.1-mini，远超DeepSeek R1。多语言处理优化：DeepSeek-V3.1能处理超过100种语言，尤其对亚洲语言和资源较少语种的运用进行了优化。开源与生态：DeepSeek-V3.1的Base模型与后训练模型已在Hugging Face与魔搭平台开源，采用MIT许可证，允许商业使用与修改。此外，DeepSeek-V3.1增加了对Anthropic API格式的支持，用户可以轻松将DeepSeek-V3.1的能力接入其知名大模型Claude的编程框架。API价格调整：DeepSeek宣布从2025年9月6日凌晨起，对DeepSeek开放平台API接口调用价格进行调整并取消夜间时段优惠。调整后输入价格为缓存命中0.5元/百万tokens，缓存未命中4元/百万tokens；输出价格为12元/百万tokens。

		自动登录	找回密码
密码			立即注册

迈向智能体时代"第一步" DeepSeek-V3.1 发布

相关帖子