9月29日
DeepSeek宣布
官方App、网页端、小法式
均已经同步更新为
DeepSeek-V3.2-Exp
?
顾名思义
这是一款试验性
(Experimental)版本
用在摸索下一代架构的可能性
?
DeepSeek先容
患上益在新模子服务成本的
年夜幅降低
官方API价钱也响应下调
于新的价钱政策下
开发者挪用DeepSeek API的成本
将降低50%以上
?
作为迈向新一代架构的
中间法式
V3.2-Exp于此前版本基础上
引入了DeepSeek Sparse Attention
(一种稀少留意力机制)
针对于长文本的练习及推理效率
举行了摸索性的优化及验证
实现了长文本练习
及推理效率的年夜幅晋升
?

?
有媒体分析
DeepSeek给出的旌旗灯号很明确
不仅要于架构层面摸索新路径
也要经由历程成本的降落
加速开发者的涌入
或者将推动DeepSeek生态
更年夜规模增加
?
今朝
华为云已经完成
对于DeepSeek-V3.2-Exp模子的
适配事情
最年夜可撑持
160K长序列上下文长度
?
寒武纪也发文称
公司已经同步实现对于深度求索公司
最新模子DeepSeek-V3.2-Exp的适配
并开源年夜模子推理引擎
vLLM-MLU源代码
?
DeepSeek也已经将
DeepSeek-V3.2-Exp模子
于Huggingface及
ModelScope平台上周全开源
相干论文
也已经同步果真
?
值患上一提的是
连日来
DeepSeek连续推进模子迭代
8月21日
宣布宣布DeepSeek-V3.1
9月22日
宣布DeepSeek-V3.1已经更新至
DeepSeek-V3.1-Terminus版本
?
因Terminus于拉丁语里
是尽头、界限的意思
故其时业界预测这是否会是
V3系列的最终版本
并期待下一个宣布的
将是年夜版本更新
今朝看起来这个预测其实不建设
?
撰文:李飞 编纂:雷渺鑫 兼顾:李政葳
参考:DeepSeek微信民众号、中国证券报、第一财经?
?
-星空电竞