DeepSeek-V3.2-Exp是DeepSeek开源的实验性AI模型,通过引入DeepSeek Sparse Attention(DSA)机制,显著提升长文本处理的效率。模型基于DeepSeek-V3.1-Terminus持续训练而成,仅在架构上引入了DSA,实现了细粒度稀疏注意力机制,借助闪电索引器(lightning indexer)高效选择关键信息,在长文本训练和推理时大幅提高效率。DeepSeek-V3.2-Exp在多个公开评测集上与DeepSeek-V3.1-Terminus基本持平,展现了其在不同领域的能力。
>>展开阅读
DeepSeek-V3.1-Terminus 是 DeepSeek 团队推出的人工智能语言模型,是 DeepSeek-V3.1 的升级版本。模型在语言一致性、代码生成和搜索能力等方面进行优化,能更准确地处理中英文混杂内容,生成更规范的文本,提升编程辅助和信息检索的效率。模型适用内容创作、知识问答、编程辅助、学习辅导和数据分析等多种场景,为用户提供高效、准确的智能服务,为开发者和用户提供便捷的使用途径。
>>展开阅读
今年的上海世界人工智能大会比去年有什么不同,最简单现成的答案,就是DeepSeek。从巴黎人工智能峰会到WAIC,DeepSeek从未亲临现场,却依然是中国开源技术栈叙事的支点,定义了叙事节奏、商业尺度与国际话语权的边界。WAIC的几处关键画面印证了这一切。
>>展开阅读
我尼玛,这次差点被DeepSeek坑死!原因是最近疑似华为离职员工自曝盘古事件,我想到网上找一些类似事件,同时使用的GPT和DeepSeek,结果看着DeepSeek的更吸引人就采用了两条。关键提示词是:国外还有类似这种技术人员爆料事件吗?从结果来看:时间地点人物事件,一应俱全啊!这些信息可可大可小啊,结果全部是胡编乱造的。我尼玛,服气,真的不知道文章发出去火了会有什么后果,真的不能相信AI……


>>展开阅读
在这个AI技术日新月异的时代,我们眼看着它不仅在改变生活,更在改变着商业规则。AI可不只是那些冰冷的算法,它现在能像人一样思考、推理,甚至在某些方面的表现超越了普通人。这告诉我们,传统的技术和创新模式已经不够用了,企业要想增长、要保持竞争力,就需要换个思路。AI正在重新定义我们理解和实践商业创新的方式。
>>展开阅读
DeepSeek-R1-0528新版本模型最新开源,在数学推理、代码生成等领域实现了突破性性能提升,并且显著降低了幻觉,核心性能指标达到领先闭源模型水平。对于需要进行DeepSeek模型本地化部署的用户来说,使用0528版本替代原版R1模型能够进一步提升业务能力。今天为大家分享一款开源工具OpenStation,其已经适配了Deepseek-R1-0528新版模型,可以无代码在集群内快速完成新模型的服务部署与分发,这款工具还提供简单高效的服务管理与资源管理功能,帮助企业级用户在本地服务器上安全便捷地部署与使用DeepSeek-R1-0528版本模型。
>>展开阅读


>>展开阅读

>>展开阅读
- 1
- 2
- 3
- 4
- ...
- 15
- »