DeepSeek-V3.2-Exp - DeepSeek最新开源的实验性AI模型

作者:Jam 发布时间: September 30, 2025 分类:技术 No Comments

DeepSeek-V3.2-Exp是DeepSeek开源的实验性AI模型，通过引入DeepSeek Sparse Attention（DSA）机制，显著提升长文本处理的效率。模型基于DeepSeek-V3.1-Terminus持续训练而成，仅在架构上引入了DSA，实现了细粒度稀疏注意力机制，借助闪电索引器（lightning indexer）高效选择关键信息，在长文本训练和推理时大幅提高效率。DeepSeek-V3.2-Exp在多个公开评测集上与DeepSeek-V3.1-Terminus基本持平，展现了其在不同领域的能力。

>>展开阅读

DeepSeek-V3.1-Terminus - DeepSeek推出的最新版AI模型

作者:Jam 发布时间: September 25, 2025 分类:技术 No Comments

DeepSeek-V3.1-Terminus 是 DeepSeek 团队推出的人工智能语言模型，是 DeepSeek-V3.1 的升级版本。模型在语言一致性、代码生成和搜索能力等方面进行优化，能更准确地处理中英文混杂内容，生成更规范的文本，提升编程辅助和信息检索的效率。模型适用内容创作、知识问答、编程辅助、学习辅导和数据分析等多种场景，为用户提供高效、准确的智能服务，为开发者和用户提供便捷的使用途径。 1758598466-1758598466-DeepSeek-V3.1-Terminus-website-2.png

>>展开阅读

在史上最大规模WAIC中寻找DeepSeek

作者:Jam 发布时间: July 28, 2025 分类:日志 No Comments

今年的上海世界人工智能大会（WAIC）比去年有什么不同，最简单现成的答案，就是DeepSeek。从巴黎人工智能峰会到WAIC，DeepSeek从未亲临现场，却依然是中国开源技术栈叙事的支点，定义了叙事节奏、商业尺度与国际话语权的边界。WAIC的几处关键画面印证了这一切。

>>展开阅读

【转】好险，差点被DeepSeek幻觉害死，PS：用于训练的数据也存在“幻觉”，何来不幻觉

作者:Jam 发布时间: July 9, 2025 分类:日志 No Comments

我尼玛，这次差点被DeepSeek坑死！原因是最近疑似华为离职员工自曝盘古事件，我想到网上找一些类似事件，同时使用的GPT和DeepSeek，结果看着DeepSeek的更吸引人就采用了两条。关键提示词是：国外还有类似这种技术人员爆料事件吗？从结果来看：时间地点人物事件，一应俱全啊！这些信息可可大可小啊，结果全部是胡编乱造的。我尼玛，服气，真的不知道文章发出去火了会有什么后果，真的不能相信AI…… 好险，差点被DeepSeek幻觉害死

>>展开阅读

一文了解DeepSeek和OpenAI：企业家为什么需要认知型创新？

作者:Jam 发布时间: June 11, 2025 分类:日志 No Comments

在这个AI技术日新月异的时代，我们眼看着它不仅在改变生活，更在改变着商业规则。AI可不只是那些冰冷的算法，它现在能像人一样思考、推理，甚至在某些方面的表现超越了普通人。这告诉我们，传统的技术和创新模式已经不够用了，企业要想增长、要保持竞争力，就需要换个思路。AI正在重新定义我们理解和实践商业创新的方式。

>>展开阅读

DeepSeek-R1-0528 超强开源！本地服务器零代码部署神器：OpenStation

作者:Jam 发布时间: June 6, 2025 分类:技术 No Comments

DeepSeek-R1-0528新版本模型最新开源，在数学推理、代码生成等领域实现了突破性性能提升，并且显著降低了幻觉，核心性能指标达到领先闭源模型水平。对于需要进行DeepSeek模型本地化部署的用户来说，使用0528版本替代原版R1模型能够进一步提升业务能力。今天为大家分享一款开源工具OpenStation，其已经适配了Deepseek-R1-0528新版模型，可以无代码在集群内快速完成新模型的服务部署与分发，这款工具还提供简单高效的服务管理与资源管理功能，帮助企业级用户在本地服务器上安全便捷地部署与使用DeepSeek-R1-0528版本模型。 640