今天炒什么

DeepSeek 发布最新技术论文
1、2月18日, DeepSeek 在社交平台上发布了一篇关于 NSA 的纯技术论文报告。 DeepSeek 称, NSA 是一种与硬件高度适配并可原生训练的稀疏注意力机制,实现超高速长上下文训练与推理。通过针对现代硬件的优化设计, NSA 加快了推理速度,同时降低了预训练成本,而不会影响性能。2、与此同时,人工智能初创公司月之暗面也有大动作。2月