DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿深度学与NLP 2025年01月12日 00:01 北京来源:暗涌Waves,整理:Founder Park因为 V3 版本开源模型的发布,DeepSeek 又火了一把,而且这一次,是外网刷屏。训练成本估计只有 Llama 3.1 405B 模型的 11 分之一,后者的效果还不如它。
在多项测评上,DeepSeek V3