DeepSeek R1：搅动AI大模型竞争格局的低成本高性能新贵

author 2025年02月01日 19:41 95 0

1月27日，DeepSeek应用登顶苹果美国和中国区应用商店免费榜，引发市场关注。与此同时，英伟达、ASML、台积电等科技巨头股价均出现大幅下跌，微软、谷歌、亚马逊等也跌超3%。 DeepSeek R1之所以爆火，主要在于其高性能和低成本。其预训练费用仅为OpenAI GPT-4的不到十分之一，API定价也远低于OpenAI。这种成本效益比使其成为AI界的“拼多多”，吸引了大量企业和个人用户。 DeepSeek R1的创新之处在于其训练方法——首次完全通过强化学习（RL）训练大型语言模型，无需依赖监督微调或人工标注数据。这一突破验证了仅通过奖励信号，模型也能发展出强大的推理能力。 DeepSeek R1的出现，使得其直接成为OpenAI的有力竞争者，可能阶段性改变AI大模型的竞争格局。其完全开源的特点，以及显著低于竞品价格的特点，将有望加速国产应用开发及推广。 DeepSeek R1集中代表了算法创新带来的模型优化空间。在底座模型当前并没有显著代际提升的背景下，算法创新将有望加速缩小国内模型和海外模型的差距。然而，这并不意味着未来训练环节的算力需求将下降，海外头部大模型厂商的资本开支计划进一步加大便是佐证。展望2025年，Agent及端侧应用可能是重要方向。伴随着OpenAI推出官方Agent，以及字节跳动加大投入，AI应用将有望从逻辑走向落地。

标签： #DeFi #NFT #元宇宙 #Web3 #区块链技术