DeepSeek R1:搅动AI大模型竞争格局的低成本高性能新贵

author 95 0

1月27日,DeepSeek应用登顶苹果美国和中国区应用商店免费榜,引发市场关注。与此同时,英伟达、ASML、台积电等科技巨头股价均出现大幅下跌,微软、谷歌、亚马逊等也跌超3%。 DeepSeek R1之所以爆火,主要在于其高性能和低成本。其预训练费用仅为OpenAI GPT-4的不到十分之一,API定价也远低于OpenAI。这种成本效益比使其成为AI界的“拼多多”,吸引了大量企业和个人用户。 DeepSeek R1的创新之处在于其训练方法——首次完全通过强化学习(RL)训练大型语言模型,无需依赖监督微调或人工标注数据。这一突破验证了仅通过奖励信号,模型也能发展出强大的推理能力。 DeepSeek R1的出现,使得其直接成为OpenAI的有力竞争者,可能阶段性改变AI大模型的竞争格局。其完全开源的特点,以及显著低于竞品价格的特点,将有望加速国产应用开发及推广。 DeepSeek R1集中代表了算法创新带来的模型优化空间。在底座模型当前并没有显著代际提升的背景下,算法创新将有望加速缩小国内模型和海外模型的差距。然而,这并不意味着未来训练环节的算力需求将下降,海外头部大模型厂商的资本开支计划进一步加大便是佐证。 展望2025年,Agent及端侧应用可能是重要方向。伴随着OpenAI推出官方Agent,以及字节跳动加大投入,AI应用将有望从逻辑走向落地。

标签: #DeFi #NFT #元宇宙 #Web3 #区块链技术

  • 评论列表

留言评论