中国AI初创公司DeepSeek为何引发全球热议?
人工智能(AI)领域正因DeepSeek-R1的发布而备受关注。这款中国AI初创公司DeepSeek推出的全新开源模型,在短时间内引发了行业轰动。
1月20日,DeepSeek-R1正式发布,并迅速登上苹果App Store免费榜榜首,甚至超越了OpenAI的ChatGPT。
据DeepSeek介绍,在数学、编程和自然语言推理等任务中,该模型的性能可与OpenAI等行业巨头的主流模型相媲美,但其计算成本和资金投入仅为竞争对手的一小部分。
那么,DeepSeek到底做了什么?它为何正在撼动AI行业?
DeepSeek是谁?
DeepSeek的全称是DeepSeek人工智能基础技术研究有限公司,成立于2023年7月,是一家专注于前沿大语言模型(LLM)和相关AI技术的创新科技企业。
自2023年1月推出首个DeepSeek LLM以来,公司已完成多轮技术升级。2023年12月,DeepSeek推出V3开源大模型,据美国媒体报道,该模型已超越Meta的所有开源LLM,并在性能上接近OpenAI的GPT-4o。
此次发布的R1模型实现了关键性技术突破,通过纯深度学习方法,使AI具备自主推理能力。
不同于传统的**“思维链”(Chain-of-Thought, CoT)和监督式微调(Supervised Fine-Tuning, SFT),DeepSeek采用强化学习(Reinforcement Learning, RL)**作为核心训练方式。
- CoT 依赖逐步推理
- SFT 依赖大量标注数据
- RL 通过交互和奖励机制让AI自主学习,更适合复杂动态任务
这种新训练方式显著提升了模型的推理能力、适应性和计算效率,使DeepSeek成为AI行业的先锋。
当被问及**“DeepSeek”**的含义时,其最新发布的R1聊天机器人回答:
“这个名字代表了公司深入探索AI基础技术的使命,致力于推动人工智能创新的边界。”
“更大并不代表更聪明”
据DeepSeek发布的V3技术报告,该模型的训练成本仅约557万美元,是目前所有LLM模型中成本最低的。
**美国著名经济学家、哥伦比亚大学可持续发展中心主任杰弗里·萨克斯(Jeffrey Sachs)**在接受新华社采访时表示:
“DeepSeek的突破表明,先进的人工智能可以以远低于美国当前普遍认知的成本实现。”
OpenAI创始成员 Andrej Karpathy 在X(原Twitter)上评论:
“DeepSeek-V3让高端AI模型的训练变得看起来轻而易举。它仅用2048块GPU训练两个月**,成本仅600万美元,却达到了最前沿的性能。”**
相较于全球其他领先AI公司,DeepSeek的模型成本降低了一个数量级,彻底打破了AI行业长期以来依赖巨额算力投资的传统模式。
**知名科技投资人马克·安德森(Marc Andreessen)**称:
“DeepSeek-R1是我见过的最惊人的技术突破之一。”
长期以来,AI行业的发展严重依赖计算能力的积累,而DeepSeek的低成本高性能模型,可能会彻底颠覆AI产业的游戏规则。
Karpathy称,DeepSeek发布的V3技术报告内容详尽且极具参考价值,值得业内深入研究。
美国投行**摩根士丹利(Morgan Stanley)**也在分析报告中指出:
“DeepSeek展示了一条不同于超大规模企业的高效模型训练路径,通过大幅提升数据质量和优化模型架构,提供了一个值得借鉴的范式。”**
摩根士丹利总结道:
“更大并不代表更聪明。”


开源模式:DeepSeek如何用开放式AI撼动行业?
“DeepSeek的新开源模型令人印象深刻,他们成功打造了一个推理计算高效且计算资源利用率极高的AI模型。”
—— 微软CEO萨提亚·纳德拉(Satya Nadella)
开源意味着研究人员、开发者和用户可以访问模型的底层代码及其**“权重”(即决定模型如何处理信息的参数),从而自由使用、修改或优化**该模型,以满足不同需求。
DeepSeek从开源社区中获益匪浅,同时也展现了推动技术共享与共同进步的坚定承诺。
开源的力量:共享与创新
Meta首席AI科学家 扬·勒昆(Yann LeCun) 评价道:
“他们在前人的基础上提出了新的想法,并且将其付诸实践。由于他们的研究是公开的,并且采用开源模式,每个人都能从中受益。”
勒昆补充道:
“这就是开放研究与开源模式的强大之处。”
美国著名经济学家杰弗里·萨克斯(Jeffrey Sachs) 也对DeepSeek的开源策略表示认可:
“DeepSeek的商业模式和开发模式是开源的,这是一种在科学、技术和商业领域都极具吸引力且成功的模式。”
与OpenAI的不同路径:DeepSeek坚定走开源之路
值得注意的是,DeepSeek与其美国同行OpenAI走上了截然不同的发展道路。
- OpenAI最初以开源组织的身份起步,但后来转向封闭式商业模式。
- 而DeepSeek坚定地选择了开源,并希望通过共享与协作,推动AI技术的整体进步。
DeepSeek创始人梁文峰(Liang Wenfeng) 强调,建设强大且开放的科技生态系统是公司的首要任务,并明确表示:
“我们不会选择封闭式代码。”