为什么中国AI初创公司DeepSeek正在撼动全球科技界?

“DeepSeek的新模型令人印象深刻,他们成功打造了一个开源模型,在推理计算方面表现出色,并且计算效率极高。”

(Foto: Xinhua/Fu Tian)

中国AI初创公司DeepSeek为何引发全球热议?

人工智能(AI)领域正因DeepSeek-R1的发布而备受关注。这款中国AI初创公司DeepSeek推出的全新开源模型,在短时间内引发了行业轰动。

1月20日,DeepSeek-R1正式发布,并迅速登上苹果App Store免费榜榜首,甚至超越了OpenAI的ChatGPT。

据DeepSeek介绍,在数学、编程和自然语言推理等任务中,该模型的性能可与OpenAI等行业巨头的主流模型相媲美,但其计算成本和资金投入仅为竞争对手的一小部分

那么,DeepSeek到底做了什么?它为何正在撼动AI行业?

DeepSeek是谁?

DeepSeek的全称是DeepSeek人工智能基础技术研究有限公司,成立于2023年7月,是一家专注于前沿大语言模型(LLM)和相关AI技术的创新科技企业。

自2023年1月推出首个DeepSeek LLM以来,公司已完成多轮技术升级。2023年12月,DeepSeek推出V3开源大模型,据美国媒体报道,该模型已超越Meta的所有开源LLM,并在性能上接近OpenAI的GPT-4o

此次发布的R1模型实现了关键性技术突破,通过纯深度学习方法,使AI具备自主推理能力

不同于传统的**“思维链”(Chain-of-Thought, CoT)监督式微调(Supervised Fine-Tuning, SFT),DeepSeek采用强化学习(Reinforcement Learning, RL)**作为核心训练方式。

  • CoT 依赖逐步推理
  • SFT 依赖大量标注数据
  • RL 通过交互和奖励机制让AI自主学习,更适合复杂动态任务

这种新训练方式显著提升了模型的推理能力、适应性和计算效率,使DeepSeek成为AI行业的先锋。

当被问及**“DeepSeek”**的含义时,其最新发布的R1聊天机器人回答:

“这个名字代表了公司深入探索AI基础技术的使命,致力于推动人工智能创新的边界。”

“更大并不代表更聪明”

据DeepSeek发布的V3技术报告,该模型的训练成本仅约557万美元,是目前所有LLM模型中成本最低的

**美国著名经济学家、哥伦比亚大学可持续发展中心主任杰弗里·萨克斯(Jeffrey Sachs)**在接受新华社采访时表示:

“DeepSeek的突破表明,先进的人工智能可以以远低于美国当前普遍认知的成本实现。”

OpenAI创始成员 Andrej Karpathy 在X(原Twitter)上评论:

“DeepSeek-V3让高端AI模型的训练变得看起来轻而易举。它仅用2048块GPU训练两个月**,成本仅600万美元,却达到了最前沿的性能。”**

相较于全球其他领先AI公司,DeepSeek的模型成本降低了一个数量级,彻底打破了AI行业长期以来依赖巨额算力投资的传统模式。

**知名科技投资人马克·安德森(Marc Andreessen)**称:

“DeepSeek-R1是我见过的最惊人的技术突破之一。”

长期以来,AI行业的发展严重依赖计算能力的积累,而DeepSeek的低成本高性能模型,可能会彻底颠覆AI产业的游戏规则

Karpathy称,DeepSeek发布的V3技术报告内容详尽且极具参考价值,值得业内深入研究。

美国投行**摩根士丹利(Morgan Stanley)**也在分析报告中指出:

“DeepSeek展示了一条不同于超大规模企业的高效模型训练路径,通过大幅提升数据质量优化模型架构,提供了一个值得借鉴的范式。”**

摩根士丹利总结道:

“更大并不代表更聪明。”

(Foto: Zeng Hui/Xinhua)

开源模式:DeepSeek如何用开放式AI撼动行业?

“DeepSeek的新开源模型令人印象深刻,他们成功打造了一个推理计算高效且计算资源利用率极高的AI模型。”

—— 微软CEO萨提亚·纳德拉(Satya Nadella)

开源意味着研究人员、开发者和用户可以访问模型的底层代码及其**“权重”(即决定模型如何处理信息的参数),从而自由使用、修改或优化**该模型,以满足不同需求。

DeepSeek从开源社区中获益匪浅,同时也展现了推动技术共享与共同进步的坚定承诺

开源的力量:共享与创新

Meta首席AI科学家 扬·勒昆(Yann LeCun) 评价道:

“他们在前人的基础上提出了新的想法,并且将其付诸实践。由于他们的研究是公开的,并且采用开源模式,每个人都能从中受益。”

勒昆补充道:

“这就是开放研究与开源模式的强大之处。”

美国著名经济学家杰弗里·萨克斯(Jeffrey Sachs) 也对DeepSeek的开源策略表示认可:

“DeepSeek的商业模式和开发模式是开源的,这是一种在科学、技术和商业领域都极具吸引力且成功的模式。”

与OpenAI的不同路径:DeepSeek坚定走开源之路

值得注意的是,DeepSeek与其美国同行OpenAI走上了截然不同的发展道路

  • OpenAI最初以开源组织的身份起步,但后来转向封闭式商业模式
  • 而DeepSeek坚定地选择了开源,并希望通过共享与协作,推动AI技术的整体进步。

DeepSeek创始人梁文峰(Liang Wenfeng) 强调,建设强大且开放的科技生态系统是公司的首要任务,并明确表示:

“我们不会选择封闭式代码。”

留下一个答复

请输入你的评论!
请在这里输入你的名字