DeepSeek在春节前,突然爆火。
一夜之间,中美AI圈甚至全球,都在热议Deepseek,英伟达的股票一度下降17%。

图片来自网络
DeepSeek事件发酵是在其R1模型发布1周后,事件的起点可以追溯到DeepSeek发布其新一代模型DeepSeek-V3和DeepSeek-R1。
DeepSeek事件回顾:
2025年1月20日:DeepSeek正式开源R1推理模型。
其在后训练阶段大规模使用了强化学习技术,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI的GPT-4o正式版。
1月24日:获得行业大佬赞誉
A16z创始人Marc Andreessen突然在推特上对DeepSeeK赞不绝口,称其为“最令人惊叹的突破之一”。
1月26日:服务器闪崩。
此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。
1月27日:美区下载榜超越ChatGPT。
应用登顶苹果中国、美国地区应用商店免费APP排行。
1月28日,英伟达股价掉17%
基于英伟达股价的大跌,各大媒体争相报道Deepseek。28日,OpenAI发布最新声明称,其采取各种对策来保护知识产权。
1月30日起,面临禁令危机
美国、意大利等国家开始禁止使用Deepseek,DeepSeek的相关争议逐渐升级演变为国家安全层面的问题。
1月30日:用户日活飙升至1500万
18天后,DeepSeek日活1500万,在140个国家排行第一(包括美国)。
Deepseek因率先复现 MoE、o1 等成果获好口碑,其专注于智能本身,放弃安全、多模态等领域。它在多个评测中表现出色,尤其是在性价比方面,远远超过了现有的许多顶级AI模型,从而引发了广泛的关注和讨论。
今天,AI洞见研究院把春节前后的Deepseek火爆事件,帮大家还原,并深度分析其出圈的原因:
01
DeepSeek日活1500万仅用了18天
1
DeepSeek的第一个APP版本于1月11日上线
它是这样介绍自己:免费体验DeepSeek官方AI助手!这款由突破性的DeepSeek-V3模型驱动的先进AI,拥有超过6000亿参数,引领全球标准,并在多个基准测试中媲美国际顶级模型。享受更快的速度和全面的功能,旨在高效回答您的问题并提升您的生活质量。

2
上线18天日活1500万,比OpenAI快13倍
根据AI产品榜的数据,仅上线 18 天 DeepSeek 日活 1500 万,而 ChatGPT 过 1500 万花了 244 天,增速是 ChatGPT 的 13 倍 。

截止当前 DeepSeek 依然霸榜,苹果应用商店 140+ 个国家/地区的第一名,这其中当然包括 美国 。

02
DeepSeek 出圈的影响?
DeepSeek如此出圈的原因:在于其性价比、能力出众、开源超过闭源的OpenAI、巨量的下载。

而其出圈的影响,可以参考硅谷投资人Lu Zhang接受CNBC采访时提到了DeepSeek的影响。下面结合DeepSeek在全球AI圈带来的影响,给大家一一拆解下。

DeepSeek 出圈的影响
1,中美差距缩短:DeepSeek让中美的差距缩短在3~9个月2,DeepSeek:代表了开源对闭源(如OpenAI)的胜利开源对整个市场的 margin 是有控制的,如果开源能做到闭源的 95%,那如果闭源太贵,那完全就可以用开源来做,如果开源和闭源能力差不多,那对闭源是一个很大的挑战。
3,降低了AI成本,提高了效率
DeepSeek 不仅降低了AI模型的成本,还改进了扩展定律。它缩小了开源模型与专有模型之间的差距,同时提高了效率。
有一个关键发现:Deepseek R1 并非从技术层面削弱了 OpenAI o1 的进展,而是以更低的价格实现了相当的能力。
4,对云服务商有利:
一个更强大的开放实验室(深度求索目前是其中的佼佼者)对新兴云服务提供商和服务供应商来说是非常有利的。更多的资金会流向计算资源领域,而非封闭模型供应商,这意味着支出更多地流向了硬件领域。软件企业也能从中受益匪浅。

DeepSeek作为“算力屠夫”
对大模型和算力的影响:
1. 在开发像R1这样的小型模型时,大模型仍然是必不可少的。大模型为推理模型生成训练数据,然后在蒸馏过程中作为小型模型的教师。
2. 新架构的模型,CPU训练,有可能比GPU更高效。
我们在去年的AI基础设施行业报告中提到,有一些新架构的模型将能够使用CPU进行训练,并且可能比GPU更高效。
3. 对计算能力的需求将继续增长。
这将导致更多的AI部署,使得基于使用的数量比以前更大。如果模型改进,理论上推理的需求将会增加。
4. 对数据的需求不会减少。
数据仍然是必不可少的“燃料”,尤其是高质量数据。
来源:AI洞见研究院