上周一,一家名为 DeepSeek 的小型、低调的中国人工智能实验室推出了一套人工智能模型,其效率如此之高,以至于硅谷最好的技术看起来都已经过时了。
这些型号的效率甚至比美国顶级产品还要高五十倍。这一消息让 OpenAI、谷歌和 Meta 等美国科技巨头陷入了全面危机,因为他们的闭门策略突然停止了。现在X上的每个人都在嘲笑他们。
对于那些困惑为什么美国政府和硅谷今天在推特上崩溃的人来说。
中国发布了多个比美国最好的人工智能模型效率高50倍的人工智能模型并开源,破坏了人工智能市场
—ashok kumar 🇵🇸 (@broseph_stalin) 2025 年 1 月 25 日
这场冲击波背后的人物是对冲基金经理梁文峰,他将一个业余项目变成了历史上最具颠覆性的人工智能进步之一。 DeepSeek 的 R1 模型是一个自学习系统,可以在没有人类监督的情况下自行改进。
这就是让硅谷汗颜的原因:梁正在为任何想要进入人工智能开发的人——无论是在中国还是在其他地方——提供公平的竞争环境。
2021 年,当中国人工智能领域的其他人都在关注大型科技时,梁却悄悄购买了数千个 Nvidia 图形处理单元 (GPU),并开始尝试人工智能。业内人士认为他只是另一位追逐爱好的亿万富翁。
据报道,一位接受英国《金融时报》采访的商业伙伴表示,“当他告诉我们他想建立一个 10,000 个芯片的集群时,我们认为他疯了。他甚至没有解释原因,只是说,‘这将改变一切。’”
快进到 2023 年,梁推出了 DeepSeek,直接从他的对冲基金聘请了顶级人工智能工程师。利用对冲基金 High-Flyer 的利润,他建立了一支不仅了解人工智能而且掌握其背后基础设施的团队。
到 2024 年,DeepSeek 开发出了 R1,这是一种被业内人士描述为对美国各大人工智能厂商的直接挑战的语言模型。与美国竞争对手不同,DeepSeek 对商业化并不感兴趣。它完全专注于研究,梁用自己的钱来资助该行动。
“DeepSeek 的办公室感觉就像一个大学实验室,”英国《金融时报》说。该实验室位于北京和杭州,聘请了中国一些最优秀的人工智能人才,提供的薪资可与 TikTok 母公司字节跳动相媲美。
报告称,梁的唯一目标是证明中国可以达到与美国相同水平的创新,现在他已经做到了。
这个时机也是经过深思熟虑的。梁振英发布 R1 车型之际,他出席了由中国第二号人物李强在北京主持的一次高调会议。
梁是唯一受邀的人工智能领军人物。李告诉在场的企业家要集中精力突破关键技术——这明确表明了中国在人工智能发展方面超越美国的雄心。有迹象表明,美国dent唐纳德·特朗普对此不太高兴。
措手不及的美国科技巨头现在正忙着做出回应。 ChatGPT 背后的公司 OpenAI 宣布与日本软银成立 1000 亿美元的合资企业,名为 Stargate,旨在在美国建设新的人工智能基础设施
与此同时,Elon Musk 的 xAI 正在扩展其 Colossus 超级计算机,计划部署超过 100 万个 GPU 来训练其 Grok AI 模型。谷歌、Meta 和 Anthropic 也投入数十亿美元使用 Nvidia 的下一代 Blackwell 芯片升级其计算集群。
但美国公司有一个主要缺点:保密。多年来,硅谷一直采用闭门模式运作,将人工智能突破锁定在专有系统后面。 DeepSeek 将 R1 开源的决定颠覆了这种说法。
这在美国引发了一波恐慌,美国企业现在面临着决定是否效仿 DeepSeek 的压力。但也有人担心 DeepSeek 能否保持势头。尽管取得了成功,但与美国巨头相比,该公司的资源确实有限。
“他们已经建立了中国最大的计算集群之一,”一位熟悉该公司的消息人士表示。 “但与 OpenAI 和谷歌正在构建的东西相比,这还不够。如果他们想跟上,就需要扩大规模。”
加密大都会学院:如何撰写访谈的Web3简历 -免费备忘单