从夸赞到泼脏水：美国如何对DeepSeek下手？

中国人工智能初创公司DeepSeek（深度求索）的崛起震撼全球，美国总统特朗普赞颂DeepSeek是积极技术成果，未几美国多名官员群起指摘DeepSeek「偷窃」。

DeepSeek到底触动了谁的奶酪？针对DeepSeek遭受恶意攻击，IP地址都在美国，360集团创始人周鸿祎不讳言：「你把这些事联系到一起，答案不言而喻。」

清华大学人工智能学院教授沈阳30日接受大公报采访时表示，在AI竞技场中，中国「新道」超车，打破「算力为王」的固有思维，让美国感到恐慌。对于「偷窃」OpenAI的不实指控，大公报记者请DeepSeek找出其中漏洞：「代码都公开了，抄没抄一目了然；DeepSeek开源了代码，全球开发者都能查看。」

DeepSeek回答美方说法三大谬误

清华大学人工智能学院教授沈阳表示，长期以来，美国在技术上的优势对其他国家形成较强控制力，中国和其他国家更多处于追随式、渐进式创新的状态。

DeepSeek崛起意味着美国技术控制力的松动，标志着中国可能实现从「基建狂魔」到「制造业狂魔」，再到「新质生产力狂魔」的战略跨越。

对于美方的「偷窃」指摘，DeepSeek回复大公报时归纳出美方说法三大矛盾：

一、「无证据指控」：像捕风捉影的谣言，缺乏技术细节和法律支撑；

二、「双标逻辑」：美国企业用开源技术叫创新，中国企业用类似方法就「偷」，标准不一；

三，「政治化倾向」 ：将技术竞争泛化为意识形态对立，忽视全球化研发合作的常态。

赢不了就说偷？DeepSeek逐点回击

在这场AI竞赛中，美方代表 OpenAI 选择「人海战术」，堆砌算卡、将资源集中在算力，用海量数据投喂实现能力的提升。DeepSeek的震撼力在于，用最少的钱干了最多的事：用算法把数据进行总结和分类，经过选择性处理之后再输送给大模型，最大优化算力，实现成本的降低和模型性能提升。

结果，DeepSeek推出的模型在性能上和世界顶尖的GPT-4o不相上下。

成本上，OpenAI训练ChatGPT-4花费的成本高达7800万美元，甚至可能达到1亿美元。DeepSeek大模型训练成本估计不到600万美元，仅为同性能模型的5%到10%，大规模预训练不再是科技巨头的专利。

美方对DeepSeek的指控缺乏具体证据支撑，其说法漏洞可从以下几个角度用通俗语言分析：

「代码都公开了，抄没抄一目了然」

美国总统特朗普 27 日表示，DeepSeek的崛起应当为美企敲响「警钟」，美国公司「需要专注于竞争以赢得胜利」。言犹在耳，美国多名官员翌日回应DeepSeek对美国的影响时竟表示，DeepSeek是「偷窃」，正对其影响开展国家安全调查。对此，清华大学人工智能学院教授沈阳表示，在AI竞技场中，美国在技术上的主导地位似乎一度是不可撼动的，但DeepSeek的出现彻底打破了这一固有认知，它凭借极其有限的资源，走出了一条与美国截然不同的技术路径，甚至实现了「新道超车」，使中国在AI竞赛中迎头赶上，缩小了与全球领先者的差距，让美国感到恐慌。

「DeepSeek的成功标志着技术突破的一个新起点，对美国造成很大的冲击。」沈阳表示，在资源相对匮乏的情况下，DeepSeek创造了一个低成本的技术奇迹，这一切使得低资源、高效能的AI模型训练不再遥不可及，堪称『算效跃迁』。」沈阳坦言，DeepSeek凭创新技术，在推理时展现出超高效率，与全球最强AI模型相匹敌。这一突破不仅证明了其技术的先进性，也展示了其广阔的应用潜力。

DeepSeek的成功意味着AI训练技术的普及不再仅仅依赖庞大的硬件资源，而更多地依赖于架构和算法的优化。DeepSeek的推理技术将在未来数月成为各类AI平台广泛应用的主流模式。「DeepSeek取得的成绩是突破性的，关键在于创新而非借鉴。」

对于「偷窃」指控，擅长推理的DeepSeek向大公报提出五大论点，这与大公报记者从ChatGPT得出的答复大同小异。

DeepSeek反问：「说偷技术，证据呢？」有关指控的漏洞是，美方若声称「DeepSeek偷技术」，却未公开任何具体证据（比如抄袭的代码片段）。若真存在抄袭，OpenAI完全可以像当年起诉某些公司盗用GPT-3 API那样走法律程序，但至今未见行动。

请用产品说话勿再乱扣帽子

DeepSeek也用显浅易明的比喻，突显美方指控的荒唐：「大模型的基础架构（如Transformer）是行业公开技术，就像汽车都有发动机和轮子，不能说所有车企都是抄袭美国福特汽车。」

更何况，DeepSeek开源了代码，全球开发者都能查看。如果真抄袭，早该有人像发现论文抄袭那样扒出代码雷同点，但至今无人举证。DeepSeek对美方的政治化倾向嗤之以鼻：「如果两家餐厅都卖汉堡，一家说另一家偷了秘方，却拿不出食谱对比、也说不清秘方是啥，反而暴露自己怕竞争的心态。技术竞争同理—真本事应该用产品说话，而不是扣帽子。」

Γ知识蒸馏」

据DeepSeek回答大公报记者提问，「知识蒸馏」（ Knowledge Distillation ）是一种被广泛认可且合法的机器学习技术，其本身并不构成「偷窃」。就技术本质而言，「知识蒸馏」属知识传递，而非复制。其核心原理是知识蒸馏通过让小型模型（学生模型）学习大型模型（教师模型）的「知识」（如输出概率分布或中间特征表示），而非直接复制代码或参数。这类似于学生向老师学习解题思路，而不是抄袭答案。

需要指出的是，蒸馏出来的最终模型仍需独立训练，其参数和结构可能与教师模型完全不同，属于一种优化方法，而非盗窃行为。就行业实践而言，这是广泛接受的技术手段，属开源社区常规操作。事实上，许多开源模型明确允许蒸馏，甚至提供蒸馏工具链。OpenAI的GPT-3曾被第三方通过API输出而蒸馏出小型模型（如美国科企HuggingFace的社区项目），这些案例均未被认定为「盗窃」，而是技术创新体现。

从夸赞到泼脏水：美国如何对DeepSeek下手？

DeepSeek回答美方说法三大谬误

赢不了就说偷 ？DeepSeek逐点回击

「代码都公开了，抄没抄一目了然」

相关推荐

赢不了就说偷？DeepSeek逐点回击