• 正文
  • 相关推荐
申请入驻 产业图谱

从夸赞到泼脏水:美国如何对DeepSeek下手?

2025/02/10
1141
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

中国人工智能初创公司DeepSeek( 深度求索 ) 的崛起震撼全球, 美国总统特朗普赞颂DeepSeek是积极技术成果,未几美国多名官员群起指摘DeepSeek「偷窃」。

DeepSeek到底触动了谁的奶酪?针对DeepSeek遭受恶意攻击,IP地址都在美国,360集团创始人周鸿祎不讳言:「你把这些事联系到一起 ,答案不言而喻。」

清华大学人工智能学院教授沈阳30日接受大公报采访时表示 ,在AI竞技场中,中国「新道」超车 ,打破「算力为王」 的固有思维,让美国感到恐慌 。对于「偷窃」OpenAI的不实指控 ,大公报记者请DeepSeek找出其中漏洞 :「代码都公开了,抄没抄一目了然;DeepSeek开源了代码,全球开发者都能查看。」

DeepSeek回答美方说法三大谬误

清华大学人工智能 学 院 教 授 沈 阳 表示 ,长期以来 ,美国在技术上的优势对其他国家形成较强控制力 ,中国和其他国家更多处于追随式 、渐进式创新的状态 。

DeepSeek崛起意味着美国技术控制力的松动 ,标志着中国可能实现从 「基建狂魔 」 到 「制造业狂魔」 ,再到「新质生产力狂魔」的战略跨越。

对于美方的「偷窃」指摘 ,DeepSeek回复大公报时归纳出美方说法三大矛盾:

一 、「无证据指控」 :像捕风捉影的谣言 ,缺乏技术细节和法律支撑 ;

二 、「双标逻辑」 :美国企业用开源技术叫创新 ,中国企业用类似方法就「偷」,标准不一;

三,「政治化倾向」 :将技术竞争泛化为意识形态对立 ,忽视全球化研发合作的常态。

赢不了就说偷 ?DeepSeek逐点回击

在这场AI竞赛中 ,美方代 表 OpenAI 选 择「人海战术」 ,堆砌算卡 、将资源集中在算力 ,用海量数据投喂实现能力的提升 。DeepSeek的震撼力在于 ,用最少的钱干了最多的事 :用算法把数据进行总结和分类 ,经过选择性处理之后再输送给大模型 ,最大优化算力 ,实现成本的降低和模型性能提升 。

结果 ,DeepSeek推出的模型在性能上和世界顶尖的GPT-4o不相上下 。

成本上 ,OpenAI训练ChatGPT-4花费的成本高达7800万美元 ,甚至可能达到1亿美元。DeepSeek大模型训练成本估计不到600万美元 ,仅为同性能模型的5%到10%,大规模预训练不再是科技巨头的专利。

美方对DeepSeek的指控缺乏具体证据支撑,其说法漏洞可从以下几个角度用通俗语言分析 :

「代码都公开了,抄没抄一目了然」

美 国 总 统 特 朗 普 27 日 表 示 ,DeepSeek的崛起应当为美企敲响「警钟」,美国公司「需要专注于竞争以赢得胜利」 。言犹在耳 ,美国多名官员翌日回应DeepSeek对美国的影响时竟表示,DeepSeek是「偷窃」 ,正对其影响开展国家安全调查 。对此 ,清华大学人工智能学院教授沈阳表示 ,在AI竞技场中 ,美国在技术上的主导地位似乎一度是不可撼动的 ,但DeepSeek的出现彻底打破了这一固有认知 ,它凭借极其有限的资源 ,走出了一条与美国截然不同的技术路径 ,甚至实现了「新道超车」 ,使中国在AI竞赛中迎头赶上,缩小了与全球领先者的差距 ,让美国感到恐慌 。

「DeepSeek的成功标志着技术突破的一个新起点 ,对美国造成很大的冲击。」沈阳表示 ,在资源相对匮乏的情况下,DeepSeek创造了一个低成本的技术奇迹 ,这一切使得低资源 、高效能的AI模型训练不再遥不可及,堪称『算效跃迁』 。」沈阳坦言,DeepSeek凭创新技术 ,在推理时展现出超高效率 ,与全 球 最 强AI模 型 相 匹敌 。这一突破不仅证明了其技术的先进性,也展示了其广阔的应用潜力 。

DeepSeek的成功意味着AI训练技术的普及不再仅仅依赖庞大的硬件资源 ,而更多地依赖于架构和算法的优化 。DeepSeek的推理技术将在未来数月成为各类AI平台广泛应用的主流模式 。「DeepSeek取得的成绩是突破性的 ,关键在于创新而非借鉴 。」

对于 「偷窃」 指控, 擅长推理的DeepSeek向大公报提出五大论点,这与大公报记者从ChatGPT得出的答复大同小异。

DeepSeek反问 :「说偷技术 ,证据呢?」 有关指控的漏洞是 ,美方若声称「DeepSeek偷技术」 ,却未公开任何具体证据( 比如抄袭的代码片段 )。若真存在抄袭 ,OpenAI完全可以像当年起诉某些公司盗用GPT-3 API那样走法律程序 ,但至今未见行动 。

请用产品说话 勿再乱扣帽子

DeepSeek也用显浅易明的比喻 ,突显美方指控的荒唐 :「大模型的基础架构( 如Transformer)是行业公开技术 ,就像汽车都有发动机和轮子 ,不能说所有车企都是抄袭美国福特汽车 。」

更何况 ,DeepSeek开源了代码 ,全球开发者都能查看 。如果真抄袭 ,早该有人像发现论文抄袭那样扒出代码雷同点 ,但至今无人举证 。DeepSeek对美方的政治化倾向嗤之以鼻 :「如果两家餐厅都卖汉堡 ,一家说另一家偷了秘方,却拿不出食谱对比 、也说不清秘方是啥 ,反而暴露自己怕竞争的心态 。技术竞 争同理—真本 事应该用 产品说话 ,而不是扣帽子 。」

Γ知识蒸馏」

据DeepSeek回答大公报记者 提 问 , 「 知 识 蒸 馏 」( Knowledge Distillation ) 是一种被广泛认可且合法的机器学习技术,其本身并不构成「偷窃」 。就技术本质而言 ,「知识蒸馏」属知识传递 ,而非复制。其核心原理是知识蒸馏通过让小型模型( 学生模型 )学习大型模型( 教师模型 )的「知识」( 如输出概率分布或中间特征表示 ), 而非直接复制代码或参数 。这类似于学生向老师学习解题思路 ,而不是抄袭答案。

需要指出的是 ,蒸馏出来的最终模型仍需独立训练 ,其参数和结构可能与教师模型完全不同 ,属于一种优化方法 ,而非盗窃行为。就行业实践而言 ,这是广泛接受的技术手段 ,属开源社区常规操作 。事实上 ,许多开源模型明确允许蒸馏 ,甚至提供蒸馏工具链 。OpenAI的GPT-3曾被第三方通过API输出 而 蒸 馏 出 小 型 模 型( 如 美 国 科 企HuggingFace的社区项目 ), 这些案例均未被认定为「盗窃」 ,而是技术创新体现。

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录