狂飙的ChatGPT，中小企业洗洗睡吧？

Twitter上有人对比了ChatGPT、instagram、spotify、Facebook、netflix、twitter，收获百万、1亿用户所花的时间，其中，ChatGPT以火箭蹿升之姿光速登顶，业内人士评论“Something different is happening”、“它不是一个新产品、而是一个新物种”。

科技界这种盛况并不多见，上一次还是iPhone问世？ChatGPT霸屏的这段时间，相关概念股群魔乱舞，创业公司争做“中国版的Open AI”……一个核心的问题浮出水面：ChatGPT会不会固化AI产业格局，强者恒强？如果这是一场巨头的游戏，国内的中小企业该怎么玩？

会否加剧“强者恒强”的两极局面？

从硅谷到中国，ChatGPT的热度有增无减，但主要玩家都是巨头。目前国内有能力竞逐的也都是行业翘楚：百度文心一言、腾讯HunYuan-NLP 1T大模型、阿里“通义”大模型、华为盘古大模型、中科院自动化研究所“紫东·太初”等。当AI阔步进入大模型时代，走在前列的巨头会不会把追逐者远远甩开？

曾任华为系NLP企业首席科学家、现任千芯科技董事长陈巍认为，可以从企业和国家整体产业两个层面来看。

目前ChatGPT这类大模型领域确实有一定的马太效应，跑在前面的企业玩家具备完整的算法、数据和算力优势，后发者想要追赶确实有较大难度。但是对企业来说，未必就是强者恒强。例如OpenAI在ChatGPT这类问答型NLP算法曾一度落后于Google BERT，但现在又开始重新领跑。这其中少数研发人员的智慧、天赋，以及破釜沉舟般的专注，实际上是决定胜负的关键。

“而资金或者攒局恐怕无法代替技术，比如微软自己做小冰，最后也要让位于ChatGPT”，陈巍谈到，“如果国内的技术偏执狂人能够领悟或训练出更高水平的模型，在算法或训练方法上形成降维打击，超越OpenAI也不是不可能。”

再从各国产业发展而言，由于AI领先的国家确实具备了系统化且领先的AI技术人群和丰富的算力基础（大算力芯片），已经在教育-研究-产品-需求上形成完整闭环，一旦在ChatGPT这类大模型上拉开差距，很可能形成两极分化的国力竞争格局，甚至形成“强者恒强”的局面。

面对ChatGPT冲击波，中小企业的机会在哪里？

近期不少人给ChatGPT算经济账，国盛证券以英伟达A100芯片、DGXA100服务器、现阶段每日2500万访问量等假设为基础，估算得出：在初始算力投入上，为满足ChatGPT当前千万级用户的咨询量，投入成本约为8亿美元，对应约4000台服务器。

反观国内AI中小企业，他们既撑不起全栈式的AI研发，也无力为高昂的算力买单。那么在大模型快速发展、走向商用的过程中，他们的发展机会主要有哪些？如果只能接入巨头的生态求生存，会不会产生同质化竞争？

陈巍表示，对于做NLP算法的中小创业企业来说，初期确实可能会遇到比较大的打击。因为ChatGPT这类应用，把这些公司之前的积累基本拉平到同一档位上，甚至可能早期的一些投入基本打水漂了。

不过，中小企业有自身的灵活优势，船小好掉头，可以基于ChatGPT这类应用，针对细分垂域做专用的领域模型（例如做ChatGPT+领域模型的混合模型）。而对于巨头来说，由于细分领域众多，即便分散兵力、撒胡椒面也未必划算。他强调，ChatGPT是通识智能、千人一面，目前并不具有个性特征、情感和某些特定领域专家知识，国内的中小NLP企业反而可以充分借助ChatGPT带来的通识和多轮对话能力提升来拓展更多客户。

“国内中小企业说不定能诞生有高超天赋的NLP人才，未必不能打造出类似当年TMD（今日头条、美团、滴滴）在BAT（百度、阿里、腾讯）之后成为新巨头的故事。因为巨头内部有严格的季度ROI考核，对于ChatGPT这类需要多年冷板凳的研发项目不是太友好，顶尖项目在巨头内部发展未必好”，陈巍从研发方面指出了中小企业的可能性。

其次，对于做NLP应用的中小创业企业来说，他们往往侧重于场景、模型研发少，ChatGPT这类产品会在一定程度上加剧同质化竞争。但接入ChatGPT，也会让这些企业更好地提升服务获得更多客户。特别是那些有深厚行业积累、充分理解行业的NLP应用企业，反而会进一步受益。就好比淘宝最初把中小商家和大商家放到同一个平台上，开始的时候竞价激烈，但后来大家发现平台大了，客户圈也大了，反而扩展到省外甚至国外。

2年后有望追上ChatGPT现有水平？

以ChatGPT为代表的AIGC应用，离不开大数据、大算力、大模型的训练结果。当我们面对这股龙卷风般的潮流席卷时，首先要看清自身的水平和现实差距。

陈巍指出，首先数据方面，国内的高质量语料较少，大部分能用的语料标记质量恐怕达不到ChatGPT的训练要求。就拿OpenAI来说，是雇用了约40多个全职的标记员，按照特定的要求来标记语料，而不是直接找数据公司买通用的标记数据。推测这个标记方法应该与其训练策略密切相关，可能有一定的保密要求，是完全私有的数据集。因此，国内企业首先要补上私有数据集这个短板、以及数据集的标记策略，而这可能都是大量烧钱训练之后学到的经验。

再说模型本身。以ChatGPT为例，基本上国内大部分开发者都是从开源的GPT-2开始起步，大部分企业恐怕要经过大量的盲人摸象般的训练才能进阶到GPT-3的水平，然后再继续训练到GPT-3.5和ChatGPT。假如按理想的情况：准备数据和摸索训练方法用半年，GPT-2到GPT-3用半年，依此类推，大概也需要2年时间才能追上ChatGPT现有的速度。而这还是项目进展顺利、没有被公司砍掉的情况下。而2年后，国外可能已经进阶到GPT-5或者GPT-6的水平了。

最后是大算力芯片，这才是对国内开发者最头大的事情。大模型训练规模的现实摆在那里，即便使用GPU，也要消耗巨大的成本。“现在看GPU训练大模型，有点像早期的深度学习研发人员看CPU训练AlexNet这些早期的深度学习模型，训练成本很高，速度又慢，这是大模型训练未来需要努力改进的方向”，陈巍表示。

综合来看当前的三方面短板，数据和模型方面，可以通过大量资金投入和研发人员的努力来补上；但大算力芯片方面，则需要半导体和相关产业链的整体提升，这点并不容易且是一个长期的过程，可能会成为国内赶超的重中之重。

写在最后

一个朋友感慨：“我对AI的印象还停留在人工智障阶段，怎么突然就成了再进宫的甄嬛——不可同日而语了？”

ChatGPT的横空出世，让AI再度引发轰动。随着国内AI大模型的发展，使用成本的降低，AI将通过各种NLP或AIGC应用进入每个人的生活，甚至成为普通人的伙伴、助手或老师。ChatGPT这类大模型技术，还可以与机器人或传统的制药、材料、航空、汽车等领域结合，促进行业技术的快速发展。

因此，ChatGPT绝不仅仅是一个聊天机器人，也不会止步于颠覆现有的搜索引擎，它可能只是通用人工智能的一道开胃菜。

器件型号	数量	器件厂商	器件描述	ECAD模型	参考价格	更多信息
ATXMEGA128A1-AU	1	Microchip Technology Inc	IC MCU 8BIT 128KB FLASH 100TQFP	ECAD模型下载ECAD模型	$8.12	查看
AT90CAN128-16AU	1	Microchip Technology Inc	IC MCU 8BIT 128KB FLASH 64TQFP	ECAD模型下载ECAD模型	$20.4	查看
ATMEGA64A-AU	1	Atmel Corporation	RISC Microcontroller, 8-Bit, FLASH, AVR RISC CPU, 16MHz, CMOS, PQFP64, 14 X 14 MM, 1 MM HEIGHT, 0.80 MM PITCH, GREEN, PLASTIC, MS-026AEB, TQFP-64	ECAD模型下载ECAD模型	$4.99	查看

器件型号

数量

器件厂商

器件描述

数据手册

ECAD模型

风险等级

参考价格

更多信息

ATXMEGA128A1-AU

Microchip Technology Inc

IC MCU 8BIT 128KB FLASH 100TQFP

$8.12

查看

AT90CAN128-16AU

Microchip Technology Inc

IC MCU 8BIT 128KB FLASH 64TQFP

$20.4

查看

ATMEGA64A-AU

Atmel Corporation

RISC Microcontroller, 8-Bit, FLASH, AVR RISC CPU, 16MHz, CMOS, PQFP64, 14 X 14 MM, 1 MM HEIGHT, 0.80 MM PITCH, GREEN, PLASTIC, MS-026AEB, TQFP-64

$4.99

查看

狂飙的ChatGPT，中小企业洗洗睡吧？

会否加剧“强者恒强”的两极局面？

面对ChatGPT冲击波，中小企业的机会在哪里？

2年后有望追上ChatGPT现有水平？

写在最后

推荐器件

相关推荐