加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 大模型,既不是“故事”也不是“玩具”
    • 产业大模型,“百模大战”的新战线
    • 狭路相逢,得“场景”者胜
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

大模型需要实干派

2023/07/16
3706
阅读需 13 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

撰文 | 吴先之  文烨豪

编辑 | 王   潘

国内大模型战事,一度被诸多疑云所笼罩。而随着京东、腾讯接连入座,这场复杂的牌局正变得明晰起来。

百度与阿里,作为国内最早一批大模型玩家,在“先声夺人”的同时亦争得了早期的流量。相比之下,腾讯、京东虽起步稍晚,但其更能深入审视大模型赛道,以加深对行业的理解。

正因如此,一些发布大模型相对较晚的大厂并未盲从大众,投入通用大模型的大潮。例如此前华为大模型提到实用性,而京东凭借着自身在产业、供应链等方面积累的深厚积累,选择了一条更有远见且更具针对性的路径,并在2023京东全球科技探索者大会暨京东云峰会(JDD大会),推出面向产业的京东言犀大模型。

在通用大模型混战的当下,京东推出的言犀大模型和其产业价值创造路径,既是建立大模型商业秩序的绝佳尝试,亦为整个行业带来全新的思考和方向。在大模型的商业化滞水里,距离落地更近的产业大模型,极可能在未来的大模型竞逐中一路领跑,成为一股不可忽视的新生力量。

大模型,既不是故事也不是玩具

每一轮科技演替的浪潮,往往也裹挟着大量的泥沙。

从早年的芯片机器人,再到AI,每一波浪潮里,总有一些别有用心的玩家混迹于其中,将科技与营销混淆在一起,使原本清澈的赛道愈发浑浊。现阶段的国内大模型赛道,亦是如此。

赛道的一侧,玩家们苦苦摸索着大模型的技术脉络,并试图找寻落地方向;而在另一侧,纵使是和科技领域八竿子打不着一块的公司,也在纷纷下场,训练出所谓的“大模型”产品——不得不承认,当下“万物皆可大模型”的局面,颇有两年前“万物皆可元宇宙”的意味。

显然,当所谓的“大模型”变成一个代名词,服务于自身“讲故事”的诉求,而非创造实际价值,那大概率只能奔赴元宇宙的宿命。而这,对那些老实钻研技术的玩家们而言,同样成立。毕竟技术本身很难直接创造价值——大模型的终点,并非训练出通用大模型本身,而是让技术产生价值,进而实现成熟的商业化落地。

因此,追风蹭热者们看似滑稽的操作,其实给大模型赛道敲响了一记警钟。毕竟点燃AIGCChatGPT,潜移默化地影响着玩家们的大模型观,使一众玩家纷纷奔赴通用大模型,推出多款ChatGPT的“变种”。

客观地说,通用大模型有其价值所在,但在竞争维度愈发剧烈的当下,通用大模型并非坦途:

一方面,玩家们纷纷涌向单一领域,极有可能陷入“重复制造轮子”的境遇,想要从充斥着国内外科技巨头的战场中突围,难度可想而知。

另一方面,通用大模型是典型的消费与付费分离的产物,稍有不慎便会沦为“玩具”。

举一个简单的例子,广泛的C端用户或许会向其咨询问题乃至探讨宇宙和天空,但绝大部分普通用户其实并没有生产力诉求,在短期密集体验后,对新兴科技的新鲜感便会迅速丧失,未必有长期使用的动力。

基于此,纵使当下的通用大模型能在一定程度上提升内容创作效率,除了部分内容行业与组织内部降本增效以外,其尚未跑出成熟、可复制的商业模式。可以预见,随着通用大模型赛道日益拥挤,玩家们势必将在商业化延展层面面临诸多考验。

归根结底,“奇点”已至的当下,大模型不仅是科技演替的里程碑,更是塑造未来的关键驱动力。因循该逻辑,现阶段大模型战事绝非一场短程竞速,而是一项系统性工程。玩家们若想穿越周期、熬到终点,不能只靠技术层面的单点突破,而是需要同步思考技术方向、场景应用、商业模式等诸多维度。

产业大模型,百模大战的新战线

从1997年,“深蓝”战胜象棋大师加里·卡斯帕罗夫,到“阿尔法狗”杀入围棋圈,再到视觉系AI与自动驾驶,AI过往经历了多轮振奋人心的演化,每一轮仿佛都站在应用爆发的边缘,可满枝的花骨朵,却又迟迟未能开出繁花。

这背后的主因在于,技术尚未在产业端形成深厚的应用,毕竟科技进步的终点,不是在困在实验室里,而是落地下潜,走向“现实世界”。

因循该逻辑,审视现如今的通用大模型赛道,距离在真实商业场景落地生根并创造出实际价值,仍有着不少距离。

京东集团CEO许冉在JDD大会现场表示,大模型本身是实现产业价值的工具,而不是目的,大模型真正实现自己的价值,一定是在产业应用中。

换言之,大模型不是目的,应用才是目的。

当下的大模型厂商,往往会将模型参数视为大模型好坏的检验标准。殊不知,在商业落地层面,巨大的参数亦对应着高企的成本,亦存在着相应时间长、并发性差等问题。

一个简单的例子,部分“参数怪兽”,每回答一个问题就要耗费两三毛钱,还需等待5-10秒,就算回答得再精准,也很难实现大规模的商业化落地。此外,目前通用大模型85%左右的准确率,对于普通用户而言或许已经足够,但在严肃的商业场景下,此番误差很有可能对业务产生难以忽视的影响。

针对应用问题,京东多条业务线技术负责人都提到,人们会因为GPT一个编造的回答付之一笑,可一旦落实到实际应用过程中,任何偏差都导致巨大损失。

京东探索研究院院长、京东科技智能服务和产品部总裁何晓冬博士曾亲身经历过一件事情,颇有代表性。“一个大模型回答143开平方,给出的答案是11.5(实际上约等于11.96),如果在实际应用场景中,这个答案将会带来巨大损失。”

在技术领域,模型参数、精度固然重要,但在商业世界中,大模型本身好用且稳定才是关键。而在此方面,同细分产业紧密关联的产业大模型,无疑存在着天然的优势。

只是,研发产业大模型绝非易事。众所周知,训练数据是大模型学习的基础,亦决定了大模型的泛化能力与应用场景。因此,除了技术层面的突破,源于产业的一手场景、数据,对研发产业大模型而言同样重要。

以京东为例,其之所以会推出面向产业的言犀大模型,很大程度上便源于其浓厚的产业基因。毕竟在一众国内大厂中,链接着消费市场与供应链两端的京东,同产业的绑定甚强,亦具备大量优质数据。

据悉,言犀大模型训练时,便融合70%的通用数据与30%数智供应链原生数据。可见,京东并不纯粹强调参数,也非刻意讲述“故事”,而是将重点放在“调教”层面,旨在打造出同产业高度相融的大模型。

产业大模型,或将成为大模型赛道迈向大规模商业化的重要一步,而逐渐参透该逻辑的玩家们,亦在渐渐上车。

近日,迟迟按兵不动的腾讯,发布了自己的行业大模型;高举通用大模型大旗的百度,亦端出覆盖交通、能源等领域的行业大模型。不难看出,随着巨头们纷纷加码,更贴近商业化的产业大模型,已然成为了“百模大战”的新战线。

狭路相逢,得场景者胜

无论是通用大模型,还是产业大模型,构筑出新的商业秩序始终绕不开“场景”。

换言之,对于落地而言,晦涩喷的当下,为大模型找到所谓的应用场景,本身并不算难。可若想找到适合大模型大规模落地,并跑通商业化路径的场景,则可能要经历大量的弯路。

因循该逻辑,已然端出大模型的玩家们,正在各种细分领域不断尝试,试图寻找属于自身的落脚点:

百度抓住一年一度的高考热点,推出AI志愿助手,活用大模型能力的同时,亦试图借此打入C端市场;阿里则以天猫精灵为锚点,探索大模型在消费电子领域的发展空间。

发力产业大模型的京东,则提出了“大模型的价值=算法×算力×数据×产业厚度的平方”的公式,而所谓的“产业厚度”,正是由一个个具体的场景堆砌而成。

无论路径如何,大模型玩家们抵达“应许之地”之前,势必将不断试错,乃至穿越“红海”。

面对大模型的落地难题,部分玩家选择扮演“卖水人”的角色,帮助企业构建属于自己的大模型。而打法一向务实的京东,则提出了“三步走”战略,即先搭建通用大模型,然后在内部探索场景与应用,而后逐步将能力对外开放——将自身作为试验田的同时,亦自我消化掉试错成本,以确保大模型产品能创造实际价值。

据悉,在京东内部,大模型不仅已经嵌入了数智营销、运营流程优化、客户服务等常见应用场景,更已延伸至零售、物流、金融、健康等诸多垂直场景。

以物流领域为例,面对这一门繁杂的系统工程,京东跑出了多条探索路径:历时5年打造的供应链产品京慧,除了丰富的AI预测、运筹优化等原生算法外,通过开放生态技术,不仅能很好的与异构系统的算法及数据互联互通,在大模型的加持下,在销量预测、库存、供应及补货计划方面更具表现力,同时由于AIGC的广泛应用,其交互式供应链控制塔能够帮助用户快速定位并解决供应链问题。

在基金理财场景,京东金融“智能选基”产品上线。传统的基金筛选,理解成本高,操作繁锁,直接影响交易成功率。借助大模型,京东在意图匹配、算法生成、意图识别、多轮对话等环节进行优化,使常见筛选问题准确率达90%,有效提升客户体验和交易效率。这一产品后续也将全面服务于金融机构。

由此可见,京东的“三步走”战略已初见成效,并已逐渐浸润到物流、金融等垂直行业的肌理之中。可以预见,随着战略逐渐铺开,京东亦将不断积累落地场景、高质量数据,从而转动起产业大模型商业落地的飞轮。

归根结底,看似复杂的大模型战事,终究要回归一个核心问题,即技术如何为实体产业带来实际价值。而现阶段,道路不同的玩家们,只能在这场漫长的马拉松,逐渐摸索、实践出问题的答案。

 

 

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
FT232RQ-REEL 1 FTDI Chip USB Bus Controller, CMOS, 5 X 5 MM, GREEN, QFN-32

ECAD模型

下载ECAD模型
$4.95 查看
STM32F745IGT6 1 STMicroelectronics High-performance and DSP with FPU, Arm Cortex-M7 MCU with 1 Mbyte of Flash memory, 216 MHz CPU, Art Accelerator, L1 cache, SDRAM

ECAD模型

下载ECAD模型
$16.29 查看
STM32F417VGT6 1 STMicroelectronics High-performance foundation line, Arm Cortex-M4 core with DSP and FPU, 1 Mbyte of Flash memory, 168 MHz CPU, ART Accelerator, Ethernet, FSMC, HW crypto

ECAD模型

下载ECAD模型
$16.9 查看
京东

京东

The Investor Relations website contains information about JD.Com, Inc.'s business for stockholders, potential investors, and financial analysts.

The Investor Relations website contains information about JD.Com, Inc.'s business for stockholders, potential investors, and financial analysts.收起

查看更多

相关推荐

电子产业图谱