加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • AI技术基因
    • 为什么是夸克
    • 大模型将如何“升级”夸克
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

自研大模型,夸克豹变

2023/11/17
2326
阅读需 11 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

作者|李禾子,邮箱|lihezi@pingwest.com

11月14日,阿里巴巴智能信息事业群宣布正式推出夸克大模型。据介绍,夸克大模型是基于Transformer架构、全部技术均为自研,同时参数规模达千亿级的多模态大模型;其应用场景除了基础的通用搜索,还将包括医疗健康、教育学习和职场办公等更垂直的领域。

从其应用方向来看,夸克大模型的推出很符合当前大模型“重落地”的发展趋势。

推出之前,夸克大模型已经组建了数百人的研发团队,在上述垂直领域进行了预训练和精调。官方发布的数据至少显示,夸克大模型并非是一个“赶时髦”的产物,而是有着想做到行业顶尖的野心——

11月16日,在C-Eval和CMMLU两大权威评测榜单的最新评测结果中,夸克大模型分别以89和以77.08的均分登顶;国内专业考试测试方面,它在中考、高考和研究生考试中均超过了GPT-4,包括在临床执业医师资格考试、计算机等级考试、公务员考试、教师资格证考试等评测中,也均优于GPT-4(其中临床执业医师资格考试成绩为486分,远高于360分的及格线)。

如果进一步结合阿里巴巴在AI生态的布局,就会发现夸克大模型的诞生有着很强的战略属性,阿里巴巴智能信息事业群连同大模型在其中的地位一起,都被提到了相当的高度。

AI技术基因

需要指出的是,智能信息事业群属于阿里巴巴“1+6+N”中的N公司,同闲鱼、钉钉等公司于集团内的序列类似。

阿里巴巴智能信息事业群更注重产品创新和技术研发,这也是内外部对其的认知之一。

该事业群成立于2021年4月,定位于信息服务方向的智能化创新,旗下包括了夸克App、UC浏览器和书旗小说等产品。

同年10月,智能信息事业群升级组织架构,围绕夸克App成立了夸克事业部。该动作被外界解读为是在加码信息服务赛道,夸克则有望承担起创新突破的使命。包括此次推出的夸克大模型,研发路线也是为了服务夸克的业务战略。

随着AI时代的到来,信息服务领域的用户价值和商业价值仍处在高速增长的初期,夸克开始被置于更高的发展优先级。

今年9月,阿里集团宣布了用户为先、AI驱动的两大战略重心,将加大对“技术驱动的互联网平台业务”、“AI驱动的科技业务”等业务的战略性投入。

吴泳铭指明的阿里巴巴未来的战略投入方向,夸克显然是AI生态中的一份子,夸克大模型的推出已经是一个证明。

为什么是夸克

夸克当前的定位将关系到夸克大模型将如何应用。

把时间拉回至几年前,当时出现在人们眼中的夸克还是一款极度简洁的小众产品,专注于优化用户的搜索体验。也因为体验做得好,在极客和App玩家里圈了一大波粉丝,月活也达到了百万级。

后来夸克所有的探索,也都是在此基础上展开的,各种变化也一直围绕着夸克的成长。

对于当时已经拥有一定体量的夸克来说,一条分岔路其实已经摆在了面前——作为一款信息服务产品,它必然要考虑后续的发展方向,单一的功能定位能赢得当下,却不一定争取到更大的市场。夸克需要在克制的前提下做加法,然而对于这样一款对用户体验有着执念的搜索为主的应用而言,做加法不是个容易的过程。

期间夸克进行过一些尝试,譬如垂直领域的专业搜索,以及不同形态的优质内容生态建设。

但就在人们以为夸克要走上内容付费时,它又结合用户需求和市场变化迅速对自己的业务体系进行了梳理。

2021年夸克事业部成立,按照阿里巴巴智能信息事业群总裁吴嘉的说法,夸克已进入新的阶段,正在从一个好用的搜索App,迈向个人学习、生活和工作的智能助手。

此前,夸克已经在搜索业务的基础上延展出了一些信息服务,譬如辅助考生进行志愿筛选的高考信息服务,包括健康百科和健康精选问答在内的健康信息搜索,以及内容涵盖简历、PPT、论文、合同、表格和期刊等在内的文档等。此外,工具属性更强的夸克网盘也在2019年就已上线。

这些服务在“智能信息”的概念出现之前,还是较为分散的,而当明确要做用户“个人学习、生活和工作的智能助手”之后,夸克的定位也逐渐清晰起来。

依然是在不牺牲用户体验的原则上,夸克后续又对这些服务进行了更深入的优化,并在2022年推出另一款工具产品夸克扫描王,补足了扫描场景下的用户体验。也是在2022年,夸克App的Slogan正式由“新生代智能搜索”升级为“你的高效拍档”,自此完成了从一个“小而美”的App走向新一代智能信息产品的生态化发展的蜕变。

由于服务场景更贴合学生以及年轻的上班族,夸克也在更新自己的同时,积累起了一批画像更加年轻的用户——据QuestMobile发布的《2023年轻人群智能效率应用研究》报告,夸克App在泛学生人群和新生代职场人群的用户占比最高,年轻用户使用时长位列行业第一;此外,在夸克服务的数千万级用户中,25岁以下用户占比超过一半。

这些统统构成了夸克区别于其他同类应用的差异化用户心智。

很显然,对于夸克这样致力于帮助用户提高效率、有更强实用性质的应用来说,大模型的引入在现阶段是适配的,也符合大模型的进化规律。夸克的发展已经从单一服务变成产品矩阵形态,这也给大模型提供了足够多的落脚点。

大模型将如何“升级”夸克

当我们提大模型对某个应用的改造,一定是建立在这个应用原有的业务基础之上。

夸克首先作为一个搜索工具,在过去几年已经积累起了海量的中文数据,并号称有“最全面的中文数据库”。训练大模型最核心的三要素之一就是数据,夸克过去的积累首先给了大模型能更好理解、评估和提炼中文知识体系的前提。

而在更细分的领域,夸克的知识内容体系也相对更完整。

比如高考服务,到今年夸克已经连续五年提供高考信息服务,各省市的高考数据非常齐全,同时也涵盖了丰富的图文、视频和直播等针对不同省份、分数段学生的填报技巧内容;健康服务方面,夸克也联合数百位院士、医疗专家和专业协会建立起了夸克健康百科,并且和数十家行业头部医疗机构合作建立起了健康精选问答体系;至于文档服务,其内容也包括了实用范文、求职简历、合同模板、PPT模板、教育教学、表格模板和研究报告等八大类,精选文档也已上线了超千万份……

更重要的是,这些数据和内容背后,包含的是非常丰富的用户场景,对于大模型理解和认知不同用户对工作、学习和生活上的真实需求,亦是加分项。

某种程度上,大模型的加持和夸克一直以来的技术传统是一脉相承的。

AI此前就在夸克的各项服务中多有应用,就高考和健康服务来说,已经在录取预测、模拟填报以及针对病例、药品的筛查等等使用场景下借助过AI帮助;夸克网盘也在今年先后上线了AI自然语言搜索以及播放器AI字幕生成功能;夸克扫描王在识别的准确性上,也一直离不开AI的贡献。

夸克可以说对浪潮的到来早有准备,而大模型一旦加码融入,对夸克各项功能服务的影响可以预见地也将十分显著。

想象这样一种场景,在扫描工具的使用中,用户的痛点通常在于相机识别出的内容不够准确,尽管此前借助AI已经能在诸如版式、公式和手写内容等的识别上提升准确度,但此类AI往往在语义和前后文的理解上较为机械。而大模型最强的能力恰恰就在于认知,因此当大模型被用于扫描场景,识别准确性又可以提升一个量级。

类似的大模型应用场景,几乎可以匹配到夸克当前的每一项服务,从而带来更多体验上的变革。

而在大模型现阶段普遍存在的幻觉问题方面,夸克也提出了自己的应对,建立了从内容、搜索再到推理的一套可辨别知识真伪的技术体系,尤其是在通用知识、图文知识、专业知识、推理知识和写作增强等方面,有望让大模型提供的内容更具有准确性和专业性。

在给用户带来改变前,夸克先积极拥抱了变化,改变了自己。

吴泳铭几天前在世界互联网大会上的预判是,“在可见的未来,会有更智能的下一代产品进入人们的生活,AI助理会无处不在,成为每个人工作、生活、学习中的助手”。夸克已经到了迈向下一代搜索的临界点,大模型也将成为推动夸克持续进行产品体验创新的技术底座。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
ATXMEGA32E5-MU 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, 5 X 5 MM, 0.50 MM PITCH, GREEN, PLASTIC, MO-220VHHD-2, VQFN-44

ECAD模型

下载ECAD模型
$3 查看
STM32F103VET6 1 STMicroelectronics Mainstream Performance line, Arm Cortex-M3 MCU with 512 Kbytes of Flash memory, 72 MHz CPU, motor control, USB and CAN

ECAD模型

下载ECAD模型
$16.64 查看
ATXMEGA128A1U-AU 1 Microchip Technology Inc IC MCU 8BIT 128KB FLASH 100TQFP

ECAD模型

下载ECAD模型
$7 查看
阿里巴巴

阿里巴巴

阿里巴巴集团经营多项业务,另外也从关联公司的业务和服务中取得经营商业生态系统上的支援。业务和关联公司的业务包括:淘宝网、天猫、聚划算、全球速卖通、阿里巴巴国际交易市场、1688、阿里妈妈、阿里云、蚂蚁金服、菜鸟网络等。

阿里巴巴集团经营多项业务,另外也从关联公司的业务和服务中取得经营商业生态系统上的支援。业务和关联公司的业务包括:淘宝网、天猫、聚划算、全球速卖通、阿里巴巴国际交易市场、1688、阿里妈妈、阿里云、蚂蚁金服、菜鸟网络等。收起

查看更多

相关推荐

电子产业图谱

关注中国未来创新技术产业发展,讲好科技创新的中国故事。

微信公众号