加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 1. M1 Pro & Max 的架构升级
    • 2. 上手体验
    • 3. 购买建议
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

【评测】深度体验苹果M1 Max:王炸性能背后的逻辑

2021/11/26
3546
阅读需 16 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

上个月,苹果正式发布了M1 Pro和M1 Max两个芯片,以及搭载这两个芯片的两款MacBook Pro笔记本。作为一个2015款MacBook Pro的老用户,这次的产品更新也是我一直希望的,芯片和笔记本都是,我也第一时间下单了。

今天的文章就来聊聊苹果M1 Pro & Max芯片,特别是它相比M1芯片做出的架构优化,以及它擅长与不擅长的事情都有哪些。关注我视频内容的朋友应该也看到,我做了一期视频专门介绍这个内容。不过在这篇文章里,我也会分享一些视频里没有提到的细节,以及我深度使用一个月的上手体验与购买建议。

1. M1 Pro & Max 的架构升级

事实上,我其实没想到苹果会在这次一口气发两个芯片。去年苹果M1发布的时候,我也和大家分享过,我不买的主要原因是内存太小了。所以这次我很期待会有64G版本的出现。

结果当时熬夜看发布会的时候,先发布了M1 Pro,然后它最多只支持32G内存,我当时心里就凉了,赶紧安慰自己说32G其实也够了。关于够不够这件事,文章后面会讨论。

接着负责苹果硬件技术的高级副总裁Johny Srouji话锋一转,说我们今天“会把极限推向新的高度,不仅推出一款、而是两款新芯片”,然后屏幕一黑,哗的一下出现了M1 Max。当时看得我鸡皮疙瘩都起来了。

然后的事情大家都知道了,发布了M1 Max,并且可以支持最高64GB内存。

如果说,M1的发布是从0到1的跨越,那么这次发布的M1 Pro和M1 Max应该是从1到5的提升。虽然不是开创性的,但是提升的幅度非常大。

去年的文章介绍过M1性能和功耗如此牛逼的三个主要原因,分别是5纳米工艺的加持、芯片架构的创新,还有最重要的,就是软硬件生态的协同优化。对于M1 Pro Max来说,这三点逻辑依然保持不变,但是在这个基础上又增加了很多芯片架构上的优化和提升,总结来说也有3点,分别是:内核数量的提升,内存带宽的提升,以及专用加速单元的提升。这些提升的目的非常非常的明确,苹果并不是要打造一个适合所有应用的巨无霸计算机,而是要造一个面向专业内容创作者的、远超市面上任何笔记本、甚至是台式机的机器。

这其实是一个非常重要的方法学与思维方式的转变。在很多传统的芯片设计里,技术和业务是分离的,这很容易造成做出来的产品解决不了问题,或者包含了很多不必要的东西,从而白白浪费了面积和功耗。

而苹果这次使用的方法,是把上面的过程反过来,根据应用来设计硬件和芯片架构,这就取得了性能和功耗的双重优化。从M1 Pro/Max身上,也可以看到很多DSA、也就是Domain Specific Architecture 领域专用架构的影子。

简单介绍一下这次的大小王芯片,它们都是片上系统SoC,也就是说在一个芯片里集成了CPU、GPU、神经网络引擎、视频编解码等等IP和模块单元。同时按照M1芯片的传统,它们也使用了统一内存架构,把内存和芯片主体封装在一起。

具体来说,小王M1 Pro最高支持10核CPU、16核GPU、16核神经网络引擎,以及最高32GB内存。大王M1 Max在这个基础上把GPU数量和内存容量都提升了一倍,最高支持32核GPU和64G内存。

可以看到,和M1芯片的8核CPU、8核GPU、最高支持16G内存相比,M1 Pro和M1 Max有着肉眼可见的提升。但值得注意的是,它们仍然采用了台积电的5纳米工艺,而且不管是性能核还是能效核,从架构来看和M1并没有区别,只是数量提升了。但这个提升也有点讲究,大小王采用了8+2的结构,也就是8个性能核、2个能效核,所以性能核相比M1就直接提升了1倍。

很有意思的是,M1 Pro/Max的这8个性能核分成了两组,每组有独立的12MB二级缓存,同时的四个内核还可以动态的工作。比如根据知名科技媒体Anandtech的数据,只开一个内核的时候,频率最高可以跑到3.2GHz,而4核同开的时候频率会降到3GHz左右。当然也可以一组只开一个内核,而另外一组全开。总之,这种架构非常的灵活,又不至于有过于精细、细粒度的调度机制。所以这其实也是在CPU架构设计的时候的一种折中和平衡。

图片来自Anandtech

事实上,M1 Pro/Max最大的提升其实并不在CPU和GPU,而是内存带宽。

M1 Pro采用了256位的LPDDR5内存,最高带宽可以达到204GB/s,远超过M1的68GB/s。而M1 Max直接又提升了一倍,把总线宽度提高到512位,内存带宽达到408GB/s。

这个数字是什么概念呢?之前英特尔架构日的文章里介绍过,英特尔当前技术的集大成者、用于下一代超算和云数据中心的GPU Ponte Vecchio,它的内存带宽是5TB/s。而M1 Pro Max这个消费级笔记本处理器的内存带宽是Ponte Vecchio的10分之一,晶体管数量是它的一半。这个就非常夸张了。虽然不能说苹果在笔记本里装了半个超算芯片,但是这个内存带宽在消费级CPU芯片里也是绝对前无古人的存在。

 

由于M1系列采用了统一内存架构,所以大幅降低了数据传输的延时。而且这么大的内存,这么高的内存带宽,并不专属于CPU或者GPU,芯片上的各个模块都可以快速访问并且共享内存,减少了很多数据搬运、拷贝的开销。

但是另外一方面,M1 Max能不能充分利用这400G的内存带宽还要打个问号。Anandtech的测试发现,M1 Max的CPU只能使用243G的带宽、GPU最多使用小100G,这样还剩下几十G的带宽空余。不过这个其实就引到了我们要说的第三个架构升级,那就是专用加速单元的提升。

在M1 Pro/Max里,共享内存带宽的还有很多硬件加速模块,最典型的就是神经网络引擎Neural Engine,以及这次专门加入的针对图形图像应用的硬件编解码模块。这个其实很好的提现了芯片设计“领域专用”的思想,也就是针对某个具体应用领域,进行专门的硬件优化,让专门的模块做专门的事情,而不是依赖通用的CPU或者GPU来完成。这样就能既大幅提升性能,又大幅降低功耗

所以基于前面说的这些逻辑,M1 Pro/Max的CPU单核性能和M1几乎没有区别,但是多核性能有了质的飞跃,更是吊打市面上现有的其他移动端CPU。

别的厂商挤牙膏都是百分之几、百分之几的提升,而M1 Pro/Max上来就是几倍几倍的提升。比如根据苹果的数据,在同等功耗条件下M1 Pro Max的性能是某8核 PC笔记本处理器的1.7倍。在同样的性能要求下,M1 Pro Max的功耗只有PC芯片的70%。

这里插一句,去年发布M1的时候我吐槽过苹果的图太营销号了,没说对比的是谁,只能成为张三芯片,横纵坐标也没有。今年的发布这些都有改进,也用小字标明了这里比的是微星GP66,里面用的其实是英特尔的11代酷睿i7-11800H。这个就有点扎心了。

从跑分来看,M1Pro/Max的CPU多核性能、以及GPU性能都非常逆天,分数甚至超过了桌面级CPU 11900K和5800X,甚至逼近服务器CPU的性能。这些产品能放在一起比较,本身就说明M1 Pro Max已经赢了。而且不要忘了M1系列芯片有着极低的功耗,这样M1 ProMax的性能功耗比,就会远远高于任何同级别的竞争对手。

但是,正如之前介绍过的,我们不可能单独的去买M1 ProMax芯片,而是需要购买苹果的整个生态系统,包括它的硬件、软件,还有它的服务和生态,这些才是真正的溢价和利润。

对于苹果来说,这不仅经济上有大利可图,技术上也有很大好处。因为这让苹果可以专注于自己生态的建设,而不需要各种跨平台、跨厂商的兼容和适配。这次推出的两个芯片和两个Macbook Pro笔记本电脑,就是为了专业用户量身打造的,特别是广大的视频和图形图像内容创作者,他们需要强大的视频处理能能力。这也是苹果往芯片里堆这么多GPU、堆这么多ProRes编解码单元的最主要原因。

至于很多非苹果用户常说的“游戏性能”,则是苹果战略“放弃”的领域。之所以打引号,是因为苹果并不是没有技术能力布局这个方向。事实上,在手游领域,不管是iphone还是ipad,它们的游戏性能都是行业顶级。

油管的知名博主Dave Lee也分析过,不管是游戏主机、还是Mac和Macbook游戏,都不是苹果感兴趣的领域。比如,传统的游戏主机厂商都不是靠主机本身挣钱,而是靠卖游戏挣钱。相比之下,苹果靠卖高溢价高利润的硬件和生态挣钱。此外,使用Mac的用户本来就是少数,他们中有多少人是游戏玩家更要打个问号。所以基于这两点原因,苹果干脆就放掉了主机和电脑游戏这个领域,而专攻内容创作这个更加广泛、专业、且购买力更强的市场。

2. 上手体验

我不是数码博主,这个玩意就是我的生产力工具。我不买去年发布的Macbook Air和13寸Macbook Pro的主要原因,除了内存太小,还有就是不方便:接口太少,需要外接一个适配器,非常麻烦。

新Macbook Pro恢复了HDMI和SD卡插槽,这个绝对是刚需,特别是对于需要外接显示器和经常使用相机读写东西的人来说。其他硬件就不用多说了,键盘、屏幕、扬声器电池,每个都是我用过的所有十几款Windows/Mac笔记本里最好的。我经常有这样的疑问,为什么苹果能做出这样细节极度优化的产品,而其他厂商不能?困难在什么地方?

至于中间那个刘海,虽然看起来很丑,但我在日常使用的时候几乎完全不会注意到。大部分应用在使用的时候上面都会有一个菜单栏,会很好的把这个刘海隐藏掉。

我觉得这次苹果做的非常好的一点,就是倾听了广大使用者的感受和反馈,虽然在很多人看来,好像苹果的设计语言又倒退回了几年前,但有的时候以退为进,专注于产品实用性的提升,特别是像这种专业级的产品,是很多人吃饭的家伙,所以好用比特立独行更为重要。

3. 购买建议

如果你是专业用户,日常工作就需要大量处理视频图片音乐,特别是如果你用的主力软件是苹果生态的,比如我用的final cut pro等等,或者你从事很多苹果生态的软件开发和编译,那么这个机器绝对是性能猛兽。不过如果你是专业用户,应该也不需要我的购买建议。

如果你不是专业用户,我知道关注我的不少朋友都是学生,那么这个机器大概率不适合你。或者说,你可能用不到它这么强劲的性能。买个M1芯片的13寸macbook pro或者macbook air,也很香。

对于我来说,老石谈芯的全部内容都是基于我之前的2015款macbook pro。我从完全不会做视频的小白,到现在做了将近50期视频。从公众号的第一篇文章,到现在一百多篇原创文章,都是用我之前的那台Macbook Pro一个字一个字打出来的。

我用这个电脑开启了太多全新的机会,学到了太多东西,也创作了很多有价值的内容,所以它就是我最重要的生产力设备。但是我的老款电脑做视频的时候特效加多了就很卡、渲染时间很久,网页开多了风扇就呼呼直转,这就限制了我尝试更多的可能性、也限制了我创作更多的内容,这种感觉非常不爽。

我现在其实也并不需要64GB内存的机器,就像6年前我不需要16GB内存一样。但我很难保证,未来的某一天我是否有需要,就像我自己也不知道我会开始做视频一样。

我相信,有了这台机器,在今后的五年里,电脑不会是我创造力的制约,我也会用它创作更多更有意思的东西带给大家。

至于要不要等M2出来,我只能说:等等党,永不为奴!

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
TLV320AIC3110IRHBR 1 Texas Instruments Low-Power Audio Codec With 1.3W Stereo Class-D Speaker Amplifier 32-VQFN -40 to 85

ECAD模型

下载ECAD模型
$4.6 查看
TPA3110D2PWP 1 Texas Instruments 15-W stereo, 30-W mono, 8- to 26-V supply, analog input Class-D audio amplifier w/ SpeakerGuard™ 28-HTSSOP -40 to 85

ECAD模型

下载ECAD模型
$2.94 查看
CS4207-DNZ 1 Cirrus Logic Consumer Circuit, CMOS, 6 X 6 MM, LEAD FREE, MO-229, QFN-48
$12.4 查看
苹果

苹果

Discover the innovative world of Apple and shop everything iPhone, iPad, Apple Watch, Mac, and Apple TV, plus explore accessories, entertainment, and expert device support.

Discover the innovative world of Apple and shop everything iPhone, iPad, Apple Watch, Mac, and Apple TV, plus explore accessories, entertainment, and expert device support.收起

查看更多

相关推荐

电子产业图谱

微信公众号“老石谈芯”主理人,博士毕业于伦敦帝国理工大学电子工程系,现任某知名半导体公司高级FPGA研发工程师,从事基于FPGA的数据中心网络加速、网络功能虚拟化、高速有线网络通信等领域的研发和创新工作。曾经针对FPGA、高性能与可重构计算等技术在学术界顶级会议和期刊上发表过多篇研究论文。