从表面上看,M1 Ultra 是两个M1 Max通过 UltraFusion 的芯片对芯片连接器连接在一起。连接器本身就非常厉害:2.5TB/s 的芯片到芯片带宽,这两个 M1 Max 可以在逻辑上被视为一个大型 M1 Ultra。
摘要:
M1 Ultra 是 Apple 于 2022 年 3 月发布的最新 SOC,并在全新 Mac Studio 上首次亮相
基本而言,M1 Ultra 是两个 M1 Max 连接在中间,所以拥有双倍的东西:20 个计算机核心、2 个神经引擎、64 个图形核心、4 个媒体引擎和 800 MB/s 内存带宽
技术细节:有一个芯片到芯片的桥接器是微缝合在一起的,称为 UltraFusion,芯片到芯片的带宽为 2.5 TB/s
根据专利调查结果,Apple 正在考虑以 3D 堆叠样式加入更多芯片,并使用这种微缝合,预计将在更新的 Mac Pro 中首次亮相。
M1 Ultra 布局
拥有两个或更多物理 CPU 或对称多处理(SMP) 并不是什么新鲜事。然而,拥有双物理处理器存在许多缺陷,因此业界普遍转向多核系统。苹果可以将双 M1 Max 焊接在一块板上并完成设计,但使用 HyperFusion 比安装双 M1 Max 有更多的性能优势。
UltraFusion 是连接两个 M1 Max 的桥梁
由于 M1 Ultra 本质上是两个 M1 Max 拼接在一起,因此它具有 M1 Max 的两倍内容:20 个计算核心(16 个性能和 4 个效率),2 个神经引擎,总共 32 个神经核心,高达 64 个核心图形核心和 4 个媒体引擎,可让在 Final Cut Pro 中流式传输 16、16个8K ProRes 422 视频流。布局的独特之处在于图形核心如何彼此相邻布局,因此有关图形处理的数据被捆绑在一起,而不是需要从芯片的一端传输到另一端。
另一个壮举是大约 800MB/s 的内存带宽。基于每个 8 位通道 6.4 GB/s,M1 Ultra 应该有大约 16 个通道才能达到神奇的 800 GB/s 带宽。英特尔高端芯片(如 i9-12900K)只有双通道,内存带宽为 76.8GB/s,而更高端的 Xeon W-3375 在 DDR4 上有 8 个内存通道,应转换为大约 200GB/s 的内存带宽。M1 Ultra 拥有大约 128GB 的可用 RAM,每秒可以访问整个内存库 6 次。
Apple 描述的 M1 Ultra 功能
M1 的壮举并不止于内存,还有 I/O 带宽的问题,毕竟我们需要从外部通过联动来获取和呈现数据。在 M1 Ultra Mac Studio 中,有 6 个 Thunderbolt 4 端口,每个端口都有自己的控制器。这意味着 Mac Studio 中的每个 Thunderbolt 4 端口都具有专用于每个端口的完整 40GB/s 带宽。因此,仅对于 ThunderBolt 端口,总共有 240 GB/s 的带宽。还有 10Gb 以太网、HDMI 2.0 端口和传统的 USB-A 端口,它们应该提供大约 USB 3.1 Gen 2 速度。这就是 Mac Studio 可以支持 4 台 6K 显示器(如 Pro Display XDR)加上一台 4K 电视的原因。尽管处理大量带宽和处理能力,M1 Ultra 是一款很强大的 SOC。但根据 Apple 的介绍,CPU 消耗大约 60 瓦,而 GPU 消耗大约 100 到 120 瓦。
截至 2022 年 3 月的 M1 系列 SOC
表现
这里将 M1 Ultra 与 Intel i9-12900K 进行了比较。
Geekbench测试显示 M1 Ultra 在多核性能方面的表现落后于英特尔 i9-12900K,但在 CineBench 中却是另一回事。
在 CPU 方面,英特尔 i9-12900K 在单核任务中表现更好,而 M1 Ultra 由于拥有比英特尔更多的内核,在多线程任务中表现出色。英特尔在其第 12 代酷睿处理器方面取得了很大进步,并成功击败了 M1 Max 芯片,但苹果凭借其 M1 Ultra 处理器再次拿下比赛,该处理器在多核任务上击败了英特尔的处理器。
根据 Apple 的说法,在给定的功耗下(300),M1 Ultra 比 Nvidia RTX 3090 更高效、更强大,但没有说 RTX 3090 要消耗 400-600 瓦以才获得所需的性能,算是苹果玩了一个文字游戏。总而言之,如果工作适合Apple 生态系统,那么 M1 Ultra 是 Apple 迄今为止最强大的芯片。
M1 Ultra 拥有迄今为止最强大的集成 GPU, 但PC 制造商更喜欢依赖 Nvidia 的离散解决方案。