28人参与 • 2025-08-01 • Windows
在常见的文字图片处理,以及游戏应用中,一般的8核心、16核心处理器就足以满足用户的需求。但在电脑用户中,还有一部分人对处理器的性能要求非常高,他们要么用电脑设计汽车、飞机与舰船等高度复杂的产品,也就是常说的工业设计,要么用电脑来进行建筑结构与工程计算,或是影视级视频的编辑、3d动画与特效制作,当然现在流行的ai计算,以及科学计算与软件设计等专业应用也是它能够胜任的任务,他们需要的电脑也就是我们常说的工作站。amd自2017年开始发布专为工作站打造的ryzen threadripper锐龙线程撕裂者处理器,到2023年年底,已推出六代产品,获得了大量专业用户的选择与好评。现在,基于amd最新zen 5架构的锐龙线程撕裂者9000系列处理器也终于来了。
锐龙线程撕裂者的主要特点就是核心数多,比如我们在2023年测试,基于zen 4架构的锐龙线程撕裂者7980x、锐龙线程撕裂者7970x处理器各采用64核/128线程、32核/64线程配置。本次我们测试的锐龙线程撕裂者9980x、锐龙线程撕裂者9970x也分别采用相同的核心数与线程数配置,那么在已经拥有如此多核心数量的设计下,仅仅是处理器架构的升级,是否能为处理器带来明显的性能提升?另外,与同样采用zen 5架构,但核心数量少得多的普通处理器相比,锐龙线程撕裂者9000系列在专业软件应用中是否真的有优势呢?会不会出现“几颗核心干活,其他核心围观”的名场面?接下来就让我们通过实战测试来体验锐龙线程撕裂者9980x、锐龙线程撕裂者9970x的强大威力。
▲工作站主要用在专业领域
长期以来,amd的锐龙线程撕裂者处理器在一些性能测试中都远远超过消费者使用的普通处理器。就像2023年底发布的锐龙线程撕裂者7980x的cpu-z多线程性能得分在52000分以上,这是现在最新消费级处理器也难以企及的成绩。原因就在于amd通过chiplet技术和处理器架构更新,极大地提高了单插槽处理器核心数量上限。除了针对企业级用户的epyc处理器外,借助强大的架构、技术优势,amd在2017年推出了首代基于zen架构的锐龙线程撕裂者处理器,其中的amd锐龙线程撕裂者1950x率先在个人电脑上实现16核心、32线程配置,一上市就凭借强大的规格和极高的性能得到了工作站和专业用户的青睐。
▲amd从2017年开始推出专为工作站打造的锐龙线程撕裂者处理器
随后amd又在2018年推出了采用zen+架构的第二代锐龙线程撕裂者处理器,仅仅时隔一年就在单颗处理器上实现了32核心、64线程的配置。接下来,随着生产工艺、zen处理器架构的不断进化,amd锐龙线程撕裂者处理器也得到了同步发展,2019年末基于zen 2架构的第三代锐龙线程撕裂者处理器发布,amd在锐龙线程撕裂者3990x上实现了64核心、128线程的配置。而2022年发布的第四代锐龙线程撕裂者5000wx系列,凭借强大的zen 3架构、优秀的扩展能力,专业的安全与管理技术,得到众多整机厂商的采用,成为各款工作站中的“心脏”。2023年末上市的第五代锐龙线程撕裂者7000系列则得益于对ddr5内存、pcie 5.0技术的支持,zen4架构的采用,使得其综合性能更上一层楼。
▲相对第一代旗舰产品:锐龙线程撕裂者1950x,锐龙线程撕裂者pro 7995wx的核心数量是它的6倍,内存带宽与pcie带宽则是它的4倍。
在zen架构问世的这8年时间里,只要每一代zen架构发布,除了推出像锐龙9 9950x这类面向普通用户的消费级处理器外,amd也势必将发布基于新一代zen架构的锐龙线程撕裂者处理器。这也令该系列产品的性能越来越强,其核心数量不仅随着生产工艺的进步增加,新架构的使用也有效提升了每颗核心的ipc性能,毕竟每代zen架构较上一代zen架构的提升幅度几乎都在10%以上,并带来了更强大的扩展能力,以及对各类新技术、新标准的支持。更值得一提的是,目前国内的工作站市场也在高速成长,根据idc数据预测,从2026年到2028年,国内市场每年的工作站市场容量增长幅度都在15%以上,直到2029年,增长势头才会有所放缓,凸显市场对高性能处理器与显卡的渴求。
▲根据idc预测,市场很快将迎来工作站的成长高峰期。
▲众多游戏与动画、特效等数字化内容制作公司都采用了锐龙线程撕裂者处理器,包括制作《黑神话:悟空》的游戏科学,为电影《终结者:黑暗命运》制作后期场景的blur studio。
所以在基于zen 5处理器架构的amd锐龙9000系列处理器发布约一年以后,amd也毫不意外地为用户带来了第六代锐龙线程撕裂者处理器:锐龙线程撕裂者pro 9000 wx以及锐龙线程撕裂者9000系列。其中前者面向专业工作站,核心数最多、扩展能力最强,完整支持安全功能、安全管理工具。锐龙线程撕裂者9000系列则面向hedt高性能桌面平台,即需要多线程性能的发烧友或对安全性要求不高的工作站。
▲锐龙线程撕裂者9000系列处理器将于2025年7月31日晚9点在各大平台上市
相对上一代产品,锐龙线程撕裂者pro 9000 wx以及锐龙线程撕裂者9000系列最大的更新就是采用zen 5架构。首先其制造工艺由锐龙线程撕裂者7000系列所用的tsmc 5nm finfet升级为了tsmc 4nm finfet,提高了能效比。zen 5架构核心内部改进的重点在于解码器改为2个4宽度的解码器,在同一时间可以实现8宽度的解码。从zen架构开始,amd使用单个4宽度解码器已经历经多代,包括zen 4架构都是使用的4宽度设计,在zen 5中终于彻底改进。相对应的分支预测能力也大幅度提升,包括更低的延迟、更高的准确性以及更大的吞吐能力等。zen 5的分支预测启用了更大的tage,每周期可以处理2个执行的分支。同时处理器支持smt同步多线程技术,每核心支持两个计算线程。指令缓存方面也由于解码器的调整,更快、更宽了。总的来说,zen 5现在拥有了一个更大的前端,随之而来的则是更多的优化和调整工作。
▲zen 5架构改进的重点在于解码器升级为2个4宽度的解码器
前端的变化带来了更多指令的涌入,因此zen 5的整数执行部分更大、更宽。zen 5的整数部分现在拥有8宽度的调度和退出系统,排序单元由之前zen 4的4个小单元变成2个大规模单元。整数执行部分包含3个alu br和3个alu mul乘法器与4个agu,前代zen 4则是2个alu、2个alu br单元以及3个agu,从规模上来看zen 5显然更大一些。浮点执行单元方面,amd则带来了一个强大的、支持avx-512的simd 512bit单元,队列深度为384,拥有6个2周期延迟的fadd单元,每周期支持6个浮点指令,且延迟从3个周期减少到2个周期,整体的fp指令执行能力也大幅度提升。浮点运算能力的进步将让处理器在ai和科学计算方面表现更好。虽然zen 4处理器也可以执行avx-512,但它是通过2个256bit的simd单元来合并实现的,zen 5则拥有完整的avx-512支持能力,而且zen 5内部的4条装载流水线可以保证每个时钟周期,实现两个avx-512指令的载入。
▲zen 5架构的主要改进之处——增加了执行单元的能力,提高了l1缓存的容量与带宽,并内置支持avx-512的simd 512bit单元。
缓存和数据处理方面,zen 5带来了新的48kb l1 12-way数据缓存,延迟为4周期,l1缓存总容量达到了每核心80kb,而zen 4架构处理器每颗核心的l1数据缓存容量只有32kb,且只采用8-way设计,l1缓存总容量只有64kb。同时zen 5架构下的l1缓存带宽翻倍,浮点单元带宽翻倍(对应浮点执行部分的调整),数据预取性能得到了加强。在二级缓存上,zen 5与zen 4架构的容量相同,依然是每颗处理器核心独享1mb缓存,但amd将指令缓存和数据缓存的关联性从8-way增加到了16-way,从而提高了命中率并减少了冲突失误。amd还将l2到l1的带宽从每个周期32个字节增加到64个字节,能更有效地提升执行单元的效率。不仅如此,即使高达320次未命中,其l3缓存仍然能保持低延迟,这对于高并发工作负载来说是一个显著的提升。和以前一样,l3是ccd中所有核心的共享缓存,每8颗核心共享32mb,允许应用程序利用其全部容量。
▲zen 5架构中的l2缓存采用16-way设计,l2到l1的带宽翻倍,l3缓存延迟降低。
由于zen 5架构在分支预测方面表现更好,所以利用smt技术可以提供更好的每区域性能和每瓦性能,并且大规模消除冗余指令,最大限度地减少不必要的内核流量,从而减少能耗的浪费。zen 5内核还实现了更智能的功率门控和更快的功率状态转换,这有助于帮助芯片在动态工作负载下保持高效,从而提升系统性能,降低功耗。结合以上几大改进,根据amd官方数据,在与上一代线程撕裂者产品的比较中,在相同核心数量、相同工作频率设置下,zen 5在10个工作站基准测试里平均提升了16%,在工作站ai推理和机器学习测试里的提升高达25%。
▲zen 5架构实现了更智能的功率门控和更快的功率状态转换,拥有更高的每瓦性能。
▲按amd官方数据,zen 5架构的锐龙线程撕裂者在相同核心数量、相同工作频率设置下较zen 4产品获得了大幅提升。
接下来,再看看新一代锐龙线程撕裂者的结构图,从图中可知,完整版本的处理器将具有12个ccd,每个ccd有8颗cpu核心,12个ccd总计96颗cpu核心。所有cpu核心和外界数据的沟通交换都通过中央的iod完成。其iod芯片则和之前的zen 4处理器中的那颗iod芯片一致,依旧是tsmc n6工艺打造,iod中布局了pcie 5.0控制器、ddr5内存控制器、第三代infinity fabric总线以及安全处理器等。12个ccd被平均分布在iod左右,每侧6个,同时单侧的6个ccd也是上下各三个分布。
▲完整版锐龙线程撕裂者pro 9995wx的芯片组成图示,可看到由左右总计12颗小芯片也就是ccd,围绕着中间那颗巨大的iod芯片。
您想发表意见!!点此发布评论
版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。
发表评论