鲲鹏处理器概述
华为鲲鹏处理器基于ARM架构,是华为在2019年1月向业界发布的高性能数据中心处理器,它包括五个方面:通用计算、存储、传输、管理和AI计算。
首先华为鲲鹏处理器是一种基于ARM架构的处理器,以下是X86和ARM处理器区别
X86 | |
---|---|
指令集 | CISC |
供应商 | 主要有Intel和AMD,Intel处于垄断阶段 |
产业链 | 成熟 |
ARM | |
---|---|
指令集 | RISC |
供应商 | 开放的授权策略,众多供应商 |
产业链 | 成熟快速发展中 |
指令的作用,就像我们人和我们的计算机和我们的CPU沟通的一种语言。我们的CISC架构就像我们的古文,它追求把一件事情完整地传递给我们的芯片。而我们的RISC架构就像我们的白话文直接明了描述这件事情
华为鲲鹏处理器基于ARM架构。ARM是一种CPU架构,有别于Intel、AMD CPU采用的CISC复杂指令集,ARM CPU采用RISC精简指令集(reduced instruction set computer,精简指令集计算机)。
ARM架构处理器应用领域
- 目前超过90%的移动终端采用的是ARM架构的处理器
- 随着IOT、Al和业务云化的发展,ARM在终端的优势地位将会带动其进入数据中心市场,成为下一个快速增长的市场领域。
华为鲲鹏处理器架构(ARM)特点
目的在于满足数据中心的多样性计算和绿色计算需求,具有高性能,高带宽,高集成度,高效能四大特点
- 采用ARM架构,同样功能性能占用的芯片面积小、功耗低、集成度更高,更多的硬件CPU核具备更好的并发性能。也就是说我们的ARM芯片可以在单位面积上拥有更多的核心,就是一个天生的多核的特点==
- 支持64位指令集,能很好的兼容从IOT、终端到云端的各类应用场景。
- 大量使用寄存器,大多数数据操作都在寄存器中完成,指令执行速度也更快。我们的逻辑运算器CPU里面的逻辑运算器取数据的时候,从我们的寄存器里取数据和我们的存储器内存中取数据速度是一个天差地别的。在我们的ARM架构中会更多更频繁地使用我们的寄存器,标签寄存器数量也会更多,所以我们的指令执行的速度也就会更快
- 采用RISC指令集,指令长度固定,寻址方式灵活简单,执行效率高。
不足:在数据中心领域属于新进入者,其生态仍处于快速发展阶段。包括苹果也是投向了ARM
内核全自研,性能提升
鲲鹏处理器的性能跑分中比我们英特尔的金牌处理器平均都要高上一些的。它的集成度在于我一颗鲲鹏处理器等于4颗芯片,即网卡、SAS(硬盘控制器)、南桥、CPU
支持8通道DDR4内存控制器
总带宽等于通道数量乘以每通道速率。通道越多,鲲鹏920的总的带宽也就上去了
- 8通道DDR4带来4696带宽提升,同时容量也可按需提升
- 延迟优化,和业界主流水平相当/更优
我们的泰山200系列服务器采用我们的鲲鹏920处理器,最多支持8通道4TB的我们的内存容量
网络端口& IO协议
Kunpeng 920集成了PCle4.0/CCIX,以及集成了100GE RoCEv2(延迟和同等带宽IB相当),为客户的网络/存储/加速卡等外围接口带来更高的效率。
制程工艺领先
Kunpeng 920处理器,采用业界领先的7nm工艺,是首款采用7nm工艺制作的数据中心ARM CPU。
采用业界领先的CoWoS封装技术,实现多Die合封,控制每Die面积提升良率,降低整体成本,乐高方式更加灵活。
系列芯片
低功耗级鲲鹏916处理器:采用16nm工艺,支持24个内核,主频2.4GHz,功耗低至75w。
极致效能级鲲鹏920-3226和鲲鹏920-4826处理器:采用7nm工艺,支持32和48个内核,主频2.6GHz,单位功耗的计算性能表现优秀。
极致性能级鲲鹏920-6426处理器:采用7nm工艺,支持64个内核,主频2.6GHz。