存储带宽如此重要的原因是Roof-line模型,Roof-lineModel解决的,是“计算量为A且访存量为B的模型在算力为C且带宽为D的计算平台所能达到的理论性能上限E是多少”这个问题。
算力决定“屋顶”的高度(绿色线段),带宽决定“房檐”的斜率(红色线段)
模型计算的理论性能自然不可能超过其硬件的最大理论性能,如果有一个异常消耗算力的模型,其需要的算力超过了计算平台的理论性能,那么计算平台的利用率是100%,也就是红色线段部分,这时的风险就是处理图像的帧率或者说FPS会达不到目标帧率,对智能驾驶来说,主流帧率是30FPS,低速智能驾驶可以再降低一点,高速需要再升高一点。由于需要的算力太高,计算平台满负荷运转也无法适应,帧率会下降,此时高速行驶的话就会有风险,一般来说,厂家不会推荐算力需求远超理论性能上限的模型。
在低于100%利用率的绿色线段部分,模型理论性能P的大小完全由计算平台的带宽上限(房檐的斜率)以及模型自身的计算强度I(Intensity)所决定,因此这时候就称模型处于Memory-Bound状态。可见,在模型处于带宽瓶颈区间的前提下,计算平台的带宽即房檐越陡,或者说模型的计算强度I越大,模型的理论性能P可呈线性增长。斜率越低,意味着即使计算强度快速增加,计算平台算力的增加还是很缓慢,计算平台的利用率很低,比如计算平台的理论算力是100TOPS,斜率很低,很高计算强度的模型利用率也可能不到50%,换句话说,存储带宽决定了计算平台的性能利用率,因此存储带宽重要性丝毫不亚于算力,甚至高于算力。这也是为何特斯拉二代FSD排名第二的主要原因,GDDR6的带宽相对LPDDR有压倒性优势。
特斯拉第二代FSD
安霸的CV3熟悉的人可能不多,其存储带宽支持最高的LPDDR5X,且是最高的256比特,采用三星的5纳米工艺制造,目前得到了德国大陆汽车公司的支持。
安霸CV3-AD内部框架图
免责说明:本文观点和数据仅供参考,和实际情况可能存在偏差。本文不构成投资建议,文中所有观点、数据仅代表笔者立场,不具有任何指导、投资和决策意见。
ECAD模型
佐思汽车研究:致力于汽车、TMT、新能源(特别是新能源汽车、智能汽车、车联网)领域的产业研究、专项调研、战略规划和投资咨询服务。