详细一点可以这样认为,并行计算一般有2种类型:基于任务的并行处理和基于数据的并行处理。前者主要指的是把算力任务拆分成若干个小的但不同的任务,然后再根据算力芯片内的不同核心做不同的计算分,从而形成一条算力流水线。后者主要指的是将数据分解为多个部分,让多个运算单元分别去计算这些小块的数据,形成一个计算网格,最后再把这些网格完成的任务汇总起来。
或者我们也可以这么认为:AI领域的大数据流运算本来就是一个模糊概率问题,并没有多少很精准的计算需求,也就不要那么多的算力“牛人”(CPU),需要的是很多能够干一般活的“工人”(通用GPU)。
2012年发生的一件事,让人工智能领域研究者认识到了,GPU在算力支持领域的发掘潜力。
3年后,NVIDIA提出了基于自家GPU的CUDA深度学习生态系统的算力GPU,将GPU的性能直接提升了65倍。
此外,为了建立自己的通用GPU生态,NVIDIA还开放了基于自己GPU的从后端模型训练到前端推理应用的全套深度学习解决方案,让全球范围的内一般开发人员都可以非常容易地使用GPU进行深度学习开发或高性能运算,最后奠定了自己在GPU算力领域的老大地位。
作为目前AI服务器最主流的算力选择,2021年通用GPU服务器销售额占据我国AI加速服务器市场的88.4%,其中80%以上的国内市场被NVIDIA占据。
如果要做高端的产品,去年美国在这块也开始卡我们,直接加大了国内大厂想要在这个领域发力的门槛。比如重要的芯片IP(一般也被成为IP核,指的是芯片中具有独立功能的电路模块的成熟设计)供应商都是美国公司。
THE END