主页 > 中国新闻信息 >

英伟达RAPIDS:打造更系统的开源平台

编辑:凯恩/2018-11-19 09:08

  在本月的10号,NVIDIA创始人黄仁勋在GTC大会上发布了面向Machine Learning(机器学习)、大数据处理市场的开源产品:NVIDIA RAPIDS。而针对国内媒体的一系列问题,NVIDIA在10月23日也为媒体举办了媒体讲解会,就RAPIDS工作流程和所带来的收益以及对未来的市场影响程度做了详尽的解答。NVIDIA亚太区解决方案架构高级总监赵立威为主讲。

  首先我们来看一下最典型的大数据处理过程,也就是图中灰色部分:首先是数据准备,包括数据特征的提取、数据的合并、数据降维等等;然后进行模型训练,通过人为的进行帮助,比方说人脸的特征是眼睛、鼻子、嘴等等,通过这些形象的分析来帮助机器了解学习;最后就是输出结果,进行信息可视化。

  那么RAPIDS的出现究竟加速了哪些东西呢?总的来说,RAPIDS是一个加速平台,用以加速机器学习过程。通过加速CUDF/CUML/CUGRAPH库,来让PYTHON语言变得更容易输出,使用。

  黄仁勋在GTC上曾经讲到,数据科学家是一个全世界每个人都想做的工作。为什么呢?因为他们有很多的时间喝咖啡,他们不是在喝咖啡,就是在去喝咖啡的路上。因为前边的很多准备工作、对于数据的准备工作,科学家要把这个数据集宕下来,可能动不动是多少G或者多少T的很大的一个数据包。下载下来以后,对它进行处理,ETL,我们所谓的数据抽取、数据转换和数据夹在的过程,然后就可以喝咖啡去了。图中左侧环形图中绿色部分,都是以前数据科学家喝咖啡的占比,因为每次把数据往上面一处理就可以走了,以前基于CPU整个数据的夹在过程、数据的计算过程是非常耗时的。

  而当我们运用GPU和RAPIDS平台时,对于公司的领导层面会非常开心,因为数据处理速度会大大加快,而且对于数据的精度也会有提高。

  而在会上,赵立威也公布了新的服务器:NVIDIA DGX-2。最多可以搭载16块计算卡,因为每一块卡差不多有900带宽/s,所以整个服务器的带宽为14.4TB/S的传输速率。另外其还支持NVLink、512GB显存等强大功能,可谓是新一代大数据处理服务利器。

  之后,NVIDIA针对媒体的问题也一一做了解答。首先就是DGX-2的最低硬件要求,其可以服务于Pascal、Volta架构的GPU服务器,推荐在四个NVLink连接的Telsa GPU服务器运行。而针对NVIDIA在此时选择进入大数据、机器学习领域时间点问题,他也回答道,在摩尔定律终结的时代和大数据爆炸的时代,市场和GPU的特性决定了NVIDIA要开始加速数据处理,由此RAPIDS应运而生。

  本文属于原创文章,如若转载,请注明来源:英伟达RAPIDS:打造更系统的开源平台

  在本月的10号,NVIDIA创始人黄仁勋在GTC大会上发布了面向Machine Learning(机器学习)、大数据处理市场的开源产品:NVIDIA RAPIDS。而针对国内媒体的一系列问题,NVIDIA在10月23日也为媒体举办了媒体讲解会,就RAPIDS工作流程和所带来的收益以及对未来的市场影响程...

  参与七彩虹B360 PLUS主板攒机单活动赢百元优惠卷 更有29份大奖等你拿!