我爱编程

GTC 2018

2018-03-28  本文已影响0人  小石头爸爸

GTC 2018 没有新的消费级显卡发布,这个是一个令人失望的地方。对于有钱人来说,到不是问题。在硬件方面,Nvidia 基于V100的架构上,发布了内存加倍的Quadro GV100显卡,新的Telsa V100. DGX-2 世界上计算能力最强的显卡(2P flops, 512 GB HDM2, 399K$).

GTC 2018 GTC 2018

其他可圈可点的主要在软件上。

在医疗方面 Clara - Medical Imaging Supercomputer.

琢磨来琢磨去觉得是Nvidia 在DGX workstation 上的software stack, 为了给传统的医疗影像行业注入新的生命力。老黄用了一个超声设备为例子:

如果从software stack 来看的话,GPU server 提供硬件计算能力,GPU containers/VGPU 可以让GPU server 在云端scale up, 如果数据的传输不再是瓶颈的话。Cuda 提供通用的高性能计算能力,可以用于传统的医学影像算法。cudnn和tensorrt一起提供AI的推理能力(比如用于semantic segmentation 和建模)。 OpenGL 和RTX 用于3D rendering。 让超声这个传统的成像模式老树发新芽。最后这些能力体现在AutoEF 等等自动测量,和通过3D 帮助医生更好更快的做判断。老黄是想给医院已经大量部署的仪器加点AI的调料,为医生的日常工作提供价值(更快更好的诊断)。

感觉这种把数据采集和数据的处理分开的做法在商业上也可能是一个可行的模式:

11Untitled.jpg 16Untitled.jpg 10Untitled.jpg 17Untitled.jpg

TensorRT 4.0

TensorRT3.0 说是支持 tensorflow, caffe 模型,其实仔细调研发现功能上还是有不少不完备的。希望TensorRT4.0能够搞定这些问题。目前TensorRT4.0还不能下载,介绍如下:

TensorRT 4 now provides capabilities to accelerate speech recognition, neural machine translation and recommender systems. The native ONNX parser in TensorRT 4 provides an easy path to import models from frameworks such as PyTorch, Caffe2, MxNet, CNTK and Chainer.

Highlights include:

觉得特别有用的就是对ONNX的支持。也就是你可以随便用自己喜欢的语言做模型的训练,然后用TensorRT做模型的部署。

上一篇下一篇

猜你喜欢

热点阅读