当前的尖端科技如人工智能(AI)和机器学习(machine learning)需要处理能力强大、速度相当快的芯片,除了绘图处理器(GPU)之外,现场可编程闸阵列(FPGA)也相当符合要求,但需要复杂的专业技术辅助,英特尔(Intel)计划让FPGA变得更简便,让它们加速打入数据中心服务器应用。
FPGA可以随着不同的任务被重新改配置,长久以来被电信设备、工业系统、汽车、军事和航太产业所使用。但新式FPGA有大型的闸阵列、存储器区块,以及快速的I/O,适合更广泛的应用。
微软(Microsoft)服务器已经使用Altera的FPGA来支援Bing搜寻、Cortana语音辨识和自然语言翻译等许多服务背后的神经网路,Azure也将采用FPGA来进行推论。此外,百度正为自己的数据中心开发FPGA,亚马逊(Amazon)的AWS则使用赛灵思(Xilinx)Virtex UltraScale+ FPGA。
FPGA优点之一是相当灵活,但这也是最大的挑战,需要动用大量的硬件和软件工程资源。英特尔则致力于简化FPGA,以便作为数据中心的服务器加速器之用,英特尔近日为采用Xeon处理器的服务器发布Programmable Acceleration Card(PAC)标准,以及让它们可以简单写程式的软件。此外,英特尔同时也与合作伙伴为各种应用打造各式各样的功能,包括加密、压缩和资料库加速等。
PAC是标准PCI Express Gen3扩充卡,可以插入任何服务器内。第一张卡结合Arria 10 GX,是由台积电20纳米制程制造的中阶FPGA,有8GB DDR4存储器和128MB快闪存储器,目前仍在制作样本阶段,预定2018年上半出货。英特尔表示未来也将提供采用高阶Stratix 10的PAC,由自家厂房14纳米制造,但并未透露此版本何时开始供应。
除了PAC之外,英特尔也提供一款多芯片封装(MCP),内含Skylake Xeon Scalable处理器和一个FPGA,此为英特尔收购Altera之后一直酝酿推出的产品,预定2018年下半正式推出。
基本上这与Altera和赛灵思采用安谋(ARM)CPU的SoC没什么太大的差异,但x86处理器应该会有较高的性能,英特尔可能利用专利互连技术和现正开发的2.5D封装技术。
虽然推出硬件和软件标准不保证能达成加速数据中心处理的任务,但至少可让FPGA有机会接触到更多的使用者,2018年前,FPGA加速堆叠将会出现在英特尔、赛灵思、Xeon Scalable处理器、PCIe卡等独立芯片,或许会支援微软Azure或AWS,或者被戴尔EMC(Dell EMC)服务器所采用。
然而,真正的决胜负的关键似乎是架构和快速演进的演算软件,NVIDIA曾表示,过去10年来投注数10亿美元开发CUDA平台,英特尔FPGA必须达到相同的密度,才能从跨越少数大型云端业者,抵达更广泛的数据中心市场。