GPU虽然训练和推理性能较好,但从技术上讲也有一定的局限性。首先,应用过程中无法充分发挥并行计算优势。GPU在推理时一次性只能对一个输入项进行处理,并行计算的优势不能发挥出来。其次,运行能效比不佳。相对而言,运行深度学习算法实现同样的性能,GPU所需功耗远大于FPGA,通常情况下,GPU只能达到FPGA能效比的一半或更低。第三,硬件结构固定不具备可编程性。目前来看,深度学习算法还未成熟,算法还在迭代衍化过程中,若深度学习算法发生大的变化,GPU无法像FPGA一样可以灵活的配置硬件结构,快速切入市场。主要测试内容包括:OpenCL并行计算库支持; 对于操作系统Android NN的支持, 对于AI框架Tensorflow/Caffe的支持
FPGA适配测试_测试OpenCL对FPGA设备适配情况_20220302.xlsx
FPGA适配测试_测试TensorFlow对FPGA设备适配情况_20220302.xlsx