使用cupy实现卷积、池化、双线性插值上采样,能够在gpu上推理yolov3、yolov4。(基于darknet格式的cfg和weights)卷积、池化均用imcol + gemm实现。推理速度和pytorch相当。
评论