国产欧美精品一区二区,中文字幕专区在线亚洲,国产精品美女网站在线观看,艾秋果冻传媒2021精品,在线免费一区二区,久久久久久青草大香综合精品,日韩美aaa特级毛片,欧美成人精品午夜免费影视

基于FPGA的量化推理CNN加速系統研究與設計
DOI:
CSTR:
作者:
作者單位:

廣東工業(yè)大學(xué)物理與光電工程學(xué)院

作者簡(jiǎn)介:

通訊作者:

中圖分類(lèi)號:

基金項目:

廣東省科技計劃項目 (2017A020208063); 廣州市科技計劃項目 (201804010384)


Research and design of CNN acceleration system for quantitative reasoning based on FPGA
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 圖/表
  • |
  • 訪(fǎng)問(wèn)統計
  • |
  • 參考文獻
  • |
  • 相似文獻
  • |
  • 引證文獻
  • |
  • 資源附件
  • |
  • 文章評論
    摘要:

    基于FPGA的量化推理設計了CNN加速系統。通過(guò)對主流的深度神經(jīng)網(wǎng)絡(luò )結構的運算特性分析,使用(Density-Based Spatial Clustering of Applications with Noise) DBSCAN聚類(lèi)算法截取閾值的INT8量化推理方法,融合深度神經(jīng)網(wǎng)絡(luò )全連接,減少數據運算位寬和壓縮網(wǎng)絡(luò )大小,在準確率損失很小的情況下有效壓縮了網(wǎng)絡(luò )結構。基于LeNet-5、VGG-16與ResNet-50的CNN網(wǎng)絡(luò )結構,設計出量化CNN加速系統并進(jìn)行校驗。實(shí)驗結果表明,網(wǎng)絡(luò )參數和輸入特征數據量化精度為8-bits時(shí),網(wǎng)絡(luò )壓縮率在25%的情況下,網(wǎng)絡(luò )準確率的損失低于1%。在Xilinx XC7K325 平臺上量化推理CNN加速系統的運行頻率為450 MHz,與其他相似類(lèi)型的加速器比較,其GOPS性能提升2倍。

    Abstract:

    Based on the quantitative reasoning of FPGA, the CNN acceleration system is designed. Through the analysis of the operation characteristics of the mainstream deep neural network structure, the int8 quantitative reasoning method of intercepting the threshold using the (density based spatial clustering of applications with noise) DBSCAN clustering algorithm is used to integrate the full connection of the deep neural network, reduce the data operation bit width and compress the network size, and effectively compress the network structure with little loss of accuracy. Based on the CNN network structure of lenet-5, vgg-16 and resnet-50, a quantitative CNN acceleration system is designed and verified. The experimental results show that when the quantization accuracy of network parameters and input characteristic data is 8-bits, the loss of network accuracy is less than 1% when the network compression rate is 25%. On Xilinx xc7k325 platform, the running frequency of CNN acceleration system is 450 MHz. Compared with other similar accelerators, its GOPs performance is improved by 2 times.

    參考文獻
    相似文獻
    引證文獻
引用本文

何家俊,蘇成悅,羅榮芳,施振華,陳堆鈺,羅俊豐.基于FPGA的量化推理CNN加速系統研究與設計計算機測量與控制[J].,2022,30(9):162-169.

復制
分享
文章指標
  • 點(diǎn)擊次數:
  • 下載次數:
  • HTML閱讀次數:
  • 引用次數:
歷史
  • 收稿日期:2022-03-16
  • 最后修改日期:2022-06-23
  • 錄用日期:2022-04-13
  • 在線(xiàn)發(fā)布日期: 2022-09-16
  • 出版日期:
文章二維碼
吴旗县| 黄浦区| 通州区| 曲阳县| 出国| 静乐县| 张家川| 龙山县| 鄂尔多斯市| 泸水县| 怀宁县| 东乌| 白山市| 汽车| 夏邑县| 茂名市| 东乌珠穆沁旗| 定西市| 宜都市| 安图县| 和政县| 扎兰屯市| 嘉定区| 呼玛县| 湘西| 莱芜市| 安达市| 略阳县| 确山县| 崇文区| 武穴市| 桐庐县| 汉川市| 溧水县| 常德市| 泊头市| 饶河县| 松原市| 宜黄县| 曲沃县| 突泉县|