国产欧美精品一区二区,中文字幕专区在线亚洲,国产精品美女网站在线观看,艾秋果冻传媒2021精品,在线免费一区二区,久久久久久青草大香综合精品,日韩美aaa特级毛片,欧美成人精品午夜免费影视

神經(jīng)網(wǎng)絡(luò )訓練處理器的浮點(diǎn)運算優(yōu)化架構
DOI:
CSTR:
作者:
作者單位:

中國綠發(fā)投資集團有限公司

作者簡(jiǎn)介:

通訊作者:

中圖分類(lèi)號:

TP183;TN791

基金項目:

中國綠發(fā)投資集團有限公司科技項目(項目編號:CGDG529000220008;項目名稱(chēng):多產(chǎn)業(yè)融合下的數據治理體系研究)


Floating Point Optimization Architecture of Neural Network Training Processor
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 圖/表
  • |
  • 訪(fǎng)問(wèn)統計
  • |
  • 參考文獻
  • |
  • 相似文獻
  • |
  • 引證文獻
  • |
  • 資源附件
  • |
  • 文章評論
    摘要:

    針對神經(jīng)網(wǎng)絡(luò )訓練加速器中存在權重梯度計算效率低的問(wèn)題,設計了一種高性能卷積神經(jīng)網(wǎng)絡(luò )(CNN)訓練處理器的浮點(diǎn)運算優(yōu)化架構。在分析CNN訓練架構基本原理的基礎上, 提出了包括32bit、24bit、16bit和混合精度的訓練優(yōu)化架構,從而找到適用于低能耗且更小尺寸邊緣設備的最佳浮點(diǎn)格式。通過(guò)現場(chǎng)可編程門(mén)陣列(FPGA)驗證了加速器引擎可用于MNIST手寫(xiě)數字數據集的推理和訓練,利用24bit自定義浮點(diǎn)格式與16bit腦浮點(diǎn)格式相結合構成混合卷積24bit浮點(diǎn)格式的準確率可達到93%以上。運用臺積電55nm芯片實(shí)現優(yōu)化混合精度加速器,訓練每幅圖像的能耗為8.51μJ。

    Abstract:

    Aiming at the low efficiency of weight gradient calculation in neural network training accelerator, this paper designs a floating-point operation optimization architecture of high-performance convolutional neural network (CNN) training processor. Based on the analysis of the basic principle of CNN training architecture, a training optimization architecture including 32bit, 24bit, 16bit and mixed accuracy is proposed, so as to find the best floating-point format for edge devices with low energy consumption and smaller size. The field programmable gate array (FPGA) verifies that the accelerator engine can be used for the reasoning and training of MNIST handwritten digital data sets. The accuracy of the hybrid convolution 24bit floating-point format formed by the combination of 24bit custom floating-point format and 16bit brain floating-point format can reach more than 93%. TSMC 55nm chip is used to realize the optimized hybrid accuracy accelerator, and the energy consumption of each image is 8.51μJ.

    參考文獻
    相似文獻
    引證文獻
引用本文

張立博,李昌偉,齊偉,王剛,戚魯鳳.神經(jīng)網(wǎng)絡(luò )訓練處理器的浮點(diǎn)運算優(yōu)化架構計算機測量與控制[J].,2023,31(6):176-182.

復制
分享
文章指標
  • 點(diǎn)擊次數:
  • 下載次數:
  • HTML閱讀次數:
  • 引用次數:
歷史
  • 收稿日期:2022-10-17
  • 最后修改日期:2022-11-06
  • 錄用日期:2022-11-07
  • 在線(xiàn)發(fā)布日期: 2023-06-15
  • 出版日期:
文章二維碼
东乡族自治县| 德惠市| 雅安市| 玉门市| 板桥市| 饶河县| 黄冈市| 山西省| 吉安市| 昌乐县| 大姚县| 探索| 沅陵县| 滨州市| 宁安市| 平舆县| 石河子市| 娄底市| 平泉县| 巴青县| 那曲县| 仲巴县| 元江| 治多县| 华亭县| 凤城市| 长武县| 阳江市| 张家港市| 晋中市| 普安县| 河北区| 尉氏县| 祥云县| 阿拉善盟| 开远市| 金华市| 鄂尔多斯市| 盐源县| 民和| 萍乡市|