摘要:在數字芯片設計后端流程中,宏和標準單元的布局是一項耗時(shí)的工作,通過(guò)機器學(xué)習快速有效地提供解決方案能夠加快芯片開(kāi)發(fā)的周期,降低人工布局帶來(lái)的風(fēng)險;然而布局問(wèn)題是一個(gè)多目標優(yōu)化問(wèn)題,目前大多數方法都注重在滿(mǎn)足各項指標下最大化減小線(xiàn)長(cháng),已換取時(shí)鐘延遲的降低,忽略了其他指標仍然存在下降的空間,例如良好的擁塞指標有利于降低芯片散熱和功耗;針對上述問(wèn)題,設計一種新的帶有密集型獎勵函數的深度強化學(xué)習框架,將擁塞信息映射到圖像中,給出新的特征嵌入模型對版圖的全局信息進(jìn)行多尺度提取,并引入圖注意力網(wǎng)絡(luò )捕獲網(wǎng)表的連接關(guān)系,采用Advantage Actor Critic(A2C)算法更新策略函數,實(shí)現了數字版圖的自動(dòng)布局,并在公共的數字芯片網(wǎng)表基準上驗證了該方法的有效性。