AMD顯卡將支持BFloat16浮點 AI性能飛躍

GitHub開源社區最新公布的AMD ROCm開發庫顯示，AMD GPU將在未來加入對BFloat16(BF16)浮點指令的支持，相比現在的FP16浮點可帶來巨大的飛躍。

目前，Intel Cascade Lake至強、Ice Lake酷睿處理器已經支持BF16，ARM下一代ARMv8 CPU架構也會加入。BF16雖然不屬於IEEE標準規范，但它的優勢正得到越來越廣泛的驗證和認可。

BF16可以視為精簡版的FP32單精度浮點指令，使用8個有效位、8個階位，記憶體和帶寬占用減半，執行效率大大提升，同時又在性能方面遠勝FP16，可以大大提升AI人工智能、ML機器學習、DL深度學習等應用的性能、效率，不再受限於FP16的性能、FP32的效率。

根據模擬，BF16相比於FP16帶來的性能提升在不同運算類型中，少則可達1.6倍，多則能夠超過4倍。

現代3D遊戲渲染不太可能從BF16中獲益，但是隨着GPU越來越多地參與AI、ML、DL運算，BF16的加入必將會給AMD顯卡帶來強大的加成，未來值得期待。

作者：上方文Q
來源：快科技