近期,AMD在ROCm開源軟件堆棧方面邁出了新的一步,發布了備受期待的6.4.0版本。這一消息源自外媒Phoronix的報道,發布時間為當地時間4月11日。
此次更新的一大亮點在于,ROCm 6.4.0正式將Radeon PRO W7800 48GB顯卡納入支持范圍。然而,值得注意的是,盡管呼聲很高,新版本尚未全面支持“RDNA 4”架構的獨立顯卡以及“Strix Halo”處理器的大規模核顯,這對于部分高端用戶來說或許稍顯遺憾。
除了顯卡支持方面的更新,ROCm 6.4.0還帶來了一系列技術改進。其中,Megatron-LM框架在ROCm版本中新增了多項融合功能,包括融合注意力機制、融合層范數以及融合旋轉式位置編碼RoPE內核支持,這無疑將進一步提升人工智能模型的訓練效率。
在兼容性方面,ROCm 6.4.0也展現出了強大的實力,同時支持PyTorch的2.6和2.5版本,為用戶提供了更多的選擇空間。新版本中的rocDecode和rocPyDecode還新增了對VP9編解碼的支持,進一步豐富了ROCm的應用場景。
對于使用Instinct加速器的用戶來說,ROCm 6.4.0同樣帶來了好消息,它新增了對Oracle Linux 9操作系統的支持,使得用戶能夠在更多的平臺上享受到ROCm帶來的性能提升。
想要了解更多關于ROCm 6.4.0的信息,用戶可以前往AMD官網的相關頁面進行查閱。AMD在官方文檔中詳細列出了新版本的各項功能和改進,以及已知的問題和解決方案,為用戶提供了全面的參考。
AMD還預告將在即將舉行的Advancing AI 2025活動中分享AMD ROCm開放軟件生態系統的最新進展。這無疑將吸引更多關注ROCm的用戶和開發者的目光,共同期待ROCm在未來能夠帶來更加出色的表現。