Xilinx XC2064 問世四十周年後商用 FPGA 應用更廣泛並加速 AI 應用
第一顆商用 FPGA XC2064 推出至今四十年,此創新的可重複程式化硬體設計改變半導體產業,其靈活的開發讓其應用十分廣泛,現今 AI 熱潮之下亦有其發揮的領域。
在積體電路(IC)發明之後,半導體產品突飛猛進,然而想要開發特定功能的產品時,從設計到生產必須花費許多心力與成本。當功能改變時,就得重新設計與生產,而且需求量不夠高時,生產成本將會很高。FPGA(Field Programmable Gate Array,可程式邏輯閘陣列)的推出,其可程化的設計讓開發者更容易開發出所需的功能,也改變半導體產業。
今年剛好是首款商用 FPGA 問世 40周年,其可重複程式化硬體的概念如同軟體般靈活,應用非常廣泛。可重複程式化的特性讓開發工程師在設計晶片過程中,若遇到規格或需求更動,甚至在製造完成後要變更設計,都可重新設定晶片功能來完成目的。如此獨特的靈活性提升晶片設計的開發速度,縮短產品上市時程,可做為 ASIC(Application Specific Integrated Circuit) 先期開發應用,甚至成為替代方案。
FPGA 推出後對市場影響深遠,並形成價值超過 100億美元的產業。過去四十年間,AMD/Xilinx 已向全球超過7,000 家不同產業的戶交付超過30億顆 FPGA 與自行調適 SoC(結合FPGA架構、系統單晶片與其他處理引擎)。
FPGA 是由 Xilinx (賽靈思, AMD 2022完成收購)共同創辦人 Ross Freeman (1948-1989) 所發明,在固定功能的 ASIC 之外,FPGA 成為更好、更具成本效益的晶片設計方式。FPGA 提供工程師隨時修改晶片設計的自由與靈活性,甚至能在一天之內完成一款客製晶片的開發與設計。FPGA 同時也推動「無晶圓廠」(fabless)商業模式而改變整個半導體產業,藉由消除對客製光罩製作與相關非經常性工程成本的依賴,讓企業無需擁有晶圓廠,只需具備設計能力搭配 FPGA 即可打造創新硬體。
當年 Xilinx 推出全球首款商用 FPGA XC2064,其內部共有85,000 個電晶體、64個可配置邏輯區塊與 58個 I/O區塊。而今日先進的 AMD FPGA(如 Versal Premium VP1902)則具有高達 1,380億個電晶體、1,850萬個邏輯單元、2,654個 I/O 區塊、高達 6,864個 DSP58 引擎以及大量應用於記憶體、安全與介面技術的硬體 IP,相比之下可見進步幅度之大。
自 XC2064 問世至今已四十年,如今 FPGA、自行調適 SoC 和系統模組(SOM)等自行調適運算裝置,已遍佈各種領域,從汽車、火車車廂、交通號誌,到機器人、無人機、太空船與衛星,再到無線網路、醫療與測試設備、智慧工廠、資料中心,甚至高頻交易系統等。
1985年:首款商用 FPGA XC2064 問世 。
1990年代:XC4000 與 Virtex FPGA 首次將嵌入式記憶體與 DSP 整合於無線通訊基礎設施。
1999年:Spartan 系列成為大容量應用提供高成本效益的傳統ASIC替代方案。
2001年:首款整合 SerDes 的 FPGA。
2011年:Virtex-7 2000T 成為業界首款採用 CoWoS 封裝量產,開創先進的 2.5D 整合技術之採用,現已成為高效能運算(HPC)與AI GPU的核心。
2012年:Zynq 系列為首款將 Arm CPU 與可程式化邏輯結合的自行調適 SoC。
2012年:Vivado 設計套件讓軟體開發者也能設計 FPGA。
2019年:首款 Versal 自行調適 SoC 問世,引進專屬的 AI 引擎與可程式化晶片上網路(NoC)。
2019年:Vitis 統一軟體平台提供預先最佳化的 AI 工具與抽象層,加速 AI 推論。
2024年:第二代 Versal AI Edge 系列將可程式化邏輯、CPU、DSP 與 AI 引擎整合於單一晶片,首次實現端對端AI加速,為新一代需要異質、高效率、低延遲的應用提供支援。
2024年:強化成本最佳化型 FPGA 與自行調適 SoC 的 Spartan UltraScale+ FPGA 系列,為邊緣 I/O 密集型應用提供高效率且經濟的解決方案。
Vivado 與 Vitis 軟體推出有助於擴大市場,其中 Vivado 提供高階合成、機器學習最佳化與無縫 IP 核心整合功能,幫助開發人員簡化工作流程、縮短開發周期並提升效能。
Vitis 開發環境則提供預先最佳化工具與抽象層以加速 AI 推論,最新版本(2024.2)引進多項新功能,例如針對嵌入式 C/C++ 設計的獨立工具以及簡化 AMD Versal 自行調適 SoC AI引擎部署的改良功能。AMD將持續投入於這些工具,提升使用者的工作效率,同時支援新興與多樣化的資料類型與 AI 模型。
目前大部分 AI 工作負載都在資料中心的 GPU,然而有越來越多的 AI 需要在邊緣處理,FPGA 技術正可滿足這波 AI 融合應用快速發展的需求。FPGA 與自行調適 SoC 能即時處理感測器資料,實現低延遲的加速邊緣 AI 推論。隨著小型生成式 AI 模型的問世,讓 AI 模型能在如AI PC、車輛、工廠機器人、太空任務或任何嵌入式系統等邊緣裝置上執行。
AMD 預期 FPGA 的自行調適運算技術,將持續在自動駕駛、機器人與工業自動化、6G 通訊、氣候變遷、藥物研發、科學研究與太空探索等領域推動邊緣 AI 應用的突破。在FPGA 問世四十周年之際,AMD 將持續運用 FPGA 推動創新晶片設計、支援硬體輔助驗證並加快產品上市腳步。
(本文所有圖片由 AMD 提供)