「中小企業友好」 IBM 發表 Granite 4.0小語言模型 輕量 高效 低成本
IBM 日前發表其最新一代企業級「小語言模型」 Granite 4.0,以創新的混合式架構,結合 Mamba-2 與 Transformer 技術,實現前所未有的效能與效率。Granite 4.0 不僅大幅降低記憶體與硬體成本,更提供企業部署 AI 的安全性、可控性與彈性,為台灣各類型企業的 AI 應用落地提供強力支援。
Granite 4.0已在 IBM watsonx.ai 平台正式上線,並同步支援 Dell Technologies (Dell Pro AI Studio 與 Enterprise Hub)、Docker Hub、Hugging Face、Kaggle、LM Studio、NVIDIA NIM、Ollama、OPAQUE 及Replicate 等平台;未來也將支援 Amazon SageMaker JumpStart 與 Microsoft Azure AI Foundry。
混合式架構,創造效能與成本的完美平衡
Granite 4.0 採用創新的 Mamba/Transformer 混合架構,突破傳統 Transformer 模型處理長文本的效能瓶頸。Mamba 架構可線性擴展上下文長度,讓 Granite 4.0 在處理複雜任務時,大幅減少記憶體的使用量達 70%,推理速度卻加快 2 倍,同時支援更平價的 GPU包括家用硬體。這項突破對台灣中小企業與開發者意味著高效能 AI 不再是高成本的同義詞,而是人人可及的技術資源。
多元模型版本,滿足各種企業需求
Granite 4.0 提供多種模型規格,靈活應對不同場景:
- Granite-4.0-H-Small:總參數量32B的混合式專家模型,活躍參數9B,適合客服自動化、多工具代理任務;
- Granite-4.0-H-Tiny:總參數量7B的混合式專家模型,活躍參數1B,適合邊緣運算與地端部署;
- Granite-4.0-H-Micro:總參數量3B 的混合式模型,快速執行關鍵任務;
- Granite-4.0-Micro:傳統 Transformer 架構,適用於尚未支援混合架構的平台。
Granite 4.0 所有模型皆提供 Base 與 Instruct 版本;並預計於2025年底推出強化邏輯推理的Thinking 模型。
小模型,大效能
Granite 4.0模型雖然尺寸精簡,但在多項基準測試中的表現,超越同級與其他大型開源模型:
- 在 Stanford IFEval 指令遵循測試中,Granite-4.0-H-Small 表現優於所有開源模型(除 Llama 4 Maverick 外);
- 在 Berkeley Function Calling Leaderboard v3 中,Granite-4.0-H-Small 以更低成本達到與大型模型相同的工具調用準確率;
- 在 MTRAG 多輪檢索增強生成測試中亦有亮眼表現。
上述成果歸功於 IBM 全面升級了模型架構、訓練方法與資料品質,包含使用一個精心編製、聚焦於企業應用的 22 兆字元規模的語料庫。Granite 4.0 的預訓練資料涵蓋多元來源,包括 DataComp-LM (DCLM)、GneissWeb、TxT360 子集、Wikipedia 以及其他與企業場景高度相關的資料來源。為了增強模型處理企業任務的表現,這些模型經過後訓練(post-training),涵蓋語言理解、程式碼生成、數學推理、多語言處理、安全性、工具調用 (tool calling)、檢索增強生成(RAG)與資安等多個領域,並結合合成資料與開放資料集進行優化。
安全、可信、可控,是企業部署的首選
Granite 4.0 是全球第一個獲得 ISO/IEC 42001:2023 AI 管理系統認證的開源模型家族,展現 IBM 對 AI 安全與負責任治理的高度承諾:
- 所有模型皆經過加密簽章,確保來源與完整性;
- 訓練資料皆經過倫理審查與企業授權;
- 若在 watsonx.ai 平台使用 Granite 模型,IBM 提供無上限第三方 IP 賠償保障。
此外,IBM 與 HackerOne 共同宣布「找尋Granite漏洞」獎勵計畫,最高獎金達美金十萬元,鼓勵開發社群共同提升 AI 安全。
企業部署AI更簡單、更靈活
Granite 4.0 支援多種硬體與推理框架,讓台灣企業與開發者可快速整合至現有系統:
- 支援 AMD Instinct™ MI-300X GPU 與 Qualcomm Hexagon™ NPU,適用於行動與邊緣設備;
- 相容於 vLLM、llama.cpp、MLX、NexaML 等主流推理框架;
- 可透過 Unsloth 進行微調,並整合至 Continue 等開發者工具。
開發者可在 Granite Playground試用 Granite 4.0,並參考 Granite Docs 中的 RAG、摘要、自動化教學資源。
IBM 將繼續擴展 Granite 4.0 模型家族,將推出:
- 更小型的 Medium 與 Nano 模型,強化邊緣AI部署能力;
- 強化邏輯推理的 Thinking 模型,支援複雜決策與分析任務;
- 持續優化架構與平台支援,推動 AI 普及化與在地化。
IBM推出Granite 4.0,持續倡議與實現開放、安全、高效的企業級AI,協助全球企業在數位轉型旅程中穩健前行。Granite 4.0 模型已在 IBM watsonx.ai 平台開放使用,並採用 Apache 2.0 開源授權。更多資訊請參閱IBM Granite 4.0網頁。