NVIDIA BioNeMo 在 AWS 上實現用於藥物發現的生成式人工智慧
領先的製藥和科技生物公司的研究人員和開發人員現在可以透過 Amazon Web Services(AWS)輕鬆部署 NVIDIA Clara 軟體和服務,用於加速醫療保健。
這項計畫今日在AWS re:Invent上宣佈,它讓使用AWS 雲端資源的醫療保健和生命科學開發人員能夠靈活地整合NVIDIA 加速的產品,例如用於藥物發現的生成式人工智慧平台NVIDIA BioNeMo。這個平台將整合到AWS 上的NVIDIA DGX Cloud,並已可透過實現高效能運算的AWS ParallelCluster 叢集管理工具和機器學習服務的Amazon SageMaker使用。
全球有數千家醫療保健和生命科學公司使用 AWS。 他們現在將能夠存取 BioNeMo,利用專有資料建置或客製化數位生物基礎模型,並使用 AWS 上的 NVIDIA GPU 加速雲端伺服器擴大模型訓練和部署規模。
包括Alchemab Therapeutics、Basecamp Research、Character Biosciences、Evozyne、Etcembly和LabGenius在內的科技生物創新者已經是AWS的用戶,他們正在使用BioNeMo進行生成式人工智慧加速的藥物發現和開發。此次合作為他們提供了更多方法來快速擴展雲端運算資源,以開發基於生物分子資料訓練的生成人工智慧模型。
此次發布擴展了NVIDIA在AWS上現有的醫療保健用產品,像是用於醫學影像工作流程的NVIDIA MONAI和用於加速基因組學的NVIDIA Parabricks。
AWS新增加項目:NVIDIA BioNeMo推進用於藥物發現的生成式人工智慧
BioNeMo 是數位生物生成人工智慧的特定領域框架,包括預先訓練的大型語言模型、資料載入器和最佳化的訓練配方,可透過加速目標識別、蛋白質結構預測和候選藥物篩選來幫助推進電腦輔助藥物發現。
藥物探索團隊可以使用其專有資料透過 BioNeMo 建立或最佳化模型,並在基於雲端的高效能運算叢集上運行模型。
其中一個模型 ESM-2(一種支援蛋白質結構預測的強大的大型語言模型)在 256 個 NVIDIA H100 Tensor Core GPU 上實現了幾乎線性的伸縮。 研究人員可以擴展到 512 個 H100 GPU並在幾天內完成訓練,而不是原始論文中公佈所需的一個月訓練時間。
開發人員可以使用 6.5 億或 30 億個參數的檢查點大規模訓練 ESM-2。 BioNeMo 訓練框架支援的其他人工智慧模型包括小分子生成式模型 MegaMolBART 和蛋白質序列生成式模型 ProtT5。
BioNeMo 的預訓練模型和最佳化訓練方案能幫助研發團隊建立基礎模型,以探索更多候選藥物、最佳化濕實驗室實驗並更快地找到有前途的臨床候選藥物,可使用 AWS ParallelCluster 和 Amazon ECS 等自我管理服務以及透過 NVIDIA DGX Cloud 和 Amazon SageMaker 的整合託管服務取得。
AWS 上也提供:NVIDIA Clara用於醫學影像和基因組學
MONAI 計畫由 NVIDIA 共同創立並由企業支持,旨在支援醫學影像工作流程,已經被下載超過 180 萬次,並且可在 AWS 上部署。 開發人員可以利用已儲存在 AWS 雲端資源上的專有醫療保健資料集來快速註釋和建立用於醫學成像的人工智慧模型。
這些模型在 NVIDIA GPU 驅動的 Amazon EC2 執行個體上進行訓練,可用於醫學影像中分割、分類、註冊和偵測任務的互動式註解和微調。 開發人員還可以利用 MONAI 中提供的核磁共振影像合成模型來增強訓練資料集。
為了加速基因組學流程,Parabricks可以在大約 15 分鐘內對整個人類基因組進行變體識別,而僅使用CPU 系統則需要一天的時間。 在 AWS 上,開發人員可以快速擴展以跨多個 GPU 節點處理大量基因組資料。
Amazon HealthOmics 上提供了十多個 Parabricks 工作流程作為 Ready2Run 工作流程,使客戶能夠輕鬆運行預先建置的管道。
開始使用 AWS 上的 NVIDIA Clara 來加速藥物發現、基因組學和醫學成像的人工智慧工作流程。