AI 的 iPhone 時代:揭開驅動 AI 硬體、軟體和工具的神秘面紗
隨著 NVIDIA 在 2018 年推出 RTX 技術,以及首款專為人工智慧(AI)打造的消費級GPU ——GeForce RTX,加速推動向AI運算領域邁進的轉變起,RTX 與工作站上的 AI 持續蓬勃發展,如今已茁壯成擁有超過一億名使用者和 500 款AI應用程式的生態系統。
生成式 AI 現正迎來從 PC 到雲端運算的新一輪功能浪潮。而 NVIDIA 在 AI 領域的豐富經驗與專業知識,有助於確保所有使用者都能獲得處理各種 AI 功能的優異執行效能。
家庭和辦公室裡的使用者已經開始運用 RTX 上的 AI 軟體以提高生產力,並提升娛樂性。遊戲玩家可以享受 GeForce RTX GPU 所蘊含的 AI 優勢,以更高的畫格率及出色的解析度來運行他們最愛玩的遊戲。創作者可以把重心放在發揮天馬行空的創意上,而不用浪費時間盯著螢幕畫面上顯示著「執行中」不停轉動的圈圈,或重複平凡枯燥的工作。開發人員則可以利用生成式AI來製作原型及自動除錯,簡化他們的工作流程。
AI 高速發展中,隨著更進一步深入研究,AI將用於處理更複雜的工作,而使用者對效能的嚴苛要求則由 RTX 來滿足。
什麼是 AI?
從最基本的形式來看,AI 是一種更聰明的運算方式。它是電腦程式或機器在沒有明確用指令編寫程式碼的情況下,思考、學習和採取行動的能力,即使用者無需控制每一個指令。
AI 可以理解為一種裝置消化和分析海量數據資料,然後找出其中的模式(通常被稱為「經過訓練」),從而自主執行任務的能力。
AI 的研發始終圍繞著開發系統來進行,這些系統可以完成原本需要一般人類智慧及大量輸入資料才能完成的工作,並且以超出任何個人或群體的效率來完成。因此,AI被認為具有顛覆性和高度變革性。
AI 系統的一大關鍵優勢便是能夠從經驗或資料模式中學習,在獲得新的輸入項目或資料時自行調整結論。這種自我學習能力使得AI系統能夠完成各種驚人的工作,包括影像識別、語音辨識、語言翻譯、醫療診斷、車輛導航、圖片和影片增強,還有其他數百種應用案例。
AI 下一步將朝內容生成的功能發展,即生成式 AI。它能夠讓使用者基於不同種輸入,包括文字、圖片、聲音、動畫、3D 模型或其他類型的資料,快速建立新的內容,並對其進行迭代,然後以相同或新的形式生成新內容。
使用者可以運用如基於雲端的 ChatGPT 等這類熱門語言應用程式,根據簡短的文字請求生成長格式文案。而 Stable Diffusion 這類影像生成器可以將輸入的描述性文字變成所需的影像。更有其他新的應用程式將可以把文字變成影片,將 2D 平面圖片變成 3D 立體渲染結果。
GeForce RTX AI PC 與 NVIDIA RTX 工作站
AI PC 是一種配備專用硬體的電腦,用於協助 AI 運行得更快,具體展現在過往需耗費時間等待 3D 影像載入,如今透過AI降噪器便能夠看到影像的即時更新。
RTX GPU 上這些專門的 AI 加速器被稱為 Tensor 核心,它們能夠顯著提高需要高效能的工作和娛樂應用程式裡的AI表現。
TeraOps/s或每秒兆次運算(TOPS)是衡量 AI 效能的方法之一。TOPS 跟引擎的馬力等級類似,可以讓使用者透過單一指標了解 PC 的 AI 效能。目前 GeForce RTX GPU 的 AI 效能選擇範圍,大約介於 200 至 1,300 以上 AI TOPS 不等,也提供許多介於筆記型電腦和桌上型電腦兩者之間的效能選擇。此外,專業人士可選擇提供更高 AI 效能的 NVIDIA RTX 6000 Ada 世代 GPU。
從這個角度來看,目前未搭載 GPU 的AI PC 的效能在 10 到 45 TOPS 之間。
越來越多類型的 AI 應用程式將需要一台能夠在本地端或裝置上執行特定 AI 工作,而非在雲端環境裡運行的 PC。在 AI PC 上運行的優點包括,PC 在未連接網路的環境下也能隨時進行運算;藉系統的低延遲實現高度的反應速度;並且帶來更高的隱私性,使用者無需將敏感資料上傳到線上資料庫,AI 在本地端就能使用這些資料。
可供所有人使用的 AI
RTX GPU 帶來的不光是效能,它們還帶來了只有 RTX 技術才能做到的功能。無論使用者的技術水準,數百萬人都可以使用其中的許多 AI 功能,並且感受AI技術對人帶來的影響。從運用AI來將影像升頻、提升視訊會議品質,再到智慧化、個人專屬的聊天機器人,帶給使用者各種類型的應用工具。
RTX Video 採用 AI 技術對串流影片進行升頻,並以 HDR 格式顯示。將標準動態範圍的低解析度影片,提升到清晰生動、高達 4K 畫質的高解析度高動態範圍。RTX 使用者在Chrome或 Edge 瀏覽器中的絕大多數串流影片上,僅需點擊一次便能啟用並享受這項功能。
NVIDIA Broadcast 是可供 RTX 使用者免費使用、界面操作簡單的應用程式,擁有一系列可改善視訊會議和直播效果等的AI功能。它可以透過 噪音和回音消除(Noise and Echo Removal )功能消除不需要的背景聲音,例如敲鍵盤聲、吸塵器聲和孩子的哭鬧尖叫聲;它能利用 虛擬背景(Virtual Background) 功能,透過更強大的邊緣偵測功能來替換或模糊背景;它還能運用影像噪音消除 (Video Noise Removal)功能讓低解析度的攝影機影像變得平滑。此外,無論使用者走到哪裡,它都能透過 自動取景(Auto Frame) 和 眼神接觸(Eye Contact) 功能,讓眼睛注視著攝影鏡頭,並且保持在螢幕畫面中央。
Chat With RTX 是一個本地端、個人專屬的 AI 聊天機器人展示項目,容易上手且可以免費使用。
使用者只要把檔案放入一個資料夾中,然後將展示程式指向該位置,就能輕鬆將 PC 上本地端的檔案連接到有支援的大型語言模型。使用者可以進行查詢,快速獲得與前後文有關的答案。
由於 Chat With RTX 是在 Windows 系統的 GeForce RTX PC 和 NVIDIA RTX 工作站上的本地端運行,它的運行速度非常快,且使用者的數據資料可以保留在裝置上,也不會丟失。與依賴雲端環境的服務不同,Chat With RTX 允許使用者能夠在 PC 本地端處理敏感資料,無需分享給第三方或是連接到網路。
供遊戲玩家使用的 AI
在過去的六年裡,遊戲效能在AI加速技術的協助下突飛猛進。玩家們從 2019 年開始便開始使用 NVIDIA DLSS 來提升畫格率及改善影像品質。這是一種利用AI在遊戲裡自動生成畫素的技術,經過不斷改良,現在DLSS可以將畫格率提高至最高四倍。
在最新版本 DLSS 3.5 中引入光線重建技術後,更進一步強化了全球頂尖遊戲大作的視覺品質,為視覺效果更豐富、更具有臨場感的遊戲樹立了新標準。
現有超過 500 款遊戲和應用程式利用光線追蹤、DLSS 和AI技術,徹底改變了玩家享受遊戲和進行創作的方式。
除了提升畫格率,AI還將改善遊戲玩家與角色的互動方式及重新製作經典遊戲。
包括生成式AI語音和動畫模型在內的 NVIDIA ACE 微服務,讓開發人員能夠在遊戲中加入有著智慧且生動的數位化身。在 CES 大會上展示的 ACE 項目以其創造出寫實逼真遊戲角色的能力贏得了多個獎項,更讓人們看到了 PC 遊戲領域未來的發展趨勢。
供遊戲修改者建立經典遊戲 RTX 重製版的 NVIDIA RTX Remix 平台,提供生成式AI工具,可將經典遊戲中的基本材質紋理,轉化成現代 、擁有4K 解析度、符合物理原理的渲染材料。部分項目已經推出或正在製作中,其中包括《戰慄時空2 RTX(Half-Life 2 RTX)》及《傳送門with RTX(Portal with RTX)》。
供創作者使用的 AI
AI 可以減少人們處理繁瑣工作的時間,或是自動執行這些工作,讓創作者有更多時間來釋放創作潛能,純粹地進行創作。而這些功能僅在配備 NVIDIA RTX 或 GeForce RTX GPU 的 PC 上運行或可獲得最高的執行速度。
Adobe Premiere Pro 的 Enhance Speech 工具可消除不必要的噪音,並提升對話品質。
Adobe Premiere Pro 的 Enhance Speech 工具經過 RTX 加速運行下,使用AI消除不必要的噪音,提高對話片段的品質,使得它們聽起來更專業。它在 RTX 上的運行速度是 在Mac上的 4.5 倍。Adobe Premiere Pro 還有另一項 自動裁剪(Auto Reframe) 功能,使用 GPU 加速來辨識和追蹤影片中最具相關性的元素,智慧地按照不同長寬比來重新調整影片畫面。
DaVinci Resolve 的 Magic Mask 是另一個可以讓影片剪輯人員節省工作時間的 AI 功能。在此之前,如果剪輯人員要調整鏡頭中主體的顏色或亮度,或是移除不需要的物體,必須搭配轉描(rotoscoping)技術或基本的 Power Window 和 Mask 功能,才能將主體從背景中分離出來。
Magic Mask 功能徹底改變了這種工作流程。有了它,創作者只要在主體上畫一條線,AI處理片刻後就會於所選的區域中顯示。GeForce RTX 筆記型電腦運行這項功能的速度,是未配備RTX 的筆記型電腦的 2.5 倍。
這僅僅是運用AI提高創作速度的其中一個例子,如今已有超過 125 項由 RTX 加速的AI應用程式。
供開發人員使用的AI
AI透過具擴充性的環境、硬體和軟體最佳化,以及新的 API,將讓開發人員有更好的方式來開發軟體應用程式。
NVIDIA AI Workbench 可以協助開發人員利用 PC 級的效能和記憶體,快速建立、測試和客製化預先訓練好的生成式AI模型和大型語言模型(LLM)。它是一個具統一性、且易於使用的工具包,可以在 RTX PC 上本地端運行,也可以擴大到幾乎任何資料中心、公有雲或 NVIDIA DGX Cloud等虛擬環境運行。
在為 PC 使用案例建立好 AI 模型後,開發人員可以使用 NVIDIA TensorRT 軟體將其調整至最佳狀態,該軟體能夠協助開發人員充分利用 RTX GPU 中的 Tensor 核心。
現在可以透過 TensorRT-LLM for Windows,在文字式應用程式裡使用 TensorRT 加速技術。這個開源函式庫提高了 LLM 的效能,並且加入適用於 Google 的 Gemma、Meta Llama 2、Mistral 及 Microsoft Phi-2等熱門模型的預先最佳化檢查點。
開發人員還能取得用於 OpenAI Chat API 的 TensorRT-LLM 包裝函式。只要修改一行程式碼,continue.dev,這是一個針對VS Code 和可以利用大型語言模型的JetBrains 的開源 autopilot,就能在 RTX PC 上本機端使用 TensorRT-LLM,運用這項熱門工具在本機端快速進行 LLM 推論作業。
我們將在接下來的每一週揭開AI的神秘面紗,幫助更多人了解和接觸AI技術,並且為 RTX AI PC 使用者展示最新的硬體、軟體、工具和加速功能。
AI 的 iPhone 時代已經到來,而這只是開始。