谷歌發布最新版AI 系統，圖像配文準確率高達93.9%

編輯觀點: Google的以圖找圖功能提供頗為便利的功能，尤其再找風景地點的時候特別方便!!

近日，谷歌發布了最新版機器學習系統，通過識別圖像中的內容，配上對應文字，效果達到了歷史最佳。谷歌已經在TensorFlow 上開源了這項成果。自2014 年以來，谷歌一直致力於這個項目，現在這個算法描述圖像的準確率已經高達93.9% 。

因為他們正在使用一個使用一個開始架構的最新的迭代，所以對於谷歌團隊來說，有個大問題是該算法是否可以做的比簡單識別圖像中的對象更多。要真正解釋和描述一張照片，人工智能不僅需要了解圖片中是什麼，更要了解圖像中這些對像有什麼相互關係。谷歌的開發人員表示這不只是一個數據的倒推。該算法必須能夠自然地理解圖像中的對象和它們的用途。

谷歌研究的博客發文說：“令人興奮的是，在展示全新情境時，我們的模型的確可以產生準確的配文，這顯示出系統對圖像中目標和背景的理解更深了。”同樣重要的是，“它還學會瞭如何表示知識在自然的英語短語，儘管它只讀了人類給的說明字幕，沒有在接受其他額外的訓練。”

至少從目前來說，相對於視頻，機器學習算法能更好地理解靜止圖像的內容。

文章來源

谷歌發布最新版AI 系統，圖像配文準確率高達93.9%

Phanteks Ethoo普里莫i7-4790K GTX980-SLI水冷

聯發科Helio X30發布：首款10nm十核芯

The Author

Fairybear

Google 於 I/O 2026 推出新一代模型 Gemini 3.5 ，首波開放 Flash 版本使用

Google 整合健康生態系：Google Health 正式取代 Fit APP，導入 Gemini AI 教練

Google Cloud Next 2026 推出第八代 TPU，效能算力提升、訓練時效「月變週」

Chrome 功能更新！垂直標籤頁、沈浸式閱讀，幫助用戶提升使用效率。

Google AI新技術造成記憶體價格暴跌專家不認同：需求不會降只會增

Google 發布 Gemini Embedding 2 模型，支援多模態交錯輸入

9 Bay 大儲存！JONSBO N6 NAS 機殼開箱 / 9 Bay 儲存空間、雙電源配置、多種電源安裝方式

Intel入門款CPU發威 Core 7 350跑分曝光

ROG 創世源碼 2026 展出 CROSSHAIR 2006 紀念主板與 T1 RTX 5070 / 5060 Ti 顯示卡

谷歌發布最新版AI 系統，圖像配文準確率高達93.9%

谷歌發布最新版AI 系統，圖像配文準確率高達93.9%

原價屋 Coolpc 資訊

Phanteks Ethoo普里莫i7-4790K GTX980-SLI水冷

聯發科Helio X30發布：首款10nm十核芯

The Author

Fairybear

Related Posts

谷歌發布最新版AI 系統，圖像配文準確率高達93.9%