谷歌發布最新版AI 系統,圖像配文準確率高達93.9%
Fairybear 2016-09-26
3,399 views
編輯觀點: Google的以圖找圖功能提供頗為便利的功能,尤其再找風景地點的時候特別方便!!
近日,谷歌發布了最新版機器學習系統,通過識別圖像中的內容,配上對應文字,效果達到了歷史最佳。谷歌已經在TensorFlow 上開源了這項成果。自2014 年以來,谷歌一直致力於這個項目,現在這個算法描述圖像的準確率已經高達93.9% 。
因為他們正在使用一個使用一個開始架構的最新的迭代,所以對於谷歌團隊來說,有個大問題是該算法是否可以做的比簡單識別圖像中的對象更多。要真正解釋和描述一張照片,人工智能不僅需要了解圖片中是什麼,更要了解圖像中這些對像有什麼相互關係。谷歌的開發人員表示這不只是一個數據的倒推。該算法必須能夠自然地理解圖像中的對象和它們的用途。
谷歌研究的博客發文說:“令人興奮的是,在展示全新情境時,我們的模型的確可以產生準確的配文,這顯示出系統對圖像中目標和背景的理解更深了。”同樣重要的是,“它還學會瞭如何表示知識在自然的英語短語,儘管它只讀了人類給的說明字幕,沒有在接受其他額外的訓練。”
至少從目前來說,相對於視頻,機器學習算法能更好地理解靜止圖像的內容。
原價屋 Coolpc 資訊
-
【開箱】三千有找 Wi-Fi 7 隨便打!TP-Link Archer GE230 電競雙頻路由器。on 2026-05-21
-
【原價屋搶購】你的神裝值得被看見!ROG Cronox GR801幻世神機殼上市,加碼送 ROG 大地墊。on 2026-05-21
-
行情天天亂漂移,想升級不用再看市場臉色!微星指定電競神機加碼16G享超值加購價!on 2026-05-20