谷歌發布最新版AI 系統,圖像配文準確率高達93.9%
Fairybear 2016-09-26編輯觀點: Google的以圖找圖功能提供頗為便利的功能,尤其再找風景地點的時候特別方便!!
近日,谷歌發布了最新版機器學習系統,通過識別圖像中的內容,配上對應文字,效果達到了歷史最佳。谷歌已經在TensorFlow 上開源了這項成果。自2014 年以來,谷歌一直致力於這個項目,現在這個算法描述圖像的準確率已經高達93.9% 。
因為他們正在使用一個使用一個開始架構的最新的迭代,所以對於谷歌團隊來說,有個大問題是該算法是否可以做的比簡單識別圖像中的對象更多。要真正解釋和描述一張照片,人工智能不僅需要了解圖片中是什麼,更要了解圖像中這些對像有什麼相互關係。谷歌的開發人員表示這不只是一個數據的倒推。該算法必須能夠自然地理解圖像中的對象和它們的用途。
谷歌研究的博客發文說:“令人興奮的是,在展示全新情境時,我們的模型的確可以產生準確的配文,這顯示出系統對圖像中目標和背景的理解更深了。”同樣重要的是,“它還學會瞭如何表示知識在自然的英語短語,儘管它只讀了人類給的說明字幕,沒有在接受其他額外的訓練。”
至少從目前來說,相對於視頻,機器學習算法能更好地理解靜止圖像的內容。
延伸影片閱讀:
原價屋 Coolpc 資訊
-
on 2024-12-18 -
on 2024-12-17 -
on 2024-12-16 -
on 2024-12-15 -
on 2024-12-14