作者: 發布時間:2024-02-29 瀏覽次數 :0
機器視覺可以看作是與人工智能和模式識別密切相關的一個子學科或子領域。限制機器視覺發展的瓶頸是多方面的,其中z重要的可以歸結為三個方面:計算能力不足、認知理論未明以及精確識別與模糊特征之間的自相矛盾。
1、機器視覺面向的研究對象主要是圖像和視頻,其特點是數據量龐大、冗余信息多、特征空間維度高,同時考慮到真正的機器視覺面對的對象和問題的多樣性,單一的簡單特征提取算法(如顏色、空間朝向與頻率、邊界形狀等等)難以滿足算法對普適性的要求,因此在設計普適性的特征提取算法時對計算能力和存儲速度的要求是十分巨大的,這就造成了開發成本的大幅度提高。
2、如何讓機器認知這個世界?這一問題目前沒有成熟的答案,早期的人工智能理論發展經歷了符號主義學派、行為主義學派、連接主義學派等一系列的發展但都沒有找到令人滿意的答案,目前較新的思想認為應該從分析、了解和模擬人類大腦的信息處理功能去構建智能機器視覺檢測系統,但神經科學的發展目前只能做到了解和模擬大腦的一個局部,而不是整體(當然計算能力限制也是原因之一)。事實上,我們對人是如何對一個目標或場景進行認知的這一問題仍停留在定性描述而非定量描述上。
3、 機器視覺系統經常被人詬病的問題之一就是準確性。以十年前如火如荼的人臉識別算法為例,盡管一系列看似優秀的算法不斷問世,但目前為止在非指定大規模樣本庫下進行人臉識別的準確率仍然無法滿足實際應用的需求,因此無法取代指紋或虹膜等近距接觸式生物特征識別方法。這一問題的出現并非偶然。因為目標越精細,越復雜,信息越大,則其模糊性和不確定性也越強。人類之所以能夠較好的對人臉進行識別,其實也是以犧牲一定的準確性為代價的。而機器視覺在做的事情一方面想要借鑒人腦或人眼系統的靈感去處理復雜而龐大的信息流,另一方面又想摒除人腦在模式識別方面存在的精確性不足的缺陷。這顯然是一種一廂情愿的做法。
綜合以上三點,機器視覺的發展在短期內難有重大突破,當前的實用技術仍然還是會集中在特定性任務或特定性目標的識別算法的開發上。