我們理解高階視覺嗎? 讀後總結

2021-08-09 08:25:40 字數 863 閱讀 2439

高階視覺缺乏乙個唯一的,一致性的定義。最近幾十年的工作大多數都集中在物件的識別問題上,主要是在視覺系統的乙個場景當中去識別乙個或者一群物件。重要的是在其中忽略了物件的位置、大小、光線以及它周圍所呈現的物體。當物件識別作為了高層視覺的操作框架的時候,僅僅通過視覺神經來解決問題顯然已經不足以解決問題了。所以作者將在這裡陳述這項工作所做出的成績和不足,並且一起討論了是否應該重新形成我們對高階視覺的理解。

一、直覺性的錯誤:為什麼視覺是如此的困難?

1、3d的世界被轉換成了2d的平面影象去處理,其中就會很容易的忽視一些重要的資訊

2、我們人類的視覺感知是從人類的進化就開始了,而對於計算機則是不同的過程、

3、我們在視覺系統上的能力擾亂了我們基本的直覺

二、尋求高階視覺操作的定義

關於高階視覺的乙個功能性的定義是在某種程度上集中精力於處理物件或者其表面的物理引數,而不是關注於光線投擲到視網膜上所測量到的物理引數。

三、讀出物件的身份

對於人類,在視網膜神經細胞上的資訊呈現並不是一種形式,它可以很容易的為了引導行為通過順流神經元很容易的被讀出。

對於提取物件資訊,在探查高階神經編碼上線性分類器是一種合理的解碼選擇。

四、探索物件識別上面臨的挑戰

1、定義乙個物件是十分困難的。我們可以表達特定物件的名稱,但是每個物件都有很多種分類、用途、外觀等特性,我們很難用簡單的修飾將其準確的表達出來。

2、構建具有代表性的刺激方案物件是困難的。

3、有大量的證據表明高水平視覺皮層的神經元依賴於正在觀察的場景。

五、物件識別是正確的框架問題嗎?

對於這個問題,應該引用作者的一句比較經典的話:驅動我們對高階視覺理解的關鍵不在於去解決問題,而是去探索乙個豐富的關於視覺要做什麼的框架性問題。

前端視覺欺騙

前情提要 很常見的需求 當使用者沒有購買記錄的時候,顯示 暫無消費記錄 有則顯示消費記錄。本來以為很簡單,我一開始是使用v if來判斷資料長度,為0則顯示 暫無消費記錄 但是發現在載入頁面的時候會有一閃而過的 暫無消費記錄 字型,然後才顯示正常的消費記錄,影響使用者體驗。解決辦法 對於這個bug我個...

高階視點 摘錄

突然發現能看的懂程式設計師雜誌了,有些文章 語言對自己似乎有所觸動和啟發,有種字字珠璣的感覺。摘錄部份文章片斷以做收藏。一 軟體不是 二 面向服務體系的理念 以上兩段摘於 soa 從應用開始 普元軟體公司創始人 董事 兼首席技術官 黃枊青 四 按照建立的價值高低及所造成的影響可分為三個層面 持續創新...

無限滾屏效果,高階視差滾屏

ccparallaxnode不適用於生成無限滾屏效果。使用ccspritebatchnode來提高背景的渲染速度。單獨的層檔案 滾屏效果中的所有單獨的條紋檔案都是480x320畫素的,乍看起來很浪費,但是並不是要把這些單獨的檔案載入到遊戲中去,而是要把它們放到紋理貼圖集中去。zwoptex可以移除每...