扒一扒Profiler中這幾個「佔坑鬼」

waitfortargetfps、gfx.waitforpresent和graphics.presentandsync是我們經常會被問到的引數。想必正在讀此文的你也經常在profiler中遇到過這幾項cpu開銷過大的情況。對此，我們今天就來好好地聊一聊這幾個引數的具體含義和觸發規則。

解析：該項在unity引擎的主迴圈中其實是最早執行的，即引擎實際上是根據上一幀的cpu耗時，在當前幀中通過增補waitfortargetfps的方式來將執行fps維持到目標值。比如，目標幀率為30幀/秒，上一幀耗時15ms，那麼當前幀中waitfortargetfps將會是18（33-15）ms，但是這一幀中其他耗時為28ms，那麼在profiler中這一幀的總耗時就變成了46（18+28）ms。

因此，由該值造成了profiler開銷較高的現象，其實是耗時的「假象」，在優化過程中，你對它可以「視而不見」。

這兩個引數在profiler中經常出現cpu占用較高的情況，且僅在發布版本中可以看到。究其原因，其實是cpu和gpu之間的垂直同步（vsync）導致的，之所以會有兩種引數，主要是與專案是否開啟多執行緒渲染有關。當專案開啟多執行緒渲染時，你看到的則是gfx.waitforpresent；當專案未開啟多執行緒渲染時，看到的則是graphics.presentandsync。

graphics.presentandsync是指主線程進行present時的等待時間和等待垂直同步的時間。gfx.waitforpresent其字面意思同樣也是進行present時需要等待的時間，但這裡其實省略了很多的內容。其真實的意思應該是為了在渲染子執行緒（rendering thread）中進行present，當前主線程（mainthread）需要等待的時間。聽起來依然很拗口，下面，我們就來進行詳細地解釋。

當專案開啟多執行緒程渲染時，引擎會將present等相關工作盡可能放到渲染執行緒去執行，即主線程只需通過指令呼叫渲染執行緒，並讓其進行present，從而來降低主線程的壓力。但是，當cpu希望進行present操作時，其需要等待gpu完成上一次的渲染。如果gpu渲染開銷很大，則cpu的present操作將一直處於等待操作，其等待時間，即為當前幀的gfx.waitforpresent時間，如下圖所示。

同理，當專案未開啟多執行緒渲染時，引擎會在主線程中進行present(當前絕大多數的移動遊戲均在使用該中操作)，當然，present操作同樣需要等待gpu完成上一次的渲染。如果gpu渲染開銷很大，則cpu的present操作將一直處於等待操作，其等待時間，即為當前幀的graphics.presentandsync時間，如下圖所示。

我們做了乙個較為極端的例子來展示這種情況。在unity 5.3.3版本上，建立60個全屏uipanel，分別開啟和關閉多執行緒渲染，並不設定targetfps。那麼，在三星s6裝置上該引數的cpu開銷如下：

開啟多執行緒渲染時：

關閉多執行緒渲染時：

所以，如果你的專案中，gfx.waitforpresent或graphics.presentandsync的cpu耗時非常高時，其實並不是它們自己做了什麼神秘的操作，而是你當前的渲染任務太重，gpu負載過高所致。

同時，對於開啟垂直同步的專案而言，gfx.waitforpresent 和 graphics.presentandsync也會出現cpu占用較高的情況。在解釋這種問題之前，我們先以「大家乘坐地鐵」來舉個例子。一般來說，地鐵到達每一站的時間均是平均且一定的，假設每10分鐘一班接走一批乘客。但是幾乎沒有多少乘客可以按點到達，如果提前兩分鐘到達，則只需要等待兩分鐘即可乘上地鐵，但是，如果你錯過了，哪怕只差了一分鐘，那麼你也不得不再等待九分鐘才能乘上地鐵。

上述的情況我們經常會遇到。在gpu的渲染流水線中，其轉換front buffer和back buffer的工作原理和「乘坐地鐵」其實是一致的。大家可以把gpu的流水線簡單地想象成為一列地鐵。對於移動裝置來說，gpu的幀率一般為30幀/秒或60幀/秒，即vsync每33ms或每16.6ms「到站一次」，cpu的present即為「乘客乘上地鐵」，然後前往各自的目的地。與乘客的早到和晚到一樣，cpu的present也會出現類似的情況，比如：

cpu端開銷非常小，present在很早即被執行，但此時vsync還沒到，則會出現較高的等待時間，即gfx.waitforpresent 和 graphics.presentandsync的cpu開銷看上去很高。下圖為unity 5.3.3版本上，乙個空場景在不開啟多執行緒渲染、不設定targetfps的情況下，graphics.presentandsync在三星s6裝置上的cpu占用情況。

cpu端開銷很高，使得present執行時錯過了vsync操作，這樣，present將不得不等待下一次vsync的到來，從而造成了gfx.waitforpresent 和 graphics.presentandsync的cpu開銷較高。這種情況在cpu端載入過量資源時特別容易發生，比如www載入較大的assetbundle、resource.load載入大量的texture等等。

通過以上的講解，我們希望此刻的你已經對gfx.waitforpresent 和 graphics.presentandsync已經有了深入的理解。這兩個引數無論cpu占用多少，其實都不是這兩個引數的自身問題，而是專案的其他部分造成。對此，我們做乙個總結，以方便你進一步加深印象。

造成這兩個引數的cpu占用較高的原因主要有以下三種原因：

cpu開銷非常低，所以cpu在等待gpu完成渲染工作或等待vsync的到來；

cpu開銷很高，使present錯過了當前幀的vsync，即不得不等待下一次vsync的到來；

gpu開銷很高，cpu的present需要等待gpu上一幀渲染工作的完成。

最後，如何優化並降低這兩個引數的cpu占用呢？那就是，忽略gfx.waitforpresent 和 graphics.presentandsync這兩個引數，優化其他你能優化的一切！

扒一扒Profiler中這幾個「佔坑鬼」
waitfortargetfps gfx.waitforpresent 和 graphics.presentandsync是我們經常會被問到的引數。想必正在讀此文的你也經常在profiler中遇到過這幾項cpu開銷過大的情況。對此，我們今天就來好好地聊一聊這幾個引數的具體含義和觸發規則。解析該項在...

扒一扒Profiler中這幾個「佔坑鬼」
解析該項在unity引擎的主迴圈中其實是最早執行的，即引擎實際上是根據上一幀的cpu耗時，在當前幀中通過增補waitfortargetfps的方式來將執行fps維持到目標值。比如，目標幀率為30幀秒，上一幀耗時15ms，那麼當前幀中waitfortargetfps將會是18 33 15 ms，但...

扒一扒vue的資料追蹤原理
大家都知道在angular或vue中，資料的更新會實時的反應到dom上，那麼到底是什麼原理呢，下面就vue 一下。開啟vue的官網，可以看到它關於vue如何追蹤變化的原理。把乙個普通物件傳給 vue 例項作為它的 data 選項，vue.js 將遍歷它的屬性，用 object.defineprope...

扒一扒Profiler中這幾個「佔坑鬼」

扒一扒Profiler中這幾個「佔坑鬼」

扒一扒Profiler中這幾個「佔坑鬼」

扒一扒vue的資料追蹤原理

相關推薦