Epoll工作模式詳解

我們目前的網路模型大都是epoll的，因為epoll模型會比select模型效能高很多，尤其在大連線數的情況下，作為後台開發人員需要理解其中的原因。

select/epoll的特點

select的特點：select 選擇控制代碼的時候，是遍歷所有控制代碼，也就是說控制代碼有事件響應時，select需要遍歷所有控制代碼才能獲取到哪些控制代碼有事件通知，因此效率是非常低。但是如果連線很少的情況下， select和epoll的lt觸發模式相比，效能上差別不大。

這裡要多說一句，select支援的控制代碼數是有限制的，同時只支援1024個，這個是控制代碼集合限制的，如果超過這個限制，很可能導致溢位，而且非常不容易發現問題， taf就出現過這個問題，除錯了n天，才發現：）當然可以通過修改linux的socket核心調整這個引數。

epoll的特點：epoll對於控制代碼事件的選擇不是遍歷的，是事件響應的，就是控制代碼上事件來就馬上選擇出來，不需要遍歷整個控制代碼鍊錶，因此效率非常高，核心將控制代碼用紅黑樹儲存的。

對於epoll而言還有et和lt的區別，lt表示水平觸發，et表示邊緣觸發，兩者在效能以及**實現上差別也是非常大的。

epoll的lt和et的區別

lt：水平觸發，效率會低於et觸發，尤其在大併發，大流量的情況下。但是lt對**編寫要求比較低，不容易出現問題。lt模式服務編寫上的表現是：只要有資料沒有被獲取，核心就不斷通知你，因此不用擔心事件丟失的情況。

et：邊緣觸發，效率非常高，在併發，大流量的情況下，會比lt少很多epoll的系統呼叫，因此效率高。但是對程式設計要求高，需要細緻的處理每個請求，否則容易發生丟失事件的情況。

下面舉乙個列子來說明lt和et的區別（都是非阻塞模式，阻塞就不說了，效率太低）：

採用lt模式下，如果accept呼叫有返回就可以馬上建立當前這個連線了，再epoll_wait等待下次通知，和select一樣。

但是對於et而言，如果accpet呼叫有返回，除了建立當前這個連線外，不能馬上就epoll_wait還需要繼續迴圈accpet，直到返回-1，且errno==eagain，taf裡面的示例**：

if(ev.events & epollin)

else

}}while(true);}

同樣，recv/send等函式，都需要到errno==eagain

從本質上講：與lt相比，et模型是通過減少系統呼叫來達到提高並行效率的。

epoll et詳解

et模型的邏輯：核心的讀buffer有核心態主動變化時，核心會通知你，無需再去mod。寫事件是給使用者使用的，最開始add之後，核心都不會通知你了，你可以強制寫資料（直到eagain或者實際位元組數小於需要寫的位元組數），當然你可以主動mod out，此時如果控制代碼可以寫了（send buffer有空間），核心就通知你。

這裡核心態主動的意思是：核心從網路接收了資料放入了讀buffer（會通知使用者in事件，即使用者可以recv資料）

並且這種通知只會通知一次，如果這次處理（recv）沒有到剛才說的兩種情況（eagin或者實際位元組數小於需要讀寫的位元組數），則該事件會被丟棄，直到下次buffer發生變化。

與lt的差別就在這裡體現，lt在這種情況下，事件不會丟棄，而是只要讀buffer裡面有資料可以讓使用者讀，則不斷的通知你。

另外對於et而言，當然也不一定非send/recv到前面所述的結束條件才結束，使用者可以自己隨時控制，即使用者可以在自己認為合適的時候去設定in和out事件：

1 如果使用者主動epoll_mod out事件，此時只要該控制代碼可以傳送資料（傳送buffer不滿），則epoll

_wait就會響應（有時候採用該機制通知epoll_wai醒過來）。

2 如果使用者主動epoll_mod in事件，只要該控制代碼還有資料可以讀，則epoll_wait會響應。

這種邏輯在普通的服務裡面都不需要，可能在某些特殊的情況需要。但是請注意，如果每次呼叫的時候都去epoll mod將顯著降低效率，已經吃過幾次虧了！

因此採用et寫服務框架的時候，最簡單的處理就是：

建立連線的時候epoll_add in和out事件，後面就不需要管了

每次read/write的時候，到兩種情況下結束：

1 發生eagain

2 read/write的實際位元組數小於需要讀寫的位元組數

對於第二點需要注意兩點：

a：如果是udp服務，處理就不完全是這樣，必須要recv到發生eagain為止，否則就丟失事件了

因為udp和tcp不同，是有邊界的，每次接收一定是乙個完整的udp包，當然recv的buffer需要至少大於乙個udp包的大小

隨便再說一下，乙個udp包到底應該多大？

對於internet，由於mtu的限制，udp包的大小不要超過576個位元組，否則容易被分包，對於公司的idc環境，建議不要超過1472，否則也比較容易分包。

b 如果傳送方傳送完資料以後，就close連線，這個時候如果recv到資料是實際位元組數小於讀寫位元組數，根據開始所述就認為到eagin了從而直接返回，等待下一次事件，這樣是有問題的，close事件丟失了！

因此如果依賴這種關閉邏輯的服務，必須接收資料到eagin為止，例如lb。

Epoll工作模式詳解

Epoll工作模式詳解

EPOLL的工作模式 ET and LT

epoll的ET和LT模式詳解

Epoll工作模式詳解

Epoll工作模式詳解

EPOLL的工作模式 ET and LT

epoll的ET和LT模式詳解

相關推薦