杭研大咖說 王新勇 死磕雲原生的「懶人」

2022-06-05 18:30:09 字數 2268 閱讀 9195

在生活中,作為戶外運動愛好者,王新勇常常於週末爬山,享受攀越高峰之後見到的無限風光 ;在工作上,作為網易杭州研究院(網易杭研)的系統開發專家,王新勇則鍾情於征服雲計算領域的一座座「山峰」。業務部門邀請他去排查問題,常常驚異於他找出異常的速度和解決故障的效率,心悅誠服地稱他為「大神」。

然而,在王新勇看來,自己不過是乙個「懶人」。因為「懶」於投簡歷、筆試、面試,研究生一畢業就早早鎖定聲名在外、環境獨特的網易杭研的工作;因為「懶」於做重複的事情,盡量把重複的需求都寫成**,盡量採用自動化(或者說devops)工具;因為「懶」於查閱所需要的知識,把常用的技術細節、工具用法都裝到自己大腦之中……正是這些懶人舉動,讓他的工作事半功倍,面對難題時舉重若輕。

網易杭州研究院系統開發專家 王新勇

雲原生、容器在今天是主流技術,但容器的價值在四五年前並未廣為人知。從docker開始出現,網易杭研就預見到了容器的好前景。在王新勇看來,docker可以滿足「懶」的需求,它提出的映象打包技術是基礎設施的乙個很大的進步。在這之前,為了實現不可變基礎設施的理念,需要要通過雲主機快照的方式,在雲上完成類似的部署的一致性,整個過程非常重。而容器技術,這種不涉及虛擬化的打包技術,使得這種「不可變基礎設施」的理念,無論是公有雲上,還是在私有資料中心,都可以非常方便地使用。

今天,kubernetes編排、微服務化、service mesh、serverless等技術,都是圍繞容器來設計的。最新linux的lts版本4.19的核心,對於容器的支援也越來越穩定,修復了不少之前版本的bug。由此,王新勇認為,在沒有新的顛覆性的技術出現之前,容器技術將會一直在it基礎設施層面扮演乙個非常核心的角色。在網易內部,當前的網際網路業務,都已經實踐了或者正在準備容器化。目前看來,容器化確實是乙個值得死磕的技術方向。

當然,容器化並不容易。從網易的實踐來看,容器化主要有兩大挑戰:

首先是業務方對容器化的不適應,之前使用物理機以及虛擬機器的很多玩法,在容器化的場景下,發生了變化。比如容器化以後,容器的ip將不再固定,之前的很多基於ip做白名單、基於ip提供服務的做法,就不再適用了;包括一些監控metric資訊,使用容器後的獲取方式、展示形式也與之前有差別;具體運維操作上,之前的運維都是命令式的,轉向kubernetes之後,變成了宣告式的,但是大家的運維思路上,還是原來的命令式的玩法,也會有不適感。

其次,大規模的容器化面臨很多技術上的挑戰,比如docker會有bug;作業系統包括一直到4.9核心,在cgroups的支援上,都還有不少bug;不同的業務型別,需要進行針對性的調優;隨著集群規模的增大,硬體故障的概率會大幅增加哎,需要緩解機器硬體問題導致宕機的影響。

針對這兩類問題,王新勇和他的團隊都給出了他們的答案。

針對業務的不適應,團隊會提供大量的諮詢和支援服務,會去了解業務的第一手需求,(需求一經轉述,需求可能就變形了),然後根據業務的第一手需求,給出較好的實踐建議,幫助業務更好地去使用kubernetes。另一方面,比如針對大家的ip白名單需求,團隊也做了自己的全域性ip管理服務,支援了容器的池化分配以及一些特殊容器的ip固定,通過這些方式去降低業務在容器化改造中的不適。另外,在網路方面,雲網路也和容器團隊一起,做了大量方便業務方遷移的解決方案。

針對技術上的挑戰,團隊做了大量的優化工作。從作業系統、docker等系統軟體的bugfix以及引數優化,到部署架構根據使用者的需求做持續的調整優化;同時也梳理常見問題的應急處置方式,形成經驗積累。對於所有使用者遇到的bug,都不放過,會持續跟進尋找root cause。目前,使用者一旦報障,或者通過監控系統監控到故障後,團隊基本上都能很快地在積累下來的故障情況中找到故障型別,並能夠迅速按照緩解恢復方案,快速完成恢復。

容器只是雲原生的開始,當前比較火的技術,微服務化、service mesh、aiops、serverless、混沌測試等,接下來都會逐步落地。當然,也有一些問題需要解決,比如:

微服務化以後,系統拆得很散,如何做系統的跟蹤、監控;

service mesh由於引入了proxy,對業務的呼叫延遲有影響,怎樣優化;

獲取到大量的監控資料的情況下,如何能夠更好地幫助業務做出診斷;

針對一些事件觸發型的業務,可以引入faas(函式即服務),在引入faas之後,如何解決冷啟動的延遲,如何做更好的資源排程,也引入了不少挑戰;

當前混沌測試的話題隨著雲計算的普及也變得熱了起來,畢竟雲計算並不保證100%的sla。如何做更好的故障模擬,幫助業務方發現問題於暴露之前,也是乙個挑戰。

總的來說,當前大家已經逐步從使用雲原生和容器技術,轉向了怎樣用好雲原生和容器技術。王新勇表示,作為基礎設施服務提供者,團隊也會在這些方面持續投入,以輕舟平台為載體,幫助業務能夠把容器技術用好,達到提效降本。

華雲大咖說 高校混合雲建設及應用

新一代資訊科技的到來,推動了我國各高校逐漸重視對資訊化的建設,尤其隨著雲計算技術的深入發展,人們逐漸將混合雲作為校園資訊化建設的核心。混合雲集成公有雲 私有雲雙重優勢,既可以盡可能多地發揮雲計算系統的規模經濟效益,同時又可以保證資料安全性。對於高校來說,那些不是很敏感的非關鍵業務可以由混合雲中的公有...

物聯網雖火 但大咖們為什麼這麼說

近些年,我們身邊出現了太多的智慧型硬體,也聽說了太多物聯網應用的那些事,但總歸有不完善的一面,眾多業內人士紛紛表示,萬物互聯的前景雖然美好,但缺乏標準已經成為阻礙產業發展的最大瓶頸。當然隨著科技的不斷發展堅信未來是美好的,也許還需5年?10年?可以拭目以待。業內人士就就表示,如海爾家電集團副總裁兼首...

大咖說 企業資訊價值難衡量?女神教你 六維法」

資訊 是近年 出鏡率 最高的乙個詞。在這個時代,資訊無疑是企業最有價值的資產之一。企業在建立 管理和保護資訊方面的投資力度之大足以說明這點。但從另一方面來說,很多時候,資訊價值的衡量尚無明確的標準。不是所有資訊都可以靠一部 智財權法 來衡量和保全其價值。因此,問題出現了,企業如何擴充套件基本的資訊評...