微服務與站點可靠性工程

2021-09-17 18:36:52 字數 1630 閱讀 4373

\

\

\\

在過去的幾年間,我們已經討論過站點可靠性工程(site reliability engineering,sre)的角色,尤其這個群體如何從google這種領域的公司得到發展,進而滿足金融和醫療等行業公司的期望。最近科技記者alex handy撰寫了sre和微服務架構如何適配的文章:

\\

\

[...]儘管sre和微服務在世界範圍內的軟體公司中並行發展,但是前者實際上讓後者的生活更加艱難。

\

\\

alex認為造成這一點的原因是非常清晰的:

\\

\

[...]sre的存亡依託於所要維護和優化的整個系統的全棧視角。這個角色將開發人員的技巧和管理員的技巧結合在了起來,這樣所產生的員工能夠在事情偏離方向的時候,除錯生產環境中的應用。

\

\\

alex接著介紹了sre的一些背景知識以及該功能如何在像google這種規模的公司中運轉,他引用了google的一位sre主管todd underwood的觀點,闡述了google如何安排實踐和系統,幫助開發團隊能夠在分布式系統中既能考慮到可靠性和可用性,又能採用像paxos這樣的技術方式實現一致性。

\\

\

underwood強調sre工作的另外乙個重要方面,也就是可見性。當微服務在不斷變化的基於的雲的伺服器、容器和資料庫中執行時,會丟擲數以億計的資料報,不管處理哪種型別的問題,首先找到**有問題都是至關重要的。這也就是sre工作的全棧性要發揮作用的地方了。

\

\\

按照google的一位產品主管morgan mclean的說法,這裡的關鍵在於微服務的監控和跟蹤,關於這個話題,過去有人也提到過,我們也曾經在其他地方討論過。在alex的文章中,他提到了google發布的一些新工具,以便於解決這個問題:

\\

\

[...]google最近發布了stackdriver trace、stackdriver debugger和stackdriver profiler。這些工具的名字聽起來很像傳統企業廠商的老式測試和運維工具,其實這是有原因的:它們所執行的正是傳統的故障診斷任務,也就是開發人員和運維人員所熟悉的工作內容,但是它們聚焦於微服務,並且在雲端完成它們的任務。

\

\\

alex引用morgan mclean的內容總結了這些工具是如何確保sre團隊更好地管理新的基於微服務的架構的,儘管跟蹤非常重要,但是google相信他們所提供的工具目前在profiling和除錯方面是獨一無二的,能夠為開發人員和sre帶來重要的收益。在文章的結尾處,alex通過google和其他的行業參考資料進一步介紹了監控、指標(metrics)和可見性,這是非常重要的,因為它們可能會與越來越多的公司息息相關。

\\ 我們看到越來越多的開發人員和公司採用微服務,其中很多正在使用,或者將要使用sre團隊,了解架構和工具如何演化以保證可靠性、可用性以及一致性是非常有意思的事情,這樣的話,開發人員和sre團隊才能和諧相處。如果在這方面你有經驗要分享,不管是正面的還是負面的,對於整個社群來說,能夠傾聽這些經驗都是非常有用的。

\\檢視英文原文:microservices and site reliability engineering

微服務與站點可靠性工程

在過去的幾年間,我們已經討論過站點可靠性工程 site reliability engineering,sre 的角色,尤其這個群體如何從google這種領域的公司得到發展,進而滿足金融和醫療等行業公司的期望。最近科技記者alex handy撰寫了sre和微服務架構如何適配的文章 儘管sre和微服務...

HDFS架構與可靠性

hdfs是乙個分布式檔案系統,基於流資料模式訪問和處理超大檔案的需求而開發的,可以運用在海量物理機集群上,具備的,高容錯 高可靠性 高可擴充套件性 高獲得性 高吞吐率等特徵,適用於海量資料儲存的場景。hdfs架構由hdfsclient namenode secondarynamenode datan...

數理邏輯 可靠性與完備性

命題邏輯與一階邏輯都有可靠性和完備性。數理邏輯研究推理,研究前提和結論之間的可推導關係 前提和結論之間的可推導關係是由它們的真假值之間的關係確定 即 前提的真蘊涵結論的真 用賦值 在命題邏輯中是真假賦值 定義的邏輯推論刻畫了可推導性 邏輯推論是語義的概念 用有限條形式推演規則定義的形式推演涉及公式的...