中國工程院院士王恩東 融合架構引領雲計算資料中心

2021-09-23 04:32:11 字數 4829 閱讀 6118

zd至頂網網路頻道 05月18日 

北京報道(文/李超):5月18日,由中國電子學會主辦,zd至頂網協辦的第八屆中國雲計算大會在北京國家會議中心隆重舉辦。中國工程院院士、中國大資料專家委員會副主任委員、中國電子學會雲計算專家委員會副主任委員王恩東出席了本次大會,並在大會上做了主題為「融合架構引領雲計算資料中心」的精彩演講。

中國工程院院士、中國大資料專家委員會副主任委員、中國電子學會雲計算專家委員會副主任委員 王恩東

王恩東在演講中表示:「未來的資料中心應當是乙個業務感知的資料中心,成為符合我們每乙個人應用的專用計算機,而不是乙個今天的通用計算機,從而大大提公升計算的效率、節省計算的能耗。真正能夠符合未來智慧型計算的需要。」

王恩東:尊敬的大會主席李伯虎院士,尊敬的各位專家、各位同仁、女士們、先生們大家下午好。 非常高興來參加今天的第八屆中國雲計算大會。應當說中國的雲計算在中國電子學推動下,經過這樣乙個**年的發展,我們大概可以看到,確實是取得了非常長足的進步。我們今天每個人應當說都在切身體會雲計算帶給我們的變化。今天我們大會有乙個副標題叫技術融合、應用創新,今天我的題目也是融合架構,作為資料中心支撐雲計算發展中心,在技術上、在產品上也面臨很多一些新的需求、新的挑戰。所以我想今天就為了這融合架構、為了未來雲計算資料中心的趨勢和技術發展熱點與大家做乙個交流。

包括分三個方面,首先給大家分享一下資料中心的發展與需求。

所以在未來我們可以想像,也許到了2023年之後,我們再來看計算的分類,可以就分為三類,一類是我們最初的面向解決重大科學問題的科學計算。另外一類就是在一些關鍵的應用場合,像金融、像通訊在關鍵的應用裡面有一些關鍵計算。但是我想更大的一類我們是否可以把它歸納為,或者叫做智慧型計算。

在前一段時間,麥肯錫曾經對影響世界的22項技術做了一次調查和分析。他把前12位的放在這地方,我們可以看到這12位裡面,排在前5位的基本上都是移動網際網路、自動化、物聯網、雲計算、機械人。可以想見計算機技術對人類生活、社會發展將產生越來越大的這種影響和作用。因此呢我們想社會可能與我們所謂的資訊時代進入智慧型時代。實際上最近我們也在看到像阿爾法狗與李世石下棋,應當說人工智慧炒的很熱,包括谷歌人工智慧,用了十天的時間,通過識別一千萬張,教會了計算機能夠認識貓的。一方面我們可以看到人工智慧的發展,給計算帶來巨大的需求,但同時呢,應當說如果我們真的像讓我們社會,讓我們的萬物,在我們的工作當中,智慧型打的像人一樣的智慧型一樣,它的能耗是非常非常大的。人需要在3毫秒認識乙隻貓,而作為計算機需要這麼強大的系統,需要這麼長的時間。

當然通過這樣一種我們可以看到,作為在智慧型計算的時代,或者在未來的智慧型時代,應該說雲計算、大資料會成為我們核心的一些技術。如果展望未來智慧型計算時代,或者智慧型時代,是乙個什麼樣子?它資料在計算方面具體會產生多大的需求呢?我們來看幾個例子,像智慧型醫療,像未來人的衣食住行都是跟物聯網相關,會產生大量的終端,這些終端時時刻刻會產生大量的資料,當然通過這種資料的儲存、分析也會產生巨大的價值。這會對我們未來得健康、醫療帶來根本性的一些變革。

既然有這麼多的終端,終端這樣的一種便攜化、輕量化產生大量的資料,需要儲存、需要分析、需要計算。這樣應當就會要求後端的資料中心,要能夠承擔起這樣乙個作用來。因此資料中心資料的大規模集中化是一種必然的戰略趨勢。所以我們來看的話,應當說這幾年包括未來,我們資料中心的裝置需求在快速的增長。我這裡列出了幾類核心裝置、伺服器、儲存和網路,可以看到這是乙個很快增長的這樣乙個趨勢。具體的數字就不給大家來念了。

資料中心的集中化和規模化,也必然會帶來很多的問題和挑戰。我們從三個方面來看:

第乙個是效能,計算的效能、儲存的容量等等,是來支撐雲計算、支撐資訊發展、支撐資訊社會發展根本的東西。應該說效能的瓶頸可能是乙個最大的瓶頸,尤其是我們的效能主要來自於像cpu也就是半導體的技術支撐。從2023年之後cpu的頻率就由於能耗、由於工藝等各方面的限制,基本上就停留在3g赫茲以下。尤其隨著工藝越來越接近於極限,現在14奈米接下來7奈米再往下可能就變成幾個原子這樣乙個寬度。所以半導體的工藝越來越極限的挑戰。我們三四十年來我們更多的是靠摩爾定律這樣一種,來自於通過半導體技術的快速發展,帶來效能的快速發展。在2023年ittrs也就是半導體技術發展的組織,就發布將不再遵循,就未來得半導體技術就不再遵循摩爾定律。所以我們在效能上會遇到乙個很大的挑戰。

第二個效能當然還有就是儲存的效能,因為架構將計算和儲存做了分離,我在這裡儲存的層次做了計算,從cpu與記憶體的訪問的延遲,訪問中硬碟的外存的延遲,應當說這裡面的延遲比例變化是非常大的。當然這裡面的頻寬變化也非常大。因此就形成了這種記憶體強io強,影響計算機系統效能的提公升。

第三個效能就是網路效能。我們來看版內的設計,這種裝置內的版間的網路速度,和裝置間的網路速度是乙個逐次遞減的過程,為什麼這樣子?我們都知道裝置間是要通過交換機,交換機的背板的速度要分配到各個埠上去,我們要實現大量裝置的互聯,所以應當說通過交換的模式、交換機的背板限制了埠速度和頻寬。

同時我們也看到在這種資料中心內部裝置間的互聯的協議,跟這種資料之間的,也就是說內網的網路協議,跟外網的協議是一樣的。但是大家都知道,通用的網路協議是比較複雜的。因此在資料中心內部的,它的網路效率應當講也是有問題的。也影響了資料中心系統效能的提公升。第二個問題那就是效率的問題。一方面我們伺服器、儲存的需求在快速增長,但同時我們看到,他們的利用效率並不高。這列出來了現在80%的伺服器,利用效率在25%以下,全球資料中心的平均利用率在15%。當然現在也有很多的技術,希望說能夠提高這樣的效率,讓它虛擬化。使這種通過虛擬化,使資源能夠在不同的計算裝置之間進行平衡。

應當說虛擬化相當程度的提公升了計算裝置的總效率,但同時我們看到,還有很多制約效率的一些問題。到目前還沒有完全解決。比方說在我們的計算裝置、儲存裝置和網路裝置裡面,實際上每乙個裝置裡面,都有大量的這種計算和儲存和網路的一些資源,但這些資源都是隔離的,它們之間並沒有得到共享。

另外呢就是本身我們的cpu是通用,通用的cpu在效率上不如專用晶元要快。如何來解決這問題呢?就是能耗。能耗是資料中心要綠色、要節能,關鍵就在於能耗的問題。這裡面有幾個資料,目前說全球資料中心的能耗,每年的能耗是3千億千瓦時,我們中國的資料中心大概是一千瓦時,相當於乙個三峽大壩的總發電量。所以我們大家都在想如何降低能耗,我們來看一下資料中心有多少能耗用在實際的it裝置裡面,實際上我們pue值都比較低,在美國做的比較好像用自然風製冷,大概能做到1.1和1.1以下,而我們國內包括大規模的資料中心,基本上都是在1.5和2.0之間,而現在傳統的pue值都超過了3超過了4。 就是說大量的能耗並非用在了這種it裝置上,今天我們人工智慧的發展,應當說對能耗會提出更大的挑戰。我們都希望說每乙個人都有乙個阿爾法狗這樣的大腦。但是大家知不知道,像阿爾法狗跟我們實際人的能耗相比是有天壤之別的。阿爾法狗用了1920個cpu,256個gpu,它的運算效率大概是3千萬億次,但是它的能耗大概是500千瓦,它的功率。而人像李世石大概就是0.1千瓦,我們每個人都像阿爾法狗這麼聰明的話,我們可以想像在能耗方面是乙個多麼大的挑戰。

所以現在呢,我們應該說在很多的挑戰面前,而解決這問題的路徑,又面臨很多的問題。因為今天一些新的計算方式,新的計算機像量子計算機、量子計算,可能真正能夠用起來,到目前還沒有看到,會十年、二十年、三十年還是五十年,更多的還是在實驗室裡面,現在在量子統計方面已經有了一些進展,得到了十幾的應用,但作為量子計算機什麼時候能用起來,其他新型的計算機能用起來,而摩爾定律面臨著巨大的挑戰,大家都在講我們進入了後摩爾時代。

相關+的技術可能對於效能的提公升,目前應當說改良性不是革命性。所以在這樣一種狀況下,計算能力的路在何方?那麼融合這個詞並不是乙個很好的詞。它更多的是叫把現有的技術如何整合到一起去,來滿足一種需要。但既然今天計算技術在很多方面遇到了一些瓶頸性東西,還沒有革命性方案的時候,也許融合技術在未來十年、二十年、三十年之內來提公升資料中心效能的一條路徑。這條路徑我們把它叫做融合,所以我們講說未來的資料中心是融合架構的資料中心。什麼是融合架構?在這地方呢我們把融合架構用在硬體重構+軟體定義,就是硬體網路裝置中的同類資源整合成乙個資源池,不同的裝置能夠任意的整合,在軟體的動態感知業務的資源需求,利用硬體重組的能力來滿足各類應用的需要。當然要實現這樣乙個融合架構,也是需要一些演進性技術一些支撐,在這裡面像高速互聯技術的發展,像新興記憶體技術的發展,像可重構晶元的發展,像軟體定義。在這裡面像高速互聯技術,應當說這種矽光互聯可能進入晶元互聯這樣的一種技術,因為光的傳輸在電的傳輸有很多的優點,現在隨著半導體技術的一些演進,光互聯進入到晶元間的互聯成為一種可能。並且這樣一種通過光互聯進入晶元,可以使我們資源的這種結構,由原來的只是對結點的結構對晶元的結構,進入細密度的結構。

另外就是新型儲存材料的出現,就會改變原來傳統計算機這樣一種傳統層次。更大的記憶體出現在計算機裡面,我們原來就是希望我們的記憶體更大,我們的資料都放在記憶體裡面,這樣的話我們就會縮減,它去訪問慢速儲存所帶來的延遲或者效率資源的消耗。當然還有一種支撐技術就是半導體的3d技術的發展。使處理器內部的增加速度,使可程式設計的晶元成為可能。我們可以在這種晶元裡面,既有固定的通用的能力,又有可程式設計的能力,既保持了通用性,又能夠專業性的應用,變成專用的中晶元。通過這種晶元的重構,它可以是乙個作為動態壓縮的晶元,也可以變成乙個作為影象晶元,這諱忌大的提高晶元的處理效率。

當然根本上還在於軟體定義,硬體的重構,它能夠成為乙個更加符合你應用的東西,更加符合你應用的計算機,軟體定義是靈魂。由於時間的關係我就稍微快一點。

要出現融合架構我們把它分成三步走,第一步就是首先要把一些非計算的資源進行整合,滿足資料中心在能耗、在密度方面的要求。第二步來吧一些儲存把計算、網路進行整合。第三步成為完全可重構的資料中心,完全用軟體定義的資料中心。

如何融合第二代就是把儲存和網路進行融合,這裡面我們也把已經出現的產品所帶來的好處呈現在工作中,可以看到它在密度提高方面,在效率方面,又比第一代有了更進一步的提公升。尤其是在hadoop上面更加的高,在雲計算方面密度有了更進一步的提公升。當然第三代真正滿足我們的需要。我們不管什麼樣子的應用最根本的就是計算機,在未來應當是你需要你有乙個什麼應用,我給你這樣乙個計算資源,就正好是按照你的應用是乙個專用的計算效能,它的速度、它的能耗都會降低。

到最後的聲音就出來了,應當講就是說,就未來得資料中心應當是乙個業務感知的資料中心,成為我們每乙個人都有乙個符合你應用的專用的計算機,而不是乙個今天的通用的計算機,從而大大提公升計算的效率、節省計算的能耗。真正能夠符合未來智慧型計算的需要,這就是我今天的報告,謝謝大家。

原文發布時間為:2023年5月18日

python bs64爬取中國工程院院士資訊

作為乙個渣碩已經畢業一年了,也工作一年了,得了空閒來寫寫文章。前段時間,有個老師叫我寫個爬取中國工程院院士資訊的爬蟲,我寫了個大概的 來實現。先說一下做這個的整體思路吧 開門見山的說 就是領導想要看看申請院士,從業者的經歷等等資訊,為了滿足領導的需求,我就開始實現我的爬蟲程式了 cotent url...

中國工程院院士鄔賀銓 5G更大的發展在於產業應用

有人說,4g改變了我們的生活,而5g會改變社會。那麼已經在路上的5g,究竟會給社會帶來哪些實質性改變?對此,中國工程院院士鄔賀銓表示,移動通訊的發展從1g到4g都是面向個人的通訊,但5g不僅帶來更寬的頻寬 更高的速率,5g更大的發展在於它所定位的應用場景 產業應用和大量未知的應用創新。對於5g的應用...

中國工程院院士鄔賀銓 5G更大的發展在於產業應用

有人說,4g改變了我們的生活,而5g會改變社會。那麼已經在路上的5g,究竟會給社會帶來哪些實質性改變?對此,中國工程院院士鄔賀銓表示,移動通訊的發展從1g到4g都是面向個人的通訊,但5g不僅帶來更寬的頻寬 更高的速率,5g更大的發展在於它所定位的應用場景 產業應用和大量未知的應用創新。對於5g的應用...