發包資料 戴爾向資料科學家「下手」了

2021-10-14 20:00:47 字數 2679 閱讀 1892

如今,新的需求隨著ai的勃興,也已經傳遞到了工作站市場。一台能夠服務於ai開發需求的工作站,正在成為這個行業的必須品。

只是,它有多「必須」呢?

因為ai技術在自動駕駛、醫療、零售、製造和物流等眾多行業領域的廣泛應用,ai專案開發的需求正在水漲船高。

戴爾在2023年委託第三方調研了500家企業,其中高達70%的企業高管表示,已經在企業的生產、實驗或者概念驗證中使用了ai技術。

這自然而然地給那些ai的開發者帶來了壓力。

ai的實現通常要經過資料準備、模型開發和訓練、以及模型部署三個階段,整個過程對平台的算力有很高的要求。

而在這三個階段中,圍繞硬體平台,資料科學家們通常會有三個選擇,一是在伺服器上,二是在雲端,而第三,就是找到一台適合高強度計算要求的資料科學工作站產品。

只要有一台合適的資料科學工作站,開發ai專案的資料科學家就能獲得其他平台無法獲得的便利。

例如在試驗階段進行自由的試驗,輕鬆裝載容器開發包或平台;或者對演算法、模型等進行隨意的迭代和修改;而且由於資料就在本地,開發階段的資料修改也變得異常輕鬆。

但也不是那麼的輕鬆……例如在記憶體發生故障的時候。

「越是計算密集型任務,記憶體的佔用量就越大。這時乙個資料出錯,很容易就會導致計算結果錯誤或者程式崩潰。」黃亮是戴爾科技集團商用終端解決方案資深工程師,他說,這也是為什麼高階的quadro和tesla都要支援ecc記憶體的原因了。

ecc記憶體也就是應用了能夠實現錯誤檢查和糾正技術(ecc)的記憶體條。它可以防止在軟體、資料呼叫或是大資料平行計算時,出現藍屏或資料讀取失敗。 

因為關係到資料科學家在ai開發流程的穩定性,戴爾在所發布的資料科學工作站產品系列中,都配備了它。

戴爾precision工作站擁有廣泛的產品線,其中就包括專門針對資料科學領域的資料科學工作站:

precision 7000系列高階移動工作站配置有強大的計算效能和gpu顯示卡;precision 5820塔式工作站則支援多gpu顯示卡;而precision 7000系列塔式工作站和機架工作站則是戴爾最強大、可擴充套件性最強的資料科學工作站產品。

不過,在戴爾看來,這些產品系列僅使用ecc還不足夠可靠,於是,就有了rmt的加入。

rmt是戴爾自身的專利技術——智慧型糾錯記憶體(rmt),它可進一步防止因為硬體問題導致的記憶體錯誤。

在硬體出現故障的時候,工作站主機板上的乙個晶元可以自動遮蔽硬體壞掉的部分,讓記憶體繼續穩定執行,減少宕機時間。

「ecc能糾正輕微的錯誤,而rmt可以允許記憶體『帶病』工作。」黃亮說介紹說,「它可以隔離一部分記憶體,讓開發者繼續工作。」

「它能極大地提公升硬體的穩定性。」戴爾科技集團專業工作站產品經理汪志軍說,事實上,這項技術是免費提供給所有使用者的。

解決了資料科學家在ai開發和部署階段的平台所需,又解決了計算密集型任務最擔心的可靠性和穩定性問題,

戴爾的資料科學工作站就開始發揮precision工作站的傳統優勢了——開箱即用是所有選擇工作站產品使用者的基礎要求。

資料科學家之所以被稱為科學家,很重要的一點,就是他們不用把寶貴的時間浪費在平台的組裝、修復中——要知道,完成試錯、配備起一套新的資料科學平台,通常要花這些科學家們去數天,甚至數週的時間。

通過與nvidia及作業系統和ai開發平台的廠家合作,戴爾precision資料科學工作站在出廠前就經過硬體配置和系統預裝載。

資料科學家在做ai專案時,工作站的相容性是一項重要的考量要素。如果對專案所需的軟體無法相容,他們就需要花費大量時間進行重新裝載與測試。

在這一點上,戴爾資料工作站擁有著ai領域平台、作業系統、開發包及廣泛的軟體認證。

這些採用了nvidia技術的戴爾precision資料科學工作站配備了nvidia quadro rtx gpu和nvidia cuda-x ai加速資料科學軟體資源合集,包括如rapids、tensorflow、pytorch和caffe等ai開發軟體。

這種完備的配備和認證讓使用者可以在開箱後,立刻進行資料模型的準備和ai開發等工作。

有趣的是,這些資料科學工作站是為資料科學家開發ai專案而定製的,而它本身也是「ai的」。

戴爾precision工作站內建了戴爾的dell optimizer智慧型調優軟體,也就是說,它能用ai來加速ai專案研究。

通過機器學習演算法,這些資料科學工作站可以收集、監測機器執行資源。當使用者再執行這些軟體的時候,它就會對自身進行優化配置,並根據不同的軟體運**況,把機器的效能再做一次提公升。?

資料科學家Docker入門指南

摘要 docker容器那麼強大?可以應用道資料科學領域?看來學習一下!docker容器是通過虛擬化開發和部署應用程式的一種越來越流行的方式,它對資料科學家有用嗎?當然,本指南就會向你介紹它的作用,並手把手教你快速入門。docker是一種越來越流行的,使在容器中開發 部署和執行應用程式變得更容易的工具...

資料科學家成搶手人才

對於乙個理應奇缺人才的領域,資料科學似乎在快速造就大批新專家。不久前,1600人出席了華盛頓大學 university of washington 機器學習教授卡洛斯 格斯特林 carlos guestrin 執掌的公司turi在舊金山主辦的一次資料科學峰會,表明資料科學引起的興趣是多麼的濃厚。格斯...

資料科學家面試如何準備?

編輯 april emma 專欄 九章演算法 資料科學家 data scientist 被 財富 雜誌譽為21世紀最 的職業。據調查顯示,僅僅在美國市場,2018年大資料和高階分析相關人才的缺口就將高達19萬。然而雖然現在很多人對這份職業躍躍欲試,但是卻對這份新興職業並不了解,更不知道應該如何準備面...