資料科學如此火爆,為什麼找個工作還那麼難?

2021-09-10 10:12:12 字數 3762 閱讀 2778

大多數人都沒有足夠的能力成為合格的資料科學家

回答者:riya dubey,資料科學家 回答於 2018 年 10 月 24 日

謝邀,我的答案可能會傷害那些胸懷抱負的資料科學家們的感受。不過我還是得實話實說——大多數有志者都沒有足夠的能力成為合格的資料科學家。請不要誤解我的意思,但大多數希望成為資料科學家的朋友都不具備足夠的技能儲備。

雖然市場對於資料科學家確實有著巨大的需求,但大多數人的技能都太爛了(請原諒,我就是這麼坦率)。

並不是企業不想雇用新人擔任資料科學家這類角色。事實上,不只是應屆畢業生,就算是企業通過社招吸納的資料科學家們也未必能夠順利完成任務。** 資料科學是一類極具挑戰性的工作,要求敏銳的分析能力、強大的數字能力以及卓越的商業理解能力。** 即使我們立刻著手學習這些技能,要達到游刃有餘仍然需要耗費漫長的週期。簡單地總結,單憑在大學裡的教育背景不足以支撐大家完成相關工作。

而以上提到的,還只是資料科學所提出的最低技能要求。從行業角度來看,邁入資料科學領域還需要其它多種技能。下面來看其中的一些主要專案:

1. 對於統計及統計學技術幾乎無可挑剔的認知與理解。

2. 你需要對推理統計資料擁有良好的控制能力。

3. 良好的 r 與 python 程式設計能力。這兩種是目前大家最需要了解的高人氣資料科學語言。

4. 資料視覺化技能,包括對 tableau 以及 qlikview 等工具的熟練掌握。

5. **建模能力,意味著你需要了解各類機器學習演算法。

現在,著眼於上述技能,大家會意識到其涵蓋範圍極廣,甚至足以徹底將我們吞沒。更具體地講,要精通這些技能需要相當長的時間——更遑論很多人窮盡一生可能也無法掌握。

很少有企業會雇用應屆畢業生出任資料科學職位,但在接受企業培訓並擁有 6 到 12 個月的工作經驗之後,他們會逐步贏得資料科學家頭銜。mu sigma、latentview analytics 以及 absolute data 等就是這類開放性企業的典型代表。然而,必須承認,鮮有公司願意提供這樣的機會。

需要考量的另一大重要因素在於,大多數希望出任資料科學家的年輕人都就讀於 iit/nit 以及 bits pilani 等頂尖高校。企業意識到,這類大學的畢業生技術能力出眾,學習速度快且能夠輕鬆完成訓練。因此,企業更傾向於選擇這些高校的學生。在入職之後,這些學生會自行學習其它技術性技能,或者接受企業內部提供的培訓。

然而,對於其他一些畢業生來講,以上只是一種不切實際的幻想。因此,要進入資料科學領域,你只能全程自學。

目前存在眾多面向資料科學方向的平台,你可以在其中學習資料科學領域的各類技能。data camp、data science.com、coursera、edx 以及 udemy 等都能夠為你提供理想的技能積累環境。

除了上述平台之外,大家還應該嘗試 kaggle 以及 kdnuggets 等,這些是通過資料科學專案磨練水平的好去處。事實上,這些平台甚至更為重要。正如我之前所提到,資料科學極具挑戰性,因此除了真正投身於實際專案之外,大家根本不可能真正加以掌握。

因此,在大家通過上述平台學習時,請確保同時參與具體專案以實現理論與實踐的結合。此外,大家還需要利用這些專案展示自己的實際工作能力。在資料科學領域,我們參與的專案以及藉此做出的有價值的貢獻才是對技能的真正考驗。對於新手而言,資料清潔往往最為重要。而如果你才剛剛起步,那麼參與專案絕對是個良好的選擇。當然,你所選擇的專案,最好涉及一切作為資料科學家所需要的技能方向。

總體來講,作為一位胸懷大志的資料科學家,如果你希望找到理想的工作,請遵循以下方法:

學習資料科學領域的必要技能。開展專案工作,藉此建立自己的技能組合並磨練技術水平。贏得資料科學職位。

除此之外,我還建議你參考 gautam tiwari 給出的以下答案,以了解如何以新手面貌邁入資料科學領域。

gautam tiwar 的回答:應該如何邁出成為資料科學家的第一步?(

每一家企業都希望選擇「最具價效比」的目標候選人

回答者: jon wayland,資料科學家 回答於 2018 年 10 月 23 日

今年春季,我和我的未婚夫買了輛新車。買車當然不是件小事,原本我們也根本沒打算買,但這輛車一下子抓住了我們的心。我們也考慮了其它一些車型,並且進行了全面的試乘試駕體驗。

我們對於自己的需求有著非常明確的認知,但最終促使我們下定決心的,還是這款產品的出色價效比。

與汽車類似,資料科學家同樣成本高昂。身為客戶,企業雇主當然希望找到那些最能滿足自身需求的目標。

你認為哪些因素決定著他們的招聘意願?

想象一下,對於典型的資料科學職位,候選人的分布可能如下所示,其中 x 軸代表「符合要求」的情況,或者說人才自身吸引力的直觀指標:

備註:上圖完全基於我的假設,與實際資料無關。

另外需要注意的是:

像我們普通人一樣,企業也有預算額度,而且不願意接受存在風險的支出。標註為綠色的候選人最為安全,標註為藍色的候選人由於缺乏經驗而代表存在風險,而標註為紅色的候選人則直接被排除在外。

那麼,作為客戶,你認為企業會做何選擇?

如果我們能夠購買一台全新的微軟 su***ce 筆記本,或者是選擇一款號稱具有同等配置且幾乎同等價位的「即將推出」的新產品,你會如何決定?

毫無疑問,市場對於標註為綠色的候選人擁有最迫切的需求。每一家企業都希望選擇這類人才,而鮮有企業願意選擇標註為藍色的候選人並承擔相關風險。

總而言之,每一家企業都希望選擇「最具價效比」的目標。

我還沒見過任何真正的初級資料科學家

回答者: mike west,pluralsight 公司機器學習講師(2018 年至今) 回答於 2018 年 10 月 22 日

答案很簡單,資料科學家職位對技能在深度與廣度層面的要求遠遠超出大多數人的認知。

由於大多數現實世界中的資料科學任務,具體體現為機器學習,而機器學習屬於一類硬核程式設計工作。

如果你無法使用 python 語言程式設計,那麼你根本得不到這份工作。事實就是如此。

因為你無法完成資料清潔工作,因此沒人在乎你能多麼高效地從 github 上覆制現成**。

因為 sql 遠比建模更重要,而新手們根本就不明白這背後的原因所在。我們不再關注那些 sql 實際使用經驗不足兩年的候選人。事實上,學習建模要比學習關聯式資料庫理論簡單得多。

資料處理是一項極為艱深的工作。

因此如果我是一家企業的老闆,而且我願意拿出 15 萬美元以上雇用一名員工,那這傢伙最好能夠充分滿足我提出的技能需求。

在接觸這一領域五年之後,我還沒見過任何真正的初級資料科學家——這裡只存在初級機器學習工程師,而且他們大多是由程式設計或者資料相關崗位轉型而來。

資料科學崗位候選人的增長速度遠超過就業機會的增長速度

回答者: vincent granville 回答於 2018 年 11 月 2 日

造成這種現象的主要原因,在於資料科學崗位的候選人正呈現出指數級增長,而就業機會雖然同樣增長極快,但卻不足以抵消新生人才數量。這在一定程度上類似於博士生的全面爆發,其直接導致博士學歷的市場競爭力快速削弱。有人可能會想:為什麼還會有那麼多人願意讀博?幾年下來,市場對於人才的要求可能已經發生劇變了呀。沒錯,我認為這個問題的答案在一定程度上與資料科學家問題存在相似之處:

為什麼社群團購如此火爆?

社群 無疑是2020年消費領域最炙手可熱的消費賽道之一,疫情的推動使社群 獲得更多發展的空間,引得無數創業者紛紛投入,那麼,商家做 的好處有哪些呢?1 裂變分享速度快 2 成本低風險更低 3 商品複購率高 社群 的商品是快消產品,居民的需求更高,使用者粘性強,不同於美團和拼多多,社群 主打的是生鮮百...

為什麼IT行業如此火爆,它的發展前景如何

it行業作為高新技術產業之一,為社會各界創造了許多神話,同時it行業巨大的人才需求和相對容易得到的高薪還是吸引著大量的人才。在經歷了十年的高速發展後,it行業還是潛力滿滿嗎?什麼是it?it 這個名詞,簡要地說它的意思就是資訊科技 information technology 它涵蓋的範圍很廣,舉凡...

大資料為什麼對人們來說如此重要?

在這10年中,幾乎所有行業都或多或少的受到大資料的影響。科技滲透到各個領域,並且已經成為每個處理單元的必要元素。談到it行業,具體來說,軟體和自動化是最基本的術語,並且用於處理迴圈的每個階段。大資料 毫無疑問,各行各業因為大幅爆發的資料而正變得蒸蒸日上。在這10年中,幾乎所有行業都或多或少的受到這一...