資料科學初學者九種常見錯誤

2022-09-18 16:30:14 字數 3465 閱讀 6765

資料科學初學者九種常見錯誤

如果你想開始乙個資料科學

方面的職業,你可以通過避免這9個會使你付出高代價的初學者錯誤來免去幾天,幾個星期甚至幾個月的挫折。

如果你不仔細,這些錯誤將會消耗你最寶貴的資源:你的時間、精力和動力。

我們將它們分為三類:

學習資料科學時的錯誤;

求職時的錯誤;

求職面試中的錯誤;

學習資料科學時

第一組錯誤是「隱蔽的」,很難發現。沒有絲毫的預兆,它們如同溫水煮青蛙般耗盡你的時間和精力,並且它們產生的誤解圍繞這個領域。

1.花費太多時間在理論上

許多初學者陷入了花費太多時間在理論上的陷阱,無論是數學相關(線性代數,統計學等)還是機器學習相關的(演算法,派生等)。

這種方法效率低下有三個主要原因:

首先,這是緩慢而艱鉅的。如果你曾經被所有要學的東西壓垮,那麼你很有可能陷入了這個陷阱。

第二,你也不會保留這些概念。資料科學是乙個應用領域,而鞏固技能的最好方法是實踐。

最後,還有乙個更大的風險就是如果你不明白你所學的東西與現實內容有什麼聯絡,那麼你會變得消極然後放棄。

傳統上這種重理論的方法在學術界中傳授,但大多數從業者可以從更注重結果的觀念中受益。

為了避免這個錯誤:

平衡你的研究和你實踐的專案。

學會適應區域性知識。當你進步的時候,你自然會填補空白。

了解每一部分如何適應大局(包括在我們免費7天速成課程)。

2.從頭開始編寫太多的演算法

下乙個錯誤也會導致學生片面重視區域性而忽略了整體。一開始你真的不需要從頭開始編寫每個演算法。

雖然為了學習而實現一些這麼做很好,但現實是演算法正在成為商品。由於成熟的機器學習庫和基於雲的解決方案,大多數從業者實際上從不從頭編寫**。

今天,了解如何在正確的設定(以正確的方式)中應用正確的演算法更為重要。

為了避免這個錯誤:

使用通用的機器學習庫,如scikit-learn(python)或caret(r)(需fq)。

如果你從頭開始編寫乙個演算法,那麼這樣做是為了學習而不是完善你的實現。

理解現代機器學習演算法的環境及其優缺點。

3.急於深入更高的層次

有些人進入這個領域是因為他們想要構建未來的技術:自駕車,高階機械人,計算機視覺等。

這些技術由深度學習和自然語言處理等技術所驅動。

但是,掌握基本原理很重要。 一口吃不成胖子。每個奧運潛水員都需要先學習如何游泳,那麼你也應該如此。

為了避免這個錯誤:

首先掌握「經典」機器學習的技術和演算法,以此作為高階課題的基石。

要知道經典機器學習仍然具有驚人的潛力。雖然演算法已經成熟,但我們仍然處於發現使用富有成效的方法的早期階段。

學習乙個系統的方法來解決任何形式的機器學習問題。

不要在家裡嘗試這個(除非你有足夠的練習)

求職時下一組錯誤可能會導致你在求職過程中錯過一些很好的機會。

即使你能夠勝任,但你可以通過避免這些問題來發揮到最好的效果。

4.簡歷中有太多的專業術語

許多應聘者在寫簡歷時犯的最大錯誤就是用專業術語填滿了簡歷。

相反,你的簡歷應該簡潔明瞭並且你的要點要闡述清晰。你的簡歷應該主張你能給公司帶來的影響,尤其是當你申請初級職位的時候。

為了避免這個錯誤:

不要簡單列出你所使用的程式語言或庫。描述你如何使用它們並解釋結果。

少即是多。考慮強調最重要的技能,並突出它們。

製作乙個簡歷主模板,這樣你就可以根據不同的職位定製不同的版本。這樣可以使每個版本保持整潔。

5.高估學位的價值

有時,畢業生會高估他們的教育價值。雖然在相關領域有高等學位肯定會增加你的機會,但這是不夠的,也不是最重要的因素。

當然了,我們並不是說畢業生傲慢自大…

在大多數情況下,在學校學習的東西與在企業中應用的機器學習完全不同。處理期限、客戶和技術障礙需要在學術界不那麼迫切的實際權衡。

為了避免這個錯誤:

參加相關實習,即使是兼職。

6.搜尋內容太狹隘

資料科學是乙個相對較新的領域,機構還在不斷發展,以適應資料日益增長的影響。如果你只搜尋「資料科學家」的空缺,你就會限制自己。

許多職位沒有被稱為「資料科學」,但它們可以讓你以類似的角色發展類似的技能和功能。

為了避免這個錯誤:

搜尋所需技能(機器學習,資料視覺化,sql等)。

按工作職責進行搜尋(**建模、a/b測試、資料分析等)。

用職位所需的技術搜尋(python,r,scikit learn,keras,等)。

通過職位名稱(資料分析師、定量分析師、機器學習工程師等)擴充套件搜尋範圍。

面試過程中

最後一組錯誤是面試時的絆腳石。你已經為達到這一步做了艱苦的工作,所以現在是結束的時候了。

7.沒有事先做討論專案的準備

在你的產品組合中有專案用於回答「你會如何」這類的面試問題,以此作為乙個主要的安全保障。而不是說假設,你可以指出你如何處理某些情況的具體例子。

此外,許多面試官都會特別關注你獨立自主的能力,因為資料科學的職位自然包含專案管理的要素。這意味著你應該理解整個資料科學工作流程,並了解如何將所有內容整理在一起。

為了避免這個錯誤:

完整的端到端的專案,能使你實踐每乙個主要步驟(即資料清理、模型培訓等)。

組織你的一套方法。資料科學應該是深思熟慮的,而不是偶然的。

回顧和實踐從過去的實習、工作或課程中所做的專案。

8.低估領域知識的價值

技術技能和機器學習知識是獲得資料科學職位的基本前提。然而,要真正脫穎而出,你應該更多地了解你將運用技能的具體行業。

記住,資料科學永遠不會存在於真空中。

為了避免這個錯誤:

如果你在銀行面試乙個職位,就要了解一些基本的財務概念。

如果你正在為財富500強的戰略職位面試,那就去面試幾次,了解一下盈利能力的驅動因素。

如果你正要去一家初創公司面試,要了解它的市場,並試著辨別它將如何獲得競爭優勢。

簡而言之,在這方面採取一些額外的舉措可以帶來很大的好處!

9.忽視溝通技巧

目前,在大多數機構中,與開發團隊或分析師團隊相比,資料科學團隊仍然非常小。因此,當乙個入門級的軟體工程師經常被乙個高階工程師管理時,資料科學家傾向於在更多跨功能的環境中工作。

面試官會注重你和不同技術背景和數學背景的同事交流的能力。

為了避免這個錯誤:

向非技術受眾講解技術概念。例如,試著向朋友解釋你喜歡的演算法。

為常見的面試問題準備要點,並練習回答問題。

實踐分析各種資料集,提取關鍵的見解,並展示你的發現。

總結在本指南中,你學習了資料科學初學者應該避免的9種代價高的錯誤的實用技巧:

1.花費太多時間在理論上。

2.從頭編寫太多的演算法。

3.跳入高深的主題,例如深度學習、太快了。

4.在簡歷中有太多的技術術語。

5.高估學位的價值。

6.找工作搜尋太狹窄。

7.在面試中沒有準備好討論專案。

8.低估領域知識的價值。

9.忽視溝通技巧。

初學者的錯誤

用記事本編寫 時 如需要輸入中文字元 要把格式改為utf 8格式編碼 不然會報c2001 常量中有換行符的錯誤 用define定義常量時在結尾不能用 號 用dos開啟qq時 輸入路徑有誤 g program files x86 tencent qq bin qqsclauncher.exe 應輸入 ...

初學者python中常見的錯誤

一 常見的錯誤型別 1.syntaxerror python 直譯器語法錯誤 if syntaxerror invalid syntax syntaxerror 異常是唯一不是在執行時發生的異常.它代表 python 中有乙個不正確的結構,在它改正之前程式無法執行.這些錯誤一般都是在編譯時發生,py...

16 oc初學者常見的錯誤

只有類的宣告,沒有類的實現 1.漏了 end 2.inte ce和 implementation巢狀 3.成員變數沒有寫在括號裡面 4.方法的宣告寫在了大括號裡面 5.成員變數不能在 中進行初始化 不能被直接拿出去訪問 6.方法不能當做函式一樣呼叫 7.oc方法只能宣告在 inte ce和 end之...