資料科學家的15項原則

2021-10-01 00:20:21 字數 1341 閱讀 7862

作為乙個資料科學家,我為我的日常工作總結開發出15項原則,這些是我本人也遵循的:

1、不要用資料說謊或吹牛: 對經驗性證據要誠實坦率。最重要的是不要用資料自欺欺人。

2、建立永久工具並分享給他人: 花費一些日常工作時間去建立一些能使自己和他人生活變得輕鬆的工具(譯者補充:我為人人,人人為我)。我們可是該死的人類,我們應該是工具的製造者!

4、提高你的技能: 學好一種語言,這樣你才能被稱為行家裡手。其他語言也要學到能與別人溝通。不要忘記,sql和英語很象,這個星球上每個白痴都能說,但你只有真正掌握它才可以寫出優美的詩篇。學習一種編譯性語言、一種解釋性語言,和r語言。或者只需要學習r!它是醜陋的,但它會給你乙個優勢。搞透matlab,你已經不再是沒畢業的學生了。學習unix,即使你平時使用windows,學習sed和grep等所有那些東西,你可以用bash和powershell做些奇妙的事情。如果你願意,也學學hadoop,但要知道它是乙個蹩腳的系統。

5、明白資料科學家有個生存意義 「踢人們屁股並讓他們震驚」: 每天做一件與此相關的事。(譯者注:kick ass在一般情況下指「很厲害;很拽」,但對於資料科學家來說,通常是用資料來揭示人們錯誤或具有危險性的行為,以此引起關注,所以用本意「踢屁股」反而比較合適)

6、通過向別人展示工作來經常挑戰自我:不要害怕一些惡棍會批評你的工作,粉碎他們。如果你想害怕蟑螂的話,那你就不要走路了!

7、不要吝惜知識,也不要害怕問問題: 有些人對他們的知識缺乏信心,不去分享它,原諒他們,但不要成為他們中的乙個。

8、先開發出一些思路,然後聽取別人的看法,利用他們關於這一領域所知道的知識,但不要讓你自己被其束縛: 如果他們真牛到可以用他們所知道的來解決問題,他們就不會來找你要解決方案了。

9、出去和人們在一起,與之交談,互通有無,他山之石可以攻玉。

10、為你溫和的**建立個令人印象深刻和互動性強的使用者介面: **是我們的語言(譯者注:但不是使用者的,所以……),讓你的**通過好的ui來閃耀光輝吧。

11、有效使用視覺化技術,避免難以理解的圖形: 視覺化的唯一用途是使資料易於理解而非令人困惑。

12、學習新技術,努力理解經典技術的原理。

13、多攬多做: 這就是天才工作的方式。不要害怕提出創造性的想法。你聽說過「低調說話,高調做事」?不要覺得這很華麗,這其實是無能鼠輩工作的方式,不要成為他們中的乙個。

14、保持創造力和關注: 你可以通過創造力和關注取得成功(咖啡因對這個有點幫助,但別過頭兒)。

15、積極起來,努力工作。如果有人想阻止你,只管碾碎他們。

來自:openresearch

譯者:machogyb, 趙亮-碧海情天, lwei

資料科學家的成長之路

背景 平凡之路 凡事預則立,不預則廢。結合國內外的行業現狀,和資料科學領域的培養模式,我把資料科學的學習過程分成以下四個級別 入門 初級 中級 高階。吃瓜群眾就是喜歡分級,哈哈哈 高階之上,我認為還有乙個級別 高階,強調跨學科的綜合能力,以及團隊協作能力。由於我不是科班出身,學得不夠系統,所以現在的...

資料科學家Docker入門指南

摘要 docker容器那麼強大?可以應用道資料科學領域?看來學習一下!docker容器是通過虛擬化開發和部署應用程式的一種越來越流行的方式,它對資料科學家有用嗎?當然,本指南就會向你介紹它的作用,並手把手教你快速入門。docker是一種越來越流行的,使在容器中開發 部署和執行應用程式變得更容易的工具...

資料科學家成搶手人才

對於乙個理應奇缺人才的領域,資料科學似乎在快速造就大批新專家。不久前,1600人出席了華盛頓大學 university of washington 機器學習教授卡洛斯 格斯特林 carlos guestrin 執掌的公司turi在舊金山主辦的一次資料科學峰會,表明資料科學引起的興趣是多麼的濃厚。格斯...