如何系統地學習資料探勘?

2021-07-04 16:04:04 字數 1926 閱讀 2762

磨刀不誤砍柴工。在學習資料探勘之前應該明白幾點:

如果你閱讀了以上內容覺得可以接受,那麼繼續往下看。

學習一門技術要和行業靠攏,沒有行業背景的技術如空中樓閣。

技術尤其是計算機領域的技術發展是寬泛且快速更替的(十年前做網頁設計都能成立公司),一般人沒有這個精力和時間全方位的掌握所有技術細節。但是技術在結合行業之後就能夠獨當一面了,一方面有利於抓住使用者痛點和剛性需求,另一方面能夠累計行業經驗,使用網際網路思維跨界讓你更容易取得成功。不要在學習技術時想要面面俱到,這樣會失去你的核心競爭力。 

一、目前國內的資料探勘人員工作領域大致可分為三類。

二、說說各工作領域需要掌握的技能。 

(1).資料分析師

(2).資料探勘工程師

(3).科學研究方向

三、以下是通訊行業資料探勘工程師的工作感受。

真正從資料探勘專案實踐的角度講,溝通能力對挖掘的興趣愛好是最重要的,有了愛好才可以願意鑽研,有了不錯的溝通能力,才可以正確理解業務問題,才能正確把業務問題轉化成挖掘問題,才可以在相關不同專業人才之間清楚表達你的意圖和想法,取得他們的理解和支援。所以我認為溝通能力和興趣愛好是個人的資料探勘的核心競爭力,是很難學到的;而其他的相關專業知識誰都可以學,算不上個人發展的核心競爭力。

說到這裡可能很多資料倉儲專家、程式設計師、統計師等等都要扔磚頭了,對不起,我沒有別的意思,你們的專業對於資料探勘都很重要,大家本來就是乙個整體的,但是作為單獨乙個個體的人來說,精力有限,時間有限,不可能這些領域都能掌握,在這種情況下,選擇最重要的核心,我想應該是資料探勘技能和相關業務能力吧(從另外的乙個極端的例子,我們可以看, 比如乙個迷你型的挖掘專案,乙個懂得市場營銷和資料探勘技能的人應該可以勝任。這其中他雖然不懂資料倉儲,但是簡單的excel就足以勝任高打6萬個樣本的資料處理;他雖然不懂專業的展示展現技能,但是只要他自己看的懂就行了,這就無需什麼展示展現;前面說過,統計技能是應該掌握的,這對乙個人的迷你專案很重要;他雖然不懂程式設計,但是專業挖掘工具和挖掘技能足夠讓他操練的;這樣在迷你專案中,乙個懂得挖掘技能和市場營銷業務能力的人就可以圓滿完成了,甚至在乙個資料來源中根據業務需求可以無窮無盡的挖掘不同的專案思路,試問就是這個迷你專案,單純的乙個資料倉儲專家、單純的乙個程式設計師、單純的乙個展示展現技師、甚至單純的乙個挖掘技術專家,都是無法勝任的)。這從另乙個方面也說明了為什麼溝通能力的重要,這些個完全不同的專業領域,想要有效有機地整合在一起進行資料探勘專案實踐,你說沒有好的溝通能力行嗎?

資料探勘能力只能在專案實踐的熔爐中提公升、昇華,所以跟著專案學挖掘是最有效的捷徑。國外學習挖掘的人都是一開始跟著老闆做專案,剛開始不懂不要緊,越不懂越知道應該學什麼,才能學得越快越有效果。我不知道國內的資料探勘學生是怎樣學的,但是從網上的一些論壇看,很多都是紙上談兵,這樣很浪費時間,很沒有效率。

另外現在國內關於資料探勘的概念都很混亂,很多bi只是侷限在報表的展示和簡單的統計分析,卻也號稱是資料探勘;另一方面,國內真正規模化實施資料探勘的行業是屈指可數(銀行、保險公司、移動通訊),其他行業的應用就只能算是小規模的,比如很多大學都有些相關的挖掘課題、挖掘專案,但都比較分散,而且都是處於摸索階段,但是我相信資料探勘在中國一定是好的前景,因為這是歷史發展的必然。

講到移動方面的實踐案例,如果你是來自

電腦上門維修

至於移動通訊的具體的資料探勘的應用,那太多了,比如不同話費**的制訂、客戶流失模型、不同服務交叉銷售模型、不同客戶對優惠的彈性分析、客戶群體細分模型、不同客戶生命週期模型、渠道選擇模型、惡意欺詐預警模型,太多了,記住,從客戶的需求出發,從實踐中的問題出發,移動中可以發現太多的挖掘專案。最後告訴你乙個秘密,當你資料探勘能力提公升到一定程度時,你會發現無論什麼行業,其實資料探勘的應用有大部分是重合的相似的,這樣你會覺得更輕鬆。

四、成為一名資料科學家需要掌握的技能圖。

(原文:

data science: how do i become a data scientist?

)人一能之,己十之;人十能之,己千之。果能此道矣,雖愚,必明;雖柔,必強。

與君共勉。

如何系統地學習資料探勘?

看資料探勘方面的演算法理論時經常感覺一些公式的推導過程如天書一般,例如看svm的數學證明,em演算法.感覺知識跳躍比較大,那麼資料探勘系統的學習過程是怎麼樣?磨刀不誤砍柴工。在學習資料探勘之前應該明白幾點 如果你閱讀了以上內容覺得可以接受,那麼繼續往下看。學習一門技術要和行業靠攏,沒有行業背景的技術...

如何有系統地學習Python爬蟲?

近年來,大資料成為業界與學術界最火熱的話題之一,資料已經成為每個公司極為重要的資產。網際網路大量的公開資料為個人和公司提供了以往想象不到的可以獲取的資料量。而掌握網路爬蟲技術可以幫助你獲取這些有用的公開資料集。我是從商科自學轉到資料科學的,因此程式設計和資料探勘能力都是上網自學的。在這個過程中,我深...

如何快速地學習

如何進行快速學習?因為工作關係,經常需要快速學習一些新東西,每到這個時候,就會想 如何才能快速的學習新東西,如何能快速的掌握新知識和新技能呢?關於如何進行快速學習,每個人應該有自己的學習經驗和技巧。這裡列出來我總結的一些經驗和技巧,以拋磚引玉。給自己找乙個師傅 一般的新東西,對你而言是新的東西,總會...