鏈家大資料使用到的機器學習演算法

2021-07-23 06:30:37 字數 391 閱讀 3133

摘自: infoq對鏈家網大資料架構師蔡**的訪談

infoq:房地產資料探勘會用到哪些演算法?

蔡**:房產領域的資料探勘用到的演算法和平常大家用到的演算法並不會有什麼類別的不同,只是資料探勘本身需要和業務緊密關聯,所以這些演算法在房產領域的使用細節上會有不同。

我們現如今已經使用的演算法包括了 gbdt、隨機森林、hedonic、神經網路、卷積神經網路、邏輯回歸、svm、hmm、itemcf、usercf、聚類演算法等。

gbdt、隨機森林、hedonic、神經網路是我們在估價中使用的。卷積神經網路是我們在戶型圖識別中使用的, 邏輯回歸、svm則是在使用者畫像中判別同一使用者、和判別使用者是否是買家還是賣家使用。hmm是我們用來描述使用者買賣行為階段的演算法。 聚類則是用在相似的樓盤識別,也用在了**推薦和小區推薦當中。

大資料 機器學習 演算法概論

演算法概述演算法是電腦科學領域最重要的基石之一,計算機語言和開發平台日新月異,但萬變不離其宗的是那些演算法和理論,資料結構和演算法是軟體開發必備的核心基礎,是內功心法。下面舉例拿推薦演算法和分類演算法的實際場景做下舉例 再有就是應用內的推薦 可以看出手機購物時,當我們搜尋某家商店的某件商品時。系統會...

大資料時代的機器學習

張長水 大資料時代的機器學習 vs 傳統機器學習 從機器學習角度看,大資料 指的是資料量大,資料本身不夠精確。資料混雜,資料自然產生。機器學習對大資料的處理的兩個挑戰 大資料時代給機器學習帶來新的機遇 於劍 從認知角度看待大資料 該報告從認知角度分析資料與知識的聯絡。眼下機器學習的知識主要是概念,傳...

機器學習演算法中用到的R新增包

r的好多功能是通過r新增包實現的,以下幾種演算法就用到了r的新增包 1.k 鄰近演算法 r語言裡的kknn包可以實現k 鄰近演算法 使用kknn函式。2.決策樹演算法 要實現c4.5演算法,r提供了乙個程式包rweka,裡面的j48函式可以實現決策樹的構建,至於cart演算法,r中的tree包提供函...