挖掘三度關係的設計

2021-08-14 08:28:49 字數 1253 閱讀 4918

背景介紹:公司是做b2b平台的,號稱要做第一家線上完成所有business業務的的b2b平台。公司產品的主要產品有路由引擎:負責單個業務例項的執行,由於開發初期,公司無法確認具體的業務流程及業務需求,因此開發出一套專門處理業務的路由引擎,將單個原子化的業務(例如:傳送採購訂單、支付請求等)設計為單個路由例項,每個路由例項執行在路由引擎中輔助處理各個業務。路由引負責例項的維護、監控、管理。資料維護引擎:負責將業務處理後的資料進行維護,過期的業務資料歸檔操作,無用的業務資料進行刪除。

需求:採購訂單表中是平台中發生過交易的訂單,訂單中有賣方和買方的資訊。為推進平台中的交易量和為使用者提供優質的服務,產品部門提出為採購方推送意向的**商。為此需要挖掘出三度關係中的意向**商推送給採購商。

設計設想:利用資料維護引擎對採購訂單表進行資料探勘,挖掘出已發生的具有直接關係的一度關係,定期對一度關係進行維護,當通過計算關係的強度來維護,當一度關係強度低於門檻值時捨棄。路由引擎對一度關係進行分析處理,為每乙個採購方挖掘出意向的三度關係,產生意向**商,以意向**商作為發起方、此採購方作為接收方生成產品目錄。由推送的路由去分發目錄。

挖掘一度關係非常簡單,相同發起方和接收方並且產品型別相同時,生成一條一度關係,如果一度關係已存在,計算關係的強度,低於門檻值則捨棄,否則將更新強度。

在分析一度關係時遇到了問題!

如示例圖中:要為買家c推送賣家b,為買家e推送賣家a。

一度關係表中有4條一度關係:a-c,a-d,b-d,b-e

一、先對一度關係進行分堆,便利一度關係列表,分別建立兩個map作為容器,分別存買家的所有賣家(sellermap:key是買家id,value是包含此買家的所有賣家的一度關係)和賣家的所有買家(buyermap:key是賣家id,value是包含此賣家所有買家的一度關係)。sellermap中既有,buyermap中既有

二、分堆完後,遍歷一度關係列表,來逐條挖掘分析,獲取此條一度關係的買方(a-c中的c),從sellermap中獲取包含此買方的所有賣方的一度關係(a-c),通過一度關係的賣方a到buyermap中獲取包含此賣家所有買家的一度關係(a-c,a-d),此時過濾掉a-c,從上一層獲取的一度關係中判斷是否包含,此時就得到二度關係c-d(他們有相同的賣家),通過d從sellermap中獲取包含此買家所有賣家的一度關係,得到(a-d,b-d)此時需要過濾掉a-d,從上一級所有買方一度關係列表中判斷是否包含,過濾後剩下b-d,此時將d替換為正在分析一度關係中的買方c,生成一條b-c的產品目錄。

百姓信任 陳玉信三度落淚

班子共商發展大計 崇尚這樣的 名利觀 自己留好名,百姓得大利 陳玉信獲得過很多榮譽,但他最看重的是1997年原郊區區委組織部發的乙個 優秀人民公僕 的獎牌,這是他當書記之後得到的第乙個榮譽。陳玉信說 每天上班前看看它,我就想今天應該做些什麼,才無愧於這個稱號。每天回家看到它,我就想今天做了些什麼,才...

統計學和資料探勘的關係

資料探勘和統計學是交集的關係,它們之間有很強的關係,但不是乙個涵蓋另乙個。統計學是從小樣本資料分析,推測總體的特徵。而資料探勘是從盡可能大的資料集上直接尋找特徵。應用方法上,資料探勘多用於主動式的發現,而統計學多用於被動式的驗證。從大量的商業專案實踐中,我們體會到資料探勘探索與統計學分析很多時候結果...

清晰度 解析度和銳度的關係

銳度是acutance,而不是sharpness,雖然兩個詞都是銳度的意思,但兩者表示的是不同的東西,sharpness其實指的是 的清晰度 acutance是指黑白色調的邊界的鋒利或銳利程度,即黑白邊界處的對比度。高acutance 的黑白邊界非常清晰,見下圖 銳度 邊界處影像資訊過渡的快慢 高銳...