數倉 使用者畫像

2021-10-25 22:18:18 字數 3411 閱讀 5498

在數倉開發中,主要目的就是2個,乙個是基於現有資料提煉出規律和資訊,乙個是基於現有資料訓練模型,然後**未來的資料。

使用者畫像屬於前者,但由於畫像的特殊性,如果乙個人的畫像標籤較多,較完善,其實可以一定程度**其未來行為規律。

具體可以看《夏洛克》中的心理側寫,就是一樣的道理,乙個人有哪些特質,喜愛,偏好,憎惡等等,就可以一定程度**這個人在某個場景下的行為規律。

使用者畫像中,需要使用標籤來給使用者打標籤,如果需要完整畫像,還需要有模型來給各個標籤一定權重,一定的演算法。

標籤可以分為事實標籤和模型標籤,事實標籤一般從業務資料和行為日誌資料中通過資料處理分析可以提取出來,模型標籤則需要利用到演算法來提取。

對於乙個業務來說,如何能夠更好了解客戶,分析使用者特徵,得到使用者的特點。這樣就可以基於這些特點,對使用者進行畫像,類似心理學的側寫

了解客戶之後,就可以針對性做運營**等操作,這也是這幾年的精準營銷,精準廣告的基礎。將合適的內容推送給合適的使用者,這樣可以更加有效地提公升營業額,提公升效益成本地比例。

畫像最重要就是得到使用者標籤,而這些標籤可以分為幾類

模型標籤,顧名思義,使用到了演算法和機器學習等技術,通過使用者舊地資料,訓練出地演算法模型,評估**使用者的屬性。

如使用者性別,使用者流式風險,使用者質量等級等等標籤

這種一般是人為定義,手動對使用者做標籤。

注意,所有的使用者標籤,最終都是為運營和業務服務的,知道使用者是什麼樣的人,然後針對性做**,折扣,積分等等活動來挽留使用者,提公升使用者活躍度,刺激使用者消費等等業務目標

技術,資料底層還是以hdfs,hive,flume,sqoop,azkaban,atlas等框架搭建起來。演算法模型以spark的mllib機器學習模組為主

注意,這裡涉及到對外的資料服務,考慮到外部資料使用,資料量少一般將這些結果資料存入mysql,資料量大,可以存入hbase種。也可以存入hdfs但結合計算引擎如impala和presto。具體看業務場景

注意,olap場景下,還可以使用clickhouse,上述的解決方案包括clickhouse都是可以提供秒級別的業務訪問的,但適用場景不同。

clickhosue因為本身可以搭建集群,儲存日誌資料,儲存結構化資料,但不適合做多表之間join,所以一般提前join好資料,查詢大寬表是clickhouse擅長之事

資料存入hdfs,結合impala或者presto,這樣解決了資料儲存和查詢,並且因為impala和presto都是記憶體計算引擎,速度很快,也是很不錯選擇。

資料存入hbase,直接適用olap進行簡單維度查詢,也是很不錯的選擇。但注意,hbase雖然查詢速度快,但本身不支援sql,同時由於技術本身原因,乙個表不支援多個維度的資料綜合查詢,如果有很多維度需要綜合查詢,一般是建立多個不同主要為度的**。

使用者畫像並不是每個業務都需要的,一般用於推薦系統,營銷系統,olap資料分析等場景。

簡而言之,就是使用者畫像適合需要精細化對使用者做區分處理的業務場景。如精細化運營中的針對營銷,廣告投放中的精準投放,使用者智慧型推薦(千人千面)等場景

使用者基本屬性表

可以看到,這些資訊基本從使用者註冊資訊表中就可以獲取。但也需要注意,由於使用者有意無意,生日,性別等很多時候並不算很精準。

同時,由於業務原因,很多時候身份證(實名認證),**,收貨位址會相對真實很多。

所以,大資料處理中,使用者的真實性別,業務性別很多時候需要專門去分析和提取。

真實性別,顧名思義;業務性別,這是因為使用者在業務流程中表現出來的性別傾向,不一定是真實地。如老婆更多購買給老公地男性用品;男生一直給物件購買女性用品都可能存在。得到這些資訊後,相應地產品推薦,廣告投放,營銷活動等都需要做適當地調整。

使用者活躍表

使用者年齡段標籤,這個有時候直接從使用者資訊表提取,有時候單獨計算處理。(如果使用者填寫地生日不是真實地,就需要單獨提取)

使用者互動行為標籤

使用者消費歷史標籤

消費能力是所有業務都很看重的,但現實一般很少有使用者消費能力高而且消費頻次也高。

所以消費能力一般是區分高消費,中等,低消費能力。但注意,消費能力和消費頻次並不是正相關的,而且不同品類,不用使用者差異性較大。甚至同一使用者不同品類差異性也很大,這時候就需要針對性做標籤和資料處理了。、

使用者消費畫像標籤

可以看出,上述是乙個綜合性的標籤表

這些標籤基本都可以從使用者行為資料,業務資料中提取。同時適用一些模型,可以算出使用者的消費偏好,消費能力,消費活躍度等情況。

注意,所謂的模型其實就是給使用者在各個方面打分,類似如下的五角星圖,不過使用者標籤往往會很多,甚至複雜的多大上百個

使用者退貨換貨標籤

顧名思義,這個標籤的使用者是所有業務都希望避免,但也需要額外關注的。

如果是平台型公司,退換貨過多,就需要加強商家的審核與管控,並研究使用者退換貨的原因了。

從個人經歷來說,退換貨很多時候可以通過商家管理來降低比例,如尺寸問題引發的退換貨,顏色,色差,質量問題等等。

使用者購物偏好畫像標籤

這其實是使用者喜好的另外一種表現。但從實際開發經驗來說,如果可以結合相同使用者群喜好產品,關聯產品做推薦和廣告等,業務上可能會有意料之外的提公升。

商品品類和類目是需要不斷提公升的

使用者畫像 如何構建使用者畫像

1 使用者畫像是什麼 what 2 為什麼要構建使用者畫像 why 3 如何構建使用者畫像 how 下文將會對這三部分內容做詳細介紹。1 什麼是使用者畫像 使用者畫像是一種用來描述產品目標使用者特徵的使用者研究方法,在實際操作的過程中往往會以最為淺顯和貼近生活的標籤將使用者的屬性 行為與需求聯絡起來...

使用者畫像 使用者畫像之新使用者分類

使用者畫像的簡單介紹 使用者畫像是一種勾畫目標使用者 聯絡使用者訴求與設計方向的有效工具,利用使用者的基本屬性,訪問特徵,交易特徵,社交特徵及風險特徵等組合的資訊形成一些列的使用者標籤組合稱之為使用者畫像。構建使用者畫像的目的 使用者運營 活動運營過程中,制定策略,對使用者精準投放策略,促使平台引流...

展示 使用者畫像 使用者畫像系統搭建思路

本篇文章主要講解精細化運營中不可或缺的核心功能 使用者畫像系統,並將介紹如何從 0 到 1 的進行系統的搭建,思路和功能點的設計。當我們通過資料分析,得到了資訊和知識後,最後都是需要落地的,這個落地的操作可能是我們改進了自己的產品,也可能是我們在運營中優化了策略 從目標上劃分,資料分析又可以分為三類...