基於大資料的使用者畫像構建(理論篇)

2021-08-17 08:16:43 字數 2299 閱讀 9769

alan cooper (互動設計之父)最早提出了 persona 的概念:「personas are a concrete representation of target users.」persona 是真實使用者的虛擬代表,是建立在一系列真實資料(marketing data,usability data)之上的目標使用者模型。

簡而言之,使用者畫像是根據使用者社會屬性、生活習慣和消費行為等資訊而抽象出的乙個標籤化的使用者模型。構建使用者畫像的核心工作即是給使用者貼「標籤」,而標籤是通過對使用者資訊分析而來的高度精煉的特徵標識。

舉例來說,如果你經常購買一些玩偶玩具,那麼電商**即可根據玩具購買的情況替你打上標籤「有孩子」,甚至還可以判斷出你孩子大概的年齡,貼上「有 5-10 歲的孩子」這樣更為具體的標籤,而這些所有給你貼的標籤統在一次,就成了你的使用者畫像,因此,也可以說使用者畫像就是判斷乙個人是什麼樣的人。

除去「標籤化」,使用者畫像還具有的特點是「低交叉率」,當兩組畫像除了權重較小的標籤外其餘標籤幾乎一致,那就可以將二者合併,弱化低權重標籤的差異。

羅振宇在《時間的朋友》跨年演講上舉了這樣乙個例子:當乙個壞商家掌握了你的購買資料,他就可以根據你平常購買商品的偏好來決定是給你發**還是假貨以提高利潤。且不說是否存在這情況,但這也說明了利用使用者畫像可以做到「精準銷售」,當然了,這是極其錯誤的用法。

其作用大體不離以下幾個方面:

1. 精準營銷,分析產品潛在使用者,針對特定群體利用簡訊郵件等方式進行營銷;

2. 使用者統計,比如中國大學購買書籍人數 top10,全國分城市奶爸指數;

3. 資料探勘,構建智慧型推薦系統,利用關聯規則計算,喜歡紅酒的人通常喜歡什麼運動品牌,利用聚類演算法分析,喜歡紅酒的人年齡段分布情況;

4. 進行效果評估,完善產品運營,提公升服務質量,其實這也就相當於市場調研、使用者調研,迅速下定位服務群體,提供高水平的服務;

5. 對服務或產品進行私人定製,即個性化的服務某類群體甚至每一位使用者(個人認為這是目前的發展趨勢,未來的消費主流)。比如,某公司想推出一款面向 5-10 歲兒童的玩具,通過使用者畫像進行分析,發現形象=「喜羊羊」、**區間=「中等」的偏好比重最大,那麼就給新產品提供類非常客觀有效的決策依據。

6. 業務經營分析以及競爭分析,影響企業發展戰略。

當然,收集到的資料不會是 100% 準確的,都具有不確定性,這就需要在後面的階段中建模來再判斷,比如某使用者在性別一欄填的男,但通過其行為偏好可判斷其性別為「女」的概率為 80%。

還得一提的是,儲存使用者行為資料時最好同時儲存下發生該行為的場景,以便更好地進行資料分析。

該階段是對上階段收集到資料的處理,進行行為建模,以抽象出使用者的標籤,這個階段注重的應是大概率事件,通過數學演算法模型盡可能地排除使用者的偶然行為。

這時也要用到機器學習,對使用者的行為、偏好進行猜測,好比乙個 y=kx+b 的演算法,x 代表已知資訊,y 是使用者偏好,通過不斷的精確 k 和 b 來精確 y。

在這個階段,需要用到很多模型來給使用者貼標籤。

使用者汽車模型

根據使用者對「汽車」話題的關注或購買相關產品的情況來判斷使用者是否有車、是否準備買車

使用者忠誠度模型

通過判斷+聚類演算法判斷使用者的忠誠度

身高體型模型

根據使用者購買服裝鞋帽等用品判斷

文藝青年模型

判斷使用者對於**的價值,對於提高使用者留存率非常有用(電商**一般使用 rfm 實現)

還有消費能力、違約概率、流失概率等等諸多模型。

該階段可以說是二階段的乙個深入,要把使用者的基本屬性(年齡、性別、地域)、購買能力、行為特徵、興趣愛好、心理特徵、社交網路大致地標籤化。

為什麼說是基本成型?因為使用者畫像永遠也無法 100% 地描述乙個人,只能做到不斷地去逼近乙個人,因此,使用者畫像既應根據變化的基礎資料不斷修正,又要根據已知資料來抽象出新的標籤使使用者畫像越來越立體。

關於「標籤化」,一般採用多級標籤、多級分類,比如第一級標籤是基本資訊(姓名、性別),第二級是消費習慣、使用者行為;第一級分類有人口屬性,人口屬性又有基本資訊、地理位置等二級分類,地理位置又分工作位址和家庭位址的**分類。

這是把使用者畫像真正利用起來的一步,在此步驟中一般是針對群體的分析,比如可以根據使用者價值來細分出核心使用者、評估某一群體的潛在價值空間,以作出針對性的運營。

如圖:

大資料中的使用者畫像 persona

摘要 使用者畫像 persona 的概念最早由互動設計之父alan cooper提出 personas are a concrete representation of target users.是指真實使用者的虛擬代表,是建立在一系列屬性資料之上的目標使用者模型。隨著網際網路的發展,現在我們說的使...

資料應用案例 基於使用者畫像的騰訊大資料防刷架構

1.羊毛黨角色 1 軟體製作團夥 開發黑產工具,如註冊自動機 刷單自動機等 2 簡訊代接平台 實現簡訊的自動接髮 3 賬號 團夥 養各類賬號,通過轉賣賬號獲利 4 刷單團夥 到各平台刷單,獲取優惠,然後通過第三方平台 優惠套現 2.對抗刷單的三個主要環節 1 註冊環節 識別虛假註冊的賬號 2 登入環...

什麼叫大資料人物畫像 大資料時代使用者畫像有什麼作用

簡單來說,使用者畫像就是把使用者的資訊進行標籤化,從而提供給企業和公司。在當下這個大資料時代,各個企業公司早就把使用者畫像,作為重要的經營戰略調整依據。因此,使用者畫像在電商中的價值和作用不言而喻。下面就為大家著重講講使用者畫像的定義 作用和價值。什麼是使用者畫像?使用者畫像也叫使用者資訊標籤化 客...