資料分析 使用者關係 開篇

2021-09-21 16:52:01 字數 1551 閱讀 1898

最近突然對**的使用者關係感起了興趣。當然了,萬事萬物都是有原因的,只是有的是直接原因,有的是間接原因;有的原因很明顯,有的原因不明顯;有的原因很容易說清楚,有的原因說不明白。總之一句話,肯定是原因的。

引發這個系列話題的原因是,在我收到的人人或者是校內傳送的的推薦關注郵件中,或者是各大微博、sns社群中的推薦關注與推薦話題中,發現大多和我沒有關係,推薦的準確率不是很高,甚至可以說的比較低,更有甚者,還有一些毫無相關的人和內容推薦過來,我就不明白了,既然沒有就算了吧,為什麼非要有呢?

但是轉念一想,原因可能有以下幾點:

關於精準其實也是有爭議的,精準的標準是什麼?大家的理解又不一樣了。還有就是成本和產出比如何控制,想要精準也行,可是**當前可能沒有那麼多成本去做這件事,或者說做這件事的產出相對成本來說有點低,所以失去了做的意義。

當然了,有一些精準也確實在當前的條件下是不可能實現的。

這件事引發了這個系列,也引發了我對於資料分析的興趣,準確的說是資料分析中的使用者關係分析,也就是在大量資訊中發現使用者的相關性。

以前沒有做過資料分析的工作,技術的積累也不夠,但是感興趣之後,就開始關注這方面的資訊,技術,和文章,做了一些簡單的思考,得出了一些簡單的結論。從今天開始會和大家分享一下我的理解,肯定有不當的地方,或者是比較粗淺的地方,希望大家指出,或者給一些好的資源,也讓我進步進步。

使用者關係分析的好,有很多的應用場景。sns、微博可以做社會化推薦,電商可以做商品推薦,任何**都可以利用使用者關係來增加使用者的黏度,增加使用者的忠誠度,做大做強自己的**,提供更好、更合理的使用體驗,以便於更好的為使用者服務。

今天先說一些簡單的使用者相關性理論和如何確定使用者相關性?

使用者相關性,就是使用者關係的強弱,也可以量化為數值的形式。如果說0是無相關,10是相關性最高的話,1-3屬於若相關,4-7屬於中等相關,8-10屬於強相關。

那麼如何得出兩個使用者之間的相關性呢?最簡單的莫過於利用使用者的基本資訊,身高,體重,年齡,愛好等等結構化的資料對兩個使用者之間的相關性進行計算,得出結果。

舉例來說,使用者a的年齡是20,使用者b的年齡是20,在年齡這個維度上面他們的相關性就是10,當然了,這個10在最終的相關性結果中佔多大的比例,還需要為年齡維度設計乙個加權值,在綜合各維度的時候使用,不是簡單的加和平均。同樣是年齡,除了直接比較意外,還有一些是需要通過計算其他資訊的,例如使用者b沒有年齡,但是有小學畢業時間,根據這個時間也可以推算年齡,然後進入年齡維度的比較。

首先會設計很多的維度,每一種維度的權重以及加權值,然後通過採集使用者的資訊,進行分析計算。

在實際的應用中,結構化資料畢竟是有限的,很多資訊使用者會由於某些原因,不想填寫,大量資訊的空白,給結構化資料的分析帶來困難,強制填與不填之間,**也很會糾結一番。

常用的就包括map/reduce這種進來很流行的東西,在分析的過程中還可能會用到語義學的知識,甚至是心理學。

尤其是社會心理學,我認為會起到很重要的作用,而且我認為大多數的sns和微博在社會心理學方面的研究和應用做的都不太夠,深度不夠才導致推薦的結果差之千里。不過,想要應用的好,也需要下一番功力的,需要專業的知識,還需要將這些專業的知識轉化為技術。

今天就聊到這裡吧,在以後的日子裡,我會繼續好奇這方面的資訊,繼續和大家分享我的認識,希望大家踴躍拍磚!!!

Python大資料分析 開篇

python大資料分析 開篇 目前在網上看了很多部落格,都是一些關於資料處理的,且都淺嘗輒止,沒有形成乙個系列,只言片語,不能給人以更深層次的啟發。加之,最近在用python做金融大資料這塊的分析,故寫部落格以記之,以供他人閱,相互交流。大資料分析的意義,我自不用多述。眾多金融公司,無不在挖掘其價值...

資料分析 使用者行為分析

電商 使用者購物路徑如下 使用者行為 分析定義 對使用者購物路徑日誌資訊進行統計 分析,從中發現使用者訪問 的規律,並將這些規律與網路營銷策略等相結合,從而發現目前網路營銷活動中可能存在的問題,並為進一步修正或重新制定網路營銷策略提供依據。使用者行為分析目的 通過對使用者行為監測 獲得的資料進行分析...

使用者行為資料分析筆記

使用者行為資料分析 第一部分 量化成效 沒有 分析,運營很可能變得無頭蒼蠅一樣。基本指標 index是乙個單頁面指標,index衡量了乙個頁面的價值 在為提高使用者體驗 提高轉化率 優化 內容的時候,最先關注的總是 index最高的頁面。因為這些都是舉足輕重的頁面。為了理解網頁的重要性,考慮下列4個...