記憶體計算掘金社交網路

2021-05-27 20:14:52 字數 3560 閱讀 6821

本文**:

隨著社交網路的發展及普及,其擁有的海量資料的商業價值也日益被廣大企業所重視。記憶體計算是社交網路掘金海量資料的神兵利器。

社交網路的商業價值不僅體現在其龐大的使用者群,更大程度上在於其社會關係網路使用者群生產的海量資料。例如,facebook全球坐擁6億使用者,實時接收各種使用者自主提交的資料。這些使用者所提交的資料,組成了一張張真實的**,記錄了使用者的各種屬性以及他們的關係網路。

社交網路的資料為何如此被推崇?原因就在於社交網路讓資訊溝通的成本大大降低, 企業原本費盡心力也難以有效接觸到的目標消費群,如今借助社交網路就可以輕鬆觸及。可以說,哪個企業率先利用社交網路工具,就有可能在新形勢下獲得更多的商機,取得長久的競爭優勢。

社交網路上龐雜的資料不僅包括使用者的個人資訊、屬性,還包括互動資料,如參與的投票和測試、分享和查詢的內容等資訊。這些依據興趣細分的資訊,滲透到了網民日常生活的方方面面。這些看似雜亂無章的資訊其實正在悄悄地告訴企業——哪些使用者可能是其潛在的目標使用者群,這些群體有哪些特徵。如果企業獲得了這樣的資訊,便可以更精準地投放廣告,銷售自己的產品。

無論是facebook,zynga(社交遊戲公司)、color(移動網際網路社交應用),還是剛剛成功上市的linkedin,無一不是看準了社交的趨勢,繼而獲得市場青睞。通過社交網路,這些企業對使用者行為進行分析,揣摩使用者心理,然後適時地為某個獨特行為習慣的使用者群提供有針對性的服務,進而幫助企業找到並聚焦這些使用者。

這也是為什麼社交網路color的創始人bill nguyen 會這樣定義自己:「我們是一家資料探勘公司,而非**分享**。」他在創業之初就打定主意要好好利用智慧型手機上那些感測器所蒐集到的資料,並且開發一整套演算法技術。通過這些資料的計算,識別出使用者和哪些人在同乙個區域。通過這樣的資料積累,color試圖計算出使用者和他人的親疏遠近。就像在現實生活中,那個與使用者總在不同場合出現的人必定是他的熟人一樣。

在肯定了社交網路海量資料的價值之後,問題也隨之出現。這些由使用者隨意填寫和定義的資訊和資料依舊處於乙個散亂的狀態,如何將這些資料有效地進行系統化處理並且變現,就顯得尤為重要。一句在業界久為流傳的話,道明了社交網路目前所面臨的癥結所在:「資料本身並不會產生價值,資料經過分析以後才會產生價值。」

擁有大量豐富的資料只是企業走向成功的第一步。如何讓這些資料變成有效的、容易被抓取和利用的資料,才是企業實現社交網路商業價值中的關鍵環節。資料探勘透過資料模型來分析社交網路上儲存的大量資料,可以找出不同的客戶或市場劃分,分析出消費者喜好和行為,進而實現社交網路資料的商業價值。

舉個例子,谷歌通過資料探勘,大大增加了其廣告投放的針對性,從本質上來說,就是通過對大量資料的挖掘,對使用者消費模式或者行為模式產生了一種識別。把消費模式、行為模式識別出來之後,就能夠方便、直接地制定相應的市場策略和方向選擇。

由於經濟環境的瞬息萬變及社交網路資料量的不斷增加,能夠提供實時的資訊反饋顯得非常重要,這對傳統的資料探勘技術提出了新的要求及挑戰。

譬如,過去做資料探勘,受資料探勘工具的效能限制,一般會先對資料做預處理,即根據預定的資料探勘模型進行預處理,對可能要挖掘的資料切面,做過一些預處理之後,才能做資料展示。這就存在一定問題。如果預處理的資料是按照地區去處理或按照銷售的產品種類去彙總,未來顯示的資訊也就只能按照這種方式去展示。如要選擇按照其他彙總,則要重新花時間做預處理。換而言之,資料探勘需要很多時間去做資料準備,把預處理的結果儲存起來,才能給終端使用者做快速展示,用空間換取時間。此外,建模過程也是非常耗時,為了獲得最佳的**模型,對於每個業務新問題,都要重新探索資料的相關性,進行演算法引數的重新調整和配置,以得到優化的模型。

不難看出,傳統的資料探勘由於先期準備時間長,再加之對資料建模人員技術要求高,因此無法迅速處理當下瞬息萬變的資料,難以應對為解決企業決策者對資訊進行「實時」分析的強烈需求,更不用說去提供基於歷史資料的「實時」**來輔助決策。這時就需要一種新的方法和工具,要求能從快速變化、「實時」的資料中提取最直接的資訊,並能提供任意資料切面的分析。同時,決策者可以快速模擬未來市場情景,快速制訂最佳的行動方案以增加銷售利潤、解決客戶問題、降低風險,幫助企業更深入的分析市場、交易和運營資料。

記憶體計算技術隨之應運而生。

與傳統的資料探勘技術相比,記憶體計算則優勢明顯。記憶體計算充分發揮多核cpu的能力,可以對資料並行處理,並且記憶體讀取的速度也很快,再加上資料按照優化的列儲存方式存放在記憶體裡面。依託於以上特點,記憶體計算可以對大規模海量資料做實時的分析運算,而不需要事先建模和資料預處理。例如,想要以任何維度去分析資料,實時就可以建立模型,完成分析處理,對上億條資料可能僅需幾秒鐘就處理出來,處理速度非常快,故而可以快速嘗試任意資料模型,對多種未來情景進行模擬。

記憶體計算的「實時」性除了體現在對既有資料的分析處理更加迅速之外,更大的價值體現在如何在既有資料的基礎上做**。因為歷史資料只有乙個真相,而對未來的**可以有無限多的可能性。例如,根據現在社交網路上的資料,再加上一些假設條件,去做乙個**。但利用傳統技術做**,每一種可能性都需要大量的預處理時間,要對多種情景做出模擬,在時間上就不允許。記憶體計算「實時」的特性則能根據社交網路提供的海量資料,即時看到當前的客戶行為模式,進而在既有的海量資料下做出模擬**。使用者通過增加一些變數條件,展示可能會產生的情況,比較各種方案,從而採取相應的決策。例如,在市場活動中,使用者人群的特點,消費傾向等資料一定,若要增加他們的滿意度,是通過增加客戶關係投入效果好,還是通過降低產品**更有效?滿意度的增加會帶來什麼程度的收益?這樣的**性探索性的問題,都是記憶體計算「實時」分析擅長的內容。可以說,記憶體計算解決了企業決策者和一線職員對資訊進行「實時」分析的強烈需求,更提供基於歷史資料的「實時」**來輔助決策。

雖然社交網路憑藉其海量資料和社會關係網路被全球資本市場追捧,但不容迴避的是,社交網路至今還沒能找到乙個合理、高效的方式將這些資料的商業價值變成企業收入,即沒有很明確的盈利模式。不過,隨著記憶體計算技術的發展,這或將為社交網路提供乙個盈利的契機——記憶體計算可以快速地實時處理社交網路所掌握的資訊,在未來社交網路公司可以把有價值的資訊去售賣,或根據企業需求定製特定人群的資訊產品。

同時,未來記憶體計算可以與雲計算進行更多有益的結合,讓記憶體計算更容易發揮出應有的效用。因為記憶體計算往往需要很多的計算能力和計算資源,如果只是單憑乙個或兩個私人的企業去使用,不適合普遍化應用,也不經濟。記憶體計算作為乙個技術,可以被部署在「雲」上面,讓需要的使用者去租用。社交網路作為乙個很好的平台,除了提供交流和資訊**外,也部署在「雲」上面。社交網路中的某些資訊時刻都被處理和呼叫的需求產生,這時記憶體計算就提供了乙個可供計算的引擎。

此外,記憶體計算也並非孤立存在。要想將記憶體計算與社交網路完好的結合,建立記憶體計算的生態系統十分必要。記憶體計算給社交網路提供了新盈利方式的同時,也連同社交網路的資源一起,建立起乙個新型的生態系統。在這個生態系統中,有人專門負責運營社交網路,即擁有海量資料的一方;有人專門運營記憶體計算的資源,即處理海量資料的一方;而產生了價值資訊之後,通過不同的方式去進行商業售賣,即進行資訊**售賣的一方。無疑,各方都會在這一過程中獲得一定的盈利。普通使用者則可以通過產生的資訊,更方便地找到與他們志趣相投的人,或者更好地發展他們的個人網路,在社交網路上獲得更好的體驗。而這種使用者體驗,顯然是記憶體計算和社交網路所組成的生態系統所提供的。

總之,隨著社交網路的發展及普及,其擁有的海量資料的商業價值也日益被廣大企業所重視,記憶體計算是社交網路掘金海量資料的神兵利器。同時在未來,記憶體計算能給社交網路帶來兩點改變——首先,能夠幫助社交網路找到盈利模式;其次,記憶體計算和社交網路都部署在「雲」上,能給社交網路提供計算的引擎。可以**,記憶體計算未來將會在社交網路領域大放異彩。

(本文作者為sap中國研究院總裁)

社交網路度的計算

2 1 3 13 2 4 14 2 4 35 1 6 17 1 7 57 6 python filename r txt 自己的資料值的位址 mydict with open filename as f for line in f.readlines 一行一行去讀取list temp list li...

再看社交網路

社交網路領域的術語 圖譜 一種網狀結構,代表實體 興趣,人 和聯絡。實體就像頻率分量,聯絡就像相位和幅度。興趣圖譜 社交圖譜,從譜中濾出你關心的分量,進而建立聯絡 通訊 聚類 一種演算法,用來從社交網路 資料庫 中根據需求分類,便於提高搜尋的查全率。查全率 一次查詢中需要的和所有的之比 和查準率的關...

直播引爆社交熱 網際網路企業搶占掘金新藍海

和美食家體驗西雅圖的酒莊 與旅遊達人 暢遊 巴黎鐵塔 隨健身教練感受極限運動的刺激 不用親力親為,開啟社交軟體,移動直播就能給你相似的體驗。隨著技術普及和資費下降,越來越多的使用者 並參與直播,網際網路企業也將其視為掘金新藍海。國內社交平台陌陌 日發布資料稱,直播業務上線僅 個月,月度活躍使用者已經...