大資料服務,至少有四點還值得存疑

2021-09-23 12:03:38 字數 1644 閱讀 9762

大資料時代的到來並不是很突然,但是卻讓人措手不及。不少企業完全沒有做好準備,就已經進入了乙個所謂的「資料操控一切」的時期。他們有過恐慌、畏懼,甚至在一些企業的宣傳中認為沒有跟上大資料的腳步,結果就只有淘汰。可事實真的如此嗎?筆者認為,大資料服務,至少有四點還值得存疑。

大資料服務,至少有四點還值得存疑

資料採集

誠然,在網際網路企業中,客戶終端和網頁的資料十分重要。這些資料在確實可以通過資料庫來準確獲得,但是大資料的特點就是大。一旦遇到客戶峰值,如雙十一或者春運等,資料採集併發數極高,使用者操作和訪問同時進行,這就需要大量的資料庫才有可能支撐,那麼這些資源從何而來?資料庫之間的負載均衡如何實現?

其次,資料採集的難題在其他行業中會變的更難。物聯網落地至今尚未獲得大規模成功,所謂的工業4.0目前依然只是我們想象出來的烏托邦,資料如何採集?採集到的資料如何確保正確性?

再者,涉及到人的服務行業中,資料往往與隱私並存。使用者的資料是在變動的,大資料分析所需的資料卻是越多越準的。要確認使用者的資料正確性,提高資料分析正確性,則很容易事實上形成對人隱私的侵犯,大資料會不會成為作惡的表現?

資料保值

資料採集的困境和難題可以突破,也確實有一部分公司成功突破。但是,資料採集後的保值問題卻成為了更大的難關。

大資料公司偏愛這樣宣傳「資料是企業最大的財富」,可是企業卻很少有能成功使用的。所以現在的企業普遍多了乙個愛好——囤資料。那麼,資料儲存的成本從何而來?隨著360個人雲盤的倒下,資料儲存的成本之高已經超出了很多人的想象,這筆投資真的物有所值?

更可怕的是,由於社會和環境的改變,普遍來講資料的保質期只有3個月。當資料超過3個月後,其有價值的部分將只剩下10%。也就是說,費勁千辛萬苦所採集到的資料將有90%會被淘汰,那麼這部分資料要如何甄別?過期的資料真實性要如何判斷?資料本身出了問題,分析又如何談正確性?

資料處理

大資料的大,在於非結構化資料占用空間較多。可是,非結構資料主導時代是無可爭議的事實。非結構化資料的價值能為企業所用的有多少呢?企業又能用的了多少呢?

在網際網路企業資料庫中往往能夠得到結構化資料,這部分資料占用空間較小,分析容易,價值較高,因此也得到了使用者的青睞。但是,結構化資料存在著其最大的弱點,不易轉化。結構化資料的這一特點反而成了一種限制,在未來的發展中很可能會不如非結構化資料。

非結構化資料在大多數行業中都是主流存在,但是其處理難度要比結構化資料高太多。非結構化資料在處理的過程中,分類、檢索、處理等方法多種多樣,而且,包含資訊量巨大,不同方式處理的結果很可能存在較大差異,因此價值雖高,但正確性都可能存疑,那麼其產生的價值究竟能有多大呢?

資料應用

大資料經過多層包裝處理最終可以得出很多結果,但是資料結果的應用卻是個值得商榷的存在。

一般來講,大資料分析的結果經過視覺化等處理之後可以有乙個比較直觀的呈現。可是,資料的使用卻往往是企業高層決策者的專利。而佔據了公司絕對主體的企業員工卻很少能夠直接獲取大資料創造的價值。而如果開放資料給全體企業員工,那麼資料安全該如何保障呢?

而從成本角度來看,企業百尺竿頭更進一步誠然可貴,可是如果大資料分析結果只是一種企業決策者的靈光一現,那麼這筆投資真的能比高層培訓更有價值嗎?對於中小型企業來講,大資料投資的意義又在**呢?所謂的知己知彼又是否真的能讓企業百戰百勝呢?

結束語中國在大資料方面的發展形勢十分樂觀,但是對於企業來講,每一筆投資都應當讓他有所價值。資料的價值呈現可以有很多種,那麼大資料是否真的像部分廠商所宣傳的那樣「資料操控一切」呢?

使得閉區間內找至少有一點

描述 上數學課時,老師給了 lyh一些閉區間,讓他取盡量少的點,使得每個閉區間內至少有乙個點。但是這幾天 lyh太忙了,你們幫幫他嗎?輸入 多組測試資料。每組資料先輸入乙個n,表示有n個閉區間 n 100 接下來n行,每行輸入兩個數a,b 0 a b 100 表示區間的兩個端點。輸出輸出乙個整數,表...

Java演算法題,列印平行四邊形,至少有四五個坑

懶得寫解題思路了。直接上 public class test1 int max 0 用來存放一列最大的數字,計算該列應佔多寬 max array size 1 0 strwidth size max length 從中心列開始往兩邊計算 for int k 1 k size k max array ...

在系統啟動時,至少有乙個服務或驅動程式產生錯誤解決

server2003 xp 2000 每次彈出服務控制管理器系統啟動時至少有乙個服務或驅動程式產生錯誤解決方法把以下登錄檔用記事本編輯,儲存為 reg 直接點選匯入即可 windows registry editor version 5.00 hkey local machine system cu...