「大數」據真的那麼必要麼

2021-08-14 14:26:54 字數 1471 閱讀 3165

「大資料」這個詞這幾年火的不得了。各種企業都宣稱自己掌握著大量的資料,好像有了大資料,就能解決一切問題一樣。

然而現實情況時,很多時候我們對資料的痴迷,卻將我們引上了歧途。是的,在一些情況下,要想從資料中萃取有用的東西,我們的確需要大量的這類資料,然而對於創新者來說,資料的數量和規模並不是最關鍵的因素——正確性才是最重要的東西。

資料正確性無關大小

在談到大資料的作用的時候,我們總是拿uber來舉例,他們好像是用大資料獲得成功的最典型的例子。毫無疑問,uber從資料中獲得了財富。依靠他們的應用,uber從司機和乘客那裡獲得了實時的資料,讓他們能夠知道何時、何處人們對車輛有著較高的需求。

但是uber的成功,依靠的並不是他們所收集的大資料。如果你仔細分析一下,就會發現,他們的成功依靠的是規模並不大的正確的資料——車輛派遣資料。

在可以用手機叫車以前,我們依靠的是傳統的計程車。雖然傳統計程車看上去與網際網路沒有什麼關係,但是其實它們才是一種依靠大資料的東西。原因是,傳統計程車依賴的是「人眼網路」:無數人站在城市中的某乙個點,在看到計程車後馬上招手。雖然貌似與資訊科技無關,但是實際上人們在打車的過程中,同樣使用了計算——人腦的計算:我們在大腦中收集並且分析資料。

uber提出了乙個更好的解決方案,人們不再需要自己跑到街上去用眼睛收集資料,不用再用大腦去處理資料,轉而開始讓uber為我們提供正確的資料來完成打車任務。城市中誰需要打車?他在**?離他最近的車在**?需要多長時間能接到乘客?正是憑藉這些正確的資料,uber才得以成功的在計程車行業內掀起了革命。

用正確的資料完成任務

有的時候,正確的資料規模很大;也有的時候,正確的資料規模很小。對於創新者來說,關鍵在於分析出那些資料對我們來說最有幫助。要想找到正確的資料,我建議你去思考下面三個問題。

問題1:哪些因素會浪費公司的資源?大多數企業都會在日常運營中浪費許多資源。用鮮花零售業務來舉例,大多數花店中50%的庫存都會被最終浪費掉。因此urbanstems和bouqs這樣的鮮花配送服務應運而生,他們的作用就在於利用正確的資料幫助花店減少浪費。

無論你是工業生產、零售還是法務調查公司,搞清楚哪些因素會浪費你的資源,都能夠幫你找到正確的資料。

問題2:如何利用自動化來減少浪費?在確定哪些因素會造成資源浪費之後,下一步就是要減少浪費。人類的優勢,在於分析問題。但是在實施方面,尤其是大量計算方面,計算機有著人類難以比擬的能力。在當今這個計算能力**的時代,我們應該利用自動化技術來解決問題。

例如,有訊息稱亞馬遜正在計畫刪除大量定價團隊,讓演算法來給產品進行定價。在很多零售商看來,這是乙個不可思議的行為。但是如果亞馬遜的演算法能夠勝任定價工作,它將能夠亞馬遜帶來巨大的好處,例如減少積壓庫存。

問題3:針對問題1和2,你需要哪些資料?最後一步,就是確定你需要哪些資料才能減少浪費,並且完成自動化。

還是用uber來舉例,他們需要知道潛在乘客的具體位置,才能完成自動化司機指派工作,從而減少浪費(車輛閒置、乘客司機在街上打車)。

這就是你所需要的正確的資料。很多企業都在花費大量的時間去研究大資料,但是卻沒有花足夠的時間去考慮哪些資料才是真正有用的資料。

興趣真的那麼重要麼?

經常有人說他對自己所目前所做的事情沒興趣,或者對自己的專業不感興趣,而他真正感興趣的是某某事情,某某專業。正如我們經常看到的那樣,這些人往往不快樂。因為它們 覺得 自己在做自己不喜歡的事情。然而,真的是他們以為的那樣嗎?不客氣的說,99 的情況並非如此。首先,這些人並不是對正在做的事情沒有興趣,而是...

資料結構與演算法真的那麼重要麼?

很多同學對資料結構與演算法的第一印象,可能是覺得它複雜 深奧 難以理解。之所以會有這種觀念,我認為主要是因為沒有找到適合自己的學習方法及學習資料。其實學習任何知識點,只要找到對的學習方法和學習資料,都能做到攻克難點,牢牢掌握。另外,同學們可能還有乙個疑問 在平時的開發工作中,乙個產品,從開發到上線,...

你寫的Try Catch真的有必要麼?

很多人喜歡用try.catch把每乙個方法都包裹起來,可是真的有必要麼?為什麼要這樣做?我估計是大家被bug嚇怕了,生怕生產環境出現各種莫名其妙的錯誤,比如最經典的nullreferenceexception,可問題是你用try.catch包裹起來後錯誤是不會爆出來了,但是執行結果是你想要的麼?恐怕...