資料科學的未來

from: kirk borne

資料科學的發展日新月異，正深入我們生活的方方面面。資料科學改變了我們探索世界，與世界互動的方式，而且資料科學的演算法和應用也在持續發展。我們期待這一趨勢繼續，因為資料科學對人類產生了日益深刻的影響。在這裡我們描述的是資料科學領域中我們參與的未來幾年即將出現的一些趨勢與應用。

資料科學演算法的進步可以追蹤那些資料科學家所使用的用來表示他們研究領域的資料結構和資料模型的發展。可以反映這種聯絡的乙個最明顯的例子是部署在圖形資料庫（包含網路資料和語義聯絡的資料庫）中的大規模圖分析演算法的應用。人們有時候說，「整個世界是乙個圖」，因此最自然的資料結構不是由行列構成的表，而是由點和邊構成的網路圖。圖形分析方法包括了傳統的機器學習方法。

另乙個資料科學演算法增長的領域是地理空間時間**分析，能夠應用在任何涉及空間位置和時間的資料集，而這包括了我們生活的一切。我們希望在法律執行、氣候變化、災難控制、人口健康，社會變遷等更多領域越來越多地進行這一方法的高階部署。

很明顯，更大更快更複雜的資料集需要更快（超快）的分析。我們期盼著利用先進技術優勢如量子機器學習、記憶體資料運算和基於專門裝置（gpu等）的機器學習等的先進資料科學演算法出現。在這些商業裝置中，我們希望開發更多的嵌入式機器學習演算法（尤其是深度學習），在資料收集時刻能夠執行時間要求嚴格的資料到洞察的轉換。隨著物聯網（iot）的出現，包括工業物聯網和一切網際網路，這一應用場景將會極大豐富。

認知機器學習也取得了新進展，包括開源和開發可配置演算法，能夠用來探索流式實時資料的全部內容，上下文和語義意義。使用360度情景的能力使其在正確的時間，正確的地點，正確的語境下做出正確的行動-這是認知分析的本質。另乙個考察認知分析的方式是，針對某乙個物件或種群，演算法能夠找到你應該問你的資料的正確的問題（這可能不是以傳統的方式問的問題）。

資料科學發展的另乙個領域，跟特定的資料型別有關的，是非結構化資料，尤其是文字。這種非結構化資料的增長是驚人的，因為在自然語言中有著比**中數字更多的含義，所以需要比數值型演算法更豐富的演算法。面向非結構化資料的資料科學新演算法將適用於多個方向。自然語言生成將用於將資料點轉換為文字，可以用來自動生成資料的故事。結構化資料庫生成將文字文件或其他非結構化資料轉換為資料點（即將定性資料轉換為機器可計算的定量資料）。

所有這些技術進展，加上那些我們想象不到的，將會被引進以支撐我們的新領域。

機器學習即將在未來幾年被應用的一些最熱門的，最關鍵的領域有：

資料科學的未來

資料科學什麼是資料科學？

資料清洗資料科學

資料科學之路

資料科學的未來

資料科學 什麼是資料科學？

資料清洗 資料科學

資料科學之路

相關推薦

資料科學什麼是資料科學？

資料清洗資料科學