工業大資料分析技術在實踐應用中的思路與方法(上篇)

2021-10-10 10:51:30 字數 2167 閱讀 2151

本文將結合作者在工業領域多年的實踐應用經驗,力圖對工業大資料分析技術的應用思路、方法和流程進行總結,旨在為企業開展大資料分析工作提供技術和業務上的借鑑。

在本文中我們將一起研討和思考:

工業大資料分析的特殊性;

工業大資料分析的困境及難點;

工業大資料分析的基本框架;

工業大資料分析該如何開展?

工業大資料分析技術在實踐應用中的思路與方法

01 工業大資料分析與傳統資料分析的差異性及特殊性

工業大資料分析是利用統計學分析技術、機器學習技術、訊號處理技術等技術手段,結合業務知識對工業過程產生的資料進行處理、計算、分析並提取其中有價值的資訊和規律的過程。從過程與目標角度看,工業大資料分析和傳統統計分析、商業智慧型分析涉及的學科和技術大同小異。但從分析理念和特點上看,工業大資料分析又有其自身的特殊性。

首先,進入大資料時代,資料的變化往往引發工作方法和價值體現的改變。對於資料的變化,非工業領域往往強調數量上的變化;但在工業領域,則更注重資料完整性和質量的提公升。工業現場往往對分析結果的精度、可靠度要求高,加之工業物件和過程本身也很複雜。因此,工業大資料分析方法的重點是通過資料條件的改善,結合相關分析技術的有效應用,得到質量高的分析結果。

此外,工業場景的邊界往往都有專業領域的機理來約束。對於複雜的工業過程資料分析,往往不能僅侷限於相關關係分析,需要強調工業領域業務知識和資料分析過程的深度融合;強調複雜業務問題簡化和分析結果的可解釋性,而不是簡單地追求資料量大與分析演算法的複雜和先進性。一言以蔽之,工業大資料分析需要在工業具體業務要求的邊界下,用資料思維和數理邏輯去嚴格地定義問題,採用「資料驅動+機理模型」的雙輪驅動方式去精確表徵、有效解決實際問題。

02 工業大資料分析的困境及難點

工業大資料分析的困境及難點主要體現在對工業物件(過程)理解和認知要求的高標準和一致性、工業大資料建模的複雜性和反覆性、分析結果的可靠性和確定性三個方面。

第一. 工業大資料分析對資料分析人員的業務背景認知能力要求較高

資料分析師不能按照以往思路,對業務相關物件、資料情況初步摸底認知後就匆匆開展具體分析建模工作。而針對工業物件和過程的複雜系統,不同的場景下業務問題之間的關係往往會發生改變,加之資料缺失嚴重、雜訊大、業務含義代表性強等因素,理論體系下的資料分析相關理念與技術很難直接適用於此類場景的變化和複雜度要求。如若資料分析團隊對研究工業物件認識不夠深入或「片面性」理解,往往會導致分析出來的結果是只是證明了領域內業務機理/常識的正確性或某一公認理念,就會經常出現專案研究投入高、產出低的問題。

因此,工業大資料分析需堅持的原則是分析和應用都要結合具體的流程,分析工作開展前要保證資料條件符合業務場景要求。

第二. 工業大資料建模演算法的複雜性和過程的反覆性使得整個實現過程較為「繁瑣和曲折」

在開展工業建模時,雖然基礎演算法原理和應用方式的變化不大,但運用此類演算法的過程卻極大程度地「曲折」,往往需要結合業務知識和資料情況將演算法嵌入到實際的工業應用場景與邏輯中去,需要模型基於初次的分析結果不斷地修正、迭代和完善,以此來提公升模型的魯棒性與準確性。此外,工業過程資料形式的複雜性、資料質量參差不齊等也使得工業大資料分析建模與有效應用的困難度加大。

第三. 工業產業模式及應用場景對工業大資料分析結果的可靠性和決策可指導性要求高,導致工業大資料分析應用的成熟化落地變得困難。

一般情況下,大多數企業的工業現場裝置控制、工藝調整、質量管控等都已處在相對優良的階段,而通過工業資料分析得到的概率性結論和現場實際有一定的偏差。此偏差可能是生產環節本身引起的,也有可能是資料採集環節的資料本身失真引起的,單從資料分析結果角度往往很難發現和解釋具體差異引起的原因,導致大家對於分析結果的可靠性存疑。另一方面,企業業務人員對所從事的工業過程/經營管理等業務的認識原本就相對深刻,這就要求工業大資料分析能剖析、給出更深層次的業務實情資訊或優化策略,只有分析得到的知識具有更高精度和可靠性時,從業務決策指導層面才具有實用價值,這也是工業大資料分析價值落地應用面臨的挑戰之一。

因此,工業領域的資料分析重點強調資料分析技術和領域知識融合來獲取有價值的知識。當模型涉及到的因素很多、形成真正的複雜多維度問題且機理不清晰時,且往往沒足夠的資料來建立和驗證模型,這時就需要充分利用專業領域知識進行「降維」,力求從有限的資料中分析出足夠可靠的結果。

我們在實踐中認識到工業大資料分析的瓶頸難點,往往不是計算機儲存和處理資料的能力,而是蘊含工業機理的資料關聯關係的複雜性。這種複雜性使得傳統的資料分析方法難以奏效,無法從資料中獲得質量更高、價值更大的知識,如果沒有合適的思想和技術手段,面對工業大資料價值的藍海時,就會無從下手。

工業大資料分析技術在實踐應用中的思路與方法(下篇)

一 工業大資料分析的基本框架 目前,業界在開展工業大資料分析時主要遵從crisp dm分析流程,以資料為中心,將相關工作分成業務理解 資料理解 資料準備 建模 驗證與評估 實施與執行等六個步驟,如下圖所示。此流程相關步驟存在多處迴圈和反覆迭代,如業務理解和資料理解 資料準備和建模之間,整個分析過程需...

工業大資料分析,主要有哪些應用?

1.加速產品創新 客戶與工業企業之間的互動和交易行為將產生大量資料,挖掘和分析這些客戶動態資料,能夠幫助客戶參與到產品的需求分析和產品設計等創新活動中,為產品創新作出貢獻。福特公司是這方面的表率,他們將大資料技術應用到了福特福克斯電動車的產品創新和優化中,這款車成為了一款名副其實的 大資料電動車 第...

「工業大資料」之「華山論劍」 也談工業大資料分析

工業大資料,伴隨著 大資料 雲計算 物聯網 人工智慧 等概念的興起而逐漸火了起來。隨之,工業界 投資界 學術界,各界均把目光投向 工業大資料 國外火,國內也火了起來。但 工業大資料 畢竟不是 商業大資料 也不是 金融大資料 似乎也不是純粹的 網際網路大資料 工業大資料 分析的主流方法和思路是什麼?本...