數據即價值是目前計算機領域極其推崇的觀念。數據無論多少都歸結為大數據,數據分析技術也被推到了非常高的地位,資本也對貼有大數據標簽的技術公司趨之若鶩。數據如同流動的數字貨幣一樣被一再地評估、追崇。
當物聯網應用后,由于其數據產生的速度、種類都會對現有云端技術架構、數據處理方式,產生超乎想象的壓力和挑戰,也必然推動從“數據即價值”盲目崇拜到“有價值數據”這一理性認識上。
物聯網的數據分類
靜態數據與動態數據
單從數據的變化上來說,物聯網數據可以分為靜態數據和動態數據。靜態數據多為標簽類、地質類數據,RFID產生的數據多為靜態數據。靜態數據多以結構性、關系型數據庫存儲;動態數據是以時間為序列的數據,物聯網動態數據的特點是每個數據都與時間有一一對應關系,并且這種關系在數據處理中尤其重要,這類數據存儲通常采用時序數據庫方式存儲。
靜態數據會隨著傳感器和控制設備數量的增多而增加;動態數據不僅隨設備數量、傳感器數量增加而增加,還會隨時間的增加而增加。
無論靜態數據還是動態數據,在物聯網1.0階段數據的增長是線性的,并且是指數級的,但是因為物聯網動態數據是連續不間斷的,所以數據的量也是海量的。因此物聯網1.0階段數據的壓力是可控的,并不是如宣傳的那樣不可數,不可控。
能源類、資產屬性類、診斷類、信號類數據
就數據的原始特性來說,我們可以把物聯網數據分為能源類、資產屬性類數據、診斷類數據、信號類數據。
能源類數據:是指與能耗相關的,或者是計算能耗所需的相關數據,例如電流、電壓、功率因子、頻率、諧波等。能源數據是物聯網最關鍵的數據類型,物聯網最終的目的之一就是節能,那么獲取能源數據,理解能源數據,分析能源數據是物聯網實施中必需的功能。能源采集設備也是物聯網重要的設備之一。
資產屬性類數據:通常指硬件資產數據,例如設備的規格、參數等屬性,設備的位置信息、設備之間的從屬關系等。資產類數據主要用于資產管理,資產管理是工業物聯網非常重要的功能甚至可以作為獨立系統研究,因為它可以和ERP系統、MES系統、物流等幾乎所有的系統對接。
診斷類數據:是指設備運行過程中檢測設備運行狀態的數據,診斷類數據可以有兩類:一類為設備運行參數,例如設備輸入輸出值,這里通常為傳統工業自動化類數據,即OT技術相關類數據;另一類為設備外圍診斷數據,例如設備的表面溫度、設備噪音、設備震動等,值得提出的是外圍診斷才是,物聯網開發技術體現的地方,它包括新型傳感器技術和物聯網通信技術。外圍診斷數據是預測性維護的重要的元數據,也為深度控制模型提供依據,因此診斷類數據是我們需要著重關注的數據類型。
信號類數據:信號類數據或者告警類數據是目前工業領域使用最普及的數據,因為其直觀、易懂、關鍵,同時在本地、遠程同時告知信號類數據容易被忽略,但是它是物聯網所需要的、也是快速可以采集到、并對物聯網系統提供重要參考價值的數據之一。
數據之間的關聯性
數據之間的關聯性是不同數據之間的關系,數據之間的關系對了解整個系統的運行有著最直接的影響,數據之間正確關系的梳理是系統有效運行、產生價值的基石。
數據之間的關聯性可以從下面幾個方面分析。
時間關聯性:即同一時刻的數據照相,數據是同一時刻系統產生的,它反應的是系統這一時刻的狀態,從數據世界角都看,這個系統就是這一時刻的數據集合。數據照相體現的是系統靜態展示;時間戳是這類數據關鍵的因素,因此要求各個數據獲取的時間戳必須相同,時間戳是目前很多數據所缺失的,也是物聯網實施中需要關注和解決的問題之一。
流程關聯性:即一個點的數據經過一定時間后影響第二個點數據的產生,它體現的是系統動態的流程展示。數據之間的流程關系性需要模型提供,并在實施中進行修正。
數據的時效性
數據的時效性是指數據產生到其被清楚的時間,數據時效是由系統的實施部署所決定。數據可以被使用次數,也可以被使用一次后就被清楚。總體來說,遠程部署數據還是邊緣部署數據影響著數據的時效性,通常邊緣部署的數據時效性短,遠程數據的時效性長。邊緣部署需要的數據通常及時性強,但是邊緣存儲空間計算能力弱,因此不能長期保持;遠程數據通常為歷史性數據展示、計算分析,同時云端空間、計算的伸縮性強,因此數據時效性長。
數據的實時性也是數據時效性的一部分,實時性和數據的部署位置、數據的重要性以及傳輸方式都有關聯性。