數據融合和管理技術是物聯網應用層的核心技術,也是物聯網開發技術體系的重要組成部分,它們為促進物聯網的廣泛應用起到了關鍵作用。由于受到網絡的動態特性、感知節點的能源有限性、數據的時間敏感性等諸多因素的影響,人類在物聯網數據融合及管理技術方面遇到了越來越多的難題,這也成為了阻礙物聯網廣泛應用的難題之一。因此,對物聯網數據融合及管理技術的探討一直是國際物聯網機構研究的課題。
物聯網的數據融合及管理技術包括兩個方面,分別是數據融合和數據管理,它們的定義和原理分別是:
(1)數據融合技術
數據融合技術涉及的范圍較廣,研究的內容較多,且自創始以來,應用于多個領域,其內容的廣泛性和形式的多樣性使得它很難有一個完整的定義。目前,人們對數據融合所做的較為簡單的定義是“利用計算機技術對時序獲得的若干感知數據,在一定準則下加以分析、綜合,以完成所需決策和評估任務而進行的數據處理過程”。
數據融合技術具有以下三種含義:
第一,所融合的數據覆蓋了全頻段,具有全空間性。也就是說,它所包含的數據既是多維度的,又是多源頭的,可以是數字數據或非數字數據,也可以是確定數據或模糊數據,還可以是全空間數據或子空間數據。
第二,數據具有互補性。就像一群人要共同完成一件事情一樣,他們需要分工和互補才能將一件事做好。同樣,通過完成相關數據來完成一項功能或應用,也需要數據之間具有這種相關性和互補性。這種互補性呈現在多種方面,可以是機構上的互補,也可以是層次上的互補,還可以是表達方式上的互補。
第三,數據融合區別于數據組合。這是因為,數據融合要求,融合的數據之間具有內部的特性,而這與數據組合的外部特性不符。
數據融合其實就是將多維度的數據先進行系統的關聯,然后再做綜合分析,最后融合成需要的數據資源。在這個過程中,融合的模式具有多樣性,處理的算法具有廣泛性,融合的目的是在已有數據信息的基礎上,提高數據質量,提取可用知識,從而為物聯網的廣泛應用奠定基礎。由此可見,數據融合需要數據的配對和識別。因此,在研究數據融合時要解決以下多種問題,比如虛假數據的識別、不一致數據的對準、估計目標數據的類型、感知數據的不確定性等。
數據融合的處理過程具有多層次、多方位的特點,在數據融合的過程中,要對具有廣泛來源的數據進行檢測、相關、綜合以及評估。數據融合可以分成三個層次:數據級融合、特征級融合、決策級融合。
①數據級融合
數據級融合屬于最低層級的數據融合方式,利用這種方式融合的數據一般是同等量級的傳感器所采集的原始數據。將這些同等量級的傳感器數據融合后,就可以將多個傳感器所采集的同類信息進行歸類和打包處理,這樣一來,多個同等量級的傳感器和單個傳感器的識別和處理過程就會相同。
②特征級融
特征級融合屬于中間層級的數據融合方式,這一層級所處理的數據一般是提取后具有明顯特征的數據。通過特征級融合,這些數據將會被大幅壓縮,這樣做一方面可以節省存儲空間,另一方面便于數據的實時利用。特征級融合過的數據通常可以作為決策分析的特征信息。
③決策級融合
決策級融合屬于最高層級的數據融合方式,這一層級的融合要對特征信息進行進一步的融合判斷,進而確定應用決策,并根據信息內容評估決策施行后的結果。
除了三級信息融合外,還有一個層級,即第四層級,這一層級是根據預見的結果對決策過程進行反饋控制。第四層級通常應用于具有反饋環節的物聯網應用系統,主要作用是反饋控制或調整信息。
(2)數據管理技術
物聯網的數據管理技術,又可以稱作分布式動態實時數據管理技術。該技術就是通過代理節點收集興趣數據,并對客觀世界的數據信息進行實時、動態以及綜合的管理。數據管理中心會下達感知任務,這些感知任務被下達給各個感知節點之后,感知節點通過采集所需數據來完成任務目標。如此一來,人們不需要了解物聯網處理數據的具體方法,只需要在具體實現方法的基礎上,對數據的邏輯結構進行相關查詢,就能解決實際問題。數據管理一般包括五個方面,分別是數據獲取、數據存儲、數據查詢、數據挖掘以及數據操作。具體來說,物聯網數據管理技術具有以下特點:
第一,數據管埋技術可以處理感知數據的誤差;
第二,在傳感網支撐環境內進行數據處理;
第三,物聯網信息查詢和管理策略既要適應網絡拓撲結構的變化,又要適應最小化能量消耗。
現階段,物理網數據管理中比較優秀的研究成果有兩個查詢系統,一個是Cougar,另一個是TinyDB。
物聯網數據管理技術依賴于傳感網絡,目前,物聯網針對傳感網的數據管理結構有四種類型,分別是層次式結構、半分布式結構、分布式結構以及集中式結構。
①層次式結構
層次式結構主要應用于對數據的層次性管理。
②半分布式結構
物聯網的感知節點有些具備一定的計算和存儲能力,先利用感知節點對捕獲的數據進行初始處理,再將處理后的數據傳輸到中心節點,可以提高傳輸效率和數據質量。
③分布式結構
該種結構對感知節點的要求較高,需要感知節點具備較高的數據通信、數據存儲以及數據計算能力,并且可以對數據查詢命令進行獨立的處理等。
④集中式結構
這是一種比較簡單的數據處理結構,在這種結構中,感知節點會將獲取的數據按照某種需要的方式發送到中心節點處,然后由中心節點進行統一處理。這種結構存在較大的弊端,中心節點的容錯性較差,很容易使系統性能達到瓶頸。
目前,物聯網針對傳感網的數據管理系統主要以平分布式結構為研究對象。在該領域的研究中,典型的研究成果有Cougar系統和Fjord系統。
在Cougar系統中,為了避免通信開銷過大,數據的查詢處理需要在傳感網的內部開展,當數據與查詢內容相關時才需要從傳感網中提取。該系統中的感知節點一方面要對本地數據進行處理,另一方面還要與相鄰感知節點進行實時通信,有時還要協助其他感知節點,共同完成查詢處理的相關任務等。
Fjord系統是Telegarph的重要組成部分,是一種數據流系統,它最大的特點是具有自適應性。該系統主要由兩個部分組成,一是傳感器代理,二是自適應處理引擎。Fjord系統處理查詢的基礎是數據流計算模型,利用該種系統可以根據計算環境的變化,實時調整查詢計劃。