數(shù)據(jù)挖掘是決策支持和過程控制的重要技術(shù)手段,它是物聯(lián)網(wǎng)開發(fā)中的重要一環(huán)。物聯(lián)網(wǎng)中的數(shù)據(jù)挖掘已經(jīng)從傳統(tǒng)意義上的數(shù)據(jù)統(tǒng)計分析、潛在模式的發(fā)現(xiàn)與挖掘,發(fā)展成為物聯(lián)網(wǎng)中不可缺少的工具和環(huán)節(jié)。
數(shù)據(jù)挖掘是物聯(lián)網(wǎng)中的重要環(huán)節(jié)
·分布式并行整體數(shù)據(jù)挖掘:物聯(lián)網(wǎng)的計算設(shè)備和數(shù)據(jù)在物理上是天然分布的,因此不得不采用分布式并行數(shù)據(jù)挖掘,需要云計算模式。
·實時高效的局部數(shù)據(jù)處理:物聯(lián)網(wǎng)任何一個控制端均需要對瞬息萬變的環(huán)境進行實時分析并做出反應(yīng)和處理,需要物計算模式和利用數(shù)據(jù)挖掘結(jié)果。
·數(shù)據(jù)管理與質(zhì)量控制:多源、多模態(tài)、多媒體、多格式數(shù)據(jù)的存儲與管理是控制數(shù)據(jù)質(zhì)量和獲得真實結(jié)果的重要保證,需要基于云計算的存儲。
·決策和控制:挖掘出的模式、規(guī)則、特征指標(biāo),用于預(yù)測、決策和控制。
2、物聯(lián)網(wǎng)中數(shù)據(jù)挖掘算法的選擇。物聯(lián)網(wǎng)特有的分布式特征,決定了物聯(lián)網(wǎng)中的數(shù)據(jù)挖掘具有以下特征。
·高效的數(shù)據(jù)挖掘算法:算法復(fù)雜度低、并行化程度高。
·分布式數(shù)據(jù)挖掘算法:適合數(shù)據(jù)垂直劃分的算法、重視數(shù)據(jù)挖掘多任務(wù)調(diào)度算法。
·并行數(shù)據(jù)挖掘算法:適合數(shù)據(jù)水平劃分、基于任務(wù)內(nèi)并行的挖掘算法。
·保護隱私的數(shù)據(jù)挖掘算法:數(shù)據(jù)挖掘在物聯(lián)網(wǎng)中一定要注意保護隱私。