數(shù)據(jù)挖掘是決策支持和過程控制的重要技術(shù)手段,它是物聯(lián)網(wǎng)開發(fā)中的重要一環(huán)。物聯(lián)網(wǎng)中的數(shù)據(jù)挖掘已經(jīng)從傳統(tǒng)意義上的數(shù)據(jù)統(tǒng)計(jì)分析、潛在模式的發(fā)現(xiàn)與挖掘,發(fā)展成為物聯(lián)網(wǎng)中不可缺少的工具和環(huán)節(jié)。
數(shù)據(jù)挖掘是物聯(lián)網(wǎng)中的重要環(huán)節(jié)
·分布式并行整體數(shù)據(jù)挖掘:物聯(lián)網(wǎng)的計(jì)算設(shè)備和數(shù)據(jù)在物理上是天然分布的,因此不得不采用分布式并行數(shù)據(jù)挖掘,需要云計(jì)算模式。
·實(shí)時(shí)高效的局部數(shù)據(jù)處理:物聯(lián)網(wǎng)任何一個(gè)控制端均需要對(duì)瞬息萬變的環(huán)境進(jìn)行實(shí)時(shí)分析并做出反應(yīng)和處理,需要物計(jì)算模式和利用數(shù)據(jù)挖掘結(jié)果。
·數(shù)據(jù)管理與質(zhì)量控制:多源、多模態(tài)、多媒體、多格式數(shù)據(jù)的存儲(chǔ)與管理是控制數(shù)據(jù)質(zhì)量和獲得真實(shí)結(jié)果的重要保證,需要基于云計(jì)算的存儲(chǔ)。
·決策和控制:挖掘出的模式、規(guī)則、特征指標(biāo),用于預(yù)測(cè)、決策和控制。
2、物聯(lián)網(wǎng)中數(shù)據(jù)挖掘算法的選擇。物聯(lián)網(wǎng)特有的分布式特征,決定了物聯(lián)網(wǎng)中的數(shù)據(jù)挖掘具有以下特征。
·高效的數(shù)據(jù)挖掘算法:算法復(fù)雜度低、并行化程度高。
·分布式數(shù)據(jù)挖掘算法:適合數(shù)據(jù)垂直劃分的算法、重視數(shù)據(jù)挖掘多任務(wù)調(diào)度算法。
·并行數(shù)據(jù)挖掘算法:適合數(shù)據(jù)水平劃分、基于任務(wù)內(nèi)并行的挖掘算法。
·保護(hù)隱私的數(shù)據(jù)挖掘算法:數(shù)據(jù)挖掘在物聯(lián)網(wǎng)中一定要注意保護(hù)隱私。