隨著以高通量測序技術為代表的新技術得到發(fā)展和廣泛應用,越來越多可利用的密集型數(shù)據(jù)開始出現(xiàn)。同時,大數(shù)據(jù)技術也處于如火如荼的發(fā)展中。在大數(shù)據(jù)環(huán)境下處理密集型數(shù)據(jù)成為可能,而其處理性能也是信息技術能否成功應用的關鍵?!洞髷?shù)據(jù)環(huán)境下局部模式挖掘關鍵技術研究》首先綜述了從以基因表達數(shù)據(jù)為代表的密集型數(shù)據(jù)中挖掘局部模式的方法:并圍繞局部模式并行挖掘的執(zhí)行性能問題,提出了大數(shù)據(jù)環(huán)境下減少數(shù)據(jù)交互量的計算框架,在此基礎上設計挖掘多種類型的局部模式的并行算法。其次,為了從源數(shù)據(jù)中直接搜索符合特定要求的多類型的局部模式,提出了基于前綴樹索引的查詢方法,進而提升了密集型數(shù)據(jù)的分析效率;然后針對局部模式的挖掘、索引與查詢問題,設計了一個名為OEMGA的原型系統(tǒng)。最后,提出了利用領域知識的約束查詢方法來提升局部模式查詢的相關性?!洞髷?shù)據(jù)環(huán)境下局部模式挖掘關鍵技術研究》為大數(shù)據(jù)環(huán)境下密集型數(shù)據(jù)的有效分析提供了切實可行的解決方案,具有重要的理論意義和應用價值。