并行數(shù)據(jù)挖掘及性能優(yōu)化：關(guān)聯(lián)規(guī)則與數(shù)據(jù)相關(guān)性分析

定　價(jià)：￥88.00

作　者：	荀亞玲著
出版社：	電子工業(yè)出版社
叢編項(xiàng)：	AI工程師書(shū)庫(kù)
標(biāo)　簽：	暫缺

購(gòu)買這本書(shū)可以去

ISBN：	9787121375828	出版時(shí)間：	2019-12-01	包裝：	平裝
開(kāi)本：	16開(kāi)	頁(yè)數(shù)：	224	字?jǐn)?shù)：

內(nèi)容簡(jiǎn)介

　　大數(shù)據(jù)推動(dòng)了各行各業(yè)的迅猛發(fā)展，各領(lǐng)域呈現(xiàn)出新產(chǎn)品、新技術(shù)、新服務(wù)和新的發(fā)展業(yè)態(tài)，但“信息豐富而知識(shí)貧乏”的現(xiàn)象仍然存在。逾越數(shù)據(jù)與知識(shí)之間的鴻溝，需要強(qiáng)有力的分析工具和分析方法的支撐?，F(xiàn)有的關(guān)聯(lián)規(guī)則挖掘算法，因其時(shí)空復(fù)雜性和I/O代價(jià)高，難以適應(yīng)大數(shù)據(jù)分析任務(wù)。《并行數(shù)據(jù)挖掘及性能優(yōu)化：關(guān)聯(lián)規(guī)則與數(shù)據(jù)相關(guān)性分析》充分利用Hadoop、Spark等集群系統(tǒng)的強(qiáng)大數(shù)據(jù)處理能力，論述了支持大數(shù)據(jù)分析的關(guān)聯(lián)規(guī)則并行挖掘算法與集群系統(tǒng)性能優(yōu)化，并探討了其在智能制造領(lǐng)域的應(yīng)用。《并行數(shù)據(jù)挖掘及性能優(yōu)化：關(guān)聯(lián)規(guī)則與數(shù)據(jù)相關(guān)性分析》可供從事數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)及并行計(jì)算等相關(guān)專業(yè)的科研人員參考，也可作為高等院校計(jì)算機(jī)、大數(shù)據(jù)專業(yè)的高年級(jí)本科生與研究生的學(xué)習(xí)參考書(shū)。

作者簡(jiǎn)介

　　荀亞玲，女，1980年生，山西臨汾霍州人，博士，現(xiàn)任太原科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院副教授。在科研方面一直從事數(shù)據(jù)挖掘和并行與分布式計(jì)算等方面的研究工作。在關(guān)聯(lián)規(guī)則挖掘、天體光譜數(shù)據(jù)挖掘技術(shù)、并行與分布式計(jì)算等領(lǐng)域進(jìn)行了理論和應(yīng)用研究，已取得了一些階段性的研究成果。先后參與了多項(xiàng)國(guó)家自然科學(xué)基金、國(guó)家863”高技術(shù)發(fā)展計(jì)劃基金項(xiàng)目子課題。主持國(guó)家青年基金項(xiàng)目1項(xiàng)（MapReduce集群環(huán)境下的恒星光譜關(guān)聯(lián)規(guī)則挖掘及性能優(yōu)化”項(xiàng)目（編號(hào)：61602335））。在《IEEE Transactions on Systems， Man， and Cybernetics： Systems》、《軟件學(xué)報(bào)》等國(guó)內(nèi)外期刊上，已公開(kāi)發(fā)表了第一作者學(xué)術(shù)論文若干，其中： SCI收錄1篇， EI收錄2篇；在《Soft Computing》、《Knowledge-Based Systems》、《軟件學(xué)報(bào)》等期刊上，合作發(fā)表了論文十余篇；此外，以第一作者撰寫的《FiDoop-DP： Data Partitioning in Frequent Itemset Mining on Hadoop Clusters》論文，已被CCF推薦的A類國(guó)際**SCI期刊《IEEE Transactions on Parallel and Distributed Systems 》，于2016年5月錄用。2016年5月，《一種基于云存儲(chǔ)的校園安防系統(tǒng)》獲授權(quán)國(guó)家專利，專利號(hào)：ZL 2015 2 1058772.7。

圖書(shū)目錄

目錄
第一篇基礎(chǔ)理論篇
第1章緒論\t3
1．1 數(shù)據(jù)挖掘\t4
1．1．1 數(shù)據(jù)挖掘的產(chǎn)生和定義\t4
1．1．2 數(shù)據(jù)挖掘的任務(wù)與分類\t6
1．1．3 研究前沿和發(fā)展趨勢(shì)\t8
1．2 關(guān)聯(lián)規(guī)則\t9
1．2．1 關(guān)聯(lián)規(guī)則及其分類\t9
1．2．2 關(guān)聯(lián)規(guī)則挖掘算法\t12
1．3 集群系統(tǒng)與并行計(jì)算模型\t17
1．3．1 集群系統(tǒng)\t17
1．3．2 并行計(jì)算模型\t18
1．3．3 大數(shù)據(jù)處理架構(gòu)Hadoop與Spark\t21
1．4 大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘及應(yīng)用\t27
1．4．1 大數(shù)據(jù)\t27
1．4．2 大數(shù)據(jù)挖掘及應(yīng)用\t29
第2章 MapReduce集群環(huán)境下的數(shù)據(jù)放置策略\t33
2．1 引言\t34
2．2 數(shù)據(jù)放置策略的關(guān)鍵問(wèn)題與度量標(biāo)準(zhǔn)\t35
2．3 數(shù)據(jù)放置策略的優(yōu)化\t37
2．3．1 MapReduce集群系統(tǒng)能耗與數(shù)據(jù)放置策略\t38
2．3．2 負(fù)載均衡的數(shù)據(jù)放置策略\t41
2．3．3 改善I/O性能與通信負(fù)載的數(shù)據(jù)放置策略\t46
2．3．4 考慮其他因素的數(shù)據(jù)放置策略\t49
2．4 數(shù)據(jù)放置策略的分析與歸納\t50
2．5 本章小結(jié)\t53
第二篇關(guān)聯(lián)規(guī)則并行挖掘及性能優(yōu)化篇
第3章壓縮后綴鏈表與并行頻繁項(xiàng)集挖掘算法\t61
3．1 問(wèn)題提出\t62
3．2 基礎(chǔ)理論\t63
3．3 基于MapReduce的頻繁項(xiàng)集挖掘算法\t65
3．3．1 第一個(gè)MapReduce作業(yè)\t67
3．3．2 第二個(gè)MapReduce作業(yè)\t67
3．4 實(shí)驗(yàn)評(píng)價(jià)\t68
3．4．1 最小支持度\t69
3．4．2 可擴(kuò)展性\t70
3．4．3 加速比\t70
3．5 本章小結(jié)\t71
第4章 FIUT算法與頻繁項(xiàng)集并行挖掘\t73
4．1 引言\t74
4．2 FIUT算法描述\t76
4．3 FiDoop算法概述\t77
4．4 基于MapReduce的FiDoop算法\t81
4．4．1 第一個(gè)MapReduce作業(yè)\t83
4．4．2 第二個(gè)MapReduce作業(yè)\t83
4．4．3 第三個(gè)MapReduce作業(yè)\t84
4．5 實(shí)現(xiàn)細(xì)節(jié)\t87
4．5．1 負(fù)載均衡\t87
4．5．2 高維優(yōu)化\t88
4．6 FiDoop-HD算法\t90
4．7 實(shí)驗(yàn)評(píng)價(jià)\t92
4．7．1 最小支持度\t93
4．7．2 負(fù)載均衡\t95
4．7．3 加速比\t96
4．7．4 可擴(kuò)展性\t97
4．8 本章小結(jié)\t98
第5章 MapReduce編程模型下的約束頻繁項(xiàng)集并行挖掘算法\t101
5．1 問(wèn)題提出\t102
5．2 約束頻繁項(xiàng)集挖掘算法的并行化\t103
5．3 基于MapReduce的約束頻繁項(xiàng)集并行挖掘\t105
5．4 基于MapReduce的約束頻繁項(xiàng)集并行挖掘算法（PACFP）\t108
5．4．1 并行化計(jì)數(shù)過(guò)程\t108
5．4．2 并行化CFP-Growth算法\t109
5．4．3 結(jié)果聚合\t111
5．5 負(fù)載均衡\t111
5．6 實(shí)驗(yàn)結(jié)果及分析\t112
5．6．1 最小支持度\t113
5．6．2 可伸縮性\t115
5．6．3 可擴(kuò)展性\t116
5．6．4 約束條件判斷的代價(jià)分析\t117
5．6．5 負(fù)載均衡\t118
5．7 本章小結(jié)\t120
第6章支持并行頻繁項(xiàng)集挖掘的數(shù)據(jù)劃分策略\t121
6．1 引言\t122
6．1．1 FiDoop-DP算法的研發(fā)動(dòng)機(jī)\t123
6．1．2 FiDoop-DP算法要解決的數(shù)據(jù)劃分問(wèn)題\t124
6．1．3 FiDoop-DP算法的基本思想\t125
6．2 并行FP-Growth算法\t126
6．3 相關(guān)工作\t128
6．3．1 MapReduce下的數(shù)據(jù)劃分\t128
6．3．2 應(yīng)用系統(tǒng)相關(guān)的數(shù)據(jù)劃分\t129
6．4 問(wèn)題陳述和設(shè)計(jì)目標(biāo)\t131
6．4．1 基本方法與問(wèn)題陳述\t131
6．4．2 設(shè)計(jì)目標(biāo)\t132
6．5 數(shù)據(jù)劃分策略\t133
6．5．1 距離度量\t134
6．5．2 K-Means算法種子點(diǎn)的選擇\t135
6．5．3 劃分策略\t135
6．6 實(shí)現(xiàn)細(xì)節(jié)\t138
6．7 實(shí)驗(yàn)評(píng)價(jià)\t143
6．7．1 種子點(diǎn)個(gè)數(shù)對(duì)算法的影響\t143
6．7．2 最小支持度對(duì)算法的影響\t145
6．7．3 數(shù)據(jù)特征對(duì)算法的影響\t147
6．7．4 加速比\t149
6．7．5 可擴(kuò)展性\t150
6．8 本章小結(jié)\t151
第7章頻繁項(xiàng)集并行化過(guò)程中的重定向任務(wù)調(diào)度\t153
7．1 問(wèn)題提出\t154
7．2 重定向任務(wù)調(diào)度算法\t156
7．2．1 數(shù)據(jù)本地化的重要性\t156
7．2．2 計(jì)算響應(yīng)時(shí)間\t157
7．2．3 重定向任務(wù)調(diào)度算法的設(shè)計(jì)\t158
7．3 實(shí)驗(yàn)結(jié)果及分析\t160
7．3．1 有效性\t160
7．3．2 可擴(kuò)展性\t161
7．3．3 穩(wěn)定性\t162
7．4 本章小結(jié)\t163
第8章基于Spark內(nèi)存計(jì)算的并行頻繁項(xiàng)集挖掘及優(yōu)化\t165
8．1 引言\t166
8．2 FP-Growth 算法的并行化分析\t167
8．3 Spark環(huán)境下的均衡FP-Growth算法\t169
8．3．1 負(fù)載均衡的分組策略\t169
8．3．2 負(fù)載均衡的FP-Growth算法并行化\t172
8．4 實(shí)驗(yàn)評(píng)價(jià)\t174
8．4．1 算法執(zhí)行效率\t175
8．4．2 加速比\t176
8．4．3 可擴(kuò)展性\t177
8．5 本章小結(jié)\t178
第三篇應(yīng) 用篇
第9章冷軋輥加工質(zhì)量管理過(guò)程相關(guān)性分析\t181
9．1 引言\t182
9．2 系統(tǒng)需求與總體設(shè)計(jì)\t184
9．2．1 軋輥生產(chǎn)工藝流程\t184
9．2．2 冷軋輥生產(chǎn)質(zhì)量管理特點(diǎn)\t186
9．2．3 系統(tǒng)的軟件體系結(jié)構(gòu)及功能\t188
9．3 數(shù)據(jù)預(yù)處理及關(guān)鍵技術(shù)\t190
9．3．1 數(shù)據(jù)轉(zhuǎn)換\t190
9．3．2 數(shù)據(jù)清理\t190
9．3．3 數(shù)據(jù)離散化\t193
9．4 提取關(guān)聯(lián)規(guī)則\t195
9．5 系統(tǒng)實(shí)現(xiàn)及運(yùn)行結(jié)果\t196
9．6 本章小結(jié)\t203
附錄A 冷軋輥加工數(shù)據(jù)\t205
附錄B 冷軋輥加工數(shù)據(jù)預(yù)處理格式\t207
參考文獻(xiàn)\t209

第一篇基礎(chǔ)理論篇
第1章緒論\t3
1．1 數(shù)據(jù)挖掘\t4
1．1．1 數(shù)據(jù)挖掘的產(chǎn)生和定義\t4
1．1．2 數(shù)據(jù)挖掘的任務(wù)與分類\t6
1．1．3 研究前沿和發(fā)展趨勢(shì)\t8
1．2 關(guān)聯(lián)規(guī)則\t9
1．2．1 關(guān)聯(lián)規(guī)則及其分類\t9
1．2．2 關(guān)聯(lián)規(guī)則挖掘算法\t12
1．3 集群系統(tǒng)與并行計(jì)算模型\t17
1．3．1 集群系統(tǒng)\t17
1．3．2 并行計(jì)算模型\t18
1．3．3 大數(shù)據(jù)處理架構(gòu)Hadoop與Spark\t21
1．4 大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘及應(yīng)用\t27
1．4．1 大數(shù)據(jù)\t27
1．4．2 大數(shù)據(jù)挖掘及應(yīng)用\t29
第2章 MapReduce集群環(huán)境下的數(shù)據(jù)放置策略\t33
2．1 引言\t34
2．2 數(shù)據(jù)放置策略的關(guān)鍵問(wèn)題與度量標(biāo)準(zhǔn)\t35
2．3 數(shù)據(jù)放置策略的優(yōu)化\t37
2．3．1 MapReduce集群系統(tǒng)能耗與數(shù)據(jù)放置策略\t38
2．3．2 負(fù)載均衡的數(shù)據(jù)放置策略\t41
2．3．3 改善I/O性能與通信負(fù)載的數(shù)據(jù)放置策略\t46
2．3．4 考慮其他因素的數(shù)據(jù)放置策略\t49
2．4 數(shù)據(jù)放置策略的分析與歸納\t50
2．5 本章小結(jié)\t53
第二篇關(guān)聯(lián)規(guī)則并行挖掘及性能優(yōu)化篇
第3章壓縮后綴鏈表與并行頻繁項(xiàng)集挖掘算法\t61
3．1 問(wèn)題提出\t62
3．2 基礎(chǔ)理論\t63
3．3 基于MapReduce的頻繁項(xiàng)集挖掘算法\t65
3．3．1 第一個(gè)MapReduce作業(yè)\t67
3．3．2 第二個(gè)MapReduce作業(yè)\t67
3．4 實(shí)驗(yàn)評(píng)價(jià)\t68
3．4．1 最小支持度\t69
3．4．2 可擴(kuò)展性\t70
3．4．3 加速比\t70
3．5 本章小結(jié)\t71
第4章 FIUT算法與頻繁項(xiàng)集并行挖掘\t73
4．1 引言\t74
4．2 FIUT算法描述\t76
4．3 FiDoop算法概述\t77
4．4 基于MapReduce的FiDoop算法\t81
4．4．1 第一個(gè)MapReduce作業(yè)\t83
4．4．2 第二個(gè)MapReduce作業(yè)\t83
4．4．3 第三個(gè)MapReduce作業(yè)\t84
4．5 實(shí)現(xiàn)細(xì)節(jié)\t87
4．5．1 負(fù)載均衡\t87
4．5．2 高維優(yōu)化\t88
4．6 FiDoop-HD算法\t90
4．7 實(shí)驗(yàn)評(píng)價(jià)\t92
4．7．1 最小支持度\t93
4．7．2 負(fù)載均衡\t95
4．7．3 加速比\t96
4．7．4 可擴(kuò)展性\t97
4．8 本章小結(jié)\t98
第5章 MapReduce編程模型下的約束頻繁項(xiàng)集并行挖掘算法\t101
5．1 問(wèn)題提出\t102
5．2 約束頻繁項(xiàng)集挖掘算法的并行化\t103
5．3 基于MapReduce的約束頻繁項(xiàng)集并行挖掘\t105
5．4 基于MapReduce的約束頻繁項(xiàng)集并行挖掘算法（PACFP）\t108
5．4．1 并行化計(jì)數(shù)過(guò)程\t108
5．4．2 并行化CFP-Growth算法\t109
5．4．3 結(jié)果聚合\t111
5．5 負(fù)載均衡\t111
5．6 實(shí)驗(yàn)結(jié)果及分析\t112
5．6．1 最小支持度\t113
5．6．2 可伸縮性\t115
5．6．3 可擴(kuò)展性\t116
5．6．4 約束條件判斷的代價(jià)分析\t117
5．6．5 負(fù)載均衡\t118
5．7 本章小結(jié)\t120
第6章支持并行頻繁項(xiàng)集挖掘的數(shù)據(jù)劃分策略\t121
6．1 引言\t122
6．1．1 FiDoop-DP算法的研發(fā)動(dòng)機(jī)\t123
6．1．2 FiDoop-DP算法要解決的數(shù)據(jù)劃分問(wèn)題\t124
6．1．3 FiDoop-DP算法的基本思想\t125
6．2 并行FP-Growth算法\t126
6．3 相關(guān)工作\t128
6．3．1 MapReduce下的數(shù)據(jù)劃分\t128
6．3．2 應(yīng)用系統(tǒng)相關(guān)的數(shù)據(jù)劃分\t129
6．4 問(wèn)題陳述和設(shè)計(jì)目標(biāo)\t131
6．4．1 基本方法與問(wèn)題陳述\t131
6．4．2 設(shè)計(jì)目標(biāo)\t132
6．5 數(shù)據(jù)劃分策略\t133
6．5．1 距離度量\t134
6．5．2 K-Means算法種子點(diǎn)的選擇\t135
6．5．3 劃分策略\t135
6．6 實(shí)現(xiàn)細(xì)節(jié)\t138
6．7 實(shí)驗(yàn)評(píng)價(jià)\t143
6．7．1 種子點(diǎn)個(gè)數(shù)對(duì)算法的影響\t143
6．7．2 最小支持度對(duì)算法的影響\t145
6．7．3 數(shù)據(jù)特征對(duì)算法的影響\t147
6．7．4 加速比\t149
6．7．5 可擴(kuò)展性\t150
6．8 本章小結(jié)\t151
第7章頻繁項(xiàng)集并行化過(guò)程中的重定向任務(wù)調(diào)度\t153
7．1 問(wèn)題提出\t154
7．2 重定向任務(wù)調(diào)度算法\t156
7．2．1 數(shù)據(jù)本地化的重要性\t156
7．2．2 計(jì)算響應(yīng)時(shí)間\t157
7．2．3 重定向任務(wù)調(diào)度算法的設(shè)計(jì)\t158
7．3 實(shí)驗(yàn)結(jié)果及分析\t160
7．3．1 有效性\t160
7．3．2 可擴(kuò)展性\t161
7．3．3 穩(wěn)定性\t162
7．4 本章小結(jié)\t163
第8章基于Spark內(nèi)存計(jì)算的并行頻繁項(xiàng)集挖掘及優(yōu)化\t165
8．1 引言\t166
8．2 FP-Growth 算法的并行化分析\t167
8．3 Spark環(huán)境下的均衡FP-Growth算法\t169
8．3．1 負(fù)載均衡的分組策略\t169
8．3．2 負(fù)載均衡的FP-Growth算法并行化\t172
8．4 實(shí)驗(yàn)評(píng)價(jià)\t174
8．4．1 算法執(zhí)行效率\t175
8．4．2 加速比\t176
8．4．3 可擴(kuò)展性\t177
8．5 本章小結(jié)\t178
第三篇應(yīng) 用篇
第9章冷軋輥加工質(zhì)量管理過(guò)程相關(guān)性分析\t181
9．1 引言\t182
9．2 系統(tǒng)需求與總體設(shè)計(jì)\t184
9．2．1 軋輥生產(chǎn)工藝流程\t184
9．2．2 冷軋輥生產(chǎn)質(zhì)量管理特點(diǎn)\t186
9．2．3 系統(tǒng)的軟件體系結(jié)構(gòu)及功能\t188
9．3 數(shù)據(jù)預(yù)處理及關(guān)鍵技術(shù)\t190
9．3．1 數(shù)據(jù)轉(zhuǎn)換\t190
9．3．2 數(shù)據(jù)清理\t190
9．3．3 數(shù)據(jù)離散化\t193
9．4 提取關(guān)聯(lián)規(guī)則\t195
9．5 系統(tǒng)實(shí)現(xiàn)及運(yùn)行結(jié)果\t196
9．6 本章小結(jié)\t203
附錄A 冷軋輥加工數(shù)據(jù)\t205
附錄B 冷軋輥加工數(shù)據(jù)預(yù)處理格式\t207
參考文獻(xiàn)\t209