注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)挖掘/數(shù)據(jù)倉(cāng)庫(kù)Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(第3版)

Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(第3版)

Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(第3版)

定 價(jià):¥89.00

作 者: 張春福 白婧 張良均 范林元 吳建平
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書可以去


ISBN: 9787111764793 出版時(shí)間: 2024-12-01 包裝: 平裝-膠訂
開本: 16開 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書共13章,分三個(gè)部分:基礎(chǔ)篇、實(shí)戰(zhàn)篇、提高篇。 (1)基礎(chǔ)篇(第1~5章),第1章的主要內(nèi)容是數(shù)據(jù)挖掘概述;第2章對(duì)本書所用到的數(shù)據(jù)挖掘建模工具Python語(yǔ)言進(jìn)行了簡(jiǎn)明扼要的說明;第3章、第4章、第5章對(duì)數(shù)據(jù)挖掘的建模過程,包括數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理及挖掘建模的常用算法與原理進(jìn)行了介紹。 (2)實(shí)戰(zhàn)篇(第6~12章),重點(diǎn)對(duì)數(shù)據(jù)挖掘技術(shù)在金融、航空、零售、農(nóng)業(yè)、制造和互聯(lián)網(wǎng)等行業(yè)的應(yīng)用進(jìn)行了分析。在案例結(jié)構(gòu)組織上,本書是按照先介紹案例背景與挖掘目標(biāo),再闡述分析方法與過程,最后完成模型構(gòu)建的順序進(jìn)行的,在建模過程關(guān)鍵環(huán)節(jié),穿插程序?qū)崿F(xiàn)代碼。最后通過上機(jī)實(shí)踐,加深數(shù)據(jù)挖掘技術(shù)在案例應(yīng)用中的理解。 (3)提高篇(第13章),圍繞去編程化的TipDM大數(shù)據(jù)挖掘建模平臺(tái),先介紹了平臺(tái)每個(gè)模塊的功能,再以航空公司客戶價(jià)值分析案例為例,介紹如何使用平臺(tái)快速搭建數(shù)據(jù)分析與挖掘的工程,展示平臺(tái)去編程化、流程化的特點(diǎn)。

作者簡(jiǎn)介

  資深大數(shù)據(jù)挖掘?qū)<液湍J阶R(shí)別專家,高級(jí)信息項(xiàng)目管理師。10余年大數(shù)據(jù)挖掘應(yīng)用、咨詢和培訓(xùn)經(jīng)驗(yàn)。為電信、電力、政府、互聯(lián)網(wǎng)、生產(chǎn)制造、零售、銀行、生物、化工、醫(yī)藥等多個(gè)行業(yè)上百家大型企業(yè)提供過數(shù)據(jù)挖掘應(yīng)用與咨詢服務(wù),實(shí)踐經(jīng)驗(yàn)非常豐富。精通Java EE企業(yè)級(jí)應(yīng)用開發(fā),是華南師范大學(xué)、中南財(cái)經(jīng)政法大學(xué)、廣東工業(yè)大學(xué)、西安理工大學(xué)、廣西科技大學(xué)、重慶交通大學(xué)、桂林電子科技大學(xué)等校外碩導(dǎo)。

圖書目錄

目  錄 Contents
前言
基礎(chǔ)篇
第1章 數(shù)據(jù)挖掘基礎(chǔ)2
1.1 某知名連鎖餐飲企業(yè)的困惑2
1.2 從餐飲服務(wù)到數(shù)據(jù)挖掘4
1.3 數(shù)據(jù)挖掘的基本任務(wù)4
1.4 數(shù)據(jù)挖掘的建模過程5
1.4.1 目標(biāo)定義5
1.4.2 數(shù)據(jù)采集6
1.4.3 數(shù)據(jù)探索7
1.4.4 數(shù)據(jù)預(yù)處理8
1.4.5 挖掘建模8
1.4.6 模型評(píng)價(jià)8
1.5 常用的數(shù)據(jù)挖掘建模工具8
1.6 小結(jié)10
第2章 Python數(shù)據(jù)分析簡(jiǎn)介11
2.1 搭建Python開發(fā)平臺(tái)12
2.1.1 需要考慮的問題12
2.1.2 基礎(chǔ)平臺(tái)的搭建13
2.2 Python使用入門14
2.2.1 運(yùn)行方式14
2.2.2 基本命令15
2.2.3 數(shù)據(jù)結(jié)構(gòu)18
2.2.4 庫(kù)的導(dǎo)入與添加23
2.3 Python數(shù)據(jù)分析工具25
2.3.1 NumPy26
2.3.2 SciPy27
2.3.3 Matplotlib28
2.3.4 pandas29
2.3.5 StatsModels31
2.3.6 scikit-learn31
2.3.7 Keras33
2.3.8 Gensim35
2.3.9 TensorFlow35
2.3.10 PyTorch39
2.3.11 PaddlePaddle42
2.3.12 XGBoost45
2.4 配套附件使用設(shè)置47
2.5 小結(jié)47
第3章 數(shù)據(jù)探索48
3.1 數(shù)據(jù)質(zhì)量分析48
3.1.1 缺失值分析49
3.1.2 異常值分析49
3.1.3 一致性分析53
3.2 數(shù)據(jù)特征分析53
3.2.1 分布分析53
3.2.2 對(duì)比分析58
3.2.3 統(tǒng)計(jì)量分析60
3.2.4 周期性分析63
3.2.5 貢獻(xiàn)度分析65
3.2.6 相關(guān)性分析67
3.3 Python的主要數(shù)據(jù)探索函數(shù)71
3.3.1 基本統(tǒng)計(jì)特征函數(shù)71
3.3.2 拓展統(tǒng)計(jì)特征函數(shù)75
3.3.3 統(tǒng)計(jì)繪圖函數(shù)76
3.4 小結(jié)83
第4章 數(shù)據(jù)預(yù)處理84
4.1 數(shù)據(jù)清洗84
4.1.1 缺失值處理84
4.1.2 異常值處理89
4.1.3 重復(fù)值處理89
4.2 數(shù)據(jù)集成91
4.2.1 實(shí)體識(shí)別91
4.2.2 冗余屬性識(shí)別91
4.3 數(shù)據(jù)變換92
4.3.1 簡(jiǎn)單函數(shù)變換92
4.3.2 數(shù)據(jù)規(guī)范化92
4.3.3 連續(xù)屬性離散化95
4.3.4 屬性構(gòu)造97
4.3.5 小波變換98
4.4 數(shù)據(jù)歸約101
4.4.1 屬性歸約101
4.4.2 數(shù)值歸約106
4.5 Python的主要數(shù)據(jù)預(yù)處理函數(shù)109
4.6 小結(jié)111
第5章 挖掘建模113
5.1 分類與預(yù)測(cè)113
5.1.1 實(shí)現(xiàn)過程114
5.1.2 常用的分類與預(yù)測(cè)算法114
5.1.3 回歸分析115
5.1.4 決策樹119
5.1.5 人工神經(jīng)網(wǎng)絡(luò)126
5.1.6 分類與預(yù)測(cè)算法評(píng)價(jià)131
5.1.7 Python的分類預(yù)測(cè)模型136
5.2 聚類分析136
5.2.1 常用的聚類分析算法137
5.2.2 k均值聚類算法138
5.2.3 聚類分析算法評(píng)價(jià)143
5.2.4 Python的主要聚類分析算法144
5.3 關(guān)聯(lián)規(guī)則146
5.3.1 常用的關(guān)聯(lián)規(guī)則算法147
5.3.2 Apriori算法147
5.4 時(shí)序模式153
5.4.1 時(shí)間序列算法153
5.4.2 時(shí)間序列的預(yù)處理154
5.4.3 平穩(wěn)時(shí)間序列分析156
5.4.4 非平穩(wěn)時(shí)間序列分析159
5.4.5 Python的主要時(shí)序模式算法167
5.5 離群點(diǎn)檢測(cè)170
5.5.1 離群點(diǎn)的成因及類型170
5.5.2 離群點(diǎn)檢測(cè)方法171
5.5.3 基于統(tǒng)計(jì)模型的離群點(diǎn)
   檢測(cè)方法172
5.5.4 基于聚類的離群點(diǎn)檢測(cè)方法174
5.6 小結(jié)177
實(shí)戰(zhàn)篇
第6章 房屋租金影響因素分析
    與預(yù)測(cè)180
6.1 背景與挖掘目標(biāo)180
6.2 分析方法與過程181
6.2.1 數(shù)據(jù)預(yù)處理181
6.2.2 數(shù)據(jù)探索190
6.2.3 模型構(gòu)建201
6.3 上機(jī)實(shí)驗(yàn)207
6.4 拓展思考208
6.5 小結(jié)209
第7章 商超客戶價(jià)值分析210
7.1 背景與挖掘目標(biāo)210
7.2 分析方法與過程211
7.2.1 數(shù)據(jù)探索與預(yù)處理212
7.2.2 模型構(gòu)建及結(jié)果分析228
7.3 上機(jī)實(shí)驗(yàn)238
7.4 拓展思考239
7.5 小結(jié)240
第8章 商品零售購(gòu)物籃分析241
8.1 背景與挖掘目標(biāo)241
8.2 分析方法與過程242
8.2.1 數(shù)據(jù)探索分析243
8.2.2 數(shù)據(jù)預(yù)處理249
8.2.3 模型構(gòu)建249
8.3 上機(jī)實(shí)驗(yàn)255
8.4 拓展思考256
8.5 小結(jié)256
第9章 基于水色圖像的水質(zhì)評(píng)價(jià)257
9.1 背景與挖掘目標(biāo)257
9.2 分析方法與過程258
9.2.1 分析流程259
9.2.2 數(shù)據(jù)預(yù)處理259
9.2.3 模型構(gòu)建263
9.2.4 水質(zhì)評(píng)價(jià)264
9.3 上機(jī)實(shí)驗(yàn)265
9.4 拓展思考265
9.5 小結(jié)266
第10章 家用熱水器用戶行為
     分析與事件識(shí)別267
10.1 背景與挖掘目標(biāo)267
10.2 分析方法與過程268
10.2.1 數(shù)據(jù)探索分析269
10.2.2 數(shù)據(jù)預(yù)處理272
10.2.3 模型構(gòu)建283
10.2.4 模型檢驗(yàn)284
10.3 上機(jī)實(shí)驗(yàn)285
10.4 拓展思考287
10.5 小結(jié)288
第11章 電視產(chǎn)品個(gè)性化推薦289
11.1 背景與挖掘目標(biāo)289
11.2 分析方法與過程290
11.2.1 分析流程291
11.2.2 數(shù)據(jù)預(yù)處理291
11.2.3 分析與建模306
11.2.4 模型評(píng)價(jià)310
11.3 上機(jī)實(shí)驗(yàn)313
11.4 拓展思考314
11.5 小結(jié)314
第12章 天問一號(hào)事件中的網(wǎng)民
    評(píng)論情感分析315
12.1 背景與挖掘目標(biāo)315
12.2 分析方法與過程316
12.2.1 分析流程316
12.2.2 數(shù)據(jù)說明317
12.2.3 數(shù)據(jù)探索318
12.2.4 文本預(yù)處理323
12.2.5 繪制詞云圖327
12.2.6 使用樸素貝葉斯構(gòu)建
    情感分析模型331
12.2.7 模型評(píng)價(jià)338
12.2.8 模型優(yōu)化340
12.3 上機(jī)實(shí)驗(yàn)344
12.4 拓展思考345
12.5 小結(jié)345
提高篇
第13章 基于TipDM大數(shù)據(jù)挖掘
     建模平臺(tái)實(shí)現(xiàn)商超客戶
     價(jià)值分析348
13.1 平臺(tái)簡(jiǎn)介348
13.1.1 “共享庫(kù)”模塊350
13.1.2 “數(shù)據(jù)連接”模塊350
13.1.3 “數(shù)據(jù)集”模塊350
13.1.4 “我的工程”模塊351
13.1.5 “個(gè)人組件”模塊354
13.2 快速構(gòu)建數(shù)據(jù)挖掘工程355
13.2.1 數(shù)據(jù)源配置355
13.2.2 數(shù)據(jù)探索與處理360
13.2.3 模型構(gòu)建與結(jié)果分析379
13.3 小結(jié)393

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)