注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計Python機器學(xué)習(xí)與可視化分析實戰(zhàn)

Python機器學(xué)習(xí)與可視化分析實戰(zhàn)

Python機器學(xué)習(xí)與可視化分析實戰(zhàn)

定 價:¥69.00

作 者: 王曉華 著
出版社: 清華大學(xué)出版社
叢編項: 大數(shù)據(jù)技術(shù)叢書
標(biāo) 簽: 暫缺

ISBN: 9787302616177 出版時間: 2022-09-01 包裝: 平裝
開本: 16開 頁數(shù): 229 字?jǐn)?shù):  

內(nèi)容簡介

  使用機器學(xué)習(xí)進行數(shù)據(jù)可視化分析是近年來研究的熱點內(nèi)容之一。本書使用z新的Python作為機器學(xué)習(xí)的基本語言和工具,從搭建環(huán)境開始,逐步深入到理論、代碼、應(yīng)用實踐中去,從而使初學(xué)者能夠獨立使用機器學(xué)習(xí)完成數(shù)據(jù)分析。本書配套示例代碼、PPT課件和答疑服務(wù)。 本書分為10章,內(nèi)容包括:機器學(xué)習(xí)與Python開發(fā)環(huán)境、用于數(shù)據(jù)處理及可視化展示的Python類庫、NBA賽季數(shù)據(jù)可視化分析、聚類算法與可視化實戰(zhàn)、線性回歸與可視化實戰(zhàn)、邏輯回歸與可視化實戰(zhàn)、決策樹算法與可視化實戰(zhàn)、基于深度學(xué)習(xí)的酒店評論情感分類實戰(zhàn)、基于深度學(xué)習(xí)的手寫體圖像識別實戰(zhàn)、TensorFlow Datasets和TensorBoard訓(xùn)練可視化。 本書內(nèi)容詳盡、示例豐富,是機器學(xué)習(xí)初學(xué)者的入門書和必備的參考書,也可作為高等院校計算機及大數(shù)據(jù)相關(guān)專業(yè)的教材使用。

作者簡介

  王曉華,計算機專業(yè)講師,長期講授面向?qū)ο蟪绦蛟O(shè)計、數(shù)據(jù)結(jié)構(gòu)、Hadoop程序設(shè)計等研究生和本科生相關(guān)課程;主要研究方向為云計算、數(shù)據(jù)挖掘。曾主持和參與多項國家和省級科研課題,獨立科研項目獲省級成果認定,發(fā)表過多篇論文,擁有一項國家專利。著有《Spark MLlib機器學(xué)習(xí)實踐》《TensorFlow深度學(xué)習(xí)應(yīng)用實踐》《OpenCV+TensorFlow深度學(xué)習(xí)與計算機視覺實戰(zhàn)》《TensorFlow 2.0卷積神經(jīng)網(wǎng)絡(luò)實戰(zhàn)》《TensorFlow+Keras自然語言處理實戰(zhàn)》等圖書。

圖書目錄

第1章 機器學(xué)習(xí)與Python開發(fā)環(huán)境 1
1.1 機器學(xué)習(xí)概述 1
1.1.1 機器學(xué)習(xí)的前世今生 1
1.1.2 機器學(xué)習(xí)的研究現(xiàn)狀與方向 3
1.1.3 機器學(xué)習(xí)之美——數(shù)據(jù)的可視化 4
1.2 Python的基本安裝和用法 5
1.2.1 Anaconda的下載與安裝 6
1.2.2 Python編譯器PyCharm的安裝 8
1.2.3 使用Python實現(xiàn)softmax函數(shù)計算 11
1.3 Python常用類庫中的threading 12
1.3.1 threading模塊中的Thread類 13
1.3.2 threading中Lock類 14
1.3.3 threading中Join類 15
1.4 本章小結(jié) 16
第2章 用于數(shù)據(jù)處理及可視化展示的 Python類庫 17
2.1 從小例子起步——NumPy的初步使用 17
2.1.1 數(shù)據(jù)的矩陣化 17
2.1.2 數(shù)據(jù)分析 19
2.1.3 基于統(tǒng)計分析的數(shù)據(jù)處理 20
2.2 圖形化數(shù)據(jù)處理——Matplotlib包的使用 21
2.2.1 差異的可視化 21
2.2.2 坐標(biāo)圖的展示 22
2.2.3 大數(shù)據(jù)的可視化展示 23
2.3 常用的統(tǒng)計分析方法——相似度計算 26
2.3.1 歐幾里得相似度計算 26
2.3.2 余弦相似度計算 27
2.3.3 歐幾里得相似度與余弦相似度的比較 28
2.4 數(shù)據(jù)的統(tǒng)計學(xué)可視化展示 28
2.4.1 數(shù)據(jù)的四分位數(shù) 28
2.4.2 數(shù)據(jù)的四分位數(shù)示例 29
2.4.3 數(shù)據(jù)的標(biāo)準(zhǔn)化 32
2.4.4 數(shù)據(jù)的平行化處理 34
2.4.5 熱力圖——屬性相關(guān)性檢測 35
2.5 Python分析某地降雨量變化規(guī)律 36
2.5.1 不同年份的相同月份統(tǒng)計 36
2.5.2 不同月份之間的增減程度比較 38
2.5.3 每月降雨是否相關(guān) 39
2.6 本章小結(jié) 40
第3章 NBA賽季數(shù)據(jù)可視化分析 41
3.1 基于球員薪資的數(shù)據(jù)分析 41
3.1.1 關(guān)于球員薪資的一些基本分析 41
3.1.2 關(guān)于球員RPM相關(guān)性的分析 44
3.1.3 關(guān)于球員RPM數(shù)據(jù)的分析 45
3.2 Seaborn常用的數(shù)據(jù)可視化方法 46
3.2.1 關(guān)于RPM、薪資和年齡的一元可視化分析 46
3.2.2 關(guān)于RPM、薪資、年齡的二元可視化分析 47
3.2.3 關(guān)于衍生變量的可視化分析 49
3.2.4 NBA球隊數(shù)據(jù)的分析結(jié)果 51
3.3 NBA賽季數(shù)據(jù)分析 53
3.3.1 關(guān)于賽季發(fā)展的一些基本分析 53
3.3.2 群星璀璨的NBA 57
3.3.3 關(guān)于球員高級數(shù)據(jù)的一些基本分析 65
3.4 本章小結(jié) 66
第4章 聚類算法與可視化實戰(zhàn) 67
4.1 聚類的定義 67
4.1.1 衡量距離的方法 68
4.1.2 聚類算法介紹 72
4.2 經(jīng)典K-means聚類算法實戰(zhàn) 76
4.2.1 經(jīng)典K-means算法的Python實現(xiàn) 76
4.2.2 基于Iris數(shù)據(jù)集的可視化分析 78
4.2.3 投某音還是投某寶?基于K-means的廣告效果聚類分析 81
4.3 基于密度的聚類算法DBSCAN 88
4.3.1 DBSCAN算法原理與Python實現(xiàn) 89
4.3.2 基于sklearn的DBSCAN實戰(zhàn) 93
4.3.3 DBSCAN的優(yōu)缺點比較 95
4.4 基于層次的聚類算法 96
4.4.1 基于層次算法的原理 96
4.4.2 Agglomerative算法與示例 98
4.5 本章小結(jié) 101
第5章 線性回歸與可視化實戰(zhàn) 102
5.1 線性回歸的基本內(nèi)容與Python實現(xiàn) 102
5.1.1 什么是線性回歸 102
5.1.2 最小二乘法詳解 103
5.1.3 道士下山的故事——隨機梯度下降算法 105
5.1.4 基于一元線性回歸的比薩餅價格計算 107
5.1.5 線性回歸的評價指標(biāo) 109
5.1.6 線性回歸應(yīng)用 110
5.2 多元線性回歸實戰(zhàn) 111
5.2.1 多元線性回歸的基本內(nèi)容 112
5.2.2 多元線性回歸的Python實現(xiàn) 113
5.2.3 基于多元線性回歸的房價預(yù)測實戰(zhàn) 115
5.3 本章小結(jié) 122
第6章 邏輯回歸與可視化實戰(zhàn) 123
6.1 邏輯回歸的基本內(nèi)容與Python實現(xiàn) 123
6.1.1 邏輯回歸是一個分類任務(wù) 124
6.1.2 邏輯回歸的基本內(nèi)容 124
6.1.3 鏈?zhǔn)角髮?dǎo)法則 126
6.1.4 邏輯回歸中的Sigmoid函數(shù) 131
6.2 基于邏輯回歸的鳶尾花(Iris)分類 132
6.2.1 鳶尾花數(shù)據(jù)集簡介與基礎(chǔ)可視化分析 132
6.2.2 鳶尾花數(shù)據(jù)集進階可視化分析 135
6.2.3 基于鳶尾花數(shù)據(jù)集的數(shù)據(jù)挖掘 137
6.2.4 基于線性回歸與K-means的鳶尾花數(shù)據(jù)集分類 140
6.2.5 基于邏輯回歸的鳶尾花數(shù)據(jù)集分類 143
6.3 本章小結(jié) 147
第7章 決策樹算法與可視化實戰(zhàn) 148
7.1 水晶球的秘密 148
7.1.1 決策樹 149
7.1.2 決策樹的算法基礎(chǔ)——信息熵 149
7.1.3 決策樹的算法基礎(chǔ)——ID3算法 151
7.2 決策樹背后的信息——信息熵與交叉熵 152
7.2.1 交叉熵基本原理詳解 152
7.2.2 交叉熵的表述 154
7.3 決策樹實戰(zhàn)——分類與回歸樹 156
7.3.1 分類樹與回歸樹的區(qū)別 156
7.3.2 基于分類樹的鳶尾花分類實戰(zhàn) 157
7.3.2 基于回歸樹的波士頓房價預(yù)測 158
7.4 基于隨機森林的信用卡違約實戰(zhàn) 159
7.4.1 隨機森林的基本內(nèi)容 159
7.4.2 隨機森林與決策樹的可視化比較 161
7.4.3 基于隨機森林的信用卡違約檢測 164
7.5 本章小結(jié) 175
第8章 基于深度學(xué)習(xí)的酒店評論情感分類實戰(zhàn) 176
8.1 深度學(xué)習(xí) 176
8.1.1 何為深度學(xué)習(xí) 176
8.1.2 與傳統(tǒng)的“淺層學(xué)習(xí)”的區(qū)別 178
8.2 酒店評論情感分類——深度學(xué)習(xí)入門 178
8.3 深度學(xué)習(xí)的流程、應(yīng)用場景和模型分類 182
8.3.1 深度學(xué)習(xí)的流程與應(yīng)用場景 182
8.3.2 深度學(xué)習(xí)的模型分類 183
8.3 本章小結(jié) 184
第9章 基于深度學(xué)習(xí)的手寫體圖像識別實戰(zhàn) 185
9.1 卷積運算的基本概念 185
9.1.1 卷積運算 186
9.1.2 TensorFlow中卷積函數(shù)的實現(xiàn) 187
9.1.3 池化運算 189
9.1.4 softmax激活函數(shù) 190
9.1.5 卷積神經(jīng)網(wǎng)絡(luò)原理 191
9.2 MNIST手寫體識別 193
9.2.1 MNIST數(shù)據(jù)集 193
9.2.2 MNIST數(shù)據(jù)集特征和標(biāo)簽 195
9.2.3 卷積神經(jīng)網(wǎng)絡(luò)編程實戰(zhàn):MNIST數(shù)據(jù)集 197
9.3 基于多層感知機的手寫體識別 200
9.3.1 多層感知機的原理與實現(xiàn) 201
9.3.2 多層感知機的激活函數(shù) 203
9.4 消除過擬合——正則化與dropout 205
9.4.1 正則化與dropout概述 205
9.4.2 使用防過擬合處理的多層感知機 206
9.4.3 Keras創(chuàng)建多層感知機的細節(jié)問題 207
9.5 本章小結(jié) 208
第10章 TensorFlow Datasets和TensorBoard 訓(xùn)練可視化 210
10.1 TensorFlow Datasets簡介 210
10.1.1 TensorFlow Datasets的安裝 212
10.1.2 TensorFlow Datasets的使用 212
10.2 TensorFlow Datasets數(shù)據(jù)集的使用——FashionMNIST 214
10.2.1 FashionMNIST數(shù)據(jù)集的下載與展示 215
10.2.2 模型的建立與訓(xùn)練 216
10.3 使用Keras對FashionMNIST數(shù)據(jù)集進行處理 218
10.3.1 獲取數(shù)據(jù)集 218
10.3.2 數(shù)據(jù)集的調(diào)整 218
10.3.3 使用Python類函數(shù)建立模型 219
10.3.4 Model的查看和參數(shù)打印 220
10.3.5 模型的訓(xùn)練和評估 221
10.4 使用TensorBoard可視化訓(xùn)練過程 223
10.4.1 TensorBoard的文件夾的設(shè)置 223
10.4.2 TensorBoard的顯式調(diào)用 224
10.4.3 TensorBoard的使用 225
10.5 本章小結(jié) 229

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號