日本毛茸茸的丰满熟妇,亚洲MMM在线.国际

內(nèi)容簡介

　　本書通過通俗易懂的語言、豐富的圖示和生動的實例，撥開了籠罩在機器學(xué)習(xí)上方復(fù)雜的數(shù)學(xué)“烏云”，讓讀者以較低的代價和門檻入門機器學(xué)習(xí)。本書共分為11章，介紹了在Python環(huán)境下學(xué)習(xí)scikit—learn機器學(xué)習(xí)框架的相關(guān)知識，涵蓋的主要內(nèi)容有機器學(xué)習(xí)概述、Python機器學(xué)習(xí)軟件包、機器學(xué)習(xí)理論基礎(chǔ)、k—近鄰算法、線性回歸算法、邏輯回歸算法、決策樹、支持向量機、樸素貝葉斯算法、PCA算法和k—均值算法等。本書適合有一定編程基礎(chǔ)的讀者閱讀，尤其適合想從事機器學(xué)習(xí)、人工智能、深度學(xué)習(xí)及機器人相關(guān)技術(shù)的程序員和愛好者閱讀。另外，相關(guān)院校和培訓(xùn)機構(gòu)也可以將本書作為教材使用。

作者簡介

暫缺《scikit learn機器學(xué)習(xí)：常用算法原理及編程實戰(zhàn)》作者簡介

圖書目錄

目錄
前言
第1章機器學(xué)習(xí)介紹1
1.1 什么是機器學(xué)習(xí)1
　　1.2 機器學(xué)習(xí)有什么用2
　　1.3 機器學(xué)習(xí)的分類3
　　1.4 機器學(xué)習(xí)應(yīng)用開發(fā)的典型步驟4
1.4.1 數(shù)據(jù)采集和標記4
1.4.2 數(shù)據(jù)清洗5
1.4.3 特征選擇5
1.4.4 模型選擇5
1.4.5 模型訓(xùn)練和測試5
1.4.6 模型性能評估和優(yōu)化5
1.4.7 模型使用6
　　1.5 復(fù)習(xí)題6
第2章 Python機器學(xué)習(xí)軟件包7
　　2.1 開發(fā)環(huán)境搭建7
　　2.2 IPython簡介8
2.2.1 IPython基礎(chǔ)8
2.2.2 IPython圖形界面13
　　2.3 Numpy簡介15
2.3.1 Numpy數(shù)組15
2.3.2 Numpy運算19
　　2.4 Pandas簡介32
2.4.1 基本數(shù)據(jù)結(jié)構(gòu)32
2.4.2 數(shù)據(jù)排序34
2.4.3 數(shù)據(jù)訪問34
2.4.4 時間序列36
2.4.5 數(shù)據(jù)可視化36
2.4.6 文件讀寫38
　　2.5 Matplotlib簡介38
2.5.1 圖形樣式38
2.5.2 圖形對象40
2.5.3 畫圖操作46
　　2.6 scikit-learn簡介51
2.6.1 scikit-learn示例51
2.6.2 scikit-learn一般性原理和通用規(guī)則55
　　2.7 復(fù)習(xí)題56
　　2.8 拓展學(xué)習(xí)資源57
第3章機器學(xué)習(xí)理論基礎(chǔ)58
　　3.1 過擬合和欠擬合58
　　3.2 成本函數(shù)59
　　3.3 模型準確性60
3.3.1 模型性能的不同表述方式61
3.3.2 交叉驗證數(shù)據(jù)集61
　　3.4 學(xué)習(xí)曲線62
3.4.1 實例：畫出學(xué)習(xí)曲線62
3.4.2 過擬合和欠擬合的特征65
　　3.5 算法模型性能優(yōu)化65
　　3.6 查準率和召回率66
　　3.7 F1 Score67
　　3.8 復(fù)習(xí)題67
第4章 k-近鄰算法69
　　4.1 算法原理69
4.1.1 算法優(yōu)缺點69
4.1.2 算法參數(shù)70
4.1.3 算法的變種70
　　4.2 示例：使用k-近鄰算法進行分類70
　　4.3 示例：使用k-近鄰算法進行回歸擬合72
　　4.4 實例：糖尿病預(yù)測74
4.4.1 加載數(shù)據(jù)74
4.4.2 模型比較75
4.4.3 模型訓(xùn)練及分析77
4.4.4 特征選擇及數(shù)據(jù)可視化78
　　4.5 拓展閱讀80
4.5.1 如何提高k-近鄰算法的運算效率80
4.5.2 相關(guān)性測試80
　　4.6 復(fù)習(xí)題81
第5章線性回歸算法83
　　5.1 算法原理83
5.1.1 預(yù)測函數(shù)83
5.1.2 成本函數(shù)84
5.1.3 梯度下降算法84
　　5.2 多變量線性回歸算法86
5.2.1 預(yù)測函數(shù)86
5.2.2 成本函數(shù)87
5.2.3 梯度下降算法88
　　5.3 模型優(yōu)化89
5.3.1 多項式與線性回歸89
5.3.2 數(shù)據(jù)歸一化89
　　5.4 示例：使用線性回歸算法擬合正弦函數(shù)90
　　5.5 示例：測算房價92
5.5.1 輸入特征92
5.5.2 模型訓(xùn)練93
5.5.3 模型優(yōu)化94
5.5.4 學(xué)習(xí)曲線95
　　5.6 拓展閱讀96
5.6.1 梯度下降迭代公式推導(dǎo)96
5.6.2 隨機梯度下降算法96
5.6.3 標準方程97
　　5.7 復(fù)習(xí)題97
第6章邏輯回歸算法98
　　6.1 算法原理98
6.1.1 預(yù)測函數(shù)98
6.1.2 判定邊界99
6.1.3 成本函數(shù)100
6.1.4 梯度下降算法102
　　6.2 多元分類102
　　6.3 正則化103
6.3.1 線性回歸模型正則化103
6.3.2 邏輯回歸模型正則化104
　　6.4 算法參數(shù)104
　　6.5 實例：乳腺癌檢測106
6.5.1 數(shù)據(jù)采集及特征提取106
6.5.2 模型訓(xùn)練108
6.5.3 模型優(yōu)化110
6.5.4 學(xué)習(xí)曲線111
　　6.6 拓展閱讀113
　　6.7 復(fù)習(xí)題114
第7章決策樹115
　　7.1 算法原理115
7.1.1 信息增益116
7.1.2 決策樹的創(chuàng)建119
7.1.3 剪枝算法120
　　7.2 算法參數(shù)121
　　7.3 實例：預(yù)測泰坦尼克號幸存者122
7.3.1 數(shù)據(jù)分析122
7.3.2 模型訓(xùn)練123
7.3.3 優(yōu)化模型參數(shù)124
7.3.4 模型參數(shù)選擇工具包127
　　7.4 拓展閱讀130
7.4.1 熵和條件熵130
7.4.2 決策樹的構(gòu)建算法130
　　7.5 集合算法131
7.5.1 自助聚合算法Bagging131
7.5.2 正向激勵算法boosting131
7.5.3 隨機森林132
7.5.4 ExtraTrees算法133
　　7.6 復(fù)習(xí)題133
第8章支持向量機134
　　8.1 算法原理134
8.1.1 大間距分類算法134
8.1.2 松弛系數(shù)136
　　8.2 核函數(shù)138
8.2.1 最簡單的核函數(shù)138
8.2.2 相似性函數(shù)140
8.2.3 常用的核函數(shù)141
8.2.4 核函數(shù)的對比142
　　8.3 scikit-learn里的SVM144
　　8.4 實例：乳腺癌檢測146
　　8.5 復(fù)習(xí)題149
第9章樸素貝葉斯算法151
　　9.1 算法原理151
9.1.1 貝葉斯定理151
9.1.2 樸素貝葉斯分類法152
　　9.2 一個簡單的例子153
　　9.3 概率分布154
9.3.1 概率統(tǒng)計的基本概念154
9.3.2 多項式分布155
9.3.3 高斯分布158
　　9.4 連續(xù)值的處理159
　　9.5 實例：文檔分類160
9.5.1 獲取數(shù)據(jù)集160
9.5.2 文檔的數(shù)學(xué)表達161
9.5.3 模型訓(xùn)練163
9.5.4 模型評價165
　　9.6 復(fù)習(xí)題167
第10章 PCA算法168
　　10.1 算法原理168
10.1.1 數(shù)據(jù)歸一化和縮放169
10.1.2 計算協(xié)方差矩陣的特征向量169
10.1.3 數(shù)據(jù)降維和恢復(fù)170
　　10.2 PCA 算法示例171
10.2.1 使用Numpy模擬PCA計算過程171
10.2.2 使用sklearn進行PCA降維運算173
10.2.3 PCA的物理含義174
　　10.3 PCA 的數(shù)據(jù)還原率及應(yīng)用175
10.3.1 數(shù)據(jù)還原率175
10.3.2 加快監(jiān)督機器學(xué)習(xí)算法的運算速度176
　　10.4 實例：人臉識別176
10.4.1 加載數(shù)據(jù)集176
10.4.2 一次失敗的嘗試179
10.4.3 使用PCA來處理數(shù)據(jù)集182
10.4.4 最終結(jié)果185
　　10.5 拓展閱讀189
　　10.6 復(fù)習(xí)題189
第11章 k-均值算法190
　　11.1 算法原理190
11.1.1 k-均值算法成本函數(shù)191
11.1.2 隨機初始化聚類中心點191
11.1.3 選擇聚類的個數(shù)192
　　11.2 scikit-learn里的k-均值算法192
　　11.3 使用k-均值對文檔進行聚類分析195
11.3.1 準備數(shù)據(jù)集195
11.3.2 加載數(shù)據(jù)集196
11.3.3 文本聚類分析197
　　11.4 聚類算法性能評估200
11.4.1 Adjust Rand Index200
11.4.2 齊次性和完整性201
11.4.3 輪廓系數(shù)203
　　11.5 復(fù)習(xí)題204
　　后記205