實用機器學習

定　價：￥69.00

作　者：	Henrik Brink，Joseph W. Richards ... 著；程繼洪譯
出版社：	機械工業(yè)出版社
叢編項：	計算機科學先進技術譯叢
標　簽：	暫缺

購買這本書可以去

ISBN：	9787111569220	出版時間：	2017-06-01	包裝：	平裝
開本：	16開	頁數(shù)：		字數(shù)：

內容簡介

　　本書介紹了實用機器學習的工作流程，主要從實用角度進行了描述，沒有數(shù)學公式和推導。本書涵蓋了數(shù)據(jù)收集與處理、模型構建、評價和優(yōu)化、特征的識別、提取和選擇技術、高級特征工程、數(shù)據(jù)可視化技術以及模型的部署和安裝，結合3個真實案例全面、詳細地介紹了整個機器學習流程。后，還介紹了機器學習流程的擴展和大數(shù)據(jù)應用。本書可以作為程序員、數(shù)據(jù)分析師、統(tǒng)計學家、數(shù)據(jù)科學家解決實際問題的參考書，也可以作為機器學習愛好者學習和應用的參考書，還可以作為非專業(yè)學生的機器學習入門參考書，以及專業(yè)學生的實踐參考書。

作者簡介

　　HenrikBrink（亨里克·布林克）是一名數(shù)據(jù)科學家，對應用機器學習進行工業(yè)和學術應用開發(fā)有著豐富的經(jīng)驗?！osephRichards（約瑟夫W理查茲）也是一位數(shù)據(jù)科學家，具有應用統(tǒng)計和預測分析方面的專業(yè)知識。Henrik和Joseph是Wise.io的聯(lián)合創(chuàng)立者，Wise.io是一家提供工業(yè)機器學習解決方案的開發(fā)商。　MarkFetherolf（馬克·弗特羅夫）是數(shù)據(jù)管理和預測分析公司NuminaryDataScience的創(chuàng)始人和總裁。他曾在社會科學研究、化學工程、信息系統(tǒng)性能、容量規(guī)劃、有線電視和在線廣告應用等方面擔任統(tǒng)計師和分析數(shù)據(jù)庫開發(fā)人員。

圖書目錄

推薦序
作者序
致謝
譯者序
關于本書
作者簡介
關于封面插圖
第1部分機器學習工作流程
第1章什么是機器學習
1.1理解機器學習
1.2使用數(shù)據(jù)進行決策
1.2.1傳統(tǒng)方法
1.2.2機器學習方法
1.2.3機器學習的五大優(yōu)勢
1.2.4面臨的挑戰(zhàn)
1.3跟蹤機器學習流程：從數(shù)據(jù)到部署
1.3.1數(shù)據(jù)集合和預處理
1.3.2數(shù)據(jù)構建模型
1.3.3模型性能評估
1.3.4模型性能優(yōu)化
1.4提高模型性能的高級技巧
1.4.1數(shù)據(jù)預處理和特征工程
1.4.2用在線算法持續(xù)改進模型
1.4.3具有數(shù)據(jù)量和速度的規(guī)?；Ｐ?br />1.5總結
1.6本章術語
第2章實用數(shù)據(jù)處理
2.1起步：數(shù)據(jù)收集
2.1.1應包含哪些特征
2.1.2如何獲得目標變量的真實值
2.1.3需要多少訓練數(shù)據(jù)
2.1.4訓練集是否有足夠的代表性
2.2數(shù)據(jù)預處理
2.2.1分類特征
2.2.2缺失數(shù)據(jù)處理
2.2.3簡單特征工程
2.2.4數(shù)據(jù)規(guī)范化
2.3數(shù)據(jù)可視化
2.3.1馬賽克圖
2.3.2盒圖
2.3.3密度圖
2.3.4散點圖
2.4總結
2.5本章術語
第3章建模和預測
3.1基礎機器學習建模
3.1.1尋找輸入和目標間的關系
3.1.2尋求好模型的目的
3.1.3建模方法類型
3.1.4有監(jiān)督和無監(jiān)督學習
3.2分類：把數(shù)據(jù)預測到桶中
3.2.1構建分類器并預測
3.2.2非線性數(shù)據(jù)與復雜分類
3.2.3多類別分類
3.3回歸：預測數(shù)值型數(shù)據(jù)
3.3.1構建回歸器并預測
3.3.2對復雜的非線性數(shù)據(jù)進行回歸
3.4總結
3.5本章術語
第4章模型評估與優(yōu)化
4.1模型泛化：評估新數(shù)據(jù)的預測準確性
4.1.1問題：過度擬合與樂觀模型
4.1.2解決方案：交叉驗證
4.1.3交叉驗證的注意事項
4.2分類模型評估
4.2.1分類精度和混淆矩陣
4.2.2準確度權衡與ROC曲線
4.2.3多類別分類
4.3回歸模型評估
4.3.1使用簡單回歸性能指標
4.3.2檢驗殘差
4.4參數(shù)調整優(yōu)化模型
4.4.1機器學習算法和它們的調整參數(shù)
4.4.2網(wǎng)格搜索
4.5總結
4.6本章術語
第5章基礎特征工程
5.1動機：為什么特征工程很有用
5.1.1什么是特征工程
5.1.2使用特征工程的5個原因
5.1.3特征工程與領域專業(yè)知識
5.2基本特征工程過程
5.2.1實例：事件推薦
5.2.2處理日期和時間特征
5.2.3處理簡單文本特征
5.3特征選擇
5.3.1前向選擇和反向消除
5.3.2數(shù)據(jù)探索的特征選擇
5.3.3實用特征選擇實例
5.4總結
5.5本章術語
第2部分實際應用
第6章案例：NYC出租車數(shù)據(jù)
6.1數(shù)據(jù)：NYC出租車旅程和收費信息
6.1.1數(shù)據(jù)可視化
6.1.2定義問題并準備數(shù)據(jù)
6.2建模
6.2.1基本線性模型
6.2.2非線性分類器
6.2.3包含分類特征
6.2.4包含日期-時間特征
6.2.5模型的啟示
6.3總結
6.4本章術語
第7章高級特征工程
7.1高級文本特征
7.1.1詞袋模型
7.1.2主題建模
7.1.3內容拓展
7.2圖像特征
7.2.1簡單圖像特征
7.2.2提取物體和形狀
7.3時間序列特征
7.3.1時間序列數(shù)據(jù)的類型
7.3.2時間序列數(shù)據(jù)的預測
7.3.3經(jīng)典時間序列特征
7.3.4事件流的特征工程
7.4總結
7.5本章術語
第8章NLP高級案例：電影評論情感預測
8.1研究數(shù)據(jù)和應用場景
8.1.1數(shù)據(jù)集初探
8.1.2檢查數(shù)據(jù)
8.1.3應用場景有哪些
8.2提取基本NLP特征并構建初始模型
8.2.1詞袋特征
8.2.2用樸素貝葉斯算法構建模型
8.2.3tf-idf算法規(guī)范詞袋特征
8.2.4優(yōu)化模型參數(shù)
8.3高級算法和模型部署的考慮
8.3.1word2vec特征
8.3.2隨機森林模型
8.4總結
8.5本章術語
第9章擴展機器學習流程
9.1擴展前需考慮的問題
9.1.1識別關鍵點
9.1.2選取訓練數(shù)據(jù)子樣本代替擴展性
9.1.3可擴展的數(shù)據(jù)管理系統(tǒng)
9.2機器學習建模流程擴展
9.3預測擴展
9.3.1預測容量擴展
9.3.2預測速度擴展
9.4總結
9.5本章術語
第10章案例：數(shù)字顯示廣告
10.1顯示廣告
10.2數(shù)字廣告數(shù)據(jù)
10.3特征工程和建模策略
10.4數(shù)據(jù)大小和形狀
10.5奇異值分解
10.6資源估計和優(yōu)化
10.7建模
10.8K近鄰算法
10.9隨機森林算法
10.10其他實用考慮
10.11總結
10.12本章術語
10.13摘要和結論
附錄常用機器學習算法
名詞術語中英文對照