注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術工業(yè)技術建筑科學建筑設計Python數據科學導論:概念、技術與應用

Python數據科學導論:概念、技術與應用

Python數據科學導論:概念、技術與應用

定 價:¥59.00

作 者: (西)勞拉·伊瓜爾,桑蒂·塞吉
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111604648 出版時間: 2018-09-01 包裝:
開本: 頁數: 字數:  

內容簡介

  《Python數據科學導論》通過理論與實踐相結合的方式來闡述數據科學的一系列重要概念及算法,以使讀者學會如何管理并利用數據。本書共有11章,第1章概要地介紹了數據科學的現狀并給出了一些使用本書的建議;第2章介紹了Python語言數據科學生態(tài)系統(tǒng),涉及NumPy、SciPy和Pandas等熱門第三方庫;第3~7章著重講解了統(tǒng)計學和機器學習的知識,涉及描述統(tǒng)計學、統(tǒng)計推斷、監(jiān)督學習、回歸分析、無監(jiān)督學習等主題;第8~10章詳細介紹了數據科學的一些主要應用,如網絡分析、推薦系統(tǒng)和情感分析;第11章介紹了并行計算及性能優(yōu)化方法。

作者簡介

  Laura Igual博士是巴塞羅那大學數學和計算機科學系的副教授。她于2000 年獲得西班牙瓦倫西亞大學的數學學位,并于2006 年獲得西班牙龐培法布拉大學的博士學位。她的研究領域包括計算機視覺、醫(yī)學成像、機器學習和數據科學。Santi Seguí博士是巴塞羅那大學數學和計算機科學系的助理教授。自2007 年起,他擔任了西班牙巴塞羅那自治大學的計算機科學工程師。他于2011 年獲得西班牙巴塞羅那大學的博士學位。他的研究領域包括計算機視覺、應用機器學習和數據科學。

圖書目錄

譯者序

原書前言

作者和貢獻者簡介

第1章 數據科學概述 // 1 

1.1 什么是數據科學 //1 

1.2 關于本書 //2

第2章 數據專家的工具箱 //4 

2.1 引言 // 4 

2.2 為什么選擇Python // 4 

2.3 數據專家的基本Python庫 // 5 

2.3.1 數值和科學計算:NumPy和SciPy // 5 

2.3.2 Scikit-learn:Python中的機器學習庫 // 5 

2.3.3 Pandas:Python數據分析庫 // 5 

2.4 數據科學生態(tài)系統(tǒng)的安裝 // 6 

2.5 集成開發(fā)環(huán)境 // 6 

2.5.1 網絡集成開發(fā)環(huán)境:Jupyter // 7 

2.6 數據專家從Python開始 // 7 

2.6.1 讀取 // 11 

2.6.2 選擇數據 // 13 

2.6.3 篩選數據 // 14 

2.6.4 篩選缺失的數據 // 15 

2.6.5 處理數據 // 15 

2.6.6 排序 // 19 

2.6.7 分組數據 // 20 

2.6.8 重排數據 // 21 

2.6.9 對數據進行排名 // 22 

2.6.10 繪圖 // 23 

2.7 小結 // 24

第3章 描述統(tǒng)計學 // 25 

3.1 引言 // 25 

3.2 數據準備 // 25 

3.2.1 Adult數據集示例 // 26 

3.3 探索性數據分析 // 28 

3.3.1 匯總數據 // 28 

3.3.2 數據分布 // 31 

3.3.3 離群點的處理 // 33 

3.3.4 測量不對稱性:偏度和皮爾遜中值偏度系數 // 36 

3.3.5 連續(xù)分布 // 38 

3.3.6 核密度 // 39 

3.4 估計 // 41 

3.4.1 樣本和估計均值、方差和標準記分 // 41 

3.4.2 協(xié)方差、皮爾遜相關和斯皮爾曼秩相關 // 42 

3.5 小結 // 44

參考文獻 // 45 

第4章 統(tǒng)計推斷 // 46 

4.1 引言 // 46 

4.2 統(tǒng)計推斷:頻率論方法 // 46 

4.3 測量估計的差異性 // 47 

4.3.1 點估計 // 47 

4.3.2 置信區(qū)間 // 50 

4.4 假設檢驗 // 53 

4.4.1 用置信區(qū)間檢驗假設 // 53 

4.4.2 使用p值檢驗假設 // 55 

4.5 效應E是真實的嗎 // 57 

4.6 小結 // 57

參考文獻 // 58

第5章 監(jiān)督學習 // 59 

5.1 引言 // 59 

5.2 問題 // 60 

5.3 第一步 // 60 

5.4 什么是學習? // 69 

5.5 學習曲線 // 70 

5.6 訓練、驗證和測試 // 73 

5.7 兩種學習模型 // 76 

5.7.1 學習三要素 // 76 

5.7.2 支持向量機 // 77 

5.7.3 隨機森林 // 79 

5.8 結束學習過程 // 80 

5.9 商業(yè)案例 // 81 

5.10 小結 // 83

參考文獻 // 83

第6章 回歸分析 // 84 

6.1 引言 // 84 

6.2 線性回歸 // 84 

6.2.1 簡單線性回歸 // 85 

6.2.2 多元線性回歸和多項式回歸 // 90 

6.2.3 稀疏模型 // 90 

6.3 邏輯斯蒂回歸 // 97 

6.4 小結 // 99

參考文獻 // 99

第7章 無監(jiān)督學習 // 100 

7.1 引言 // 100 

7.2 聚類 // 100 

7.2.1 相似度和距離 // 101 

7.2.2 什么是一個好的聚類?定義衡量聚類質量的度量 // 101 

7.2.3 聚類技術的分類標準 // 104 

7.3 案例學習 // 113 

7.4 小結 // 118

參考文獻 // 119

第8章 網絡分析 // 120 

8.1 引言 // 120 

8.2 圖的基本定義 // 121 

8.3 社交網絡分析 // 122 

8.3.1 NetworkX基礎 // 122 

8.3.2 實際案例:Facebook數據集 // 123 

8.4 中心性 // 125 

8.4.1 在圖中繪制中心性 // 130 

8.4.2 PageRank // 132 

8.5 自我網絡 // 134 

8.6 社區(qū)發(fā)現 // 138 

8.7 小結 // 139

參考文獻 // 139 

第9章 推薦系統(tǒng) // 140 

9.1 引言 // 140 

9.2 推薦系統(tǒng)如何工作? // 140 

9.2.1 基于內容的過濾 // 141 

9.2.2 協(xié)作過濾 // 141 

9.2.3 混合推薦系統(tǒng) // 141 

9.3 建模用戶偏好 // 142 

9.4 評估推薦系統(tǒng) // 142 

9.5 實際案例 // 143 

9.5.1 MovieLens數據集 // 143 

9.5.2 基于用戶的協(xié)作過濾 // 145 

9.6 小結 // 153

參考文獻 // 153

第10章 用于情感分析的統(tǒng)計自然語言處理 // 154 

10.1 引言 // 154 

10.2 數據清洗 // 155 

10.3 文本表示 // 158 

10.3.1 二元組和n元組 // 163 

10.4 實際案例 // 163 

10.5 小結 // 168

參考文獻 // 168

第11章 并行計算 // 169 

11.1 引言 // 169 

11.2 架構 // 170 

11.2.1 入門指南 // 171 

11.2.2 連接到集群(引擎)// 171 

11.3 多核編程 // 172 

11.3.1 引擎的直接視圖 // 172 

11.3.2 引擎的負載均衡視圖 // 175 

11.4 分布式計算 // 176 

11.5 實際應用:紐約出租車旅行 // 177 

11.5.1 直接視圖非阻塞方案 // 178 

11.5.2 實驗結果 // 180 

11.6 小結 // 182

參考文獻 // 182


本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號