定 價:¥59.00
作 者: | 沈祥壯 |
出版社: | 電子工業(yè)出版社 |
叢編項: | |
標 簽: | 暫缺 |
ISBN: | 9787121336539 | 出版時間: | 2018-03-01 | 包裝: | |
開本: | 16開 | 頁數: | 260 | 字數: |
1 準備 1
1.1 開發(fā)環(huán)境搭建 2
1.1.1 在Ubuntu系統(tǒng)下搭建Python集成開發(fā)環(huán)境 2
1.1.2 在Windows系統(tǒng)下搭建Python集成開發(fā)環(huán)境 13
1.1.3 三種安裝第三方庫的方法 16
1.2 Python基礎語法介紹 19
1.2.1 if__name__=='__main__' 20
1.2.2 列表解析式 22
1.2.3 裝飾器 23
1.2.4 遞歸函數 26
1.2.5 面向對象 27
1.3 The Zen of Python 28
參考文獻 30
2 數據的獲取 31
2.1 爬蟲簡介 31
2.2 數據抓取實踐 33
2.2.1 請求網頁數據 33
2.2.2 網頁解析 38
2.2.3 數據的存儲 46
2.3 爬蟲進階 50
2.3.1 異常處理 50
2.3.2 robots.txt 58
2.3.3 動態(tài)UA 60
2.3.4 代理IP 61
2.3.5 編碼檢測 61
2.3.6 正則表達式入門 63
2.3.7 模擬登錄 69
2.3.8 驗證碼問題 74
2.3.9 動態(tài)加載內容的獲取 84
2.3.10 多線程與多進程 93
2.4 爬蟲總結 101
參考文獻 102
3 數據的存取與清洗 103
3.1 數據存取 103
3.1.1 基本文件操作 103
3.1.2 CSV文件的存取 111
3.1.3 JSON文件的存取 116
3.1.4 XLSX文件的存取 121
3.1.5 MySQL數據庫文件的存取 137
3.2 NumPy 145
3.2.1 NumPy簡介 145
3.2.2 NumPy基本操作 146
3.3 pandas 158
3.3.1 pandas簡介 158
3.3.2 Series與DataFrame的使用 159
3.3.3 布爾值數組與函數應用 169
3.4 數據的清洗 174
3.4.1 編碼問題 174
3.4.2 缺失值的檢測與處理 175
3.4.3 去除異常值 181
3.4.4 去除重復值與冗余信息 183
3.4.5 注意事項 185
參考文獻 187
4 數據的分析及可視化 188
4.1 探索性數據分析 189
4.1.1 基本流程 189
4.1.2 數據降維 197
4.2 機器學習入門 199
4.2.1 機器學習簡介 200
4.2.2 決策樹――機器學習算法的應用 202
4.3 手動實現KNN算法 205
4.3.1 特例――最鄰近分類器 205
4.3.2 KNN算法的完整實現 213
4.4 數據可視化 215
4.4.1 高質量作圖工具――matplotlib 215
4.4.2 快速作圖工具――pandas與matplotlib 223
4.4.3 簡捷作圖工具――seaborn與matplotlib 226
4.4.4 詞云圖 230
參考文獻 232
5 Python與生活 234
5.1 定制一個新聞提醒服務 234
5.1.1 新聞數據的抓取 235
5.1.2 實現郵件發(fā)送功能 237
5.1.3 定時執(zhí)行及本地日志記錄 239
5.2 Python與數學 241
5.2.1 估計π值 242
5.2.2 三門問題 245
5.2.3 解決LP與QP問題(選讀) 247
5.3 QQ群聊天記錄數據分析 251
參考文獻 256