注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Python數(shù)據(jù)分析:零基礎(chǔ)入門(mén)到實(shí)戰(zhàn)開(kāi)發(fā)

Python數(shù)據(jù)分析:零基礎(chǔ)入門(mén)到實(shí)戰(zhàn)開(kāi)發(fā)

Python數(shù)據(jù)分析:零基礎(chǔ)入門(mén)到實(shí)戰(zhàn)開(kāi)發(fā)

定 價(jià):¥69.80

作 者: 張玉皓 著
出版社: 中國(guó)鐵道出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787113267377 出版時(shí)間: 2020-11-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)講解主要以Python數(shù)據(jù)分析相關(guān)內(nèi)容為主,還涉及數(shù)據(jù)分析背后的數(shù)學(xué)思維。全書(shū)內(nèi)容主要分為三部分。第一部分為Python數(shù)據(jù)分析相關(guān)技能,包括NumPy、pandas等重要的第三方庫(kù)的使用技巧;第二部分為數(shù)據(jù)分析相關(guān)統(tǒng)計(jì)學(xué)知識(shí),主要包含構(gòu)建模型的流程、思路,以及數(shù)學(xué)原理的解析;第三部分為實(shí)戰(zhàn),主要是結(jié)合Python數(shù)據(jù)分析工具與統(tǒng)計(jì)學(xué)知識(shí)的實(shí)踐操作。對(duì)于那些想要進(jìn)入數(shù)據(jù)分析領(lǐng)域的初學(xué)者非常適合閱讀本書(shū),即使你沒(méi)有扎實(shí)的Python編程基礎(chǔ),沒(méi)有深厚的數(shù)理統(tǒng)計(jì)功底,依然可以通過(guò)本書(shū)的學(xué)習(xí)對(duì)數(shù)據(jù)分析技術(shù)產(chǎn)生濃厚的興趣,以及對(duì)數(shù)據(jù)分析的原理與應(yīng)用有更加整體的認(rèn)識(shí)和理解。

作者簡(jiǎn)介

  張玉皓畢業(yè)于中國(guó)科學(xué)院大學(xué)計(jì)算機(jī)應(yīng)用技術(shù)專(zhuān)業(yè),在國(guó)際ROBOmaster人工智能挑戰(zhàn)大賽上與中科院自動(dòng)化所、伯克利大學(xué)、哥倫比亞大學(xué)同臺(tái)競(jìng)技,榮獲第八名。映客直播實(shí)習(xí)期間,參與直播間文本分析,計(jì)算直播間受歡迎指標(biāo)的項(xiàng)目。京東實(shí)習(xí)期間,參與京東商城全品類(lèi)評(píng)論短文本聚類(lèi)項(xiàng)目,將短文本智能聚類(lèi),積累短對(duì)話(huà)語(yǔ)料庫(kù)。畢業(yè)斬獲瓜子二手車(chē)、映客、馬蜂窩、百度、京東等大廠(chǎng)offer,后就職于京東零售,從事NLP算法領(lǐng)域智能客服的優(yōu)化工作。

圖書(shū)目錄


目 錄
第1章 什么是數(shù)據(jù)分析
1.1 Python開(kāi)發(fā)環(huán)境 1
1.2 數(shù)據(jù)分析的前世今生 2
1.2.1 數(shù)據(jù)分析歷史 2
1.2.2 數(shù)據(jù)分析的現(xiàn)實(shí)應(yīng)用 2
1.2.3 數(shù)據(jù)分析的技能需求 3
1.3 數(shù)據(jù)分析流程 4
1.3.1 數(shù)據(jù)導(dǎo)入、清洗 5
1.3.2 單變量分析 6
1.3.3 多變量分析 6
1.3.4 選擇模型 6
1.3.5 估計(jì)與假設(shè)檢驗(yàn) 7
1.3.6 可視化 8
1.4 數(shù)據(jù)分析經(jīng)典案例 8
1.4.1 犯罪率的下降與法律條文的生成 8
1.4.2 利用數(shù)據(jù)觀(guān)察校園作弊行為 9
1.4.3 靠統(tǒng)計(jì)學(xué)致富的數(shù)學(xué)家 11
1.5 數(shù)據(jù)分析的第一個(gè)實(shí)戰(zhàn) 12
1.5.1 單變量探索 12
1.5.2 多變量分析 16
1.5.3 選擇模型 21
1.5.4 假設(shè)檢驗(yàn) 25
第2章 Python知識(shí)進(jìn)階
2.1 Python語(yǔ)言 28
2.1.1 Python的歷史 29
2.1.2 Python的特色 29
2.2 Python技巧與進(jìn)階 31
2.2.1 數(shù)據(jù)類(lèi)型方面的技巧 31
2.2.2 數(shù)字方面的使用技巧 32
2.2.3 枚舉 34
2.2.4 匿名函數(shù)的應(yīng)用 35
2.2.5 裝飾器:語(yǔ)法糖 37
2.2.6 列表生成式 39
2.2.7 迭代器與生成器 39
2.3 Python編程的易錯(cuò)點(diǎn) 41
2.3.1 全局變量與局部變量 42
2.3.2 閉包 43
2.3.3 函數(shù)傳參 44
2.3.4 列表和數(shù)組的區(qū)別 45
2.3.5 變量和按引用傳遞 45
2.3.6 None:一個(gè)獨(dú)特的類(lèi)型 47
2.4 小結(jié) 48
第3章 NumPy的入門(mén)與進(jìn)階
3.1 ndarray數(shù)組 49
3.1.1 ndarray數(shù)組的創(chuàng)建 49
3.1.2 C和Fortran順序 51
3.2 索引 51
3.2.1 基本索引 51
3.2.2 高維數(shù)組的索引 52
3.2.3 高階索引 54
3.3 廣播機(jī)制 56
3.4 NumPy數(shù)組的運(yùn)算 58
3.4.1 NumPy的數(shù)值計(jì)算 58
3.4.2 比較與排序 59
3.4.3 NumPy的數(shù)組計(jì)算 60
3.4.4 ufunc高級(jí)應(yīng)用 61
3.4.5 NumPy初等函數(shù)與math內(nèi)置初等函數(shù)的區(qū)別 63
3.4.6 NumPy中的多項(xiàng)式函數(shù) 64
3.4.7 其他功能函數(shù) 65
第4章 pandas的入門(mén)與進(jìn)階
4.1 pandas的數(shù)據(jù)結(jié)構(gòu) 66
4.1.1 Series的創(chuàng)建 67
4.1.2 Series的數(shù)值計(jì)算 68
4.1.3 DataFrame的創(chuàng)建 69
4.1.4 DataFrame的基本屬性 70
4.2 pandas數(shù)據(jù)結(jié)構(gòu)的基本操作 72
4.2.1 轉(zhuǎn)置 72
4.2.2 索引 73
4.2.3 DataFrame的關(guān)系型操作 75
4.2.4 DataFrame的畫(huà)圖操作 76
4.2.5 查看數(shù)據(jù) 80
4.3 pandas數(shù)據(jù)結(jié)構(gòu)的進(jìn)階操作 81
4.3.1 數(shù)據(jù)導(dǎo)入導(dǎo)出 81
4.3.2 表格合并 83
4.3.3 讀寫(xiě)文件中的編碼問(wèn)題 90
4.3.4 刪除與替換數(shù)據(jù) 92
4.3.5 表格整體性分析 96
4.3.6 GroupBy分組運(yùn)算 98
4.3.7 綜合練習(xí) 103
第5章 SciPy入門(mén)與進(jìn)階
5.1 SciPy中的常數(shù)與函數(shù) 106
5.1.1 SciPy中的常數(shù) 106
5.1.2 SciPy中的special模塊 107
5.2 SciPy中的科學(xué)計(jì)算工具 108
5.2.1 求解多元方程組 108
5.2.2 擬合方程 110
5.2.3 最優(yōu)化算法 113
5.2.4 統(tǒng)計(jì)分布 116
5.2.5 積分 120
5.2.6 插值 121
第6章 可視化
6.1 可視化的魅力 124
6.1.1 別出心裁的可視化 124
6.1.2 可視化的基本理論 126
6.1.3 可視化實(shí)例 127
6.2 matplotlib第三方庫(kù)的基本功能 131
6.2.1 matplotlib繪圖的基礎(chǔ)組件 131
6.2.2 餅圖 134
6.2.3 條形圖 139
6.2.4 散點(diǎn)圖 142
6.2.5 折線(xiàn)圖 145
6.2.6 箱線(xiàn)圖 146
6.2.7 小提琴圖 148
6.2.8 Basemap簡(jiǎn)單介紹 150
6.3 交互式繪圖 151
6.3.1 matplotlib的簡(jiǎn)單交互式繪圖 151
6.3.2 pyecharts可視化庫(kù) 154
第7章 時(shí)間序列
7.1 datetime庫(kù)的簡(jiǎn)單介紹 160
7.1.1 時(shí)間坐標(biāo)的構(gòu)造 160
7.1.2 時(shí)間和字符串的轉(zhuǎn)換 161
7.2 時(shí)間序列中pandas的應(yīng)用 162
7.2.1 DatetimeIndex 162
7.2.2 pandas中時(shí)間坐標(biāo)的構(gòu)造 163
7.2.3 PeriodIndex(時(shí)間索引類(lèi)型) 164
7.2.4 采樣 166
7.2.5 超前或滯后 167
7.2.6 移動(dòng)窗口函數(shù) 168
7.3 時(shí)間序列的時(shí)區(qū)轉(zhuǎn)換 169
第8章 數(shù)據(jù)分析中的統(tǒng)計(jì)學(xué)
8.1 有趣的選擇 171
8.2 數(shù)據(jù)分析回答ofo多久才能退押金 172
8.3 統(tǒng)計(jì)學(xué)在數(shù)據(jù)分析中扮演的角色 178
8.4 數(shù)據(jù)預(yù)處理 178
8.4.1 數(shù)據(jù)清洗 178
8.4.2 數(shù)據(jù)集成 180
8.4.3 數(shù)據(jù)變換 181
8.5 特征工程 182
8.5.1 過(guò)濾法 183
8.5.2 包裝法 186
8.5.3 嵌入式方法 190
8.5.4 正則化 193
8.6 模型訓(xùn)練 194
8.7 模型評(píng)估 199
8.8 數(shù)據(jù)分析中的其他問(wèn)題 201
8.8.1 數(shù)據(jù)泄露 201
8.8.2 大數(shù)據(jù)下的數(shù)據(jù)分析 202
8.8.3 辛普森悖論 204
8.8.4 數(shù)據(jù)集的劃分 205
8.8.5 優(yōu)化調(diào)參 206
第9章 豆瓣電影TOP 250數(shù)據(jù)分析
9.1 項(xiàng)目介紹 210
9.1.1 爬蟲(chóng)的簡(jiǎn)單介紹 210
9.1.2 網(wǎng)頁(yè)的構(gòu)成 210
9.1.3 實(shí)戰(zhàn)中的爬蟲(chóng)技術(shù)介紹 211
9.1.4 實(shí)戰(zhàn)中數(shù)據(jù)存儲(chǔ)與讀取 215
9.1.5 實(shí)戰(zhàn)中的界面設(shè)計(jì) 216
9.1.6 實(shí)戰(zhàn)中的數(shù)據(jù)可視化 219
9.2 數(shù)據(jù)庫(kù)操作 224
9.2.1 數(shù)據(jù)庫(kù)的安裝與配置 225
9.2.2 數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù) 227
9.3 數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)語(yǔ)言 228
9.3.1 創(chuàng)建數(shù)據(jù)庫(kù)、表 229
9.3.2 表的刪除與更新 229
9.3.3 查詢(xún) 230
9.3.4 聚合與排序 230
9.3.5 數(shù)據(jù)更新 231
9.3.6 表的集合運(yùn)算 232
9.3.7 Python和數(shù)據(jù)庫(kù)語(yǔ)言的關(guān)系 234
第10章 Python豐富的可視化案例
10.1 turtle庫(kù)的簡(jiǎn)單使用 236
10.2 北上廣深租房分析可視化案例 238
10.2.1 數(shù)據(jù)爬取 238
10.2.2 讀取數(shù)據(jù) 240
10.2.3 數(shù)據(jù)分析 241
第11章 Python預(yù)測(cè)應(yīng)用——SVM預(yù)測(cè)股票漲跌
11.1 SVM介紹 246
11.1.1 SVM原理 246
11.1.2 核函數(shù) 247
11.2 SVM實(shí)戰(zhàn) 249
11.2.1 數(shù)據(jù)預(yù)處理 249
11.2.2 訓(xùn)練模型 251
11.2.3 遺傳算法 252
第12章 文本分析《三國(guó)演義》:挖掘人物圖譜
12.1 項(xiàng)目簡(jiǎn)單說(shuō)明 262
12.1.1 代碼分塊介紹 262
12.1.2 效果圖展示 265
12.2 工程具體實(shí)現(xiàn) 265
12.2.1 設(shè)計(jì)思想 266
12.2.2 代碼詳解 266
12.2.3 可視化 267
目 錄
第1章 什么是數(shù)據(jù)分析
1.1 Python開(kāi)發(fā)環(huán)境 1
1.2 數(shù)據(jù)分析的前世今生 2
1.2.1 數(shù)據(jù)分析歷史 2
1.2.2 數(shù)據(jù)分析的現(xiàn)實(shí)應(yīng)用 2
1.2.3 數(shù)據(jù)分析的技能需求 3
1.3 數(shù)據(jù)分析流程 4
1.3.1 數(shù)據(jù)導(dǎo)入、清洗 5
1.3.2 單變量分析 6
1.3.3 多變量分析 6
1.3.4 選擇模型 6
1.3.5 估計(jì)與假設(shè)檢驗(yàn) 7
1.3.6 可視化 8
1.4 數(shù)據(jù)分析經(jīng)典案例 8
1.4.1 犯罪率的下降與法律條文的生成 8
1.4.2 利用數(shù)據(jù)觀(guān)察校園作弊行為 9
1.4.3 靠統(tǒng)計(jì)學(xué)致富的數(shù)學(xué)家 11
1.5 數(shù)據(jù)分析的第一個(gè)實(shí)戰(zhàn) 12
1.5.1 單變量探索 12
1.5.2 多變量分析 16
1.5.3 選擇模型 21
1.5.4 假設(shè)檢驗(yàn) 25
第2章 Python知識(shí)進(jìn)階
2.1 Python語(yǔ)言 28
2.1.1 Python的歷史 29
2.1.2 Python的特色 29
2.2 Python技巧與進(jìn)階 31
2.2.1 數(shù)據(jù)類(lèi)型方面的技巧 31
2.2.2 數(shù)字方面的使用技巧 32
2.2.3 枚舉 34
2.2.4 匿名函數(shù)的應(yīng)用 35
2.2.5 裝飾器:語(yǔ)法糖 37
2.2.6 列表生成式 39
2.2.7 迭代器與生成器 39
2.3 Python編程的易錯(cuò)點(diǎn) 41
2.3.1 全局變量與局部變量 42
2.3.2 閉包 43
2.3.3 函數(shù)傳參 44
2.3.4 列表和數(shù)組的區(qū)別 45
2.3.5 變量和按引用傳遞 45
2.3.6 None:一個(gè)獨(dú)特的類(lèi)型 47
2.4 小結(jié) 48
第3章 NumPy的入門(mén)與進(jìn)階
3.1 ndarray數(shù)組 49
3.1.1 ndarray數(shù)組的創(chuàng)建 49
3.1.2 C和Fortran順序 51
3.2 索引 51
3.2.1 基本索引 51
3.2.2 高維數(shù)組的索引 52
3.2.3 高階索引 54
3.3 廣播機(jī)制 56
3.4 NumPy數(shù)組的運(yùn)算 58
3.4.1 NumPy的數(shù)值計(jì)算 58
3.4.2 比較與排序 59
3.4.3 NumPy的數(shù)組計(jì)算 60
3.4.4 ufunc高級(jí)應(yīng)用 61
3.4.5 NumPy初等函數(shù)與math內(nèi)置初等函數(shù)的區(qū)別 63
3.4.6 NumPy中的多項(xiàng)式函數(shù) 64
3.4.7 其他功能函數(shù) 65
第4章 pandas的入門(mén)與進(jìn)階
4.1 pandas的數(shù)據(jù)結(jié)構(gòu) 66
4.1.1 Series的創(chuàng)建 67
4.1.2 Series的數(shù)值計(jì)算 68
4.1.3 DataFrame的創(chuàng)建 69
4.1.4 DataFrame的基本屬性 70
4.2 pandas數(shù)據(jù)結(jié)構(gòu)的基本操作 72
4.2.1 轉(zhuǎn)置 72
4.2.2 索引 73
4.2.3 DataFrame的關(guān)系型操作 75
4.2.4 DataFrame的畫(huà)圖操作 76
4.2.5 查看數(shù)據(jù) 80
4.3 pandas數(shù)據(jù)結(jié)構(gòu)的進(jìn)階操作 81
4.3.1 數(shù)據(jù)導(dǎo)入導(dǎo)出 81
4.3.2 表格合并 83
4.3.3 讀寫(xiě)文件中的編碼問(wèn)題 90
4.3.4 刪除與替換數(shù)據(jù) 92
4.3.5 表格整體性分析 96
4.3.6 GroupBy分組運(yùn)算 98
4.3.7 綜合練習(xí) 103
第5章 SciPy入門(mén)與進(jìn)階
5.1 SciPy中的常數(shù)與函數(shù) 106
5.1.1 SciPy中的常數(shù) 106
5.1.2 SciPy中的special模塊 107
5.2 SciPy中的科學(xué)計(jì)算工具 108
5.2.1 求解多元方程組 108
5.2.2 擬合方程 110
5.2.3 最優(yōu)化算法 113
5.2.4 統(tǒng)計(jì)分布 116
5.2.5 積分 120
5.2.6 插值 121
第6章 可視化
6.1 可視化的魅力 124
6.1.1 別出心裁的可視化 124
6.1.2 可視化的基本理論 126
6.1.3 可視化實(shí)例 127
6.2 matplotlib第三方庫(kù)的基本功能 131
6.2.1 matplotlib繪圖的基礎(chǔ)組件 131
6.2.2 餅圖 134
6.2.3 條形圖 139
6.2.4 散點(diǎn)圖 142
6.2.5 折線(xiàn)圖 145
6.2.6 箱線(xiàn)圖 146
6.2.7 小提琴圖 148
6.2.8 Basemap簡(jiǎn)單介紹 150
6.3 交互式繪圖 151
6.3.1 matplotlib的簡(jiǎn)單交互式繪圖 151
6.3.2 pyecharts可視化庫(kù) 154
第7章 時(shí)間序列
7.1 datetime庫(kù)的簡(jiǎn)單介紹 160
7.1.1 時(shí)間坐標(biāo)的構(gòu)造 160
7.1.2 時(shí)間和字符串的轉(zhuǎn)換 161
7.2 時(shí)間序列中pandas的應(yīng)用 162
7.2.1 DatetimeIndex 162
7.2.2 pandas中時(shí)間坐標(biāo)的構(gòu)造 163
7.2.3 PeriodIndex(時(shí)間索引類(lèi)型) 164
7.2.4 采樣 166
7.2.5 超前或滯后 167
7.2.6 移動(dòng)窗口函數(shù) 168
7.3 時(shí)間序列的時(shí)區(qū)轉(zhuǎn)換 169
第8章 數(shù)據(jù)分析中的統(tǒng)計(jì)學(xué)
8.1 有趣的選擇 171
8.2 數(shù)據(jù)分析回答ofo多久才能退押金 172
8.3 統(tǒng)計(jì)學(xué)在數(shù)據(jù)分析中扮演的角色 178
8.4 數(shù)據(jù)預(yù)處理 178
8.4.1 數(shù)據(jù)清洗 178
8.4.2 數(shù)據(jù)集成 180
8.4.3 數(shù)據(jù)變換 181
8.5 特征工程 182
8.5.1 過(guò)濾法 183
8.5.2 包裝法 186
8.5.3 嵌入式方法 190
8.5.4 正則化 193
8.6 模型訓(xùn)練 194
8.7 模型評(píng)估 199
8.8 數(shù)據(jù)分析中的其他問(wèn)題 201
8.8.1 數(shù)據(jù)泄露 201
8.8.2 大數(shù)據(jù)下的數(shù)據(jù)分析 202
8.8.3 辛普森悖論 204
8.8.4 數(shù)據(jù)集的劃分 205
8.8.5 優(yōu)化調(diào)參 206
第9章 豆瓣電影TOP 250數(shù)據(jù)分析
9.1 項(xiàng)目介紹 210
9.1.1 爬蟲(chóng)的簡(jiǎn)單介紹 210
9.1.2 網(wǎng)頁(yè)的構(gòu)成 210
9.1.3 實(shí)戰(zhàn)中的爬蟲(chóng)技術(shù)介紹 211
9.1.4 實(shí)戰(zhàn)中數(shù)據(jù)存儲(chǔ)與讀取 215
9.1.5 實(shí)戰(zhàn)中的界面設(shè)計(jì) 216
9.1.6 實(shí)戰(zhàn)中的數(shù)據(jù)可視化 219
9.2 數(shù)據(jù)庫(kù)操作 224
9.2.1 數(shù)據(jù)庫(kù)的安裝與配置 225
9.2.2 數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù) 227
9.3 數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)語(yǔ)言 228
9.3.1 創(chuàng)建數(shù)據(jù)庫(kù)、表 229
9.3.2 表的刪除與更新 229
9.3.3 查詢(xún) 230
9.3.4 聚合與排序 230
9.3.5 數(shù)據(jù)更新 231
9.3.6 表的集合運(yùn)算 232
9.3.7 Python和數(shù)據(jù)庫(kù)語(yǔ)言的關(guān)系 234
第10章 Python豐富的可視化案例
10.1 turtle庫(kù)的簡(jiǎn)單使用 236
10.2 北上廣深租房分析可視化案例 238
10.2.1 數(shù)據(jù)爬取 238
10.2.2 讀取數(shù)據(jù) 240
10.2.3 數(shù)據(jù)分析 241
第11章 Python預(yù)測(cè)應(yīng)用——SVM預(yù)測(cè)股票漲跌
11.1 SVM介紹 246
11.1.1 SVM原理 246
11.1.2 核函數(shù) 247
11.2 SVM實(shí)戰(zhàn) 249
11.2.1 數(shù)據(jù)預(yù)處理 249
11.2.2 訓(xùn)練模型 251
11.2.3 遺傳算法 252
第12章 文本分析《三國(guó)演義》:挖掘人物圖譜
12.1 項(xiàng)目簡(jiǎn)單說(shuō)明 262
12.1.1 代碼分塊介紹 262
12.1.2 效果圖展示 265
12.2 工程具體實(shí)現(xiàn) 265
12.2.1 設(shè)計(jì)思想 266
12.2.2 代碼詳解 266
12.2.3 可視化 267

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)