定 價(jià):¥59.00
作 者: | 劉鵬,程顯毅,孫麗麗,林道榮 |
出版社: | 清華大學(xué)出版社 |
叢編項(xiàng): | 大數(shù)據(jù)應(yīng)用人才培養(yǎng)系列教材 |
標(biāo) 簽: | 暫缺 |
ISBN: | 9787302610229 | 出版時(shí)間: | 2022-07-01 | 包裝: | |
開(kāi)本: | 頁(yè)數(shù): | 字?jǐn)?shù): |
第1 章 緒論
1.1 R 語(yǔ)言概述 1
1.1.1 R 語(yǔ)言現(xiàn)狀 1
1.1.2 R 語(yǔ)言主要優(yōu)勢(shì) 2
1.1.3 學(xué)R 語(yǔ)言的理由 3
1.2 新手上路 4
1.3 R 語(yǔ)言開(kāi)發(fā)環(huán)境部署 5
1.3.1 安裝R 5
1.3.2 安裝RStudio 6
1.4 獲取幫助 8
1.5 工作空間 8
1.6 腳本 9
1.7 R 包 9
習(xí)題 10
第2 章 基本語(yǔ)法
2.1 變量 11
2.1.1 變量及其作用 11
2.1.2 變量命名 12
2.1.3 變量賦值 12
2.1.4 變量值輸出 12
2.2 常量 13
2.2.1 邏輯常量 13
2.2.2 符號(hào)常量 13
2.2.3 標(biāo)量 13
2.3 向量 15
2.3.1 向量產(chǎn)生 15
2.3.2 向量引用 16
2.3.3 向量化運(yùn)算 16
XII R 語(yǔ)言(第2 版)
2.3.4 向量排序 17
2.4 運(yùn)算符 18
2.4.1 算術(shù)運(yùn)算符 18
2.4.2 關(guān)系運(yùn)算符 18
2.4.3 邏輯運(yùn)算符 19
2.4.4 其他運(yùn)算符 20
2.5 命令 20
2.6 重要內(nèi)置函數(shù) 21
習(xí)題 23
第3 章 數(shù)據(jù)類型
3.1 基本數(shù)據(jù)類型 27
3.2 結(jié)構(gòu)數(shù)據(jù)類型 28
3.2.1 矩陣 28
3.2.2 數(shù)組 30
3.2.3 數(shù)據(jù)框 32
3.2.4 因子 33
3.2.5 列表 34
3.3 字符串操作 35
3.3.1 分割 35
3.3.2 拼接 35
3.3.3 正則表達(dá)式 36
3.3.4 替換 39
3.3.5 提取 42
3.3.6 測(cè)定字符串長(zhǎng)度 42
3.3.7 匹配 43
3.4 數(shù)據(jù)類型判斷和轉(zhuǎn)換 43
3.5 日期和時(shí)間數(shù)據(jù)操作 44
3.5.1 日期數(shù)據(jù)基本操作 44
3.5.2 時(shí)間數(shù)據(jù)基本操作 45
習(xí)題 45
第4 章 數(shù)據(jù)導(dǎo)入導(dǎo)出
4.1 數(shù)據(jù)導(dǎo)入 49
4.1.1 鍵盤(pán)輸入數(shù)據(jù) 49
目 錄 XIII
4.1.2 導(dǎo)入文本文件 50
4.1.3 導(dǎo)入csv 文件 51
4.1.4 導(dǎo)入Excel 文件 51
4.1.5 導(dǎo)入數(shù)據(jù)庫(kù)文件 51
4.2 數(shù)據(jù)導(dǎo)出 52
4.2.1 導(dǎo)出文本文件 52
4.2.2 保存圖片 53
習(xí)題 53
第5 章 數(shù)據(jù)可視化
5.1 一圖勝千言 55
5.2 低水平繪圖命令 56
5.2.1 點(diǎn)圖 56
5.2.2 線圖 58
5.2.3 面圖 60
5.3 高水平繪圖命令 63
5.3.1 認(rèn)識(shí)ggplot2 63
5.3.2 幾何對(duì)象 63
5.3.3 映射 64
5.3.4 統(tǒng)計(jì)對(duì)象 66
5.3.5 標(biāo)度 67
5.3.6 分面 68
5.3.7 其他修飾 69
5.4 交互式繪圖命令 72
5.4.1 rCharts 包 72
5.4.2 plotly 包 74
5.4.3 Shiny 76
5.5 數(shù)據(jù)可視化圖形選擇建議 83
習(xí)題 84
第6 章 數(shù)據(jù)清洗
6.1 缺失值分析 87
6.1.1 缺失值檢測(cè) 87
6.1.2 缺失數(shù)據(jù)處理 88
6.2 異常值分析 89
XIV R 語(yǔ)言(第2 版)
6.2.1 箱線圖檢測(cè)離群點(diǎn) 89
6.2.2 點(diǎn)圖檢測(cè)離群點(diǎn) 90
6.3 數(shù)據(jù)去重 91
6.4 規(guī)范化 92
6.4.1 數(shù)據(jù)的中心化 92
6.4.2 數(shù)據(jù)標(biāo)準(zhǔn)化 92
6.5 格式轉(zhuǎn)換 93
習(xí)題 95
第7 章 數(shù)據(jù)探索
7.1 單一變量分析 97
7.1.1 定量變量 97
7.1.2 定性變量 99
7.2 雙變量分析 100
7.2.1 一個(gè)定性變量和一個(gè)定量變量 100
7.2.2 兩個(gè)定性變量 100
7.2.3 兩個(gè)定量變量 101
7.3 多變量分析 102
7.3.1 集中趨勢(shì)度量 102
7.3.2 離中趨勢(shì)度量 103
7.4 相關(guān)分析 104
7.4 1 相關(guān)系數(shù) 104
7.4.2 直接繪制點(diǎn)圖 105
7.4.3 繪制點(diǎn)圖矩陣 106
習(xí)題 106
第8 章 數(shù)據(jù)變換
8.1 數(shù)據(jù)集劃分與選擇 109
8.1.1 數(shù)據(jù)集劃分 109
8.1.2 數(shù)據(jù)集選擇 110
8.2 特征工程 110
8.2.1 特征工程概述 110
8.2.2 特征構(gòu)建 111
8.2.3 特征選擇 112
8.2.4 特征抽取 115
8.2.5 自動(dòng)化特征工程 117
8.3 數(shù)據(jù)整合 118
8.3.1 通過(guò)向量化重構(gòu)數(shù)據(jù) 119
8.3.2 為數(shù)據(jù)添加新變量 119
8.3.3 變形與融合 120
8.3.4 列聯(lián)表 123
8.3.5 分組匯總 123
8.3.6 連接表 125
習(xí)題 127
第9 章 高級(jí)編程
9.1 條件表達(dá)式 131
9.2 選擇結(jié)構(gòu) 132
9.3 循環(huán)結(jié)構(gòu) 135
9.4 用戶自定義函數(shù) 138
習(xí)題 139
第10 章 數(shù)據(jù)建模
10.1 Rattle 包 141
10.2 變量的類別 143
10.3 聚類分析 145
10.3.1 背景 145
10.3.2 K-means 聚類 146
10.3.3 層次聚類 148
10.4 關(guān)聯(lián)規(guī)則挖掘 150
10.4.1 背景 150
10.4.2 基本術(shù)語(yǔ) 151
10.4.3 關(guān)聯(lián)規(guī)則的分類 152
10.4.4 Apriori 算法 153
10.4.5 實(shí)驗(yàn)指導(dǎo) 154
10.5 傳統(tǒng)決策樹(shù)模型 156
10.5.1 背景 156
10.5.2 ID3 算法 157
10.5.3 C4.5 算法 158
10.5.4 實(shí)驗(yàn)指導(dǎo) 159
XVI R 語(yǔ)言(第2 版)
10.6 隨機(jī)森林決策樹(shù)模型 161
10.6.1 背景 161
10.6.2 隨機(jī)森林算法 161
10.6.3 實(shí)驗(yàn)指導(dǎo) 163
10.7 自適應(yīng)選擇決策樹(shù)模型 166
10.7.1 背景 166
10.7.2 Boosting 算法 166
10.7.3 adaboost 算法 167
10.7.4 實(shí)驗(yàn)指導(dǎo) 167
10.8 SVM 171
10.8.1 背景 171
10.8.2 SVM 算法 171
10.8.3 實(shí)驗(yàn)指導(dǎo) 173
10.9 線性回歸模型 174
10.9.1 背景 174
10.9.2 一元線性回歸方法 174
10.9.3 實(shí)驗(yàn)指導(dǎo) 176
10.10 神經(jīng)網(wǎng)絡(luò)模型 177
10.10.1 背景 177
10.10.2 人工神經(jīng)網(wǎng)絡(luò)模型 178
10.10.3 實(shí)驗(yàn)指導(dǎo) 179
習(xí)題 181
第11 章 模型評(píng)估
11.1 Rattle 模型評(píng)估選項(xiàng)卡 185
11.2 混淆矩陣 186
11.2.1 二分類混淆矩陣 186
11.2.2 模型評(píng)價(jià)指標(biāo) 187
11.2.3 多分類混淆矩陣 188
11.3 風(fēng)險(xiǎn)圖 188
11.3.1 風(fēng)險(xiǎn)圖的作用 188
11.3.2 實(shí)驗(yàn)指導(dǎo) 188
11.4 ROC 曲線 190
11.4.1 ROC 曲線概述 190
11.4.2 ROC 曲線的作用 190
11.4.3 實(shí)驗(yàn)指導(dǎo) 190
11.5 交叉驗(yàn)證 192
習(xí)題 193
第12 章 影響大學(xué)平均錄取分?jǐn)?shù)線因素分析
12.1 背景與目標(biāo) 195
12.2 數(shù)據(jù)說(shuō)明 195
12.3 描述性分析 196
12.4 數(shù)據(jù)建模 199
12.5 總結(jié) 201
第13 章 收視率分析
13.1 背景介紹 202
13.2 數(shù)據(jù)說(shuō)明 202
13.3 描述性分析 203
13.4 數(shù)據(jù)建模 209
13.5 總結(jié) 212
參考文獻(xiàn)
附錄A
附錄B