第1章大數(shù)據概論
1.1大數(shù)據技術簡介
1.1.1IT產業(yè)的發(fā)展簡史
1.1.2大數(shù)據的主要來源
1.1.3數(shù)據生成的三種主要
方式
1.1.4大數(shù)據的特點
1.1.5大數(shù)據的處理流程
1.1.6大數(shù)據的數(shù)據格式
1.1.7大數(shù)據的基本特征
1.1.8大數(shù)據的應用領域
1.2大數(shù)據的技術架構
1.3大數(shù)據的整體技術
1.4大數(shù)據分析的四種典型工具
簡介
1.5大數(shù)據未來發(fā)展趨勢
1.5.1數(shù)據資源化
1.5.2數(shù)據科學和數(shù)據聯(lián)盟的
成立
1.5.3大數(shù)據隱私和安全
問題
1.5.4開源軟件成為推動大數(shù)
據發(fā)展的動力
1.5.5大數(shù)據在多方位改善人
們的生活
本章小結
習題1
第2章大數(shù)據采集及預處理
2.1數(shù)據采集簡介
2.1.1數(shù)據采集
2.1.2數(shù)據采集的數(shù)據來源
2.1.3數(shù)據采集的技術方法
2.2大數(shù)據的預處理
2.3數(shù)據采集及預處理的主要
工具
本章小結
習題2
第3章大數(shù)據分析概論
3.1大數(shù)據分析簡介
3.1.1大數(shù)據分析
3.1.2大數(shù)據分析的基本
方法
3.1.3大數(shù)據處理流程
3.2大數(shù)據分析的主要技術
3.2.1深度學習
3.2.2知識計算
3.3大數(shù)據分析處理系統(tǒng)簡介
3.3.1批量數(shù)據及處理系統(tǒng)
3.3.2流式數(shù)據及處理系統(tǒng)
3.3.3交互式數(shù)據及處理
系統(tǒng)
3.3.4圖數(shù)據及處理系統(tǒng)
3.4大數(shù)據分析的應用
本章小結
習題3
第4章大數(shù)據可視化
4.1大數(shù)據可視化簡介
4.2大數(shù)據可視化工具
Tableau
本章小結
習題4
第5章Hadoop概論
5.1Hadoop簡介
5.1.1Hadoop簡史
5.1.2Hadoop應用和發(fā)展
趨勢
5.2Hadoop的架構與組成
5.2.1Hadoop架構介紹
5.2.2Hadoop組成模塊
5.3Hadoop應用分析
本章小結
習題5
大數(shù)據應用基礎
目錄
第6章HDFS和Common概論
6.1HDFS簡介
6.1.1HDFS的相關概念
6.1.2HDFS特性
6.1.3HDFS體系結構
6.1.4HDFS的工作原理
6.1.5HDFS的相關技術
6.2Common簡介
本章小結
習題6
第7章MapReduce概論
7.1MapReduce簡介
7.1.1MapReduce
7.1.2MapReduce功能、特征和
局限性
7.2Map和Reduce任務
7.3MapReduce架構和工作
流程
7.3.1MapReduce的架構
7.3.2MapReduce的工作
流程
本章小結
習題7
第8章NoSQL概論
8.1NoSQL簡介
8.1.1NoSQL的含義
8.1.2NoSQL的產生
8.1.3NoSQL的特點
8.2NoSQL技術基礎
8.2.1大數(shù)據的一致性策略
8.2.2大數(shù)據的分區(qū)與放置
策略
8.2.3大數(shù)據的復制與容錯
技術
8.2.4大數(shù)據的緩存技術
8.3NoSQL的類型
8.3.1鍵值存儲
8.3.2列存儲
8.3.3面向文檔存儲
8.3.4圖形存儲
8.4典型的NoSQL工具
8.4.1Redis
8.4.2Bigtable
8.4.3CouchDB
本章小結
習題8
第9章Spark概論
9.1Spark平臺
9.1.1Spark簡介
9.1.2Spark發(fā)展
9.1.3Scala語言
9.2Spark與Hadoop
9.2.1Hadoop的局限與不足
9.2.2Spark的優(yōu)點
9.2.3Spark速度比Hadoop快的
原因分析
9.3Spark處理架構及其生態(tài)
系統(tǒng)
9.3.1底層的Cluster Manager
和Data Manager
9.3.2中間層的Spark
Runtime
9.3.3高層的應用模塊
9.4Spark的應用
9.4.1Spark的應用場景
9.4.2應用Spark的成功
案例
本章小結
習題9
第10章云計算與大數(shù)據
10.1云計算簡介
10.1.1云計算
10.1.2云計算與大數(shù)據的
關系
10.1.3云計算基本特征
10.1.4云計算服務模式
10.2云計算核心技術
10.2.1虛擬化技術
10.2.2虛擬化軟件及應用
10.2.3資源池技術
10.2.4云計算部署模式
10.3云計算應用案例
本章小結
習題10
第11章典型大數(shù)據解決方案
11.1Intel大數(shù)據
11.1.1Intel大數(shù)據解決
方案
11.1.2Intel大數(shù)據相關
案例
11.2百度大數(shù)據
11.2.1百度大數(shù)據引擎
11.2.2百度大數(shù)據+平臺
11.2.3相關應用
11.2.4百度預測的使用
方法
11.3騰訊大數(shù)據
11.3.1騰訊大數(shù)據解決
方案
11.3.2相關實例
本章小結
習題11
第12章大數(shù)據應用案例分析(醫(yī)療
領域)
12.1大數(shù)據在臨床領域的
應用
12.1.1基于大數(shù)據的比較效
果研究
12.1.2基于大數(shù)據的臨床決
策系統(tǒng)
12.1.3醫(yī)療數(shù)據透明化
12.1.4病人的遠程監(jiān)控
12.1.5基于大數(shù)據的電子
病歷分析
12.2大數(shù)據在醫(yī)藥支付領域的
應用
12.2.1基于大數(shù)據的多種
自動化系統(tǒng)
12.2.2基于大數(shù)據和衛(wèi)生
經濟學的定價計劃
12.3大數(shù)據在醫(yī)療研發(fā)領域的
應用
12.3.1基于大數(shù)據的預測
建模
12.3.2臨床試驗及其數(shù)據
分析
12.3.3基于大數(shù)據的個性
化治療
12.3.4基于大數(shù)據的疾病
模式分析
12.4大數(shù)據在醫(yī)療商業(yè)模式
領域的應用
12.4.1基于大數(shù)據的患者臨床記錄
和醫(yī)療保險數(shù)據集
12.4.2基于大數(shù)據的網絡
平臺和社區(qū)
12.5大數(shù)據在公共健康領域的
應用
本章小結
習題12
習題參考答案
參考文獻