注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件大數(shù)據(jù)分布式計(jì)算與案例

大數(shù)據(jù)分布式計(jì)算與案例

大數(shù)據(jù)分布式計(jì)算與案例

定 價(jià):¥29.00

作 者: 李豐
出版社: 中國(guó)人民大學(xué)出版社
叢編項(xiàng): 大數(shù)據(jù)分析統(tǒng)計(jì)應(yīng)用叢書(shū)
標(biāo) 簽: 計(jì)算機(jī)/網(wǎng)絡(luò) 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘 數(shù)據(jù)庫(kù)

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787300230276 出版時(shí)間: 2016-07-01 包裝: 平裝
開(kāi)本: 16 頁(yè)數(shù): 148 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  大數(shù)據(jù)分布式計(jì)算課程是大數(shù)據(jù)方向應(yīng)用統(tǒng)計(jì)專(zhuān)業(yè)碩士學(xué)生的專(zhuān)業(yè)必修課,通過(guò)本課程的學(xué)習(xí)使學(xué)生能夠掌握目前大數(shù)據(jù)挖掘領(lǐng)域常用的并行計(jì)算方法,加深學(xué)生對(duì)統(tǒng)計(jì)并行計(jì)算的理解,培養(yǎng)學(xué)生使用在現(xiàn)代并行架構(gòu)下利用統(tǒng)計(jì)方法深入挖掘大數(shù)據(jù)中的數(shù)據(jù)結(jié)構(gòu)并能解決一些實(shí)際問(wèn)題的能力。

作者簡(jiǎn)介

  李豐 中央財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院碩士生導(dǎo)師,院長(zhǎng)助理。瑞典斯德哥爾摩大學(xué)統(tǒng)計(jì)學(xué)系統(tǒng)計(jì)學(xué)博士。研究方向與興趣:大數(shù)據(jù)與復(fù)雜模型、貝葉斯推斷與統(tǒng)計(jì)計(jì)算、計(jì)量經(jīng)濟(jì)與預(yù)測(cè)方法、多元模型等。曾獲國(guó)際貝葉斯協(xié)會(huì)青年旅行獎(jiǎng)勵(lì)、瑞典Knut and Alice Wallenberg 基金會(huì)獎(jiǎng)勵(lì)。任中國(guó)統(tǒng)計(jì)教育學(xué)會(huì)高等教育分會(huì)副秘書(shū)長(zhǎng)。金融工程與風(fēng)險(xiǎn)管理國(guó)際研討會(huì)執(zhí)行秘書(shū)等。

圖書(shū)目錄

目錄第1章 統(tǒng)計(jì)分析與并行計(jì)算1.1 并行計(jì)算與并行計(jì)算機(jī)1.2 統(tǒng)計(jì)計(jì)算的并行原理||以矩陣乘法為例1.3 基于R 的單機(jī)并行計(jì)算 1.4 基于Python 的單機(jī)并行計(jì)算 1.5 大數(shù)據(jù)背景下的數(shù)據(jù)采集和存儲(chǔ) 1.6 參考文獻(xiàn) 第2章 Hadoop 基礎(chǔ) 2.1 Hadoop 歷史、生態(tài)系統(tǒng) 2.2 Hadoop 的分布式文件系統(tǒng)(HDFS) 2.3 MapReduce 工作原理 2.4 Hadoop 上運(yùn)行MapReduce 2.5 MapReduce 實(shí)例: 分層隨機(jī)抽樣 2.6 MapReduce 實(shí)例: 聚類(lèi)分析 2.7 參考文獻(xiàn) 第3章 基于Hadoop 的分布式算法和模型實(shí)現(xiàn) 3.1 R 中實(shí)現(xiàn)Hadoop 分布式計(jì)算 3.2 Mahout 與大數(shù)據(jù)機(jī)器學(xué)習(xí) 3.3 利用Mahout 進(jìn)行數(shù)據(jù)挖掘 3.4 Mahout 實(shí)例: Logistics 回歸和隨機(jī)森林分類(lèi)算法 3.5 Mahout 實(shí)例: 隨機(jī)森林的分布式實(shí)現(xiàn) 3.6 參考文獻(xiàn) 第4章 統(tǒng)計(jì)模型的MapReduce 實(shí)現(xiàn)詳解 4.1 泊松回歸模型: 付費(fèi)搜索廣告分析 4.2 判別分析: 氣象因素對(duì)霧霾影響分析 4.3 分塊Logistics 回歸 4.4 文本分類(lèi) 4.5 樸素貝葉斯模型 4.6 嶺回歸模型 4.7 推薦系統(tǒng) 4.8 參考文獻(xiàn) 第5章 分布式文件訪問(wèn)與計(jì)算 5.1 Hive 基礎(chǔ) 5.2 HiveQL 數(shù)據(jù)定義(DDL) 5.3 HBase 5.4 Hive 實(shí)例: FoodMart 案例 5.5 Hive 實(shí)例: Hive Streaming 交互計(jì)算 5.6 參考文獻(xiàn) 第6章 Spark 與統(tǒng)計(jì)模型 6.1 Spark 簡(jiǎn)介 6.2 Spark 工作原理介紹 6.3 Pyspark 命令介紹 6.4 Spark 實(shí)例: 通過(guò)Word Count 了解Spark 工作流程 6.5 Spark 實(shí)例: 二分類(lèi)學(xué)習(xí) 6.6 Spark 實(shí)例: 決策樹(shù)模型 6.7 參考文獻(xiàn) 附錄A Hadoop 安裝運(yùn)行 A.1 單機(jī)偽分布式安裝 A.2 全分布式集群 附錄B Mahout 安裝與運(yùn)行 附錄C Hive 安裝運(yùn)行 C.1 準(zhǔn)備 C.2 安裝Hive C.3 配置Hive 附錄D HBase 安裝運(yùn)行 D.1 安裝配置HBase D.2 啟動(dòng)HBase

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)