注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書教育/教材/教輔教材高職高專教材大數據分析技術

大數據分析技術

大數據分析技術

定 價:¥59.00

作 者: 李俊翰,聶強
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111712084 出版時間: 2022-08-01 包裝:
開本: 16開 頁數: 216 字數:  

內容簡介

  本書主要面向高職大數據技術專業(yè)的學生,注重大數據分析技術的應用和實踐。本書每個項目主要分為兩個部分。部分是大數據分析技術的理論知識,主要講解了大數據分析模型、Python數據分析工具、NumPy和Pandas數據分析庫、Matplotlib數據分析可視化庫、Hadoop及其常用組件以及scikitlearn機器學習庫的基本原理和操作。第二部分是任務實施,通過17個實操任務充分展現了大數據分析技術的主要功能和特點。 \n本書既可作為高等職業(yè)院校大數據技術、信息安全與管理、軟件技術、計算機網絡技術、云計算技術等專業(yè)的教材,也適合有一定Python編程經驗并對大數據分析技術感興趣的讀者閱讀。

作者簡介

  李俊翰,中共黨員,執(zhí)教13年。教學經驗豐富。作為主研參與大數據技術與應用國家專業(yè)教學資源庫建設工作,主持子課程《應用程序開發(fā)基礎(Java)》;發(fā)表SCI2篇,中文核心3篇;完成軟件著作權1項,實用新型專利4項,橫向課題2項;作為指導教師,指導學生參加全國職業(yè)院校技能大賽“大數據技術與應用”賽項獲二等獎,重慶市職業(yè)院校技能競賽“大數據技術與應用”賽項獲得一等獎3項,“一帶一路”暨金磚國際技能大賽大數據賽項三等獎等;主參編教材《大數據采集與爬蟲》《大數據平臺應用》《Python編程基礎》《Spark大數據實時分析實戰(zhàn)》;作為主講教師先后承擔《數據預處理》《大數據編程基礎(Python)》和《大數據可視化技術》等十余門課程。

圖書目錄

目錄 \n
前言 \n
項目1 認識大數據分析 \n
1.1 大數據分析概述 \n
1.1.1 大數據分析的概念和發(fā)展 \n
1.1.2 大數據分析的作用和影響 \n
1.2 大數據分析模型 \n
1.2.1 大數據分析的技術和工具 \n
1.2.2 大數據分析的流程 \n
1.2.3 大數據分析的模型簡介 \n
【任務實施】 \n
任務1 網站用戶活躍度指標綜合分析 \n
任務2 身高體重指標數據關聯分析 \n
練習題 \n
項目2 安裝Python數據分析工具 \n
2.1 Python數據分析基本概念 \n
2.1.1 Python數據分析的特點 \n
2.1.2 Python與其他數據分析工具的比較 \n
2.2 Python數據分析常用庫介紹 \n
2.2.1 NumPy簡介 \n
2.2.2 Pandas簡介 \n
2.2.3 SciPy簡介 \n
2.2.4 Matplotlib簡介 \n
2.2.5 scikitlearn簡介 \n
2.2.6 Statmodels簡介 \n
2.2.7 Seaborn簡介 \n
【任務實施】 \n
任務1 在Windows系統(tǒng)中安裝Anaconda \n
任務2 運行Jupyter Notebook \n
任務3 PyCharm的安裝和使用 \n
練習題 \n
項目3 使用NumPy實現統(tǒng)計分析和處理 \n
3.1 NumPy的基本概念 \n
3.1.1 NumPy基礎理論和引用方法 \n
3.1.2 ndarry對象 \n
3.1.3 NumPy數據類型 \n
3.1.4 NumPy數組屬性 \n
3.1.5 NumPy切片和索引 \n
3.2 NumPy函數 \n
3.2.1 NumPy數學函數 \n
3.2.2 NumPy數組維度操作函數 \n
3.2.3 NumPy創(chuàng)建數組函數 \n
3.2.4 NumPy常用IO函數 \n
3.2.5 NumPy廣播 \n
【任務實施】 \n
任務1 使用Numpy實現股票數據分析 \n
任務2 使用Numpy實現豆瓣電影數據 \n
分析 \n
練習題 \n
項目4 Pandas數據分析和處理 \n
4.1 Pandas的基本概念 \n
4.1.1 Pandas基礎理論和引用方法 \n
4.1.2 Pandas基本數據結構 \n
4.2 Pandas的基本用法 \n
4.2.1 創(chuàng)建Pandas對象 \n
4.2.2 查看Pandas基本數據 \n
4.2.3 Pandas索引和切片 \n
4.2.4 Pandas缺失值和空值處理 \n
4.2.5 Pandas連接和合并數據 \n
4.2.6 Pandas分組 \n
4.2.7 Pandas重塑 \n
4.2.8 Pandas數據透視表 \n
4.2.9 Pandas時間序列 \n
4.2.10 Pandas分類 \n
4.2.11 Pandas IO操作 \n
【任務實施】 \n
任務1 使用Pandas實現水果銷售數據分析 \n
任務2 使用Pandas實現用戶消費行為數據分析 \n
任務3 使用Pandas實現電商銷售數據分析 \n
練習題 \n
項目5 Matplotlib數據分析可視化庫 \n
5.1 Matplotlib的基本概念 \n
5.1.1 Matplotlib基礎理論和引用方法 \n
5.1.2 散點圖 \n
5.1.3 條形圖 \n
5.1.4 折線圖 \n
5.1.5 餅圖 \n
5.1.6 直方圖 \n
5.1.7 箱形圖 \n
5.2 組合圖 \n
5.2.1 曲線組合圖 \n
5.2.2 柱狀、散點、折線組合圖 \n
5.2.3 直方圖組合圖123 【任務實施】 \n
任務1 使用餅圖實現零售總額數據分析 \n
任務2 使用折線圖實現零售總額數據分析 \n
任務3 使用雙柱狀圖實現零售總額變化情況數據分析 \n
練習題 \n
項目6 基于Hadoop的數據分析 \n
6.1 掌握Hadoop框架和生態(tài)組件 \n
6.1.1 Hadoop簡介 \n
6.1.2 Hadoop核心組件和工作原理 \n
6.1.3 Hadoop安裝、部署和應用 \n
6.2 Hadoop生態(tài)組件 \n
6.2.1 Hadoop生態(tài)圈簡介 \n
6.2.2 Hive的安裝、部署和應用 \n
6.2.3 Spark的安裝、部署和應用 \n
6.2.4 HBase的安裝、部署和應用 \n
6.2.5 Kafka的安裝、部署和應用 \n
6.2.6 Flume的安裝、部署和應用 \n
6.2.7 Sqoop的安裝、部署和應用 \n
6.2.8 Zookeeper的安裝、部署和應用 \n
【任務實施】 \n
任務1 使用Hadoop及其組件Hive實現數據分析 \n
任務2 使用Hadoop及其組件Spark實現數據分析 \n
練習題 \n
項目7 基于scikitlearn機器學習庫的數據分析 \n
7.1 掌握機器學習基本概念 \n
7.1.1 機器學習簡介 \n
7.1.2 機器學習基本流程 \n
7.1.3 機器學習開發(fā)流程 \n
7.1.4 機器學習算法分類 \n
7.2 掌握scikitlearn的基本用法 \n
7.2.1 scikitlearn的安裝和引用方法 \n
7.2.2 scikitlearn的基本用法 \n
【任務實施】 \n
任務1 使用scikitlearn實現鳶尾花數據分析 \n
任務2 使用scikitlearn實現波士頓房價數據分析 \n
練習題 \n
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號