注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計零基礎(chǔ)學Python爬蟲、數(shù)據(jù)分析與可視化從入門到精通

零基礎(chǔ)學Python爬蟲、數(shù)據(jù)分析與可視化從入門到精通

零基礎(chǔ)學Python爬蟲、數(shù)據(jù)分析與可視化從入門到精通

定 價:¥89.80

作 者: 孟兵,李杰臣 著
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787111668992 出版時間: 2021-01-01 包裝: 平裝
開本: 16 頁數(shù): 字數(shù):  

內(nèi)容簡介

  Python 語言功能強大而靈活,具有很強的擴展性,同時它的語法又相對簡潔易懂,沒有編程基礎(chǔ)的普通辦公人員經(jīng)過適當?shù)膶W習也能輕松上手。本書以Python 語言為工具,從編程新手的角度和日常辦公的需求出發(fā),深入淺出地講解如何通過Python 編程高效地完成數(shù)據(jù)的獲取、處理、分析與可視化。全書共13 章。第1 章和第2 章主要講解Python 編程環(huán)境的搭建和Python 語言的基礎(chǔ)語法知識。第3 ~ 6章以數(shù)據(jù)處理與分析為主題,講解NumPy 模塊和pandas 模塊的基本用法和實際應(yīng)用。第7 ~ 9 章以數(shù)據(jù)獲取為主題,由淺入深地講解如何通過編寫爬蟲程序從網(wǎng)頁上采集數(shù)據(jù),并保存到數(shù)據(jù)庫中。第10 章主要講解自然語言處理技術(shù)在文本分詞中的應(yīng)用。第11 章和第12 章以數(shù)據(jù)可視化為主題,講解如何使用Matplotlib 模塊和pyecharts 模塊繪制圖表。第13 章通過量化金融案例對前面所學的知識進行了綜合應(yīng)用。 本書適合想要提高數(shù)據(jù)處理和分析效率的職場人士和辦公人員閱讀,也可供Python 編程愛好者參考。

作者簡介

暫缺《零基礎(chǔ)學Python爬蟲、數(shù)據(jù)分析與可視化從入門到精通》作者簡介

圖書目錄

 
第1 章 Python 快速上手
1.1 Python編程環(huán)境的搭建
1.2 Python的模塊
1.2.1 初識模塊
1.2.2 模塊的安裝
 
 
第2章 Python的基礎(chǔ)語法知識
2.1 變量
2.2 數(shù)據(jù)類型:數(shù)字與字符串
2.2.1 數(shù)字
2.2.2 字符串
2.2.3 數(shù)據(jù)類型的查詢
2.2.4 數(shù)據(jù)類型的轉(zhuǎn)換
2.3 數(shù)據(jù)類型:列表、字典、元組與集合
2.3.1 列表
2.3.2 字典
2.3.3 元組和集合
2.4 運算符
2.4.1 算術(shù)運算符和字符串運算符
2.4.2 比較運算符
2.4.3 賦值運算符
2.4.4 邏輯運算符
2.5 編碼基本規(guī)范
2.5.1 縮進
2.5.2 注釋
2.6 控制語句
2.6.1 if語句
2.6.2 for語句
2.6.3 while語句
2.6.4 控制語句的嵌套
2.7 函數(shù)
2.7.1 內(nèi)置函數(shù)
2.7.2 自定義函數(shù)
2.8 模塊的導(dǎo)入
2.8.1 import語句導(dǎo)入法
2.8.2 from語句導(dǎo)入法
 
 
第3章 數(shù)組的存儲和處理—NumPy模塊
3.1 創(chuàng)建數(shù)組
3.1.1 使用array()函數(shù)創(chuàng)建數(shù)組
3.1.2 創(chuàng)建等差數(shù)組
3.1.3 創(chuàng)建隨機數(shù)組
3.2 查看數(shù)組的屬性
3.3 選取數(shù)組元素
3.3.1 一維數(shù)組的元素選取
3.3.2 二維數(shù)組的元素選取
3.4 數(shù)組的重塑與轉(zhuǎn)置
3.4.1 一維數(shù)組的重塑
3.4.2 多維數(shù)組的重塑
3.4.3 數(shù)組的轉(zhuǎn)置
3.5 數(shù)組的處理
3.5.1 添加數(shù)組元素
3.5.2 刪除數(shù)組元素
3.5.3 處理數(shù)組的缺失值
3.5.4 處理數(shù)組的重復(fù)值
3.5.5 拼接數(shù)組
3.5.6 拆分數(shù)組
3.6 數(shù)組的運算
3.6.1 數(shù)組之間的四則運算
3.6.2 數(shù)組元素的統(tǒng)計運算
 
 
第4章 數(shù)據(jù)的簡單處理—pandas模塊入門
4.1 數(shù)據(jù)結(jié)構(gòu)
4.1.1 Series對象
4.1.2 DataFrame對象
4.2 讀取數(shù)據(jù)
4.2.1 讀取Excel工作簿數(shù)據(jù)
4.2.2 讀取csv文件數(shù)據(jù)
4.3 查看數(shù)據(jù)
4.3.1 查看數(shù)據(jù)的前幾行
4.3.2 查看數(shù)據(jù)的行數(shù)和列數(shù)
4.3.3 查看數(shù)據(jù)的類型
4.4 選擇數(shù)據(jù)
4.4.1 選擇行數(shù)據(jù)
4.4.2 選擇列數(shù)據(jù)
4.4.3 同時選擇行列數(shù)據(jù)
4.5 修改行標簽和列標簽
 
 
第5章 數(shù)據(jù)的高級處理—pandas模塊進階
5.1 數(shù)據(jù)的查找和替換
5.1.1 查找數(shù)據(jù)
5.1.2 替換數(shù)據(jù)
5.2 數(shù)據(jù)的處理
5.2.1 插入數(shù)據(jù)
5.2.2 刪除數(shù)據(jù)
5.2.3 處理缺失值
5.2.4 處理重復(fù)值
5.2.5 排序數(shù)據(jù)
5.2.6 篩選數(shù)據(jù)
5.3 數(shù)據(jù)表的處理
5.3.1 轉(zhuǎn)置數(shù)據(jù)表的行列
5.3.2 將數(shù)據(jù)表轉(zhuǎn)換為樹形結(jié)構(gòu)
5.3.3 數(shù)據(jù)表的拼接
5.4 數(shù)據(jù)的運算
5.4.1 數(shù)據(jù)的統(tǒng)計運算
5.4.2 獲取數(shù)值分布情況
5.4.3 計算相關(guān)系數(shù)
5.4.4 分組匯總數(shù)據(jù)
5.4.5 創(chuàng)建數(shù)據(jù)透視表
5.5 案例:獲取并分析股票歷史數(shù)據(jù)
 
 
第6章 使用Python進行數(shù)據(jù)分析
6.1 相關(guān)性分析
6.1.1 獲取股價數(shù)據(jù)
6.1.2 合并股價數(shù)據(jù)
6.1.3 股價數(shù)據(jù)相關(guān)性分析
6.2 假設(shè)檢驗
6.3 方差分析
6.3.1 方差分析的基本步驟
6.3.2 單因素方差分析的代碼實現(xiàn)
6.3.3 雙因素方差分析的代碼實現(xiàn)
6.3.4 利用第三方模塊快速完成方差分析
6.4 描述性統(tǒng)計分析
6.4.1 描述性統(tǒng)計指標的計算
6.4.2 數(shù)據(jù)的分布狀態(tài)分析
6.4.3 數(shù)據(jù)的頻數(shù)和頻率分析
6.5 線性回歸分析
6.5.1 線性回歸分析的數(shù)學原理
6.5.2 線性回歸分析的思路
6.5.3 廣告費與銷量的一元線性回歸分析
6.5.4 不同渠道的廣告費與銷量的多元線性回歸分析
 
 
第7章 Python爬蟲基礎(chǔ)
7.1 認識網(wǎng)頁結(jié)構(gòu)
7.1.1 查看網(wǎng)頁的源代碼
7.1.2 網(wǎng)頁結(jié)構(gòu)的組成
7.1.3 百度新聞頁面結(jié)構(gòu)剖析
7.2 requests模塊
7.2.1 requests模塊獲取數(shù)據(jù)的方式
7.2.2 get()函數(shù)的參數(shù)介紹
7.3 案例:爬取豆瓣電影動畫排行榜
7.4 正則表達式
7.4.1 正則表達式基礎(chǔ)
7.4.2 用正則表達式提取數(shù)據(jù)
7.5 BeautifulSoup模塊
7.5.1 實例化BeautifulSoup對象
7.5.2 用BeautifulSoup對象定位標簽
7.5.3 從標簽中提取文本內(nèi)容和屬性值
7.6 XPath表達式
7.6.1 實例化etree對象
7.6.2 用XPath表達式定位標簽并提取數(shù)據(jù)
7.6.3 快速獲取標簽節(jié)點的XPath表達式
7.7 數(shù)據(jù)清洗
7.8 案例:爬取當當網(wǎng)的圖書銷售排行榜
 
 
第8章 Python爬蟲進階
8.1 Selenium模塊基礎(chǔ)
8.1.1 Selenium模塊的安裝與基本用法
8.1.2 Selenium模塊的標簽定位
8.1.3 Selenium模塊的標簽操作
8.2 Selenium模塊進階
8.2.1 模擬鼠標操作
8.2.2 標簽處理 8.2.3 顯式等待和隱式等待
8.3 案例:模擬登錄12306
8.4 IP反爬的應(yīng)對
8.4.1 IP反爬的應(yīng)對思路
8.4.2 搭建代理IP池
8.4.3 實戰(zhàn)案例
8.5 用cookie池模擬登錄
8.5.1 用瀏覽器獲取cookie信息
8.5.2 自動記錄cookie信息
8.5.3 cookie池的搭建和使用
8.6 提高爬蟲程序的數(shù)據(jù)爬取效率
8.6.1 多進程實現(xiàn)并行
8.6.2 進程池的創(chuàng)建
8.6.3 多線程實現(xiàn)并發(fā)
8.6.4 線程池的創(chuàng)建
8.6.5 多任務(wù)異步協(xié)程實現(xiàn)并發(fā)
8.6.6 多進程、多線程和多任務(wù)異步協(xié)程在爬蟲中的應(yīng)用
 
 
第9章 表格數(shù)據(jù)獲取與數(shù)據(jù)庫詳解
9.1 表格類數(shù)據(jù)的獲取
9.1.1 用于構(gòu)建表格的標簽
9.1.2 read_html()函數(shù)的基本用法
9.2 用數(shù)據(jù)庫存取數(shù)據(jù)
9.2.1 數(shù)據(jù)庫概述
9.2.2 MySQL的安裝和配置
9.2.3 數(shù)據(jù)表的基本操作
9.2.4 數(shù)據(jù)表中數(shù)據(jù)的基本操作
9.2.5 用PyMySQL模塊操作數(shù)據(jù)庫
9.2.6 用pandas模塊操作數(shù)據(jù)庫
9.3 案例:爬取58同城租房信息
 
 
第10章 自然語言處理
10.1 NLP概述
10.1.1 NLP的應(yīng)用領(lǐng)域和基本流程
10.1.2 文本分詞方法
10.2 jieba分詞器
10.2.1 jieba分詞器的基礎(chǔ)知識
10.2.2 jieba分詞器的基本用法
10.2.3 調(diào)整詞典
10.2.4 關(guān)鍵詞提取
10.2.5 停用詞過濾
10.2.6 詞頻統(tǒng)計
10.3 案例:新聞關(guān)鍵詞的提取與匯總
 
 
第11章 數(shù)據(jù)可視化—Matplotlib模塊
11.1 繪制基本圖表    
11.1.1 繪制柱形圖    
11.1.2 繪制條形圖    
11.1.3 繪制折線圖    
11.1.4 繪制面積圖    
11.1.5 繪制散點圖    
11.1.6 繪制餅圖和圓環(huán)圖 
11.2 圖表的繪制和美化技巧    
11.2.1 在一張畫布中繪制多個圖表 
11.2.2 添加圖表元素 
11.2.3 添加并設(shè)置網(wǎng)格線 
11.2.4 調(diào)整坐標軸的刻度范圍 
11.3 繪制高級圖表    
11.3.1 繪制氣泡圖    
11.3.2 繪制組合圖    
11.3.3 繪制直方圖    
11.3.4 繪制雷達圖    
11.3.5 繪制樹狀圖    
11.3.6 繪制箱形圖    
11.3.7 繪制玫瑰圖    
 
 
第12章 數(shù)據(jù)可視化神器—pyecharts模塊
12.1 圖表配置項
12.2 繪制漏斗圖
12.3 繪制漣漪特效散點圖
12.4 繪制水球圖
12.5 繪制儀表盤
12.6 繪制詞云圖
12.7 繪制K線圖
 
 
第13章 量化金融—股票信息挖掘與分析
13.1 案例介紹   
13.2 獲取汽車行業(yè)股票的基本信息
13.3 獲取單只股票的歷史行情數(shù)據(jù)
13.4 獲取滬深A(yù)股漲幅前60名的信息 
13.5 計算股票的月漲跌幅
13.6 股票相關(guān)性分析
13.7 股票價格預(yù)測   
 

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號