注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術工業(yè)技術建筑科學建筑設計Python數據科學:技術詳解與商業(yè)實踐

Python數據科學:技術詳解與商業(yè)實踐

Python數據科學:技術詳解與商業(yè)實踐

定 價:¥99.00

作 者: 常國珍,趙仁乾
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111603092 出版時間: 2018-07-01 包裝:
開本: 頁數: 字數:  

內容簡介

  本書共19章,第1章介紹數據科學中涉及的基本領域;第2~3章介紹與數據工作緊密相關的Python語言基礎;第4章講解描述性統(tǒng)計分析在宏觀業(yè)務領域的分析;第5章講解數據規(guī)整、清洗的重要技能;第6章介紹數據科學領域實用的四大統(tǒng)計檢驗;第7章講解當被解釋變量為連續(xù)變量時,如何使用線性回歸作預測;第8章講解使用邏輯回歸作評分卡模型;第9章講解另外一個可解釋模型——決策樹。第10~12章分別講解了BP神經網絡、樸素貝葉斯、近鄰域、支持向量機的原理和在決策類模型中的運用;第13~14章作為一個整體講解商業(yè)分析場景下的信息壓縮;第15章以產品推薦作為案例,講解發(fā)現事件與事件伴生關系的關聯分析和序列分析算法;第16章使用欺詐識別案例講解當被解釋變量分布極 端不平衡時的處理方法;第17章繼續(xù)使用欺詐識別案例講解集成學習算法;第18章講解了使用效應分解和ARIMA方法實現宏觀業(yè)務指標預測;第19章用案例展現了分類和聚類模型的CRISP-DM和SEMMA流程。

作者簡介

  常國珍 數據科學專家和金融技術專家。北京大學會計學博士,中國大數據產業(yè)生態(tài)聯盟專家委員會委員。 2005年進入數據科學領域,先后在亞信、德勤等企業(yè)從事電信、金融行業(yè)數據挖掘工作,現就職于中銀消費金融有限公司數據管理部。專注于消費金融領域的數據治理、客戶智能與風險智能。 趙仁乾 數據科學家,在電信大數據和機器學習領域有豐富的實踐經驗。 現就職于北京電信規(guī)劃設計院任高級經濟師,負責通信、ICT項目工程與業(yè)務咨詢,專注電信市場數據分析,重點研究方向包括離網用戶挖掘、市場細分與精準營銷、移動網絡價值區(qū)域分析、大數據及人工智能運營規(guī)劃等。 張秋劍 大數據專家和金融行業(yè)技術專家,上海師范大學計算機科學技術碩士。 現任星環(huán)科技金融事業(yè)部總監(jiān),大數據技術架構行業(yè)顧問專家,云析學院發(fā)起人,AICUG社區(qū)聯合發(fā)起人,曾在IEEE等期刊發(fā)表多篇論文。目前主要為銀行、證券和保險等行業(yè)客戶提供大數據平臺及人工智能平臺的整體規(guī)劃和項目建設等工作。

圖書目錄

前言 

第1章數據科學家的武器庫 

1.1數據科學的基本概念 

1.2數理統(tǒng)計技術 

1.2.1描述性統(tǒng)計分析 

1.2.2統(tǒng)計推斷與統(tǒng)計建模 

1.3數據挖掘的技術與方法 

1.4描述性數據挖掘算法示例 

1.4.1聚類分析——客戶細分 

1.4.2關聯規(guī)則分析 

1.5預測性數據挖掘算法示例 

1.5.1決策樹 

1.5.2KNN算法 

1.5.3Logistic回歸 

1.5.4神經網絡 

1.5.5支持向量機 

1.5.6集成學習 

1.5.7預測類模型講解 

1.5.8預測類模型評估概述 

第2章Python概述 

2.1Python概述 

2.1.1Python簡介 

2.1.2Python與數據科學 

2.1.3Python2與Python3 

2.2Anaconda Python的安裝、使用 

2.2.1下載與安裝 

2.2.2使用Jupyter Notebook 

2.2.3使用Spyder 

2.2.4使用conda或pip管理 

第三方庫 

第3章數據科學的Python編程基礎 

3.1Python的基本數據類型 

3.1.1字符串(str) 

3.1.2浮點數和整數(float、int) 

3.1.3布爾值(Bool:True/False) 

3.1.4其他 

3.2Python的基本數據結構 

3.2.1列表(list) 

3.2.2元組(tuple) 

3.2.3集合(set) 

3.2.4字典(dict) 

3.3Python的程序控制 

3.3.1三種基本的編程結構簡介 

3.3.2順承結構 

3.3.3分支結構 

3.3.4循環(huán)結構 

3.4Python的函數與模塊 

3.4.1Python的函數 

3.4.2Python的模塊 

3.5Pandas讀取結構化數據 

3.5.1讀取數據 

3.5.2寫出數據 

第4章描述性統(tǒng)計分析與繪圖 

4.1描述性統(tǒng)計進行數據探索 

4.1.1變量度量類型與分布類型 

4.1.2分類變量的統(tǒng)計量 

4.1.3連續(xù)變量的分布與集中趨勢 

4.1.4連續(xù)變量的離散程度 

4.1.5數據分布的對稱與高矮 

4.2制作報表與統(tǒng)計制圖 

4.3制圖的步驟 

第5章數據整合和數據清洗 

5.1數據整合 

5.1.1行列操作 

5.1.2條件查詢 

5.1.3橫向連接 

5.1.4縱向合并 

5.1.5排序 

5.1.6分組匯總 

5.1.7拆分、堆疊列 

5.1.8賦值與條件賦值 

5.2數據清洗 

5.2.1重復值處理 

5.2.2缺失值處理 

5.2.3噪聲值處理 

5.3RFM方法在客戶行為分析上的運用 

5.3.1行為特征提取的RFM方法論 

5.3.2使用RFM方法計算變量 

5.3.3數據整理與匯報 

第6章數據科學的統(tǒng)計推斷基礎 

6.1基本的統(tǒng)計學概念 

6.1.1總體與樣本 

6.1.2統(tǒng)計量 

6.1.3點估計、區(qū)間估計和中心極限定理 

6.2假設檢驗與單樣本t檢驗 

6.2.1假設檢驗 

6.2.2單樣本t檢驗 

6.3雙樣本t檢驗 

6.4方差分析(分類變量和連續(xù)變量關系檢驗) 

6.4.1單因素方差分析 

6.4.2多因素方差分析 

6.5相關分析(兩連續(xù)變量關系檢驗) 

6.5.1相關系數 

6.5.2散點矩陣圖 

6.6卡方檢驗(二分類變量關系檢驗) 

6.6.1列聯表 

6.6.2卡方檢驗 

第7章客戶價值預測:線性回歸模型與診斷 

7.1線性回歸 

7.1.1簡單線性回歸 

7.1.2多元線性回歸 

7.1.3多元線性回歸的變量篩選 

7.2線性回歸診斷 

7.2.1殘差分析 

7.2.2強影響點分析 

7.2.3多重共線性分析 

7.2.4小結線性回歸診斷 

7.3正則化方法 

7.3.1嶺回歸 

7.3.2LASSO回歸 

第8章Logistic回歸構建初始信用評級 

8.1Logistic回歸的相關關系分析 

8.2Logistic回歸模型及實現 

8.2.1Logistic回歸與發(fā)生比 

8.2.2Logistic回歸的基本原理 

8.2.3在Python中實現Logistic回歸 

8.3Logistic回歸的極大似然估計 

8.3.1極大似然估計的概念 

8.3.2Logistics回歸的極大似然估計 

8.4模型評估 

8.4.1模型評估方法 

8.4.2ROC曲線的概念 

8.4.3在Python中實現ROC曲線 

第9章使用決策樹進行初始信用評級 

9.1決策樹概述 

9.2決策樹算法 

9.2.1ID3建樹算法原理 

9.2.2C4.5建樹算法原理 

9.2.3CART建樹算法原理 

9.2.4決策樹的剪枝 

9.3在Python中實現決策樹 

9.3.1建模 

9.3.2模型評估 

9.3.3決策樹的可視化 

9.3.4參數搜索調優(yōu) 

第10章神經網絡 

10.1神經元模型 

10.2單層感知器 

10.3BP神經網絡 

10.4多層感知器的scikitlearn代碼實現 

第11章分類器入門:最近鄰域與樸素貝葉斯 

11.1KNN算法 

11.1.1KNN算法原理 

11.1.2在Python中實現KNN算法 

11.2樸素貝葉斯分類 

11.2.1貝葉斯公式 

11.2.2樸素貝葉斯分類原理 

11.2.3樸素貝葉斯的參數估計 

11.2.4在Python中實現樸素貝葉斯 

第12章高級分類器:支持向量機 

12.1線性可分與線性不可分 

12.2線性可分支持向量機 

12.2.1函數間隔和幾何間隔 

12.2.2學習策略 

12.2.3對偶方法求解 

12.2.4線性可分支持向量機例題 

12.3線性支持向量機與軟間隔最大化 

12.4非線性支持向量機與核函數 

12.4.1核函數 

12.4.2非線性支持向量機的學習 

12.4.3示例與Python實現 

12.5使用支持向量機的案例 

第13章連續(xù)變量的特征選擇與轉換 

13.1方法概述 

13.2主成分分析 

13.2.1主成分分析簡介 

13.2.2主成分分析原理 

13.2.3主成分分析的運用 

13.2.4在Python中實現主成分分析 

13.3基于主成分的冗余變量篩選 

13.4因子分析 

13.4.1因子分析模型 

13.4.2因子分析算法 

13.4.3在Python中實現因子分析 

第14章客戶分群與聚類 

14.1聚類算法概述 

14.2聚類算法基本概念 

14.2.1變量標準化與分布形態(tài)轉換 

14.2.2變量的維度分析 

14.3聚類模型的評估 

14.4層次聚類 

14.4.1層次聚類原理 

14.4.2層次聚類在Python中的實現 

14.5基于劃分的聚類 

14.5.1kmeans聚類原理 

14.5.2kmeans聚類

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號