注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡數(shù)據庫數(shù)據庫設計/管理R語言數(shù)據挖掘方法及應用

R語言數(shù)據挖掘方法及應用

R語言數(shù)據挖掘方法及應用

定 價:¥49.00

作 者: 薛薇
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 計算機/網絡 數(shù)據倉庫與數(shù)據挖掘 數(shù)據庫

購買這本書可以去


ISBN: 9787121283277 出版時間: 2016-04-01 包裝: 平塑
開本: 頁數(shù): 404 字數(shù):  

內容簡介

  大數(shù)據不僅意味著數(shù)據的積累、存儲與管理,更意味著大數(shù)據的分析。數(shù)據挖掘無可爭議地成為當今大數(shù)據分析的核心利器。R語言因徹底的開放性策略業(yè)已躋身數(shù)據挖掘工具之首列。本書以“R語言數(shù)據挖掘入門并不難”為開篇,總覽了數(shù)據挖掘的理論和應用輪廓,明確了R語言入門的必備知識和學習路線,并展示了數(shù)據挖掘的初步成果,旨在使讀者快速起步數(shù)據挖掘實踐。后續(xù)圍繞數(shù)據挖掘應用的四大核心方面,安排了數(shù)據預測篇:立足數(shù)據預測未知,數(shù)據分組篇:發(fā)現(xiàn)數(shù)據中的自然群組,數(shù)據關聯(lián)篇:發(fā)現(xiàn)數(shù)據的內在關聯(lián)性,離群數(shù)據探索篇:發(fā)現(xiàn)數(shù)據中的離群點。每篇下各設若干章節(jié),各章節(jié)從簡單易懂且具代表性的案例問題入手,剖析理論方法原理,講解R語言實現(xiàn),并給出案例的R語言數(shù)據挖掘代碼和結果解釋。本書內容覆蓋之廣泛,原理講解之通俗,R語言實現(xiàn)步驟之詳盡,在國內外同類書籍中尚不多見。相關數(shù)據資料及電子教案,可登錄華信教育資源網www.hxedu.com.cn免費下載。

作者簡介

  中國人民大學副教授,教研室主任,資深作者。主要著作:《SPSS統(tǒng)計分析方法及應用》、《SPSS MODOLER數(shù)據挖掘方法及應用》。

圖書目錄

目錄第一篇 起步篇:R語言數(shù)據挖掘入門并不難第1章 數(shù)據挖掘與R語言概述【本章學習目標】1.1 為什么要學習數(shù)據挖掘和R語言1.2 什么是數(shù)據挖掘1.3數(shù)據挖掘能給出什么1.3.1數(shù)據挖掘結果有哪些呈現(xiàn)方式1.3.2 數(shù)據挖掘結果有哪些基本特征1.4 數(shù)據挖掘能解決什么問題1.4.1 數(shù)據預測1.4.2 發(fā)現(xiàn)數(shù)據的內在結構1.4.3 發(fā)現(xiàn)關聯(lián)性1.4.4 模式診斷1.5 數(shù)據挖掘解決問題的思路1.6數(shù)據挖掘有哪些典型的商業(yè)應用1.6.1 數(shù)據挖掘在客戶細分中的應用1.6.2 數(shù)據挖掘在客戶流失分析中的應用1.6.3 數(shù)據挖掘在營銷響應分析中的應用1.6.4 數(shù)據挖掘在交叉銷售中的應用1.6.5 數(shù)據挖掘在欺詐甄別中的應用1.7 R語言入門需要知道什么1.7.1 什么是R的包1.7.2 如何獲得 R1.7.3 R如何起步1.7.4 R的基本操作和其他【本章附錄】第2章 R語言數(shù)據挖掘起步:R對象和數(shù)據組織 【本章學習目標】2.1 什么是R的數(shù)據對象2.1.1 R的數(shù)據對象有哪些類型2.1.2 如何創(chuàng)建和訪問R的數(shù)據對象2.2 如何用R的向量組織數(shù)據2.2.1 創(chuàng)建只包含一個元素的向量2.2.2 創(chuàng)建包含多個元素的向量2.2.3 訪問向量中的元素2.3 如何用R的矩陣組織數(shù)據2.3.1 創(chuàng)建矩陣2.3.2 訪問矩陣中的元素2.4 如何用R的數(shù)據框組織數(shù)據2.4.1 創(chuàng)建數(shù)據框2.4.2 訪問數(shù)據框2.5 如何用R的數(shù)組、列表組織數(shù)據2.5.1 創(chuàng)建和訪問數(shù)組2.5.2 創(chuàng)建和訪問列表2.6 R數(shù)據對象的相互轉換2.6.1 不同存儲類型之間的轉換2.6.2 不同結構類型之間的轉換2.7 如何將外部數(shù)據組織到R數(shù)據對象中2.7.1 將文本數(shù)據組織到R對象中2.7.2 將SPSS數(shù)據組織到R對象中2.7.3 將數(shù)據庫和Excel表數(shù)據組織到R對象中2.7.4 將網頁表格數(shù)據組織到R對象中2.7.5 R有哪些自帶的數(shù)據包2.7.6 如何將R對象中的數(shù)據保存起來2.8 R程序設計需哪些必備知識2.8.1 R程序設計涉及哪些基本概念2.8.2 R有哪些常用的系統(tǒng)函數(shù)2.8.3 用戶自定義函數(shù)提升編程水平2.8.4 如何提高R程序處理的能力2.9 R程序設計與數(shù)據整理綜合應用2.9.1 綜合應用一:數(shù)據的基本處理2.9.2 綜合應用二:如何將匯總數(shù)據還原為原始數(shù)據【本章附錄】第3章 R語言數(shù)據挖掘初體驗:對數(shù)據的直觀印象【本章學習目標】【案例與思考】3.1 數(shù)據的直觀印象3.1.1 R的數(shù)據可視化平臺是什么?3.1.3 R的圖形邊界和布局3.1.2 R的圖形組成和圖形參數(shù)3.1.4 如何修改R的圖形參數(shù)?3.2如何獲得單變量分布特征的直觀印象3.2.1核密度圖:車險理賠次數(shù)的分布特點是什么?3.2.2 小提琴圖:不同車型車險理賠次數(shù)的分布有差異嗎?3.2.3克利夫蘭點圖:車險理賠次數(shù)存在異常嗎?3.3如何獲得多變量聯(lián)合分布的直觀印象3.3.1 曲面圖和等高線圖3.3.2 二元核密度曲面圖:投保人年齡和車險理賠次數(shù)的聯(lián)合分布特點是什么?3.3.3 雷達圖:不同區(qū)域氣候特點有差異嗎?3.4如何獲得變量間相關性的直觀印象3.4.1 馬賽克圖:車型和車齡有相關性嗎?3.4.2 散點圖:這些因素會影響空氣濕度嗎?3.4.3 相關系數(shù)圖:淘寶各行業(yè)商品成交指數(shù)有相關性嗎?3.5如何獲得GIS數(shù)據的直觀印象3.5.1 繪制世界地圖和美國地圖3.5.2 繪制中國行政區(qū)劃地圖3.5.3 依據地圖繪制熱力圖:不同省市的淘寶女裝成交指數(shù)有差異嗎?3.7如何獲得文本詞頻數(shù)據的直觀印象:政府工作報告中有哪些高頻詞?【本章附錄】第二篇 數(shù)據預測篇:立足數(shù)據預測未知第4章 基于近鄰的分類預測:與近鄰有趨同的選擇!【本章學習目標】【案例與思考】4.1近鄰分析: K-近鄰法4.1.1 K-近鄰法中的距離4.1.2 K-近鄰法中的近鄰個數(shù)4.1.3 R的K-近鄰法和模擬分析4.1.4 K-近鄰法應用:天貓成交顧客的分類預測4.2 K-近鄰法的適用性及特征選擇4.2.1 K-近鄰法的適用性4.2.2 特征選擇:找到重要變量4.3基于變量重要性的加權K-近鄰法4.3.1 基于變量重要性的加權K-近鄰法的基本原理4.3.2 變量重要性判斷應用:天貓成交顧客預測中的重要變量4.4基于觀測相似性的加權K-近鄰法4.4.1 加權K-近鄰法的權重設計4.4.2 加權K-近鄰法的距離和相似性變換4.4.3 加權K-近鄰法的R實現(xiàn)4.4.4加權K-近鄰法應用:天貓成交顧客的分類預測【本章附錄】第5章 基于規(guī)則的分類和組合預測:給出易懂且穩(wěn)健的預測!【本章學習目標】【案例與思考】5.1決策樹概述5.1.1 什么是決策樹?5.1.2 決策樹的幾何意義是什么?5.1.3 決策樹的核心問題5.2 分類回歸樹的生長過程5.2.1 分類樹的生長過程5.2.2 回歸樹的生長過程5.2.3損失矩陣對分類樹的影響5.3 分類回歸樹的剪枝5.3.1 最小代價復雜度的測度5.3.2 分類回歸樹后剪枝過程5.3.3 分類回歸樹的交叉驗證剪枝5.4 分類回歸樹的R實現(xiàn)和應用5.4.1 分類回歸樹的R實現(xiàn)5.4.2 分類回歸樹的應用:提煉不同消費行為顧客的主要特征5.5 建立分類回歸樹的組合預測模型:給出穩(wěn)健的預測5.5.1 袋裝技術5.5.2 袋裝技術的R實現(xiàn)5.5.3 袋裝技術的應用:穩(wěn)健定位目標客戶5.5.4 推進技術5.5.5 推進技術的R實現(xiàn)5.5.6 推進技術的應用:穩(wěn)健定位目標客戶5.6 隨機森林:具有隨機性的組合預測5.6.1 什么是隨機森林?5.6.2 隨機森林的R實現(xiàn)5.6.3 隨機森林的應用:穩(wěn)健定位目標客戶【本章附錄】第6章 基于神經網絡的分類預測:給出高精確的預測!【本章學習目標】【案例與思考】6.1 人工神經網絡概述6.1.1 人工神經網絡和種類6.1.2 節(jié)點:人工神經網絡的核心處理器6.1.3 建立人工神經網絡的一般步驟6.1.4感知機模型:確定連接權重的基本策略6.2 B-P反向傳播網絡:最常見的人工神經網絡6.2.1 B-P反向傳播網絡的三大特點6.2.2 B-P反向傳播算法:確定連接權重6.2.3 學習率:影響連接權重調整的重要因素6.3 B-P反向傳播網絡的R實現(xiàn)和應用6.3.1 neuralnet包中的neuralnet函數(shù)6.3.2 neuralnet函數(shù)的應用:精準預測顧客的消費行為6.3.3 利用ROC曲線確定概率分割值6.3.4 nnet包中的nnet函數(shù)【本章附錄】第7章 基于支持向量的分類預測:給出最大把握的預測!【本章學習目標】【案例與思考】7.1 支持向量分類概述7.1.1支持向量分類的基本思路:確保把握程度7.1.2支持向量分類的三種情況7.2理想條件下的分類:線性可分時的支持向量分類7.2.1如何求解超平面7.2.1如何利用超平面進行分類預測7.3 一般條件下的分類:廣義線性可分時的支持向量分類7.3.1如何求解超平面7.3.2 可調參數(shù)的意義:把握程度和精度的權衡7.4 復雜條件下的分類:線性不可分時支持向量分類7.4.1 線性不可分的一般解決途徑和維災難問題7.4.2 支持向量分類克服維災難的途徑7.5 多分類的支持向量分類:二分類的拓展7.6 支持向量回歸:解決數(shù)值預測問題7.6.1 支持向量回歸與一般線性回歸:目標和策略7.6.2 支持向量回歸的基本思路7.7 支持向量機的R實現(xiàn)及應用7.7.1支持向量機的R實現(xiàn)7.7.2 利用R模擬線性可分下的支持向量分類7.7.3 利用R模擬線性不可分下的支持向量分類7.7.4 利用R模擬多分類的支持向量分類7.7.5 支持向量分類應用:天貓成交顧客的預測【本章附錄】第三篇 數(shù)據分組篇:發(fā)現(xiàn)數(shù)據中的自然群組第8章 常規(guī)聚類:直觀的數(shù)據全方位自動分組【本章學習目標】【案例與思考】8.1 聚類分析概述8.1.1聚類分析目標:發(fā)現(xiàn)數(shù)據中的“自然小類”8.1.2 有哪些主流的聚類算法?8.2基于質心的聚類:K-Means聚類8.2.1 K-Means聚類中的距離測度:體現(xiàn)全方位性8.2.2 K-Means聚類過程:多次自動分組8.2.3 K-Means聚類的R實現(xiàn)和模擬分析8.2.4 K-Means聚類的應用:環(huán)境污染的區(qū)域劃分8.3 PAM聚類:改進的K- Means聚類8.3.1 PAM聚類過程8.3.2 PAM聚類的R實現(xiàn)和模擬分析8.3基于聯(lián)通性的聚類:層次聚類8.3.1 層次聚類的基本過程:循序漸進的自動分組8.3.2 層次聚類的R實現(xiàn)和應用:環(huán)境污染的區(qū)域劃分8.4基于統(tǒng)計分布的聚類:EM聚類8.4.1 基于統(tǒng)計分布的聚類出發(fā)點:有限混合分布8.4.2 EM聚類:如何估計類參數(shù)和聚類解8.4.3 EM聚類的R實現(xiàn)和模擬分析8.4.4 EM聚類的應用:環(huán)境污染的區(qū)域劃分【本章附錄】第9章 特色聚類:數(shù)據分組還可以這樣做!【本章學習目標】【案例與思考】9.1 BIRCH聚類概述9.1.1 BRICH聚類有哪些特點?9.1.2 聚類特征和聚類特征樹:BIRCH聚類的重要策略9.1.3 BIRCH的聚類過程:由存儲空間決定的動態(tài)聚類9.1.4 BRICH聚類的R實現(xiàn)9.1.5 BRICH聚類應用:兩期崗位培訓的比較9.2 SOM網絡聚類概述9.2.1 SOM網絡聚類設計出發(fā)點9.2.2 SOM網絡的拓撲結構和聚類原理9.2.3 SOM網絡聚類的R實現(xiàn)9.2.4 SOM網絡聚類應用:手寫郵政編碼識別9.2.5 拓展SOM網絡:紅酒品質預測9.3基于密度的聚類模型:DBSCAN聚類9.3.1 DBSCAN聚類原理:密度可達性是核心9.3.2 DBSCAN聚類的R實現(xiàn)9.3.3 DBSCAN聚類的模擬分析【本章附錄】第四篇 數(shù)據關聯(lián)篇:發(fā)現(xiàn)數(shù)據的內在關聯(lián)性第10章 發(fā)現(xiàn)數(shù)據中的關聯(lián)特征:關聯(lián)是推薦的依據!【本章學習目標】【案例與思考】10.1 簡單關聯(lián)規(guī)則及其測度10.1.1 什么是簡單關聯(lián)規(guī)則?10.1.2 如何評價簡單關聯(lián)規(guī)則的有效性?10.1.3如何評價簡單關聯(lián)規(guī)則的實用性?10.2 Apri

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號