SQL是數(shù)據(jù)查詢的基本語言,Excel是數(shù)據(jù)分析和展示的*常見工具。兩者結(jié)合,可以組成一個(gè)強(qiáng)大且易于理解的業(yè)務(wù)數(shù)據(jù)分析工具。很多類重要的數(shù)據(jù)分析并不需要復(fù)雜且昂貴的數(shù)據(jù)挖掘工具。答案就在你的電腦桌上。這是一本實(shí)用指南,作者Gordon S. Linoff是數(shù)據(jù)挖掘領(lǐng)域的*專家。書中介紹了如何使用SQL和Excel來設(shè)計(jì)并完成復(fù)雜的數(shù)據(jù)分析。本書的第1版被廣泛認(rèn)可,第2版涵蓋了對(duì)SQL和Excel新功能的介紹,同時(shí)包括新的技術(shù)和實(shí)際業(yè)務(wù)示例。第2版介紹了業(yè)務(wù)經(jīng)理和數(shù)據(jù)分析人員所需掌握的*新信息。本書首先介紹數(shù)據(jù)挖掘所用的SQL基礎(chǔ)知識(shí),如何使用Excel展示結(jié)果,以及用于理解數(shù)據(jù)的簡(jiǎn)單的統(tǒng)計(jì)學(xué)概念。熟悉執(zhí)行SQL和操作Excel后,本書介紹了核心分析技術(shù)。本書內(nèi)容逐步從基礎(chǔ)查詢擴(kuò)展到復(fù)雜的應(yīng)用,使讀者能夠?qū)W習(xí)到某種數(shù)據(jù)分析的使用原因和時(shí)機(jī),如何設(shè)計(jì)和實(shí)現(xiàn),以及展示數(shù)據(jù)分析結(jié)果的強(qiáng)大方法。每一步都詳細(xì)解釋了業(yè)務(wù)環(huán)境、技術(shù)方法以及在所熟悉工具中的具體實(shí)現(xiàn)。隨著對(duì)本書的閱讀,你會(huì)發(fā)現(xiàn)很多知識(shí)點(diǎn),包括地理信息的重要性,圖表中的數(shù)據(jù)隨時(shí)間的變化方式,如何使用生存分析理解客戶任期和變動(dòng),以及影響生存率的因素。同時(shí),還會(huì)探索到一些方法,包括分析客戶的購買模式、分析購物車以及計(jì)算關(guān)聯(lián)規(guī)則。此外,本書還包含重要的SQL數(shù)據(jù)挖掘模型(線性回歸模型、樸素貝葉斯模型等)、建立客戶簽名所需的信息、用于分析結(jié)果集的模型、包含累積增量圖表和ROC圖表、使用SQL的*佳實(shí)踐、提高查詢性能的方法等。
作者簡(jiǎn)介
Gordon S. Linoff,從事數(shù)據(jù)庫工作數(shù)十年。在他的記憶中,他開始學(xué)習(xí)SQL時(shí),還是SQL92標(biāo)準(zhǔn)版。當(dāng)時(shí)他正領(lǐng)導(dǎo)一支開發(fā)團(tuán)隊(duì)(現(xiàn)已不存在的Thinking Machines公司),編寫*個(gè)側(cè)重于復(fù)雜查詢的高性能數(shù)據(jù)庫,用于支持決策分析。此后,Gordon在1998年合作創(chuàng)建了Data Miners公司,這是一家致力于數(shù)據(jù)挖掘、分析和大數(shù)據(jù)的咨詢公司。在他的工作生涯中,數(shù)據(jù)仍然是永恒的主題——而且通常是存儲(chǔ)于關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)。他對(duì)SQL的理解和應(yīng)用也變得越來越深刻和嫻熟。在2014年,他是Stack Overflow的*多貢獻(xiàn)者,Stack Overflow是行業(yè)內(nèi)領(lǐng)先的技術(shù)問答網(wǎng)站。Gordon編寫的另外幾本書也都是暢銷書:《數(shù)據(jù)挖掘技術(shù)(第3版)——應(yīng)用于市場(chǎng)營(yíng)銷、銷售與客戶關(guān)系管理》、Mastering Data Mining和Mining the Web——這些書籍都側(cè)重于數(shù)據(jù)挖掘和數(shù)據(jù)分析。本書延續(xù)廣受好評(píng)的第1版,側(cè)重于如何實(shí)際地獲取和解釋數(shù)據(jù)結(jié)果,更具有實(shí)踐性。