本書共分4篇,針對Python爬蟲初學者,從零開始系統(tǒng)地講解了如何利用Python進行網絡爬蟲程序開發(fā)。第1篇快速入門篇:主要介紹了Python環(huán)境搭建和基礎語法知識、爬蟲入門知識及基本的使用方法、Ajax數(shù)據的分析和抓取、動態(tài)渲染頁面數(shù)據的爬取、網站代理的設置與使用、驗證碼的識別與破解,以及App數(shù)據抓取、數(shù)據的存儲方法等內容。第2篇技能進階篇:主要介紹了PySpider和Scrapy兩個常用爬蟲框架的基本使用方法、爬蟲的部署方法,以及數(shù)據分析、數(shù)據清洗常用庫的使用方法。第3篇項目實戰(zhàn)篇:以2個綜合實戰(zhàn)項目,詳細講解了Python數(shù)據爬蟲開始與實戰(zhàn)應用。本篇對全書內容進行了總結回顧,強化讀者的實操水平。第4篇技能拓展篇:從數(shù)據爬取、數(shù)據清洗和數(shù)據分析三個角度,介紹了一常用AI技術的實用技巧。運用這些技巧,讀者可以提高網絡爬蟲程序的編寫速度和數(shù)據分析效率。本書案例豐富,注重實戰(zhàn),既適合Python程序員和爬蟲愛好者閱讀學習,也適合作為廣大職業(yè)院校相關專業(yè)的教學用書。