作為一個自學爬蟲的過來人,曾經走過很多彎路,在自學的道路上也迷茫過。每次面對一個全新的網站,都像是踏進一個未知的世界。你不知道前面有哪些反爬手段在等著你;你不知道你會踩進哪個坑里。我做爬蟲的幾年時間里,爬過很多的網站、遇到過很多的難題。這本書就是我這幾年經驗的總結,從開始的工具的學習使用,到實戰(zhàn)項目的爬取,難度一步一步的升級,需求也越來越復雜,有各式各樣的爬取方式。 \n本書主要內容與數(shù)據(jù)爬取相關,包括編寫爬蟲所需要的基礎編程知識,如Requests包、Scrapy框架和數(shù)據(jù)庫的使用,到項目實戰(zhàn)教程,適合Python基礎入門的讀者。如果你是其他行業(yè)的從業(yè)者,想進入IT行業(yè)成為一位爬蟲工程師,又或者你已經是IT行業(yè)的從業(yè)者,本書在能夠讓你在對爬蟲工程師的工作內容有所了解的同時,也能讓你掌握作為一個爬蟲工程師所需要具備的基礎技能。