計(jì)算機(jī)視覺與PyTorch項(xiàng)目實(shí)戰(zhàn)：基于深度學(xué)習(xí)框架的端到端產(chǎn)品級(jí)模型設(shè)計(jì)與開發(fā)

定　價(jià)：￥99.00

作　者：	[印] 阿克謝·庫爾卡尼（Akshay Kulkarni）、阿達(dá)沙·希瓦南達(dá)(Adarsha Shivananda)、尼廷·奈杰·夏爾馬著歐拉譯
出版社：	清華大學(xué)出版社
叢編項(xiàng)：
標(biāo)　簽：	暫缺

購買這本書可以去

當(dāng)當(dāng)網(wǎng) (￥94.10)

ISBN：	9787302657422	出版時(shí)間：	2024-04-01	包裝：	平裝-膠訂
開本：	16開	頁數(shù)：		字?jǐn)?shù)：

內(nèi)容簡介

　　《計(jì)算機(jī)視覺與PyTorch項(xiàng)目實(shí)戰(zhàn)：基于深度學(xué)習(xí)框架的端到端產(chǎn)品級(jí)模型設(shè)計(jì)與開發(fā)》使用PyTorch 框架來討論計(jì)算機(jī)視覺算法及其應(yīng)用。首先介紹計(jì)算機(jī)視覺基礎(chǔ)，主題涉及卷積神經(jīng)網(wǎng)絡(luò)、ResNet、YOLO、數(shù)據(jù)增強(qiáng)和業(yè)內(nèi)使用的其他常規(guī)技術(shù)。隨后簡要概述PyTorch 庫。接下來探究圖像分類問題、對(duì)象檢測技術(shù)以及如何在訓(xùn)練和運(yùn)行推理的同時(shí)實(shí)現(xiàn)遷移學(xué)習(xí)。最后通過一個(gè)完整的建模過程來闡述深度學(xué)習(xí)框架PyTorch 是如何運(yùn)用優(yōu)化技巧和模型AI 可解釋性的?！队?jì)算機(jī)視覺與PyTorch項(xiàng)目實(shí)戰(zhàn)：基于深度學(xué)習(xí)框架的端到端產(chǎn)品級(jí)模型設(shè)計(jì)與開發(fā)》適合具有一定基礎(chǔ)的中高級(jí)讀者閱讀和參考，可以幫助他們使用遷移學(xué)習(xí)和PyTorch 來搭建產(chǎn)品級(jí)的計(jì)算機(jī)視覺模型。

作者簡介

　　著譯者和技術(shù)審閱者簡介阿克謝·庫爾卡尼（Akshay Kulkarni），AI與機(jī)器學(xué)習(xí)（ML）布道師和思想領(lǐng)袖，為財(cái)富500強(qiáng)提供咨詢服務(wù)，幫助客戶推動(dòng)AI和數(shù)字化戰(zhàn)略轉(zhuǎn)型。作為谷歌開發(fā)者，他經(jīng)常受邀在機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)大會(huì)（包括Strata、O'Reilly的Conf和GIDS）發(fā)表演講。他還是印度多個(gè)頂級(jí)研究生院的客座教授。2019年，他入選“印度40位40歲以下數(shù)據(jù)科學(xué)家”名單。業(yè)余時(shí)間，他喜歡閱讀、寫作、寫代碼以及為有抱負(fù)的數(shù)據(jù)科學(xué)工程師提供幫助。目前，他和自己的家人居住在印度班加羅爾。阿達(dá)沙·希瓦南達(dá)（Adarsha Shivananda），數(shù)據(jù)科學(xué)和MLOps先行者，致力于創(chuàng)建世界級(jí)的MLOps能力以確保人工智能可以持續(xù)交付價(jià)值。他的使命是在組織內(nèi)部和外部建立一個(gè)數(shù)據(jù)科學(xué)家人才庫，通過培訓(xùn)來解決問題，他在這方面一直保持領(lǐng)先地位。他先后就職于制藥、保健、包裝消費(fèi)、零售和營銷領(lǐng)域。目前，他居住在印度班加羅爾，喜歡閱讀和數(shù)據(jù)科學(xué)培訓(xùn)。尼廷·奈杰·夏爾馬（Nitin Ranjan Sharma），諾華制藥產(chǎn)品經(jīng)理，主要帶領(lǐng)團(tuán)隊(duì)使用多模型技術(shù)來開發(fā)產(chǎn)品，此外也為財(cái)富500強(qiáng)公司提供咨詢服務(wù)，使用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)框架來幫助他們解決復(fù)雜的業(yè)務(wù)問題。他主要關(guān)注的領(lǐng)域和核心專長是計(jì)算機(jī)視覺，比如解決圖像和視頻數(shù)據(jù)的業(yè)務(wù)難題。在加入諾華制藥之前，他的身份是Publicis Sapient、EY和TekSystems Global Services數(shù)據(jù)科學(xué)團(tuán)隊(duì)成員。他經(jīng)常受邀在數(shù)據(jù)科學(xué)大會(huì)上發(fā)表演講并喜歡培訓(xùn)和指導(dǎo)數(shù)據(jù)科學(xué)愛好者開展工作。此外，他還是一名非?；钴S的開源貢獻(xiàn)者。歐拉，奉行知行合一，擅長于問題的引導(dǎo)和拆解。目前感興趣的方向有機(jī)器學(xué)習(xí)、人工智能和商業(yè)分析。賈萊姆·拉吉·羅希特（Jalem Raj Rohit），Episource公司的高級(jí)數(shù)據(jù)科學(xué)家，全面領(lǐng)導(dǎo)計(jì)算機(jī)視覺工作。他參與創(chuàng)辦了Pydata德里和Pydata孟買等機(jī)器學(xué)習(xí)社群并以組織者和嘉賓的身份舉辦和參加了很多小型聚會(huì)與大型會(huì)議大會(huì)。他寫了兩本書，錄制了視頻課程（Julia語言和無服務(wù)器項(xiàng)目）。他的興趣領(lǐng)域包括計(jì)算機(jī)視覺、MLOps和分布式系統(tǒng)。

圖書目錄

第1章計(jì)算機(jī)視覺的基礎(chǔ)構(gòu)成
第2章圖像分類
第3章構(gòu)建目標(biāo)檢測模型
第4章構(gòu)建圖像分割模型
第5章基于圖像的搜索和推薦系統(tǒng)
第6章姿態(tài)估計(jì)
第7章圖像異常檢測
第8章圖像超分辨率
第9章視頻分析
第10章計(jì)算機(jī)視覺的可解釋AI
詳細(xì)目錄
第1章計(jì)算機(jī)視覺的基本構(gòu)成 001
1.1 什么是計(jì)算機(jī)視覺 002
1.1.1 應(yīng)用 002
1.1.2 通道 005
1.1.3 卷積神經(jīng)網(wǎng)絡(luò) 007
1.1.4 了解CNN架構(gòu)類型 014
1.1.5 掌握深度學(xué)習(xí)模型 021
1.1.6 PyTorch簡介 024
1.2 小結(jié) 026
第2章圖像分類 027
2.1 本章所涵蓋的主題 028
2.2 方法概述 028
2.3 創(chuàng)建圖像分類流程 029
2.3.1 第一個(gè)基本模型 030
2.3.2 數(shù)據(jù) 030
2.3.3 數(shù)據(jù)探索 032
2.3.4 數(shù)據(jù)加載器 033
2.3.5 定義模型 035
2.3.6 訓(xùn)練過程 040
2.3.7 基本模型的第二種變體 044
2.3.8 基本模型的第三種變體 046
2.3.9 基本模型的第四種變體 052
2.7 小結(jié) 053
第3章構(gòu)建目標(biāo)檢測模型 055
3.1 使用Boosted Cascade進(jìn)行目標(biāo)檢測 056
3.2 R-CNN 058
3.2.1 區(qū)域候選網(wǎng)絡(luò) 059
3.2.2 快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò) 062
3.2.3 候選區(qū)域網(wǎng)絡(luò)的工作原理 063
3.2.4 錨框生成層 064
3.2.5 候選區(qū)域?qū)?065
3.3 Mask R-CNN 065
3.4 YOLO 066
3.5 YOLO V2/V3 068
3.6 項(xiàng)目代碼片段 069
3.7 小結(jié) 082
第4章構(gòu)建圖像分割模型 083
4.1 圖像分割 084
4.2 PyTorch預(yù)訓(xùn)練支持 086
4.2.1 語義分割 086
4.2.2 實(shí)例分割 089
4.3 模型優(yōu)化 090
4.4 小結(jié) 106
第5章基于圖的搜索和推薦系統(tǒng) 107
5.1 問題陳述 107
5.2 方法和方法論 108
5.3 實(shí)現(xiàn) 109
5.3.1 數(shù)據(jù)集 109
5.3.2 安裝和導(dǎo)入庫 110
5.3.3 導(dǎo)入和理解數(shù)據(jù) 111
5.3.4 特征工程 114
5.3.5 計(jì)算相似度和排名 121
5.3.6 可視化推薦結(jié)果 122
5.3.7 從用戶處接收?qǐng)D輸入并推薦相似產(chǎn)品 125
5.4 小結(jié) 128
第6章姿態(tài)估計(jì) 129
6.1 自頂向下的方法 130
6.2 自底向上的方法 130
6.3 OpenPose 131
6.3.1 分支1 131
6.3.2 分支2 131
6.4 HRNet 133
6.5 Higher HRNet 135
6.6 PoseNet 136
6.6.1 PoseNet工作機(jī)制 136
6.6.2 PoseNet的優(yōu)點(diǎn)和缺點(diǎn) 140
6.6.3 姿態(tài)估計(jì)的應(yīng)用 140
6.6.4 在雜貨店視頻上進(jìn)行的測試用例 140
6.7 實(shí)現(xiàn) 141
6.8 小結(jié) 148
第7章圖像異常檢測 149
7.1 異常檢測 149
7.2 方法1：使用預(yù)訓(xùn)練的分類模型 151
7.3 方法2：使用自編碼器 165
7.4 小結(jié) 168
第8章圖像超分辨率 169
8.1 利用最近鄰概念放大圖像 170
8.2 理解雙線性插值 171
8.3 變分自編碼器 172
8.4 生成式對(duì)抗網(wǎng)絡(luò) 176
8.5 模型代碼 177
8.6 模型開發(fā) 177
8.7 運(yùn)行應(yīng)用程序 188
8.8 小結(jié) 190
第9章視頻分析 191
9.1 問題陳述 192
9.2 方法 194
9.3 實(shí)現(xiàn) 195
9.3.1 數(shù)據(jù) 196
9.3.2 把視頻上傳到Google Colab 197
9.3.3 將視頻轉(zhuǎn)換為一系列圖像 197
9.3.4 圖像提取 198
9.3.5 數(shù)據(jù)預(yù)處理 198
9.3.6 確定雜貨店中的熱點(diǎn) 200
9.3.7 導(dǎo)入圖像 203
9.3.8 獲取人群計(jì)數(shù) 203
9.3.9 安保與監(jiān)控 205
9.3.10 確定人口統(tǒng)計(jì)學(xué)特征(年齡和性別) 208
9.4 小結(jié) 210
第10章計(jì)算機(jī)視覺的可解釋AI 211
10.1 Grad-CAM 212
10.2 Grad-CAM 213
10.3 NBDT 214
10.4 Grad-CAM和Grad-CAM 的實(shí)現(xiàn) 216
10.4.1 在單個(gè)圖像上的Grad-CAM和Grad-CAM 實(shí)現(xiàn) 216
10.4.2 在單個(gè)圖像上的NBDT實(shí)現(xiàn) 219
10.5 小結(jié) 221