注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)高性能計(jì)算的問(wèn)題解決之道:Linux態(tài)勢(shì)感知方法、實(shí)用工具及實(shí)踐技巧

高性能計(jì)算的問(wèn)題解決之道:Linux態(tài)勢(shì)感知方法、實(shí)用工具及實(shí)踐技巧

高性能計(jì)算的問(wèn)題解決之道:Linux態(tài)勢(shì)感知方法、實(shí)用工具及實(shí)踐技巧

定 價(jià):¥79.00

作 者: [美] 伊戈?duì)枴けR布希斯(Igor Ljubuncic) 著;張文力譯 譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 高性能計(jì)算技術(shù)叢書(shū)
標(biāo) 簽: LINUX 操作系統(tǒng)/系統(tǒng)開(kāi)發(fā) 計(jì)算機(jī)/網(wǎng)絡(luò)

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787111589785 出版時(shí)間: 2018-02-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 253 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)由Intel架構(gòu)師撰寫(xiě),創(chuàng)造性地采用Linux態(tài)勢(shì)感知方法來(lái)解決高性能計(jì)算的問(wèn)題,涵蓋技術(shù)、監(jiān)控和配置管理等多個(gè)方面。書(shū)中針對(duì)大規(guī)模數(shù)據(jù)中心、云平臺(tái)架構(gòu)和高性能計(jì)算環(huán)境,建立了一套基于統(tǒng)計(jì)工程和實(shí)驗(yàn)設(shè)計(jì)的方法論,從識(shí)別問(wèn)題和理解問(wèn)題,到再現(xiàn)問(wèn)題和解決問(wèn)題,一步一步地排除故障,形成了一套高效的工作流程。書(shū)中包含大量實(shí)戰(zhàn)案例和代碼,并介紹了不同工具的使用技巧,適合從事高性能計(jì)算相關(guān)工作的技術(shù)人員和管理人員參考。

作者簡(jiǎn)介

暫缺《高性能計(jì)算的問(wèn)題解決之道:Linux態(tài)勢(shì)感知方法、實(shí)用工具及實(shí)踐技巧》作者簡(jiǎn)介

圖書(shū)目錄

Contents 目  錄
譯者序
前 言
致 謝
引言 數(shù)據(jù)中心與高端計(jì)算 1
數(shù)據(jù)中心一覽 1
現(xiàn)代數(shù)據(jù)中心布局 1
歡迎來(lái)到BORG,抵抗是徒勞的 2
那就是力量 2
企業(yè)與Linux 2
經(jīng)典的辦公室 2
Linux計(jì)算環(huán)境 3
Linux云 3
10000個(gè)1不等于10000 3
問(wèn)題的非線(xiàn)性擴(kuò)展 3
大數(shù)定律 4
同質(zhì)化 4
企業(yè)的當(dāng)務(wù)之急 4
7天24小時(shí)全天候開(kāi)放 5
任務(wù)危急 5
停機(jī)時(shí)間等于金錢(qián) 5
千里之堤潰于蟻穴 5
參考文獻(xiàn) 5
第1章 你有問(wèn)題嗎 6
問(wèn)題的識(shí)別 6
如果森林里有一棵樹(shù)倒下,沒(méi)人能聽(tīng)到 6
一步一步地識(shí)別 7
總是優(yōu)先使用簡(jiǎn)單工具 7
過(guò)多的知識(shí)導(dǎo)致誤區(qū) 9
問(wèn)題的定義 9
當(dāng)前發(fā)生或可能的問(wèn)題 10
停機(jī)規(guī)模和嚴(yán)重性與業(yè)務(wù)需求 11
已知與未知 13
問(wèn)題的再現(xiàn) 13
你能隔離問(wèn)題嗎 13
偶發(fā)性問(wèn)題需要特殊處理 14
計(jì)劃如何控制混亂 14
放手是最難的事 15
因與果 16
不要流連于癥狀 16
先有雞還是先有蛋 16
嚴(yán)格控制環(huán)境改變,直到你理解了問(wèn)題的本質(zhì) 18
如果改變,確保你知道預(yù)期結(jié)果是什么 18
結(jié)論 19
參考文獻(xiàn) 19
第2章 開(kāi)始研究 20
隔離問(wèn)題 20
推動(dòng)從生產(chǎn)到測(cè)試 20
重新運(yùn)行獲得結(jié)果所需的最小集 21
忽略偏見(jiàn)信息,避免假設(shè) 21
與健康系統(tǒng)和已知參考的比較 22
那不是程序錯(cuò)誤,而是一個(gè)特性 22
將預(yù)期結(jié)果與正常系統(tǒng)作比較 23
性能和行為的參考是必需的 24
對(duì)變化的線(xiàn)性與非線(xiàn)性響應(yīng) 24
一次一個(gè)變量 25
線(xiàn)性復(fù)雜度的問(wèn)題 25
非線(xiàn)性問(wèn)題 25
響應(yīng)可能會(huì)延遲或掩蓋 25
Y到X而不是X到Y(jié) 26
組件搜索 26
結(jié)論 26
第3章 基礎(chǔ)研究 27
刻畫(huà)系統(tǒng)狀態(tài) 27
環(huán)境監(jiān)控 27
機(jī)器可訪(fǎng)問(wèn)性、響應(yīng)性和正常
運(yùn)行時(shí)間 27
本地和遠(yuǎn)程登錄以及管理控制臺(tái) 29
喊狼來(lái)了的監(jiān)控 29
讀取系統(tǒng)信息和日志 30
使用ps和top 30
系統(tǒng)日志 36
進(jìn)程記賬 39
檢查命令執(zhí)行的模式 40
與問(wèn)題表現(xiàn)相關(guān) 41
避免快速的結(jié)論 41
統(tǒng)計(jì)作為輔助 41
vmstat 41
iostat 43
系統(tǒng)活動(dòng)報(bào)告(SAR) 47
結(jié)論 49
參考文獻(xiàn) 50
第4章 深入探討系統(tǒng) 51
使用/proc 51
層次 52
每個(gè)進(jìn)程的變量 52
內(nèi)核數(shù)據(jù) 56
進(jìn)程空間 60
檢查內(nèi)核可調(diào)參數(shù) 63
sys子系統(tǒng) 63
內(nèi)存管理 64
文件系統(tǒng)管理 65
網(wǎng)絡(luò)管理 65
SunRPC 66
內(nèi)核 67
sysctl 69
結(jié)論 70
參考文獻(xiàn) 70
第5章 變身極客——跟蹤和調(diào)試應(yīng)用 72
使用strace和ltrace 72
strace 72
ltrace 86
結(jié)合兩種工具獲得最佳結(jié)果 87
其他工具 90
使用perf 93
介紹 93
為什么不用OProfile 94
前提 94
基本使用 94
基礎(chǔ)實(shí)例 99
高級(jí)實(shí)例 103
小結(jié) 107
使用gdb 107
介紹 107
前提 108
簡(jiǎn)單實(shí)例 108
不那么簡(jiǎn)單的實(shí)例 113
其他有用的命令 122
結(jié)論 124
參考文獻(xiàn) 124
第6章 極客進(jìn)級(jí)——應(yīng)用和內(nèi)核核心、內(nèi)核調(diào)試器 126
收集應(yīng)用核心 126
如何轉(zhuǎn)儲(chǔ)應(yīng)用核心 127
收集內(nèi)核核心(Kdump) 132
Kdump服務(wù)概覽 133
Kdump配置 137
測(cè)試配置 143
Kdump網(wǎng)絡(luò)轉(zhuǎn)儲(chǔ)功能 145
Kdump使用 146
小結(jié) 147
崩潰分析(crash) 147
前提 147
運(yùn)行crash 148
內(nèi)核崩潰核心分析 156
超級(jí)極客技能:C代碼分析 167
小例子 168
中級(jí)例子 172
困難的例子 176
內(nèi)核崩潰的bug報(bào)告 182
崩潰分析結(jié)果 184
內(nèi)核bug與硬件錯(cuò)誤 185
小結(jié) 186
內(nèi)核調(diào)試器 186
內(nèi)核編譯 186
進(jìn)入調(diào)試器 187
基本命令 187
小結(jié) 189
結(jié)論 189
參考文獻(xiàn) 189
第7章 問(wèn)題的解決方案 191
如何處理收集到的數(shù)據(jù) 191
文檔 191
數(shù)據(jù)的雜亂 193
最佳實(shí)踐 195
搜索引擎、郵件列表以及供應(yīng)商支持 202
找到根本原因 203
消除問(wèn)題 204
實(shí)現(xiàn)和跟蹤 206
結(jié)論 207
參考文獻(xiàn) 208
第8章 監(jiān)控和預(yù)防 209
監(jiān)控什么數(shù)據(jù) 209
過(guò)多的數(shù)據(jù)比沒(méi)有數(shù)據(jù)更糟 209
Y到X將定義你所需要的監(jiān)控 210
不要害怕改變 210
如何監(jiān)控和分析趨勢(shì) 211
設(shè)置你關(guān)心的監(jiān)控 211
監(jiān)控不等于報(bào)告 212
不監(jiān)控隨機(jī)指標(biāo) 212
定義數(shù)學(xué)趨勢(shì) 213
如何應(yīng)對(duì)趨勢(shì) 215
當(dāng)它來(lái)得太晚 216
內(nèi)務(wù)管理 217
預(yù)防是解決問(wèn)題的關(guān)鍵 217
配置審核 218
為什么審核有用 218
控制環(huán)境的變化 219
安全方面 219
系統(tǒng)數(shù)據(jù)收集工具 219
定制工具 220
商業(yè)支持 220
結(jié)論 221
參考文獻(xiàn) 221
第9章 讓你的環(huán)境更安全、更健壯 222
版本控制 222
為什么需要版本控制 222
Subversion、Git及相關(guān)軟件 223
簡(jiǎn)單回滾 223
配置管理 223
變懶:自動(dòng)化 224
大環(huán)境下的熵 225
掌控混亂 225
配置管理軟件 225
環(huán)境中引入變化的正確方法 226
一次一個(gè)變化 226
不要急著沖到截止時(shí)間 227
理解影響 228
沒(méi)報(bào)告問(wèn)題意味著什么都沒(méi)有 228
連鎖反應(yīng) 228
結(jié)論 229
參考文獻(xiàn) 229
第10章 微調(diào)系統(tǒng)性能 230
日志大小與日志輪轉(zhuǎn) 230
系統(tǒng)日志會(huì)一直增長(zhǎng) 230
慢點(diǎn),倒帶 232
確定消息的內(nèi)容 232
文件系統(tǒng)調(diào)優(yōu) 234
Ext3/4文件系統(tǒng) 234
XFS文件系統(tǒng) 235
sysfs文件系統(tǒng) 236
層次 236
blo

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)