一次嚴(yán)重的縱火案發(fā)生后,警察在現(xiàn)場抓到甲乙兩個犯罪嫌疑人。事實上正是他們?yōu)榱藞髲?fù)而一起放火燒了這個倉庫,但是警方?jīng)]有掌握足夠的證據(jù)。于是,警方把他們隔離囚禁起來,要求坦白交代。如果他們都承認(rèn)縱火,每人將入獄三年;如果他們都不坦白,由于證據(jù)不充分,他們每人將只入獄一年;如果一個抵賴而另一個坦白并且愿意作證,那么抵賴者將入獄五年,而坦白者將得到寬大釋放,免于刑事處罰。這樣,兩個犯罪嫌疑人面臨的博弈格局如下面表格所示。和前面幾節(jié)一樣,每個格子中左下角的數(shù)字是甲的博弈所得,右上角的數(shù)字是乙的博弈所得?,F(xiàn)在,這些數(shù)字都不是正數(shù)。
表述一個博弈的基本要素有三個:第一,參與人或者局中人(players);第二,他們可選擇的行動(actions)或策略(strategies);第三,所有可能的對局的結(jié)果,用局中人在相應(yīng)對局下的博弈所得來表示,這個博弈所得,叫做贏利、贏得、得益或支付(payoffs)。將來,我們主要采取“支付”的說法。這里注意,“支付”要理解為因為他們參與博弈所得到的支付,而不是他們付出的支付。
在諾曼底登陸模擬博弈中,博弈的兩個參與人是盟軍和德軍;盟軍可以選擇的策略是a、b、c,德軍可以采取的策略是A、B、C和D;博弈的各種對局下雙方之支付則是相應(yīng)格子中的+和–,或者我們可以把它們改寫為+1和–1。而在這一節(jié)上面介紹的博弈中,博弈的兩個參與人是犯罪嫌疑人甲和犯罪嫌疑人乙;他們可以選擇的策略都是同樣的兩個,即坦白和抵賴;甲在各種對局下之博弈所得,是相應(yīng)格子里面左下角的數(shù)字,乙在各種對局下之博弈所得,是相應(yīng)格子里面右上角的數(shù)字。
概括起來,三要素是:
參與人或者局中人;
他們可以選擇的行動或策略;
每個參與人在各種對局下的博弈所得,叫做贏利、贏得、得益或支付。
這種用矩陣形式的表格表示兩個參與者的博弈所得的做法,來自博弈理論的一位先驅(qū)者托馬斯·謝林(Thomas C. Schelling)。美國普林斯頓大學(xué)經(jīng)濟(jì)學(xué)系的迪克西特(Avinash K. Dixit)教授和耶魯大學(xué)經(jīng)濟(jì)學(xué)和管理學(xué)教授奈爾伯夫(Barry J. Nalebuff)在他們的博弈論普及讀物《策略思維》中告訴我們,謝林教授曾經(jīng)說過:“假如真有人問我有沒有對博弈論作出一點(diǎn)貢獻(xiàn),我會回答有的。若問是什么,我會說我發(fā)明了用一個矩陣反映雙方得失的做法……我不認(rèn)為這個發(fā)明可以申請專利,所以我免費(fèi)奉送,不過,除了我的學(xué)生,幾乎沒有人愿意利用這個便利?,F(xiàn)在,我也供給各位免費(fèi)使用我發(fā)明的矩陣。”
謝林教授這么說,實在是太謙虛了。要知道,他在1960年出版的著作《對抗的策略》,迄今是博弈論方面很有影響的文獻(xiàn)。他的其他論著,有《抉擇與后果》、《軍備與勢力范圍》、《策略分析與社會問題》等等。他對博弈論有非常大的貢獻(xiàn)。雖然謝林教授的博弈論寫作以著作為主,與其他博弈論學(xué)者以論文為主很不相同,并且謝林的寫作以語言描述為主,很少采用更加時髦的數(shù)學(xué)形式的推導(dǎo),但是他對于博弈論的巨大的和啟發(fā)性的貢獻(xiàn),最終還是得到國際學(xué)界的承認(rèn)。喜歡語言描述的謝林教授和非常數(shù)學(xué)化的奧曼(Robert Aumann)教授,因為對于博弈論的巨大貢獻(xiàn),一起獲得2005年度的諾貝爾經(jīng)濟(jì)學(xué)獎。