平均數(shù)的問題
假設(shè)你與另外49名乘客一起乘坐一輛公交車。在某一站全德國最胖的人上了車。問題是:公交車上乘客的平均體重將會增加多少個百分比?4%或5%—大概應(yīng)該是這個數(shù)值。
假設(shè)你還在同一輛公交車上,全德國最富有的人卡爾·阿爾布雷希特上了車,那么這輛公交車上的人均財產(chǎn)會增加多少個百分比呢?4%或5%?遠(yuǎn)遠(yuǎn)不止!
讓我們好好計算一下第二個假設(shè)。假設(shè)這50名隨機(jī)選擇的乘客每人有54 000歐元的財產(chǎn),這時卡爾·阿爾布雷希特的加入就使總財產(chǎn)增加了將近250億歐元,公交車上的人均財產(chǎn)變成了5億,提高了百分之一百萬。一個單一的特殊個體導(dǎo)致了整個局面的改變。在第二個假設(shè)中,“平均”這個概念已經(jīng)沒有了意義。
納西姆·塔勒布曾警告過世人:“不要試圖去過一條平均一米深的河流。”這和我舉公交車的例子是一個意思。一條河流可以在很大的范圍內(nèi)只有幾厘米深,但在中心位置有10米深—人會被淹死??偸褂闷骄祦砜紤]事情很可能會是有害的,因?yàn)槠骄笛谏w了事情背后真實(shí)的分布情況。還有一個例子是夏日里紫外線的平均輻射強(qiáng)度。如果你整個夏天都在被遮住光線的辦公室度過,然后飛到馬略卡島(Mallorca),并且在那里不做任何防護(hù)地曬太陽,那你的健康肯定會有問題—盡管你受到的平均紫外線輻射強(qiáng)度并不比那些定期進(jìn)行戶外活動的人高。
以上不是什么新的認(rèn)識,這里面的邏輯是可以理解的。新的認(rèn)識是:在一個復(fù)雜的世界里,分布情況正在變得越來越不規(guī)律?;蛘呶覀兛梢曰氐侥莻€公交車的假設(shè)上,在一個復(fù)雜的世界里,實(shí)際的分布情況更接近第二個假設(shè),因此用平均值來進(jìn)行解釋就越來越不合適。平均一個網(wǎng)站有多少訪客?沒有平均情況下的網(wǎng)站,只有很少的網(wǎng)站(臉譜網(wǎng)或谷歌)能吸引到絕大部分訪客,而剩下的網(wǎng)站,可以說有無數(shù)個,只有很少量的訪客。數(shù)學(xué)家將這種情況稱之為“冪律分布”。一旦有極為特殊的個體在控制分布情況,那么平均的概念就沒有意義。
什么是一個公司的平均規(guī)模?什么是一個城市的平均居民人數(shù)?什么是一場戰(zhàn)爭的平均規(guī)模(是戰(zhàn)爭人數(shù)還是戰(zhàn)爭天數(shù))? 什么是DAX(德國DAX指數(shù),德國重要的股票指數(shù))每日的平均變化?
建筑項(xiàng)目的平均超支是多少?一本書的平均版次是多少?一次渦流造成的平均損失是多少?一位銀行家獲得的平均紅利是多少?一次市場營銷活動的平均成功率有多少?電影演員們的平均收入是多少?以上這些人們當(dāng)然都可以計算出來,但卻是沒有意義的。在這些例子中,分布情況都與“冪律分布”有關(guān)。用最后一個例子說明一下:有少部分演員每年收入超過千萬歐元,但也有成千上萬的演員僅僅能維持溫飽。如果你因?yàn)殡娪暗钠骄杖肟雌饋砗芸捎^而建議你的子女去當(dāng)演員,那你最好還是再考慮一下。
結(jié)論:當(dāng)提到“平均”這個詞時,你最好還是對它敏感一些,試著探究一下其背后的整體分布情況。如果一個極特殊的情況不會給平均值帶來很大影響,就像第一個公交車的假設(shè),那么“平均”這個概念還是有意義的;如果一個極特殊的情況會改變整個局面,就像第二個公交車的假設(shè),那么你(特別是記者朋友們)就應(yīng)該放棄“平均”這個概念。