首頁 > 運動

【深度好文】納什均衡:只要沉入個人的井裡取水,結果會更好的

由 輕鬆編輯 發表于 運動2021-05-10

簡介在貝蒂拿到錢之前,薩莉選擇的數額會乘以10

納什均衡怎麼找

偉大的印度經濟學家考希克·巴蘇。他發明了被稱為“旅行者困境”的思維實驗。巴蘇教授在這個博弈裡告訴我們,只關注自己的利益而不信任他人實際上會傷害你自己(和其他人)。在這種情況下,納什均衡是一個糟糕的結果——博弈者將戰略放在一邊,只需要拿桶沉入個人的信任之井中取水,結果反而會更好。

有兩個朋友,我姑且稱為X和Y,參加了哈佛大學的一個戰略思維研討會。在飛回國之前,他們走訪了波士頓以古董商店而聞名的查爾斯街。

在一間古董店裡,他們找到一對一模一樣且物美價廉的中式花瓶。兩個人各買了一隻花瓶,但就像貴重物品有時候會遭遇的那樣,航空公司把他們的行李弄丟了,裡面就有這兩隻花瓶。航空公司決定立即對X和Y予以賠償。他們被請進失物招領部門經理的辦公室。

在簡短對話後,經理意識到他們對戰略思維很感興趣,因此,她決定順著以下思路對他們予以補償。他們兩位需要在不同的房間,在一張紙上寫下他們對補償丟失花瓶的期望數額。這個數字可以從5美元到100美元不等。

如果他們寫的數字相同,他們每人都可以拿到這個數額。如果他們寫的數字不同,每人會得到較低的那個數額。但這還沒完:那個寫下較低數值的人會在得到的數額基礎上增加5美元的獎勵,而那個寫下較高數值的人會在得到的數額基礎上扣掉5美元。

【深度好文】納什均衡:只要沉入個人的井裡取水,結果會更好的

舉例來說,如果X寫下80美元,Y寫下95美元,那麼X將拿到80+5=85美元,而Y會拿到80-5=75美元。那麼你選擇的數字會是多少?

表面上看,似乎兩人都應當寫100美元,因為這樣他們都會拿到這個數額。通情達理的人們很可能會這樣做。但如果X和Y都保持一種經濟世界視角——這是一種往往會變得狹隘的思維方式,會怎麼樣?大部分人都屬於“經濟人”物種——一種當機遇出現時希望財富最大化的物種。這種方式會預測出一種非常不同的數字。

有這種博弈中,納什均衡是5美元——很多博弈參與者選擇了這個低數值,並取得微少的補償。讓我解釋一下。

如果X認為Y寫的數字比100美元少(希望是最低的出價方,拿到5美元的獎金),他不會寫100美元——這已經很清楚了。但即使X認為Y寫了100美元,他仍然不會寫100美元:他會選擇寫上99美元,因為這樣他會拿到104美元(99+5)。

Y理解X的想法,他知道X不會寫下比99美元多的數額——因此,在做出和X之前一樣的思考之後,Y的選擇不會超過98美元。在這種情況下,X寫的數字不會超過97美元……以此類推。到哪裡才會停下來?我知道:他們必須在5美元這裡停下。這是保證兩位遊戲參與者事後都不會對自己的選擇後悔的唯一選項——這就是納什均衡。

【深度好文】納什均衡:只要沉入個人的井裡取水,結果會更好的

這讓我想起來溫斯頓·丘吉爾的觀點:“無論戰略有多麼好,你都應當偶爾看看結果。”這種戰略性的非零和遊戲被稱為“旅行者困境”,由著名的印度經濟學家考希克·巴蘇發明。

巴蘇教授[也發明了數獨(Sudoku)的競爭性版本(Duidoku)]是一位主要的經濟學家和世界銀行的高階副主席。

“旅行者困境”反映的情況是,最佳方案與透過納什困境獲得的結論差距很大。在這種情況下,關注自身的利益實際對自己(和他人)有害。該遊戲的一種廣泛行為實驗(有真正的經濟獎勵)會得出一些有意思的啟發。

“一個人在沒有實證的情況下,無法根據理解推斷出,在非零和的策略遊戲下,人們僅僅透過純粹正式的推斷就可以證實某種特殊的玩笑一定是有趣的。”——托馬斯·謝林

2007年6月,巴蘇教授在《科學美國人》雜誌上發表了一篇關於旅行者困境的文章。他說,在現實中玩這個簡單遊戲的時候(這不是一個零和遊戲,因為玩家得到的數額並不是固定的,而是由各自選擇的戰略所決定的),人們通常會拒絕(合理的)5美元選項,而常常會選擇100美元的選項。

【深度好文】納什均衡:只要沉入個人的井裡取水,結果會更好的

事實上,這位印度經濟學家指出,當玩家缺少相關正式資訊,從而忽略經濟手段時,他們實際能獲得更好的結果。放棄經濟思維,只去信任對手玩家是一件合理的事。所有這些歸結為一個簡單的問題:我們能信任博弈論嗎?

關於這個博弈的另一個有趣的發現是玩家的行為取決於獎金的多少。當獎金很少時,反覆進行的博弈指向的是獲得儘可能高的數額。

而當潛在的利潤非常可觀時,給出的數額往往接近納什均衡——可宣告的儘可能低的數額。這一發現同時得到阿里埃勒·魯賓斯坦教授對不同文化的研究的進一步證實,他在2002年獲得以色列經濟學獎。

“所有的人都會犯錯,但只有聰明人從他們的錯誤中學習。”——溫斯頓·丘吉爾

考希克·巴蘇認為,諸如誠實、公正、信任和關懷這樣的道德品質對一個良好的經濟體和健康的社會是必要的。雖然我完全同意他的觀點,但我嚴重懷疑世界領導人和經濟政策制定者是否擁有這樣的品質。

通常來說,誠實和信任是那種在政治競爭中不會給你任何優勢的品質,但如果有這些道德標準的個人能身居政治或經濟要職,就將會產生真正的奇蹟。

【深度好文】納什均衡:只要沉入個人的井裡取水,結果會更好的

兩個朋友到一個滿是鹿和兔子的森林裡去打獵。兔子代表獵人能捕獵到的最小戰利品,而鹿代表最大的收益。

獵人憑一己之力就可以捕到兔子,但他們必須合作才能獵到鹿。在這個遊戲中有兩個平衡點:這兩個獵人可以捕兔子,或者捕鹿。他們如果選擇更大的目標,會過得更好,但他們會這樣做嗎?這是一個信任的問題。如果每人都認為對方是一個可信賴和合作的夥伴,他們可能也會致力於獵鹿。

在此情況下,兩位參與者必須做出選擇:一方面是確定可以做到,但不那麼好的結果(兔子);另一方面是更大且更有前景的結果(鹿),而這要求彼此信任與合作。

即使這兩個獵人握了手,決定一起捕鹿,他們中的一個人還是有可能打破承諾,因為擔心對方可能也會這麼做。手裡拿著兔子總比沒人幫你捕鹿要好。

同樣的情況當然也會發生在森林之外。一家高科技公司的一位老僱員考慮辭職,與朋友一起創辦一家公司。就在他通知老闆之前,他開始擔心他的朋友不會辭職,這樣他就會被吊在那裡,既沒有了現在的工作(兔子),又沒有了夢想的初創公司(鹿)。

在博弈論誕生的很多年前,哲學家大衛·休謨和讓-雅克·盧梭在他們討論合作與信任時使用了這個博弈的口頭版本。

【深度好文】納什均衡:只要沉入個人的井裡取水,結果會更好的

需要指出的是,雖然囚徒困境通常被視為證明信任和社會合作問題的最佳範例,但一些博弈論的專家認為,獵鹿博弈代表研究信任與合作的一個更有趣的背景。

薩莉拿到500美元,並被告知她可以給貝蒂她認為合適的金額(甚至分文不給)。在貝蒂拿到錢之前,薩莉選擇的數額會乘以10。

那麼,如果薩莉給貝蒂200美元,後者實際會拿到2000美元。在博弈的第二階段,如果貝蒂願意,她可以從她實際得到的金額中拿出一部分還給薩莉。

你認為會發生什麼?請注意博弈的總價值(也就是兩個參與者可以賺取的總額)是5000美元。

假設薩莉給了貝蒂100美元,這意味著貝蒂實際可以拿到1000美元。那麼貝蒂合乎邏輯的舉動會是什麼?她應該怎麼做?她是否要把100美元還給薩莉?她可以這麼做,以感謝薩莉的信任,或者她也會因為薩莉沒有信任她、沒有給她哪怕400美元而沮喪。

如果你是其中的一位,你會怎麼做?在我給學生做實驗時,我看到有各種可能的行為:一些學生會拿出一半的金額;一些學生分文不給;一些學生完全信任對方,把所有的錢都拿了出來。一些慷慨的學生獲得回報,而有些學生卻沒有……世界上的情況也大致如此。

Tags:美元100薩莉數額信任