囚徒困境(Prisoner'sDilemma)是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇并非團體最佳選擇。或者說在一個群體中,個人做出理性選擇卻往往導致集體的非理性。雖然困境本身只屬模型性質(zhì),但現(xiàn)實中的價格競爭、環(huán)境保護等方面,也會頻繁出現(xiàn)類似情況。
“囚徒困境”是1950年美國蘭德公司的梅里爾·弗勒德(MerrillFlood)和梅爾文·德雷希爾(MelvinDresher)擬定出相關困境的理論,后來由顧問艾伯特·塔克(AlbertTucker)以囚徒方式闡述,并命名為“囚徒困境”。兩個共謀犯罪的人被關入監(jiān)獄,不能互相溝通情況。如果兩個人都不揭發(fā)對方,則由于證據(jù)不確定,每個人都坐牢一年;若一人揭發(fā),而另一人沉默,則揭發(fā)者因為立功而立即獲釋,沉默者因不合作而入獄十年;若互相揭發(fā),則因證據(jù)確鑿,二者都判刑八年。
由于囚徒無法信任對方,因此傾向于互相揭發(fā),而不是同守沉默。最終導致納什均衡僅落在非合作點上的博弈模型。
因為沒有有效的杜絕一切應該發(fā)生的人與事物 產(chǎn)生了一定的困境
方法如下:
1.施以報復,讓背叛行為不敢發(fā)生假如每一個拒供的囚徒都可以在刑滿釋放后對供認的囚徒實施報復,那么每個囚徒就可能因擔心未來的報復而在現(xiàn)在選擇拒供,使得拒供成為均衡的結(jié)果,則合作達成了。
2.契約合作,建立相互信任的關系在囚徒困境中,假如每個人都彼此相信對方不會招供,那么合作拒供的結(jié)果也可以出現(xiàn)。因此,合作的關鍵是相互的信任,也就是說,如果能夠達成一種信任關系,那么也就可以達成合作。
3.長期關系和重復博弈有的博弈是重復的。比如商業(yè)合作,往往不僅限于一次。如果你選擇了背叛,雖然就這一次博弈考察你占到了便宜,但你失去了以后合作的機會,從長遠考察則是吃了虧。
因此,一個理性的人為了從合作中持續(xù)不斷地獲得利益(而不是一錘子買賣),則必然會選擇忠誠而非背叛。也就是說,對于理性經(jīng)濟人而言,他會為了長遠的將來利益而犧牲眼前的利益。
囚徒困境是一個經(jīng)典的博弈論問題,指的是兩個犯罪嫌疑人被分別關押在不同的監(jiān)牢里,他們之間沒有任何溝通交流途徑,警方只有有限的證據(jù)。如果兩個人都保持沉默,則可以各被判入獄1年;如果兩個人都揭發(fā)對方,則會各被判入獄3年;如果一個人揭發(fā)了另一個人,揭發(fā)者將被免罪,另一個人則被判10年。這個博弈中,每個人的最佳策略都是揭發(fā)另一個人,但這樣的結(jié)果是,雙方都會被判3年,比兩個人都沉默都被判1年更糟糕。這是因為每個人都試圖追求個人利益,從而導致了最終結(jié)果的劣化。囚徒困境是博弈論中一個重要的問題,因為它的結(jié)果可以用來解釋很多現(xiàn)實生活中的情況,如合作、競爭等方面。
“囚徒困境”理論有兩個前提條件:
一是人性自私,懂得權衡利弊,在作出決定之前會作出對自己有利的選擇。
二是,處于同等境況的多人在自己作出決策時,信息閉塞,不能了解到別人的真實想法,只能依靠自己的獨立思考推測。
囚徒困境(Prisoner's Dilemma)是指兩個被捕囚徒之間的一種特殊博弈現(xiàn)象。該現(xiàn)象說明了為什么在合作對雙方都有利時,保持合作仍然是困難的。
囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇并非團體最佳選擇。雖然困境本身只屬模型性質(zhì),但現(xiàn)實中的價格競爭、環(huán)境保護、人際關系等方面,也會頻繁出現(xiàn)類似的情況。
在重復的囚徒困境中,博弈被反復地進行。因而每個參與者都有機會去“懲罰”另一個參與者前一回合的不合作行為。這時,合作可能會作為平衡的結(jié)果出現(xiàn)。欺騙的動機這時可能被懲罰的威脅所克服,從而可能導向一個較好的、合作的結(jié)果。反復的、接近無限的重復次數(shù)時,納什均衡趨向于帕累托最優(yōu),從互相背叛趨向于互相忠誠。
囚徒困境(prisoner's dilemma)是指兩個被捕的囚徒之間的一種特殊博弈,說明為什么甚至在合作對雙方都有利時,保持合作也是困難的。
囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇并非團體最佳選擇。雖然困境本身只屬模型性質(zhì),但現(xiàn)實中的價格競爭、環(huán)境保護、人際關系等方面,也會頻繁出現(xiàn)類似情況。
說明了,當所有局中人選擇其最優(yōu)策略時的策略組合可能對整體來說并不是好的策略,納什均衡可能對整體而言不是好的策略組合。《囚徒困境》,是1950年美國蘭德公司的梅里爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,后來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式闡述,并命名為《囚徒困境》。
囚徒困境是一個博弈論的例子,它描述了兩個人在做決策時,即使合作對雙方都有利,但由于彼此之間缺乏信任,最終導致雙方都做出不利于自己的選擇。
舉個例子,假設有兩個罪犯被捕,警察將他們分開審問。如果兩人都不說話,則兩人都只會被判輕罪;如果一人供認而另一人不說話,則供認的那個人會被釋放而另一個人會被判重罪;如果兩人都供認,則兩人都會被判重罪。在這種情況下,每個罪犯都會考慮自己的最大利益而選擇供認,最終導致雙方都被判重罪。
打的時候一定要沖到前面,抓不住敵人,不讓敵人跑過去你就贏啦。