第一篇:博弈論學習體會
博弈論學習體會
本月花了不少時間著重研究了微觀經濟學中的博弈論部分,學完后感覺頗有些心得.博弈論有兩個比較enlightening的觀點,一是more information can hurt you(掌握更多的信息可能是一件壞事),二是more options can hurt you(擁有更多的選擇可能是一件壞事).雖然博弈論主要用于研究經濟問題,但是我覺得這些原理在我們現實生活中同樣是適用的.舉例說明第一點,比如兩個女生同時追一個男生(反過來兩個男生追一個女生,甚至是兩個男生追另一個男生,或者兩個女生分別追另一個女生,其實也是一樣的[后兩種雖然是同性戀行為,但是不影響我們分析問題],為了表達我一貫的尊重女性和女士優先的思想,這里我們姑且先舉女生追男生的例子)。其中一個女生(女生A)和這個男生是很好的朋友,因此她知道他的很多情況,包括優點,當然也包括缺點。而另一個女生(女生B)和這個男生只是一面之緣,所以對這個男生并不是很了解,請問情況對誰有利?博弈論認為,女生B(即只有一面之緣的女生)更有優勢,她更有可能追到這個男生。而女生A會在兩點上敗給她的競爭對手,一,她已經知道了這個男生的缺點所在,這會讓她表現得不夠堅定,而女生B則不存在這個問題,所謂無知者無畏嘛,因此從主觀上來考慮,女生B占優勢;二,因為A已經和這個男生是好朋友,所以她的機會成本是最后連朋友也做不成,而女生B的機會成本是零,按照經濟學原理,機會成本越小意味著激勵越大,因此從客觀上講,女生B也占優勢。
再舉例子說明第二點,為了表示公平起見,這里改為兩個男生追一個女生的例子,其中男生A長的比較普通一些,所以沒有女生在追他,而男生B比較帥,有另一個女生正在追他(也可以是多個女生,不影響我們分析問題),請問情況對哪個更有利?根據博弈論觀點,答案是男生A(沒人追的那個)。為什么呢,因為他沒有什么選擇的余地。博弈論講一個人能夠成功往往因為他無選擇,這個觀點聽起來似乎有點怪怪的,但是仔細想想還是有很有歷史(古人講破釜沉舟,就是這個意思)和現實意義的。比如某個女生覺得某個男生是她今生非嫁不可的人,于是她得到這個男生的概率會變得極高,因為她已經沒有后路可退,如果這個男生不要她的話,她可能會以死相逼(極端了一點,但是現實中也是存在的),而且她真的做得出來(這是關鍵!博弈論的核心就是你的威脅一定要是可信的,如果你的威脅不可信,那么你在這局博弈中就失敗了,甚至在以后的博弈中也會很被動.所以誠信不僅僅是一種道德規范,而且還是一個有效的博弈策略),在這種情況下,除非這個男生真的是一個無情無義的人(如果你愛上了一個這么壞的男人,那我只能說活該你倒霉了),否則他肯定乖乖投降的.這里要聲明的是以上舉的那些例子,都是我根據博弈論的理論推導出來的,純粹是紙上談兵,用馬克思的話來說,就是都是一些形而上學的東西,因為我并沒有相關的實踐經驗,我也沒有充分的證據表明一定符合現實情況,而且事實上也不會是完全相符的,因為我按照經濟學的思想有選擇性地忽略了一些其他的因素,而那些因素可能也是非常重要的,比如說例一中,我們假設這兩個女生的其他條件是一樣的,他們的差別僅僅是與這個男生的熟悉程度,然而這實際上是一個非常強的假設,現實中也是很難實現的,在例二中我們假設男生A除了追這個女生之外別無選擇,這實際上也是一個過于強的假設,事實上這種情況也是不常見的.事實上不僅僅是個人,這些法則用在政權之間的政治博弈也是適用的.舉中國<反分裂國家法>的制定為例,沒有訂這部法律之前,臺灣分裂分子會覺得如果臺灣宣布獨立,大陸可能會選擇戰爭,也可能會考慮美國等的因素選擇不戰,于是臺獨勢力就會想賭一把,因此大陸就往往
很被動.然而這部法律出來之后,如果臺灣宣布獨立,那么根據法理,大陸便只有一個選擇:戰爭.正是因為如此,臺獨勢力的氣焰才被壓下去,大陸從此才獲得了對臺關系的主動權.所以選擇太多,往往不是一件好事.所以想要達到目的,最好的辦法就是讓自己無路可退,或者只有一條路可走,只有如此,你才能夠一往無前.也就是說,通過把自己置于一個看似被動的境地,往往能為自己獲得更多的主動權,古人所說的置之死地而后生,與這點有異曲同工之處.如果說金融學研究的對象是資本,那么經濟學研究的對象便是選擇,或者說是人們的權衡取舍.當然這里指的選擇和微觀經濟學里面需求是一個含義,指的是可實現的選擇,比如說你選擇一個人住在火星上,因為你根本就到不了火星,所以這不算是一個選擇,再比如,你選擇去當田徑運動員,但是你只有一只腳,這也不能算是一個選擇(即使殘運會的運動員貌似也不行吧).為了解釋關于人們各種經濟生活中的選擇背后的原因,經濟學家們創造出了各種各樣的經濟學模型.幾乎所有經濟學模型都致力于解釋現實,但是往往都不拘泥于一些現實的細節,而且很多事情都是由兩個甚至多個競爭的模型去解釋同一個問題.比如我曾經寫的一篇文章里由預期理論模型推導出一個人戀愛的次數越多,越難獲得高質量的愛情,但是這僅僅是考慮心理預期這一個方面,而沒有考慮戀愛經驗這個方面,因為從另一方面來說,一個人戀愛經驗越豐富,他或者她越容易讀懂對方的心思,而這是有益于提高他或者她的愛情質量的.所以實際的現實是預期和經驗綜合或者博弈的結果(看我分析得這么條理清晰,好像我談過戀愛似的,我自己都被鎮住了).這種情況在經濟學理論中比比皆是,最典型的就是沖突效應(收入與替代效應)模型.比如銀行的利息升高了,請問你是增加存款還是減少存款?根據收入效應,利息提高,意味著你更有錢了,因此你沒必要把那么多錢都放在銀行里,而可以取出一些用來消費.而根據替代效應,現在把更多的錢存入銀行會讓你獲得更多的利息,因此你會再存一些錢,因此是存是取,其實經濟學理論并沒有給你答案.再舉個例子,你的收入提高了,你是選擇增加工作時間,還是減少工作時間?根據收入效應理論,你現在變得更有錢了,因此沒必要像以前那樣起早貪黑地工作,而可以選擇多花一些時間去陪家人和朋友.但是根據替代效應理論,你現在多花一個小時工作就能賺到曾經要五個小時才能賺到的錢,因此你現在的邊際產出量要高,所以應該選擇花更多的時間在工作上.同樣在這個問題上,經濟學理論也沒有給你答案.總體來說,這段時間的經濟學理論的學習使我重新思考了很多以前想不明白地問題,有些問題得到了解決,也有些問題雖然仍然很困惑,但是經濟學同樣給了我一些新的思路,這個收獲比起考試來說,其實要大得多,甚至可以這么說,即使我不決定考研,花這些時間去學習這些經濟學理論,也是值得的。
經濟學教你看到生活背后的東西,不教你怎么賺錢(但是金融學里的投資學部分好像教賺錢的,但是也并不是我們通常意義上講的那樣,因為理論和實踐的差別還是很大的。)所以我這里建議大家有時間的話找本經濟學的讀物(這里還是推薦曼昆的《經濟學原理》,寫得很通俗的)看看,絕對是獲益匪淺,想要將來過一種有質量的生活,少偷一點菜,多讀些好的書,總是有益的。
第二篇:《博弈論》學習體會
生活中的博弈論
——學習《博弈論》課程的收獲
高中畢業那個暑假我閱讀了一本書名為《非是非非:世界經典趣味悖論》的書,里面主要講述了一些有趣的悖論和哲學以及邏輯的思維,同時該書也講述了經典的囚徒困境的博弈,但是書是以趣味故事來講述了,我也不知道那就是囚徒困境。本科上了微觀經濟學課程才恍然大悟,我原來早就對這個經典博弈有了一定程度上的感性認識。電影《美麗心靈》也讓我認識到了納什傳奇的一生。本科的學習中一直對博弈論很好奇,但是也沒有自己去學習。在學習之前我認為是一門有很強的實用性而且很有趣的課程,但是實際上的博弈論與我的想象又說區別,數學知識的要求較高,而且理解起來有一定的困難。但是博弈論課程讓我全面系統的了解了博弈論這么學科外,也讓我認識到博弈論的深奧,需要自己去領悟。通過不斷努力學習和思考,博弈論也給我帶來了許多的收獲和啟發。
一、了解了四種博弈論和四種均衡
博弈論本是數學的分支,博弈論也是一種分析問題的工具,它不僅僅運用于經濟學也運用于軍事、政治學、生物學等多個學科。中國古代的許多經典故事也是博弈論的模型,例如田忌賽馬。當博弈論被引入經濟學研究,為經濟學研究方法開啟了一扇嶄新的大門,改變了經濟學的輪廓。在分析經濟學的各種問題時都有所運用,特別是產業組織理論方面,在研究市場結構時學者運用了各種博弈模型分析市場參與者的行為和策略。
根據博弈的行動順序和信息的完全與否將博弈分為四種:完全信息靜態博弈;完全信息動態博弈;不完全信息靜態博弈;不完全信息動態博弈。對應的四種均衡:納什均衡;子博弈精煉納什均衡;貝葉斯均衡;精煉貝葉斯均衡。在課程的學習中我們了解了多種經典的博弈模型:智豬博弈,市場進入阻撓,蜈蚣博弈等等。不同的博弈模型都用其簡單的表述,描述了復雜的經濟學問題,從中要仔細體會才能得到答案。
在本科的學校中囚徒困境是無法解決的,但是在現在看來,如果將囚徒困境放到無限次的重復博弈中,結果就會不一樣了,即如果囚徒困境不再是完全信息靜態博弈,而變成完全信息動態博弈均衡結果會不一樣,囚徒困境得以解決。“冷酷策略”是無限次囚徒博弈的子博弈精煉納什均衡,在每一階段,囚徒都會選擇(抵賴、抵賴),囚徒走出了一次性博弈的困境。冷酷策略也有人稱之為“以牙還牙”策略是指一旦對方選擇坦白,自己也將選擇坦白,并且一直坦白下去。
掌握這些基本的博弈論概念我們才剛剛進入博弈論這門課程的大門,而那些經典的博弈之所以是經典也是普通人很難構建出來的博弈模型。
二、生活中處處存在博弈
其實博弈現象不只現身于經濟領域,于我們日常生活中也是處處可見的,所以博弈論的思想不僅僅能夠用來分析經濟從而獲得最大的盈利,我們也可以嘗試將博弈論的觀點與日常生活聯系,將博弈論的思想運用到生活實踐中,從而獲得最優的策略。
夫妻吵架也是一場博弈。夫妻雙方都有兩種策略,強硬或軟弱。博弈的可能結果有四種組合:夫強硬妻強硬、夫強硬妻軟弱、夫軟弱妻強硬、夫軟弱妻軟弱。
根據生活的實際觀察,夫軟弱妻軟弱是婚姻最穩定的一種,因為互相都不愿讓對方受到傷害或感到難過,常常情愿自己讓步。夫強硬妻強硬是婚姻最不穩定的一種,大多數結局是負氣離婚。夫強硬妻軟弱和妻強硬夫軟弱是最常見的一種,許多夫妻吵架都是這樣,最后終歸是一方讓步,不是丈夫撤退到陽臺里點根煙,就是妻子避讓到臥室里號啕大哭。
而我自己認為從博弈論中獲得的最大收獲是博弈中的思維邏輯和分析問題的方式。
1.逆向歸納法與重復剔除
在求解子博弈精煉納什均衡時,我們通常采用的是逆向歸納法,從每一個結果開始反向推測,在每一個子博弈中策略都在該博弈上構成納什均衡。同時運用重復剔除的方法,剔除不可置信威脅,即剔除劣的戰略,從而得到最優戰略。我們在生活和學校中往往習慣了順向的思維,而有時候逆向思維是更容易得出最優的策略。
而不可置信威脅更是到處存在,其實小朋友就很懂得利用這一點,在小朋友們為了達到目的在哭的時候,爸媽往往會放狠話,例如說再哭把你丟出去,或者不要你了之類的,但是很多小朋友并不受威脅,因為他們知道父母的話是不可信的,所以為了達到目前他們會選擇繼續哭泣。又例如在動物身上也可以看見,俗話說“會叫的狗不咬人”,也是這樣,狗遇見同類會吠叫是一種威脅,但是這種威脅是不可置信的,真正兇猛的狗在下口之前是不會吠叫的。在生活中,我們有時也會這樣,例如跟好朋友相約見面,確定了時間,并且說明遲到了就不會等,但是實際情況是即使她遲到了身為好朋友還是會等下去。
2.信息傳遞
《孫子兵法》上說:“知己知彼,百戰百勝。”這就是一個完全信息的假設了,但是有時候我們并不能正確的認識自己,也不能正確的認識別人。自信時往往會高估自己而不可一世,自卑時則相反會高估困難不敢前行。信息的傳遞成為一門學問,正如課本中的經典模型,如何發出信號將自己去他人區分開來是十分重要的。信息的不完全是現實的常態,口頭上的說明并不一定能夠取得人們的信任,行動才是最好的方法,所謂:路遙知馬力日久見人心。
在不完全信息博弈中,一個基本的假設就是行為主體都是類型依賴的,特別是不完全信息動態博弈中,參與者只知道一個先驗概率,根據先行動中的行為來修正概率,得到后驗概率,之后進行決策。
在日常生活中,我們往往都是生活中不完全信息中,我們不知道這個人“是敵是友”,我們只能根據他的行為來判斷,但是“壞人”還是可能做好事的,信息的不完全使得我們要斷進行判斷,不斷修正他是好人還是壞人的概率。我們根據他人的行為來自己的行為,往往是你對我好我也會對你好,同樣也會“以牙還牙”,能夠“以德報怨”的人實在是不多見得。同樣在生活中,一個朋友是酒肉朋友還是值得兩肋插刀的知己,我們一下子并不能區分,但是我們會通過他的行為來判斷他們的類型,在動態博弈中不斷修正自己的判斷。
3.策略的選擇
博弈論也可以說是在其他人做出選擇的情況下,自己根據他人的選擇,做出最優的選擇。人與人之間是相互的,博弈達到的均衡也是參與者之間相互作用的結果。怎么做出最優選擇呢?是在理性的情況下,利己的情況下的選擇。但是在實踐情況下,由于種種原因我們不一定能夠選擇到最優,甚至是選擇了劣策略。這時人往往會后悔,懊惱。有時利己的選擇卻會給他人帶來損失,個人理性與集體理性相沖突,這時我們又該如何選擇呢?
得與失是我們日常生活中每天都要面對的博弈,什么事該做,什么事不該做,什么利益必須爭取,什么利益敬而遠之,這些都需要我們深思熟慮后做出正確的選擇。就如同我放棄工作選擇了讀研,而另外一些人放棄讀研的機會選擇工作也是一樣的,讀研讓我得到了許多,同時我付出了巨大的機會成本:三年的時間與經驗、可能取得的工資收入、付出的學費等等。正如“舍得”這個詞,從來都是有舍去才有所得的。
人在面對很多事情時是感性的,無法做到博弈論中的理性決策,很多人說戀愛中的人是低智商的,其實只是那時大家都過于感性而已,有時喜歡不喜歡真的是說不出道理的,自己都無法知道自己怎么想,又談何理性分析。但是其實,不以得喜,不以失悲,坦然地面對得失才是處世的最高境界,得之吾幸失之我命。唯物辯證法也告訴我們事物的得失都存在一定的因果聯系,有付出才會有回報,如果有時盡力了也沒有得到想要的結果,你可能會深感上天的不公,但反過來想想,其實你更應該坦然地面對,因為盡力去做的你已經無怨無悔,得不到不是因為你沒有去珍惜和努力,而是因為對方本不屬于你,所以在人生中我們有時更要學會放棄,學會忘記。
博弈論這門課程很有難度但是在學習的過程中給我帶來了很多的思考,讓我在思考問題的邏輯和分析問題的思維方式上都有很大的收獲。
第三篇:博弈論介紹
我個人對納什的了解僅限于知道納什均衡,知道這個均衡的存在性如何證明,以及電影《美麗心靈》,對他其他的貢獻幾乎一無所知。不過,要說其對經濟學的貢獻,我只能說,影響非常非常的深遠。
據說當年納什告訴博弈論的創始人馮諾依曼他自己的研究成果時,馮諾依曼對此的評價是:不過是又一個不動點定理而已。
馮諾依曼是從數學的角度來看待納什均衡的,在他們看來可能的確沒什么(但研一的時候我們還是花了半個學期從最簡單的點集拓撲慢慢學會這個證明,多數同學苦不堪言)。
然而從經濟學的角度,這個均衡的理論翻開了經濟學新的一頁。
為什么呢?在納什之前,當經濟學家談到“均衡”的時候,大家想到的就是所謂的“市場均衡”,在這種均衡里面,個人與個人之間,企業與企業之間,是沒有任何的“策略互動”的:每個個體都根據自身面臨的“市場情況”做決策,而不會考慮其他人做什么決策。
然而這種分析框架遇到了很多困難。比如,當Intel降價的時候,AMD該怎么辦?拍賣的時候,我必須考慮別人會出什么價,來決定自己出什么價。
納什的偉大貢獻在于,在這些博弈的問題里面,給出了具有非常好的性質的“解”的概念,也就是新的“均衡”的概念,也就是納什均衡。
納什均衡意味著,給定別人的策略,自己選擇的策略是最優的。如果所有人的策略都是在給定別人的策略下選擇的最優策略,那么就不會有人愿意去偏離,從而達到了一個均衡的狀態。
納什均衡在數學上無疑是非常優美的。首先,這個均衡是必然存在的,這也就是納什所證明的。其次,在很多簡單的情況下,比如求解古諾均衡等,求解過程就是非常符合直覺的聯立等式,即使只有初中的數學水平也能求解最簡單的納什均衡。
當然,納什均衡也有局限性。首先是,這個均衡不唯一,一個博弈可能有多個甚至無數個納什均衡。其次就是,納什均衡實際上假設了完全的理性,因此這個均衡很多時候跟現實的觀察是有差距的。
但是不管怎樣,這個概念的提出是開天辟地的貢獻,從此之后,博弈論幾乎改寫了整個微觀經濟學。
首先是在應用上,人們可以研究寡頭、拍賣等之前難以研究的問題,而且在很多領域,納什均衡依然是最普遍被接受的解。
其次在理論上,從納什均衡開始,出現了從各個角度研究博弈中的均衡,以及各種其他的均衡的概念,比如可理性化、貝葉斯納什均衡、相關均衡、level-k等等等等。博弈論這門學科從馮諾依曼創立,一直到納什,正式成熟了起來。
-------不好意思,中午沒寫完就去吃飯了-------
最后,也是回應關于樓下張五常“不可證偽性”的看法。博弈論絕非不可證偽的領域,相反,最近幾十年發展出的“實驗經濟學”等學科,不就是為了對一些博弈進行證偽么?實際上除了“實驗經濟學”之外,即便是基于非受控實驗的計量經濟學,也非常關注對一些game的數據的處理,比如計量經濟學中已經發展出關于拍賣理論、匹配(matching)等的一些識別的方法,對博弈的處理正逐漸從純理論領域慢慢發展到實證領域。而這些發展,都是站在了像納什這樣的巨人的肩膀上。
成住畢竟壞空,巨星總會殞落。讓我們一起為這位不世出的天才再次默哀。
Economic Sciences Laureates: Fields All Nobel Laureates sorted by field.One Nobel Laureate may be listed under several fields.Econometrics(8)Financial economics(8)Game theory(6)Macroeconomics(9)
納什均衡中,每個參與者所選擇的策略都是最佳的,而博弈的結果是穩定的。
還是從經濟學的角度,舉個例子吧,著名的廣告博弈。比如耐克和阿迪進行一次世界杯前的促銷,如果耐克單獨打廣告,則耐克收益6,而阿迪也間接收益1。這時耐克就會覺得不爽,因為它單獨投入了所有的錢,而對手卻能分享利益。如果阿迪單獨打廣告,也是一樣的情況。如果兩邊一起打廣告,則耐克收益5,阿迪收益5,但這不滿足帕累托最優,因為雙方都投資很大。于是雙方都不打廣告,收益都是0,卻成為了占優策略。但是真實的廣告世界,往往是選擇次優解。
博弈論,即Game Theory。高手玩游戲從來都不是游戲內的較量,而在游戲外。
想要玩好就得猜對手的心思,博弈論就是告訴你怎么和別人打交道,猜人心思的學科。
經濟學的傳統方法是新古典經濟學建立起來的(以劍橋學派的創始人馬歇爾的經濟學為標志),它假定市場是完全競爭的,自己的行為對別人都沒有影響,別人的行為對自己也沒有影響。
(在每個生產者的產量和消費者的購買量對總的生產量和消費量都微不足道的時候,例如糧食市場,可以看作是完全競爭的。)
上文說過市場有四種狀態,新古典經濟學的這個假設在解釋寡頭市場時,遇到極大困難。寡頭市場就是少數幾個大企業占絕了幾乎全部市場。在這樣的市場中,每個企業的決策對其他企業都有實質性的影響。比如,智能手機市場,基本是iphone 三星,華為,小米少數廠商占據絕大多數市場份額。蘋果的決策,比如定價,要不要考慮其他廠商的反應?當然要考慮。同時,其他廠商也要關注蘋果如何動作。這樣的市場結構和糧食市場完全不同,傳統的分析方法在這里失效了!
于是博弈論應運而生~一開始只是數學家在玩,經濟學家是后面跟進的從1994年第一次博弈論或諾貝爾經濟學獎到現在的21年里,已經得過三次了。
不過博弈論有局限,因為博弈論的假設是人是理性的…要是遇到x你就沒辦法了,看似逆天的“海盜分金”的故事也就悲劇了。
博弈論分析的主要是非合作博弈,即互相之間沒有約束力下的行為。如果大家遵守協議,就是合作博弈,這是納什均衡的一種特殊,是馮·諾伊曼研究的東西。
根據信息是非完全,以及博弈是一次還是多次進行,把所有博弈論分四種:完全信息靜態博弈,完全信息動態博弈,不完全信息靜態博弈,完全信息動態博弈。
學多了你會發現,經濟學就是哲學啊,不是教你怎么賺錢的,是教你怎么做選擇,怎么更好的生活的……
如果沒有辦法做到納什均衡,則會陷入囚徒困境的例子中。
這個例子并不是納什提出的,而是塔克(Tucker)想出來的。單獨審訊兩個犯人張三和李四,如果兩人都不招供(合作),則各自分別坐1年牢。如果兩人都招供(背叛),則各自分別坐5年牢。如果任一人招供,則此人釋放,另一人做20年牢。此時雙方都不招供是對于兩個人這個整體的最優解,是帕累托最優的。但是單獨個人來看,卻并非最優解,因為存在直接釋放的可能。此時如果考慮犯人的個人利益最大化,都采用招供的方式,則是納什均衡的,所以兩犯人往往都會招供,選擇納什平衡這樣的次優解。此例證明了納什均衡和帕累托最優又是沖突的。
我們再往前看以資源配置理論為核心的傳統經濟學,這個經濟學的核心就是價格理論。在新古典經濟學中,我們假定市場中,人與人之間的關系完全通過價格來體現,或者說價格是一個參數,對所有人都一樣,每個消費者都有自己的最優選擇,然后就形成需求函數;每個生產者有自己利潤最大化的選擇,于是就形成供給函數。在市場當中,似乎總有一只無形之手來讓需求和供給相等,于是達到了所謂的均衡,這就是傳統經濟學的基本理論。
經濟學家在發展出了這套非常成熟的價格理論之后,做出的數學模型確實非常完美,非常漂亮。
將這些理論應用于分析其他社會問題,我們一般叫做理性選擇理論。但當我們這樣去分析社會問題時,就會面臨很多困難。其中一個困難就是大量的經濟行為其實是沒有價格的。另外,人們在實際行為中關心的不僅僅是物質利益,比如我找工作并不是只關心工資,我還關心其他的東西,如工作環境、對我未來職業選擇的影響,還有這個職業的社會聲譽,等等。(比如,合肥與蕪湖給出的工資并不同,但是由于女朋友的原因,我會選擇工資較低的地方,這樣一個次優解)
近代對于博弈論的研究,開始于策墨咯,波雷爾及馮-諾伊曼。1928年,馮-諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮-諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構并將博弈論系統的應用于經濟領域,從而奠定了這一學科的基礎和理論體系。1950~1951年,約翰-福布斯-納什利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎。納什的開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。
有了這樣的理論,所以在納什之后,我們的經濟分析不再是簡單的資源配置理論,不再是簡單的價格理論,而是可以分析各種各樣的制度的理論,包括市場制度。傳統經濟學只分析市場制度,我們現在要分析大量的非市場制度;傳統的經濟學只分析物質生產和分配,我們現在不僅分析物質的,也分析非物質的,不僅分析經濟問題,也分析社會、政治、文化問題以及它們之間的相互關系。我們還可以分析制度是怎么演化的,這個傳統經濟學沒有辦法分析,有了博弈論之后,制度演進分析變得容易。
所以博弈論使得經濟學發生了根本性轉型,也正在使得其他社會科學發生這種轉型,包括政治科學,包括法律,甚至包括最基礎的像心理學,社會學等等,包括對動物的研究,動物學,都在發生一些重要的變化。
我們知道,納什發展出的最重要的概念就是納什均衡。我在這里稍微給大家介紹一下。首先我要糾正一點,一般我們講的博弈論就是非合作博弈論,但在中文里特別容易誤解,讓人覺得非合作博弈是研究人怎么不合作的。事實不是這樣,非合作博弈研究的是每個人獨立決策的結果會是什么樣。我們恰恰是希望用非合作博弈理論來解釋人們為什么不合作,只有搞明白了為什么不合作,才能更好促進合作。
先來給大家做一個簡單概述,什么叫博弈論。博弈論指的是研究人與人之間行為互動的一般理論。所謂社會,就是互動。很多經濟學家對博弈論的應用范圍評價極高,比如諾貝爾獎得主奧曼(Robert Aumann)。另外一個經濟學家哈特(Sergiu Hart)在文章里說,博弈論可以視為整個社會科學理性一脈的總括。我們研究的人的行為有理性的有非理性的,博弈論為理性行為分析提供了一個統一場理論。
我講的一個基本問題是,從博弈論或者以納什劃分為界,納什之前和納什之后,經濟學是很不一樣的。現在大學教科書里邊,基本的經濟學原理主要是資源配置理論或價格理論,這個過去叫微觀經濟學。博弈論作為單拎出的一部分,有些教科書會把它放進去,但是并不是所有都放進去,放進去的份量非常有限,比如曼昆(Gregory Mankiw)的教科書《經濟學原理(微觀部分)》有一點博弈論的內容,但是大部分內容仍然是以傳統價格理論為主。
過去批評經濟學家的人都說經濟學家太注重研究物質,這有些道理。以色列曾發生過這樣一個故事,一家幼兒園規定五點放學,家長應該五點去接孩子,但是有些家長總是去得很晚,家長去得晚的話,幼兒園老師就得等著,不能把孩子一個人扔在那。后來為了解決這個問題,就出了一個新的規定,如果你來晚了超過15分鐘,家長要付一筆錢,來的越晚交的越多。傳統經濟學預測,這樣的話家長就不會來晚了。結果恰恰相反,實行新的制度以后,更多家長來得晚了,而且來得更晚。
有人批評經濟學家,你看你們經濟學的預測是錯的。錯在哪里?錯就錯在如果你簡單從過去的價格理論理解,你只能從物質層面解釋說他害怕罰款。其實人有好多心理成本,過去沒有這個制度的情況下,我去晚了會覺得很對不起老師,我要道歉,現在有了制度以后,我去晚了給錢就得了,理直氣壯。我有更重要的事,干嘛為了這點錢趕這十幾分鐘呢。
所以,如果我們只注重從物質利益角度去理解行為,似乎跟經濟學過去理解完全矛盾,但是我們如果把非物質的,特別是心理的成本加進去的話,那就完全可以解釋這種現象。
第四篇:博弈論論文
博弈論相關論文
今天下午我們班班級活動里面有做游戲的環節,每個人閉上眼睛,根據主持人的描述對一張紙進行折疊。于是第一輪游戲開始了,每個人閉上眼睛,根據主持人對折紙的描述,然后每個人自己的理解,閉著眼睛進行操作,最后睜開眼睛的時候發現每個人的結果幾乎都是不一樣的,這是怎么回事呢?首先我們只是靠著聽覺對主持人的描述進行理解,中文博大精深,加上每個人對一個中文字,一個詞的理解是不一樣的,所以每個人對整個折紙過程的理解也是不一樣的,最后的結果當然就不一樣了。在這個博弈中,我和主持人均是博弈方,只是博弈方的得益不是很明顯。我按照主持人的描述最終卻和主持人想要的結果是不一樣的,造成這樣的結果是因為博弈方之間的信息不對稱,如果博弈方是先在游戲進行前,對每一個游戲涉及到的詞進行統一的定義,即博弈雙方的信息完全對稱,那么結果就會達到我們想要的結果。
信息不對稱不得不讓我想到中國的股市。據說中國的股市股民之間的比例是1:2:7.百分之七十的人進入股市的虧損,百分之二十的人是不虧不贏,只有百分之一十的人盈利的。為什么會出現這樣的情況?我們都知道信息擁有量與得益必然有正相關性。我的理解是這樣的,首先是每個人具有的經濟知識和技術分析能力不夠,炒股票我們需要一定的經濟學知識,我們國家的經濟是由政府主導的,其中政府發布的宏觀數據和政策都會對市場有很大的影響,那么我們要用經濟學的知識和技術分析法,那么關于基本面即宏觀經濟指標,經濟政策走勢,行業發展狀況,公司銷售,財務狀況等這些數據的來源,是否具有真實性,及時性以及有效性呢?這又要涉及到作為博弈方的股民,是否掌握了這些真實有效的數據,如果股民掌握了數據,并且進行的認真的分析做出正確的決策那么股民就會在股市中獲得盈利,當然一般的股民是不具備這樣的能力的,他們一般是根據自己對所購買股票的分析及國家公布的宏觀經濟指標,還有自己的風險偏好來做出的選擇。
那么作為理財公司呢?理財公司其中一部分的盈利來自于顧客理財盈利中抽成,理財公司站在非常公正的立場上嚴格地按照客戶的實際情況來幫客戶分析自身財務狀況和理財的需求,通過科學的方式在個人理財方案里配備各種金融工具。通常,第三方獨立理財機構會先對客戶的基本情況進行了解,包括的資產狀況,投資偏好和財富目標,然后,根據具體情況為客戶定制財富管理策略,提供理財產品,實現客戶的財富目標。理財公司具有一定的能力對投資產品進行基本面分析,對數據進行技術分析和量化分析。當然,理財公司投行等這些根據自身的利益進行的投資也希望自己能夠早日得到比任何人都先知道的屬于國家機密的宏觀經濟指標和經濟政策,如果比市場上任何一個人先知道,那么及時的做出正確的決策實現自身利益最大化,當然這樣也導致了國家宏觀數據泄密案件的發生,背后都是存在參與人利益的驅動的原因的。
信息對稱性的程度會影響我們決策。法瑪根據市場信息的反應的強弱將有效市場分為三種,即弱勢市場,半強式有效市場和強式有效市場。在弱式有效市場中,證券價格充分反映了歷史上一系列交易價格和交易量中所隱含的信息。在半強式有效市場中,證券當前價格完全反映所有公開信息,不僅包括證券價格序列信息,還包括有關公司價值、宏觀經濟形勢和政策方面的信息。如果市場是半強式有效的,那么僅僅以公開資料為基礎的分析將不能提供任何幫助,因為針對當前已公開的資料信息,目前的價格是合適的,未來的價格變化依賴于新的公開信息。在這樣的市場中,只有那些利用內幕信息者才能獲得非正常的超額回報。在強式有效市場中,證券價格總是能及時充分地反映所有相關信息,包括所有公開的信息和內幕信息,任何人都不可能通過對公開或內幕信息的分析來獲取超額收益。證券價格反映了所有即時信息。在這種市場中,任何企圖尋找內部資料信息來打擊市場的做法都是不明智的。強式有效市場假設下,任何專業投資者的邊際市場價值為零,因為沒有任何資料來源和加工方式能夠穩定地增加收益。對于證券組合的管理者來說,如果市場是強式有效的,管理者會選擇消極保守的態度,只求獲得市場平均的收益水平。所以信息完全的對稱有些時候并不是我們所想要的,尤其是作為一名想要依靠證券組合來實現自身利益最大化的人。
關于信息不對稱在生活的應用是有很多的,比如說我們在買二手車是最典型的信息不對稱的例子,賣主對車子的性能和相關指數很了解,一般人在賣車之前都會對車進行修飾一番。那么買主就恰恰相反,他只能根據車主提供的數據和對車自身的觀測來判斷這個二手車。我想提一下最近鬧得很兇的食品安全問題,就是商家與消費者的博弈。不是說人民存在貪小便宜的心理,畢竟三鹿也是一個大型企業。如果我們能夠帶有理性的認識選擇食品這樣就會減少我們吃到劣質有毒的食品,如果沒有消費者的需求的存在,那么供求市場也不會存在。我認為的對食品理性認識和理性選擇是指能夠客觀的估計該食品的價值與價格,理性選擇即使我們的監管局沒有做到信息完全透露我們的選擇也會減少偏向錯誤性的。當然我是希望我們的政府部門,監管部門是能夠在人民生活生活最基本的保質上能夠將這些信息完全公開的并且加大法制制度和監管力度的,這樣人民的生活才能得以保證。(最后說一說關于上博弈論的感受吧,本來是打算寫關于博弈論中信息不對稱,就打算看一下教材關于不完全信息靜態博弈和不完全信息動態的博弈的,看了發現看不懂,其實我覺得博弈論這本教材編的真的很好,博弈論本身就是一門不錯的學科,就是我希望老師能夠多講一些,這一本書我認為這學期所接觸的知識相對于整本書是很少的,我想這樣的結果也是和博弈困這門課程本身的難度,畢竟對數學要求很高,以及課程時間比較短的原因,僅僅只有一學期啊,吳老師平時上課講了很多有關博弈論以及生活人生的認識很喜歡的。)
第五篇:博弈論論文
中國社會熱點問題透視畢業論文—胡鑫
對“愛情的羅森塞爾蜈蚣博弈”的幾點個人思考
愛情就是一種男女雙方通過多次接觸、交流信息達到信任而最終結合的過程。而交流是以公共知識為起點,逐漸過渡到私人生活。說白了就是從淺入深的試探的過程。試探就是看對方能否有這樣實力去幫助自己實現利益最大化。這種利不僅僅指地位、金錢,還因包括個人情感的滿足,甚至還包括應付父母之命,輿論之驅的需要。所以,追求愛情的過程就是一種追求個人利益最大化過程,是一種動態雙人博弈過程。1981年羅森塞爾提出的蜈蚣博弈很好解釋這點。引文如下:
“ 假定阿花(女)和阿肥(男)是這個蜈蚣博弈的主角,這個博弈中他們每人都有兩個戰略選擇,一是繼續,一是甩。他們的博弈展開式如下: 阿花 —阿肥-??-阿花-阿肥—阿花-阿肥-(10,10)| | | | | |
(1,1)(0,3)(8,8)(7,10)(9,9)(8,10)
在圖中,博弈從左到右進行,橫向連桿代表繼續交往戰略,向下的連桿代表甩掉她(他)戰略。每個人下面對應的括號代表相應的人甩了對方,愛情結束后,各自的愛情效用收益,括號內左邊的數字代表阿花的收益,右邊代表阿肥的收益。可以看到,阿肥和阿花甩戰略對應的括號數字每個都不同,這是因為愛情效用在不斷增加,這里假設愛情每繼續一次總效用增加1,如第一個括號中總效用為1+1=2,第二個括號則為0+3=3,只是由于選擇甩戰略的人不同,而在兩人之間進行分配。由于男女生理結構和現實因素不同,阿花甩戰略只能使效用在二人之間平分,即兩敗俱傷,阿肥選擇甩戰略則能占到3個便宜。顯然,甩戰略對于被甩的一方來說是一種欺騙行為。
請看,首先,交往初期阿花如果甩了阿肥,則兩人各得1的收益,阿花如果選擇繼續,則輪到阿肥選擇,阿肥如果選擇甩了阿花,則阿花屬受騙,收益為0,阿肥占了便宜收益為3,這樣完成一個階段的博弈。可以看到每一輪交往之后,雙方了解程度加深,兩人愛情總效用在不斷增長。這樣一直博弈下去,直到最后兩人都得到10的收益,為圓滿愛情結局——總體效益最大。遺憾的是這個圓滿結局很難達到!
大家注意,當阿肥到達甩了阿花可得收益是10的時候,他很難有動力繼續交往下去,繼續下去不但收益不會增長,而且有被阿花甩掉反而減少收益的風險。阿花則更不利,因為她從來就沒有占先的機會,她無論哪次選擇甩阿肥,二者都是兩敗俱傷,而且還有可能被阿肥欺騙減少收益的危險,在愛情過程中,女人總體來講處于不利地位。因此,每一次交往,無論阿肥還是阿花都有選擇甩來中止愛情的動機,更詳細的數學可以證明,如果他們是極端個人主義的話,愛情圓滿的結局不可能達到。個人效益最大與總體效益最大之間有矛盾。(《博弈論的詭計》——哈爾濱出版社)”
從以上分析可以看出,在臨近成功【10,10】時,男方為了利益最大化而選擇分手。女方預測到這種背叛后理智的先發制人地選擇分手。這是男女雙方“完全理性”的表現,缺乏必要的信任。所謂“海枯石爛、海誓山盟”就是極力用謊言維護這種信任,使能繼續交往下去。可是從屢見不鮮的戀愛失敗先例中我們可以發現這種信任是多么脆弱!個人享受主義影響下成長的一代更多表現出是自負與見異思遷。美國極高的離婚率和隨之而產生的單親家庭模式不就可以看成中國未來的預演?每當我走在校園內,發現一對對情侶十指相扣、提前承諾,有著永不分離的氣勢時覺得多么可笑與擔憂。未來工作、住宿、家長態度、個人取向和個人命運不可預知性使大學生戀愛成功率不足5%,并且對終身的承諾變成十足的謊言。從實際中可以看出大學生的沖動和不計后果使戀愛失敗不再是蜈蚣博弈中的有所收益,而是對雙方產生不可預料的損失,尤其是在個人未來發展方面。既然大學生選擇戀愛是一種嚴格劣策略,那么為什么所謂“高智商、高理智”之人屢試不爽?孔子說“食色,性也。”他將吃飯與戀愛看成是同樣性質的事情。更進一步說戀愛就是在激素作用下人不自覺行動。于是我中國社會熱點問題透視畢業論文—胡鑫
想到一個“謬論”:既然對異性追求是人類和單細胞動物都有的一種行為,那么為什么人類自己的這行為自詡為圣神不可侵犯的“愛情”,而非人類的這行為卻是可以被利用來創造價值的東西?
另一方面,從圖中可以看出,女方永遠處在戀愛的劣勢中。難道就沒有一種方法改變這種劣勢嗎?也就是說沒有一種方法使男方選擇背叛則使自己損失大于女方?縱觀戀愛過程,也可以看作男方不斷投入的過程。從日常伙食費到車船旅費,從住房到購車,這都是男方為了博得女方而投入的金錢、時間、精力。女方不停提出要求,男方更多是疲于滿足這一個又一個要求。表面看女方的這種行為與中國傳統女子道德相違背。而從另一角度看行為的結果增加男方戀愛投資,增加男方因背叛而付出的浸沒成本。一旦男方支付超過預算,他選擇背叛的收益將不再領先,可能出現負數,以至于陷入“協和博弈”的惡性循環中。為了前期高額投入不至于打水漂,男方不得不進行下一階段交往,并且投入將增加。就像輸了錢的賭徒希望下次可以咸魚翻身而投入更多錢一樣。依次遞增,男方將血本無歸。極度盼望到達【10,10】點將成為男方!戀愛時,男方大費小費全包不僅僅是表現的紳士風度,更多則是女方的生存策略。忠誠度并非與金錢、精力、時間投入成正比,但這些東西的過分投入會使男方積重難返,從而非自愿的提高忠誠度。
另一方面,男方能夠及時擺脫困境的方法也就是在戀愛時少投入或者在可承受范圍內投入。從實際可以看出這種投入具有剛性,投入的減少會使女方產生不滿與懷疑,使信任機制出現裂痕,促使蜈蚣博弈中先下手為強般的背叛出現。因此“不要把所有雞蛋放在一個籃子里”就成為男方的一個可選且可行的策略。也即男方為了降低投資一方面帶來的高失敗率而選擇投資于多方,他將不再僅僅和一個人談戀愛,而多線作戰,將戀愛這種排他性的行為完全變成個人的風險投資看待。男方將在每個女方面前欺騙,到處漫天承諾,希望在被發現前交往階段到達【10,10】。一旦其中一個成功,投資就得到回報。現實中感情欺騙并不觸犯法律,靠道德下的自我反省顯得不現實。人們總在尋求對這種“風險投資”的懲罰與約束機制。但目前的優勢策略我認為就是上段提起的女方策略。但結果是女方要求男方加大投資而男方極力減少投資,雙方經過多次討價還價,最終達到納什均衡點。任何一方變動都會引起均衡點劇烈波動。重則使關系破裂,輕則在動蕩后經過一段時間磨合,從新到達新的均衡點。“治大國如烹小鮮。”難道愛情馬拉松不也可以看成“烹小鮮”的過程嗎?
其實現實戀愛過程中雙方并非完全理智。道德、習慣、風俗、文化、學識等都可以影響這一過程。人并非“經濟人”,一個社會人在行動中會受到內在和外在多方因素影響。用雙人動態博弈模型并不能概括戀愛這一社會學問題。數學模型解釋感性認識的問題時只會取其一部而忽略大部。萬法歸宗,一切科學解釋都是為了更好、更容易認識周圍事物。這也是我認識的最重要的問題之一。
胡鑫