第一篇:博弈論的發展及其應用
博弈論的發展及其應用
【摘要】博弈論主要是研究策略選擇問題,強調的是個人理性。納什均衡在非合作博弈理論中起著不可替代的作用,博弈不僅在日常的生活中司空見慣,而且廣泛應用在經濟、社會、軍事等各個領域中。博弈論對人類最大的貢獻就是它的哲學思維方式推動著人類思維方式不斷向前發展。
關鍵詞:博弈論 納什均衡 應用 經濟學
引言
博弈論又稱對策論、競賽論,用于分析競爭的形勢。在存在利益沖突的競爭及斗爭中,競爭的結果不僅依賴于某個參與者的抉擇、決策和機會,而且也依賴于競爭對手或其他參與者的抉擇。由于競爭結果依賴于所有局中人的抉擇,每個局中人都企圖預測其他人的可能抉擇,以確定自己的最佳對策。博弈論是用數學方法來分析斗爭形式的學科,也叫沖突分析。
一、博弈論的概述
1、博弈論的發展
博弈論又稱對策論,英文名稱是Game Theory,是使用嚴謹的數學模型研究沖突對抗條件下最優策略的問題的理論,屬應用數學的一個分支。主要研究公式化了的激勵結構間的相互作用和具有斗爭或競爭性質現象的數學理論和方法,也是運籌學的一個重要學科。博弈論經過半個多世紀的短暫發展,目前在生物學、經濟學、國際關系、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。博弈論的正式提出是由美國經濟學家馮·諾依曼在1937年提出來的,他與經濟學家奧斯卡·摩根斯特恩于1944年合著的《博弈論與經濟行為》被公認為是博弈論誕生的標志,是關于純粹理論的理論。到50年代,博弈論得到了巨大的發展,Tucker于1950年提出了“囚徒困境”。納什在1950年和1951 年發表了兩篇關于非合作博弈的重要文章,提出了“納什均衡”的概念,以及證明納什均衡存在的納什定理,奠定了現代博弈論學科體系的基礎,這個時期的博弈論研究主要集中在對靜態博弈模型的研究。
50年代中后期到70年代是博弈論產生重要成果的階段。澤爾藤將納什均衡的概念引入了動態分析,提出了“多步政策”,“子博弈完美納什均衡”和“顫抖均衡”的概念,并發展了倒推歸納法等分析方法。豪爾紹尼開創了不完全信息對策研究的新領地,提出了“貝葉斯納什均衡”的概念和分析不完全信息博弈問題的標準方法,初步運用隨機分析方法解決信息不完全和不對稱問題。
80年代以后,博弈論開始走向成熟,理論框架逐漸完整和清晰,和其他學科之間的關系也逐漸深入,并開始受到經濟學家真正的重視。1994年著名博弈論專家納什、澤爾藤、豪爾紹尼因為在非合作博弈均衡領域的開創性貢獻獲得當年的諾貝爾經濟學獎。2005年奧曼和謝林因為“以博弈論分析方法增進了對沖突和合作的理解”而獲得諾貝爾經濟學獎,這說明博弈論已得到了世界的普遍認可。
2、博弈論的分類
一是分為合作博弈與非合作博弈。如果各博弈方能達成某種有約束力的契約或默契,以選擇共同的策略,此種博弈就是合作博弈。反之,就屬于非合作博弈。企業之間的聯合定價就屬于合作博弈,而經常挑起價格戰的企業采用的便主要是非合作博弈。在合作博弈中往往包含著非合作博弈。二是分為零和博弈、常和博弈與變和博弈。零和博弈指的是所有博弈方的得益總和為零,各種賭博就屬于零和博弈。
三是分為靜態博弈與動態博弈。所有博弈方同時或可看作同時選擇策略,采取行動的博弈是靜態博弈。譬如,在投標活動中,投標人投出標書一般雖有先后,但因為所有投標人在開標前都不知道其他投標人的標價,因此可看作同時選擇策略,采取行動。動態博弈則是指博弈方的選擇和行動有先后之分,后行者可以根據先行者的策略選擇來決定自己的策略。如A企業降價后,B企業也跟著降價等。四是分為完全信息博弈與不完全信息博弈。在前一種博弈中,每一個參與者都擁有全部的相關信息,只擁有部分相關信息的便屬于后一種博弈。
3、納什均衡博弈
1950年和1951年納什的兩篇關于非合作博弈論的重要論文, 不僅證明了非合作博弈及均衡解, 也證明了均衡解的存在性, 這就是著名的非合作博弈論的納什均衡。
納什均衡可以描述為:如果一個博弈存在一個戰略組合,任何參與人要改變這一戰略組合都可能導致降低自身的效用水平(或只能保持原有的效用水平),因而任何參與人都沒有積極去改變這一戰略組合,這一戰略組合稱為該博弈的納什均衡。納什均衡揭示了博弈均衡與經濟均衡的內在聯系。納什的研究奠定了現代非合作博弈論的基石,后來的博弈論研究基本上都沿著這條主線展開。納什均衡博弈論在現實中的應用也很廣泛。它不僅作為一種數學理論,可以用于經濟學領域,而且還可能影響著某些方面。各國對博弈論的研究,促進了人類社會文明的發展。博弈論對人類最大的貢獻就是博弈論的思維方式推動了人類思維方式的發展。
二、博弈論在生活中的應用
其實,生活中也存在博弈論的身影,如我國的“田忌賽馬”的故事,說的是齊威王與大將田忌各出三匹馬,一對一比賽三場,由于齊威王的最優、次優和較差的三匹馬分別跑得比田忌的三匹馬快,所以田忌總是以0:3告負。后來田忌的謀士孫胺給田忌出主意,讓最差的馬去與齊威王最快的馬比,而讓最優的馬去贏齊威王次優的馬,讓次優的馬去贏齊威王最差的馬,這樣便以2:0,取勝。還有一個關于博弈論很經典的例子就是囚徒困境。假設警察局抓住了兩個合伙犯罪的嫌疑犯,但獲得的證據并不十分確切,對于兩者的量刑就可能取決于兩者對于犯罪事實的供認。警察局將這兩名嫌疑犯分別關押以防他們串供。兩名囚徒明白,如果他們都交代犯罪事實,則可能將各被判刑5年;如果他們都不交代,則有可能只會被以較輕的罪各判1年;如果一人交代,另一人不交代,交代者有可能會被立即釋放,不交代者則將可能被重判8年。對于兩個囚徒總體而言,他們設想的最好的策略可能是都不交代。但任何一個囚徒在選擇不交代的策略時,都要冒很大的風險,一旦自己不交代而另一囚徒交代了,自己就將可能處于非常不利的境地。對于囚徒A而言,不管囚徒B采取何種策略,他的最優策略都是交代,囚徒B也是如此。最后兩人都會選擇交代。因此,囚徒困境反映了個體理性行為與集體理性行為之間的矛盾、沖突。
在現實生活中,很多情況正如上面兩個囚徒所遇情形一樣,沒能真正實現自身的最佳利益,甚至是損人不利己。從“納什均衡”的普遍意義中,我們深刻地領悟到經濟、社會、國防、管理和日常生活中的博弈現象。
三、博弈論在經濟管理中的應用 自從將博弈論引入經濟學以后,經濟學改變了傳統經濟分析地那種以個人孤立決策,其他經濟活動者的行為影響則被典型地簡化為價格信號為基礎的分析方法,而側重于經濟活動中多個利益主體的行為所產生的相互作用和影響的分析,從而使經濟分析更能反應經濟系統的本質。
現在我們經常會遇到各種各樣的商品價格大戰、家用電器大戰、服裝大戰等等。按照納什均衡博弈論的觀點,各廠家價格大戰的結局也是一個“納什均衡”,而且價格戰的結果是誰都不賺錢。因為博弈雙方的利潤正好是零。競爭的結果是穩定的,即一個“納什均衡”。這個結果可能對消費者是有利的,但對廠商而言是災難性的。所以,價格戰對廠商而言意味著自殺。事實上,完全競爭狀態下的均衡就是“納什均衡”。在這種狀態下,每一個廠商或消費者都是按照別人已定的價格來進行決策。在這種均衡中,企業要使利潤最大化,消費者要使效用最大化, 結果就導致了零利潤, 也就是說價格等于邊際成本。在完全競爭的情況下, 非合作行為導致了社會所期望的經濟效率狀態。如果廠商采取合作行動并決定轉向壟斷價格, 那么社會的經濟效率就會遭到破壞。
還有,假如市場經濟中存在著污染,但政府并沒有管制的環境,企業為了追求利潤的最大化,寧愿以犧牲環境為代價,也絕不會主動增加環保設備投資。按照看不見的手的原理,所有企業都會從利己的目的出發,采取不顧環境的策略,從而進入“納什均衡”狀態。如果一個企業從利他的目的出發,投資治理污染,而其他企業仍然不顧環境污染,那么這個企業的生產成本就會增加,價格就要提高,它的產品就沒有競爭力,甚至企業還要破產。這是一個“看不見的手的有效的完全競爭機制”失敗的例證。直到20世紀90年代中期,中國鄉鎮企業的盲目發展造成嚴重污染的情況就是如此。只有在政府加強污染管制時,企業才會采取低污染的策略組合。企業在這種情況下,獲得與高污染同樣的利潤,但環境將更好。
四、博弈論的經濟學發展方向
當拿來主義不再局限于學者的書房,而開始實踐于具有中國特色社會主義市場經濟的博弈問題時,經濟博弈論的應用必將期待著未來的重大突破,博弈論將會出現在經濟學的各個前沿領域中。
博弈論進入主流經濟學,反映了經濟學發展的以下幾個趨勢:
1.經濟學研究的對象越來越轉向個體,放棄了一些沒有微觀基礎的假定,如消費函數及其投資函數,消費最大化等,一切從個人效用函數及其約束條件開始,約束條件下的效用最大化問題而導出行為及均衡結果。這正是博弈論的范式:給出個人的支付函數及戰略空間,然后看當每個人都選擇其最優戰略以最大化個人支付函數時將發生什么。
2.經濟學越來越轉向人與人關系的研究,特別是人與人之間行為的相互影響和作用(沖突與一致、競爭與合作)。特別注意到個人理性行為可能導致的集體非理性。
3.經濟學越來越重視對信息的研究,特別是信息不對稱對個人選擇及制度安排的影響。在70年代,當經濟學家們開始將注意力集中于研究具有理性行為、但只擁有有限信息的個體時,信息就成了許多模型的焦點——形成完全信息與不完全信息博弈論。當個體行為受到重視之后,他們采取行動的時間順序也開始被明確的結合了起來——形成由靜態到動態的博弈論。
五、結束語
綜上所述,博弈論對人類貢獻很大,在現實中應用也很多,應用于社會的各個領域。博弈論憑借自身的理論優勢及其獨特的思維方式,已經發展為經濟學的前沿知識。博弈論代表著一種全新的分析方法和全新的思想。相信在以后的時間里,博弈論將在社會發展的過程中起著更為巨大的作用,博弈論的發展會邁上一個新的臺階,對企業與經濟的發展做出更大的貢獻。
參考文獻
【1】 張維迎著,《博弈論與信息經濟學》上海人民出版社,2005年 【2】 王金炳.博弈論的發展歷史和基本內容[J].時代貿易,2007,5.【3】 米立梅.淺談博弈論在企業管理中的應用[J].經濟論壇,2009,18.【4】 奧斯本#魯賓斯坦.博弈論教程[M].北京:中國社會科學出版社.【5】 馬輝.博弈論的發展及其在現實中的應用[J].中國校外教育·理論,2008.【6】 王金炳.博弈論的發展歷史和基本內容[J].時代貿易,2007,5.
第二篇:淺談博弈論的應用
運籌學課程論文
淺談博弈論的應用
摘 要:博弈論又稱對策論,是使用嚴謹的數學模型研究現實世界沖突對抗條件下最優決策問題的理論。博弈論應用廣泛,目前已經深入到經濟學、政治學、社會學和軍事及人工智能等各個領域,被各門社會科學所應用。納什均衡是博弈論的核心概念,它是博弈的一般均衡結果,是關于局中人最優策略的一致性預測。然而納什均衡的多重性使得有些博弈存在多個一致性預測,博弈局中人仍然面臨選擇哪個均衡的不確定性問題,這限制了博弈論的應用和作用效果。
Game theory is also called countermeasure theory,and it focuses on the best decision-making at the condition of confliction of the real world with religious mathematics model.Game theory has a wide application,and it has penetrated into economics,politics,sociology,military and artificial intelligence.It is applied into nearly every study field.Nash equilibrium is the core conception of game theory.It is the general equilibrium of game result and it is the consistency prediction of the players’ best decision.But the multi—equilibriums cause the multi—consistency prediction,and lead the players into an uncertainty of Nash equilibrium selection. 關鍵詞:博弈論 納什均衡 應用 引言
博弈論又稱對策論,是使用嚴謹的數學模型研究現實世界沖突對抗條件下最優決策問題的理論。兩千多年前,孫臏利用博弈論原理幫助田忌賽馬取勝,就是早期博弈論的萌芽。隨著時代的發展,博弈論在我們現實生活中的應用越來越廣泛。博弈論與納什均衡
從古到今,人類活動中一直廣泛存在著憑借策略決以勝負的競爭性現象,例如,在我們日常生活中,下棋、打牌、球賽等各種體育競賽和游戲;經濟領域內的廣告與銷售活動、貿易談判、生產管理;政黨之問的政治斗爭;國家之間的外交談判以及戰爭等。這些現象都是沖突各方處于一種競爭或對抗中,并且由于參加的各方在競爭中采取不同策略而得到不同的結果。在這些具有競爭或對抗性質的行為中,參加的各方各自具有不同的利益和目標。為了達到各自的目標和利益,各方必須考慮對手的各種可能的方案,并力圖選取對自己最為有利或最為合理的方案。研究這種競爭性現象的各方是否存在最合理的行為方案,以及如何找到這
運籌學課程論文
個合理的行動方案所形成的一門新的理論——博弈論。博弈論的出現給現實世界中合作對抗問題的解決提供了一種嶄新的思路,帶來了最優決策問題研究的新高潮。博弈論在各個領域的應用都取得了巨大的成就。
納什均衡是博弈論的核心概念,它是指,在其他局中人的策略選擇既定的前提下,每個局中人都會選擇自己的最優策略,所有局中人的最優策略組合就是納什均衡。它意味著,在給定別人策略的情況下,每個局中人都不能通過改變自己的策略得到更大的效用或收益,從而沒有任何人有積極性打破這個均衡。換一種說法就是,其中每個局中人選擇的策略是對其他局中人所選策略的最佳反應。博弈論的應用及其分析
博弈論被稱為“社會科學的數學”,從理論上講,博弈論是研究理性的行動者相互作用的形式理論,而從實際上講,它正深入到經濟學、政治學、社會學和軍事及人工智能等領域,被各門社會科學所應用。就我們所知道的博弈論的運用包括“囚徒困境”博弈、“價格問題”博弈、“貿易交易”博弈、“企業環境污染”博弈等,其中廣為人知的當屬“囚徒困境”博弈。
3.1 “囚徒困境”博弈
囚徒困境講的是兩個犯罪嫌疑人作案后被警察抓住,分別關在不同的房子里審訊。警察告訴他們,如果兩人都坦白,各判刑3年;如果兩人都抵賴(或因證據不足),各判1年;如果一人坦白,一人抵賴,坦白的獲釋,抵賴的判刑5年。可見,對兩個犯罪嫌疑人整體而言,(抵賴,抵賴)是兩個犯罪嫌疑人最佳的策略組合,但在兩犯罪嫌疑人被抓后分別關押且彼此不知道對方會采取什么策略時,每個犯罪嫌疑人就會在警察所給的策略下選擇自己的最優策略“坦白”,于是“囚徒困境”中的納什均衡解正好是策略組合(坦白,坦白),警察最終達到了預定的目的。
囚徒困境這個簡單的博弈模型之所以經典,在于它顛覆了“個人理性的選擇會自然而然的達到集體理性”這個結論,從而為主流經濟學的建立打下了現實的基礎。求解囚徒困境博弈的困難在于個人激勵與群體目標并不一致,因而,要求參與人把個人目標放在第二位,而把集體目標放在第一位。當然個體理性與集體理性的矛盾,有時對參與人而言是壞事,對集體而言卻可能是好事,兩個犯罪嫌疑人由于都“坦白”受到更嚴厲的懲罰,至少在關押期間不會再去犯罪,這對整個社會無疑是件好事。“囚徒困境”博弈正巧驗證了一句話:個人利益必須服從整體利益,當兩者相矛盾時,必須首先考慮集體利益。
此外,納什均衡是一個“僵局”,當別人不動時,自己也沒有動的積極性。當博弈只有唯一的納什均衡時,這個納什均衡會實際上發生,且參與人會在沒有
運籌學課程論文
任何壓力時,自覺自愿的遵守它,這給了我們一個很大的啟示,在設計規章制度時,應盡量達到納什均衡,這樣每個人都會做到自覺自愿地遵守它。
3.2 “價格問題”博弈
每逢節假日,我們經常會遇到各種各樣的價格戰,特別是大型商品的促銷。廠家價格大戰的結局是一個“納什均衡”,結果是誰都沒錢賺。因為博弈雙方的利潤正好是零,競爭的結果是穩定的,達到了一個“納什均衡"。這個結果可能對消費者是有利的,但對廠商而言是災難性的,它無疑是種自殺。
對于企業而言,若是降價銷售,可能導致一個有效率的零利潤結局。若不采取價格戰,則必須考慮兩種選擇:采取正常價格策略,還是采取高價格策略形成壟斷價格,并盡力獲取壟斷利潤。如果壟斷可以形成,則博弈雙方的共同利潤最大。這種情況就是壟斷經營所造成的,通常會抬高價格。另一個極端的情況是廠商用正常的價格,雙方都可以獲得利潤。由此可以看出,每個企業的戰略都是建立在假定對手會按其最佳利益行動的基礎上。事實上,完全競爭的均衡就是“納什均衡”或“非合作博弈均衡”。在這種狀態下,每一個廠商或消費者都是按照所有的別人已定的價格來進行決策。
在這種均衡中,每一企業要使利潤最大化,消費者要達到效用最大化,結果就導致了零利潤,也就是說價格等于邊際成本。在完全競爭的情況下,非合作行為導致了社會所期望的經濟效率狀態。如果廠商采取合作行動并決定轉向壟斷價格,那么社會的經濟效率就會遭到破壞。
3.3 “貿易交易”博弈
隨著經濟全球化的發展,每個國家在國際貿易中都面臨著保持貿易自由與實行貿易保護主義的兩難選擇。貿易自由與壁壘問題,也是一個“納什均衡”,這個均衡是貿易雙方采取不合作博弈的策略,結果使雙方因貿易戰而受到損害。X國試圖對Y國進行進口貿易限制,比如反傾銷,則Y國必然會進行反擊,也對X國進行反傾銷,結果誰也沒有撈到好處。反之,若X和Y能達成合作性均衡,即從互惠互利的原則出發,雙方都減少限制,結果大家都能從貿易自由中獲得最大利益,而且全球貿易的總收益也會增加。
3.4 “企業環境污染”博弈
假如企業周圍的環境受到污染,而政府并未管制,那么企業為了追求利潤的最大化,寧愿以犧牲環境為代價,也絕不會主動增加環保設備投資。按照看不見的手的原理,所有企業都會從利己的目的出發,采取不顧環境的策略,從而進入“納什均衡”狀態。如果一個企業從集體利益出發,投資治理污染,而其他企業仍然不顧環境污染,那么這個企業的生產成本就會增加,價格就要提高,它的產品就沒有競爭力,甚至企業還要破產。這是一個“看不見的手的有效的完全競爭
運籌學課程論文
機制”失敗的例證。只有在政府加強污染管制時,企業才會采取低污染的策略組合。企業在這種情況下,獲得與高污染同樣的利潤,但環境將會更好。
除此之外,像法律、規則制定者可以利用博弈論制定出所有人都能自覺遵守的法律、規則和章程;企業可以利用博弈分析產量與價格的關系,建立博弈模型分析企業之間的競爭和合作,以獲得最大的經濟利益;在日常生活中,我們也會遇到各種形式的博弈,例如擠公交車等。個人心得
通過上面幾個博弈事例我們可以看到,博弈論在我們現實生活中的應用極其廣泛。雖然取得了輝煌的成就,但是博弈論本身仍存在一些問題,這些問題限制了博弈論更廣泛的應用,也是博弈論未來的發展和完善方向。
在我看來,博弈論對信息的處理是理想化的,這在實際應用中存在嚴重缺陷。納什均衡的多重性使得有些博弈存在多個一致性預測,博弈局中人仍然面臨選擇哪個均衡的不確定性問題,這限制了博弈論的應用和作用效果。運用博弈論時,我們還應充分考慮特征、境域的影響,以便對納什均衡作出更深層次的分析。結論
博弈論的應用極其廣泛。博弈理論已經滲透到我們社會的方方面面,小到生活的日常瑣事,大到國際間的經濟貿易和軍事競備。這些都使得博弈論的應用范圍和作用效果越來越大。
參 考 文 獻
[1] 張維迎.博弈論和信息經濟學.上海:三聯書社,1996.
[2] 向楠.網絡安全投資與博弈策略研究.北京:北京郵電大學,2008. [3] 尚宇紅.博弈論簡史.西安:西北大學,2003.
[4] 侯定丕.博弈論導論.合肥:中國科學技術大學出版社,2003. [5] 謝政.對策論.長沙:國防科技大學出版社,2004.
[6] 張長青.納什均衡的效率及選擇.黑龍江大學學報,2007.24(6):1-4.
第三篇:博弈論的發展歷程
博弈論的發展歷程(下)(ZZ)
信息問題上的突破。古典經濟模型幾乎無一例外地假設,個人(或廠商)的資源與偏好情況不僅為自己,也為他們的競爭對手所知,即完全信息假設。這顯然不符合實際。不過,這并非模型建立者本身所希望的,而只是因為缺乏解決不完全信息問題的工具而不得不做出的簡化。博弈論的發展也遇到同樣問題。由于對不完全信息問題一度苦無良策,博弈論曾受到嚴厲批評。因為局中人事實上不可能清楚關于對手決策的所有信息。由此導致博弈理論建模的應用范圍也受到了限制。豪爾紹尼對這一問題的解決方法是將不完全信息建模為自然完成的一種抽彩。這種抽彩決定局中人的特征。而這些特征是局中人偏好與經驗的總和,其中,每個局中人清楚自己的特征,但不知道別人的真實特征。即他對整個博弈局勢只有不完全信息。據其特征,局中人可分為一些類型。每個局中人知道自己的類型,不知道別人的類型,但知道類型上的聯合分布,從而能對其它局人的類型作出先驗分布判斷。不完全信息的這種博弈局勢把實際中千變萬化的不完全信息都№歸結為局中人對他人的主觀判斷。這種方法成功地將不易建模的不完全信息轉化為數學上可處理的不完善信息:即局中人根據經驗與知識對對手的類型得出關于可能性大小的主觀判斷,即數學上的一種先驗分布。不完全信息博弈的解是由納什均衡概念推廣而來的。其均衡點(貝葉斯均衡點)是一個n重策略,每個局中人每種類型的個人策略均是對其它局中人的(n-1)重策略的那種類型的最佳應對。以類型為基礎的不完全信息博弈是豪爾紹尼(1967~1968年)提出的。他運用這種方法來克服將局中人的信息與偏好以及他對其它局中人信息與偏好的了解進行建模時所遇到的復雜性。這一思路極富創造性,使不完全信息博弈成為解決經濟問題的一個有力工具。其次是關于混合戰略的解釋。混合戰略概念的傳統解釋是,局中人應用一種隨機方法來決定所選擇的純戰略。這種解釋在理論與實際上均不能令人滿意。豪爾紹尼對此提出杰出的解釋方法。他說明在每一真實的博弈形勢中,總受一些微小的隨機波動因素影響。在一標準型博弈模型中,這些影響表現為微小的獨立連續隨機變量,每個局中人的每一策略均對應一個。這些隨機變量的具體取值僅為相關局中人所知,這種知識即成為私有信息;而聯合分布則是博弈者的共有信息。這稱為變動收益博弈。變動收益博弈適用豪爾紹尼的不完全信息博弈理論,各隨機變量的一種取值類型影響著一個博弈者的收益。在適當的技術條件下,變動收益博弈所形成的純策略組合與對應無隨機影響的標準型博弈的混合戰略組合恰好一致。豪爾紹尼證明,當隨機變量趨于零時,變動收益博弈的純戰略均衡點轉化為對應無隨機影響的標準型博弈的混合戰略均衡點。豪爾紹尼的變動收益博弈理論提供了對混合戰略均衡點具有說服力的解釋。局中人只是表面上以混合戰略博弈,實際上,他們是在各種略為不同的博弈情形中以純戰略博弈。這種重新解釋是一個具有重大意義的概念創新,是豪爾紹尼對博弈論所采用的貝葉斯研究方法的一塊基石。再次就是關于合作博弈的通解。豪爾紹尼關于博弈論的第一篇論文(1956)把納什的合作理論與Zeuthen的議價模型結合,這是他建立n人合作博弈的通用議價模型(1959,1965)的第一步。絕大多數合作解概念基于具有或不具有旁支付(side payment)的特征方程型博弈。而他的通用議價模型是第一個適用于標準型博弈問題的幾人合作理論。通過對均衡時效用權重與聯盟對局中人分紅具有獨創性的構造,他成功地定義了一種議價解法,與非合作博弈的一種均衡點非常相似。直至現在,他的幾人議價模型仍是合作博弈理論中最為重要的理論之一。最后是關于對合作的非合作形式建模。現在一種觀點已被廣泛接受,即有關一種博弈形勢的充分詳細的模型必為一個非合作博弈理論。而在1960年代以前,一般觀點認為,合作理論比非合作理論更為重要。豪爾紹尼是促使產生這種觀念變遷的博弈論研究者之一。他首先認識到合作機會以非合作博弈形式建模的必要性。由此觀點,合作理論可視為一個簡化形式,需要建立具有更多細節的非合作模型。以這種思路,豪爾紹尼(1974)為特征方程型博弈中一個重要的合作理論——馮?諾伊曼——摩根斯頓穩定集——進行了創造性的非合作形式重建。豪爾紹尼的議價模型中為一個具有可轉移效用的零和特征方程型博弈設計了一個收益向量序列,以其序列遞推過程描述聯盟的選擇過程。其理論利用非直接優勢概念形成了修正的穩定集概念。豪爾紹尼對穩定集概念的非合作重建為考察聯盟形成的非合作模型構造提供了方法上的突破。對不可置信威脅的研究引出了博弈論中一個很重要的概念,即承諾行動。承諾行動是博弈中的主體使自己的威脅戰略變得可置信的行動。一種威脅是否可以置信,取決于當事人在不施行這種威脅時是否會遭受更大的損失。承諾行動意味著當事人要為自己的失信付出成本,盡管這種成本并不一定真的發生,但承諾行動給當事人帶來很大的好
處,因為它會改變均衡結果。
隨著現代經濟的迅猛發展,博弈論日益為人們所認識,并應用于經濟現象的分析與研究中。博弈論已成為博大精深的體系,廣泛應用于經濟學、政治學、軍事決策、計算機科學、生物演化等研究。同時與數學、心理學、統計學以及認識論、倫理學等學科有重要聯系。它與各學科之間相互影響、相互促進,一方面借鑒其它學科的思想成果,另一方面也促進了其它學科的發展。博弈論與經濟學的關系尤為密切,其最直接的應用領域是在契約、合作及各種公共產品等領域,博弈論的影響廣及市場理論、契約與合同、政府行為等諸多方面,為研究各
種經濟現象開辟了全新視野。
博弈論思想也對經濟學家的思維方式產生了深刻影響。人們越來越認識到,大多數經濟問題可以作為博弈過程來分析。克雷普斯指出,僅就在經濟學上的應用而言,博弈論的主旨是幫助經濟學家理解和預測在經濟環境中已經發生與將要發生的事情。博弈論工具的應用的確加深了對經濟現象的理解。近年來,許多學者嘗試運用博弈論研究微觀和宏觀經濟理論問題,甚至想通過這條途徑重新建構理論框架。這一趨勢已逐漸深入到每一個經濟學及相關的領域。博弈論的傳統應用領域是產業組織或市場結構的研究以及對投票和公共物品供給的分析等。諸如重復囚犯困境、交錯出價的議價模型、時間選擇博弈和先買權博弈,都在產業組織理論分析中得到應用。而豪爾紹尼的貝葉斯納什均衡解,作為許多博弈推理分析的基石,則應用于機制設計問題。其中包括非線性價格歧視、最佳拍賣、對公共物品偏好的顯示以及信息不完備情況下的契約失效等。在對掠奪行為和就業市場信號的分析中所應用的一系列解的概念——完全貝葉斯均衡解、克雷普斯和威爾森序列均衡解、澤爾滕顫抖手完美點均衡解,體現著經擴展的不完全信息博弈中子博弈完美點的思想。近年來,博弈論被應用到對不同拍賣行為的分析、委托人——代理人的關系及激勵機制問題,以及公共財政學領域等。我國學者近年來對博弈論在經濟研究中的應用進行了有益嘗試。如對經濟調整中的社會博弈問題的研究、對中央政府與地方政府的博弈關系和規則的探討等。博弈論作為一種有力的分析手段,在經濟學中有著廣泛的應用前景。博弈、合作與經濟制度緊密相聯,諾斯則認為對經濟制度的研究實質上就是對合作的機制的研究。我們認為,近年來經濟學的一系列突出成就和最新進展越來越集中地表現出人們對經濟行為主體認識的深化。作為洞察主體行為規律和分析經濟現象背后機制形成的認識工具,博弈論在研究變革社會的秩序演進與制度創新方面應用潛力巨大。
博弈論在西方經濟學及經濟實踐中已得到廣泛應用,顯然我國經濟理論研究引入博弈論理論和研究方法,對于利用新的科學方法和科學成果推動我國經濟學的發展,為我國經濟建設和經濟改革提供必要的理
論指導,具有重要意義。
經濟學在為現實經濟提供理論指導的同時其自身也要不斷發展,凱恩斯以后的西方經濟學,在戰后已發展起了一個新的體系,即以研究資本主義經濟運行為對象的宏觀經濟學和微觀經濟學。在改革前,我國的經濟研究原是以生產關系為研究對象的政治經濟學,主要探討社會主義經濟制度不斷完善的途徑,并不研究經濟運行的過程,在當時計劃經濟體制下人們對經濟活動的關心也主要局限在對政府行為的理解和落實上,而忽視對企業和個人行為的分析、更不考慮各經濟主體之間的相互影響和相互對立,忽視經濟主體在資源配置問題上的矛盾和博弈。我國在確立社會主義市場經濟目標以后,重塑經濟主體、轉變經濟主體的職能、增強各經濟主體的活力,是重要的任務。博弈論分析我國轉型時期宏微觀經濟運行的重要工具,因為在我國社會主義市場經濟中,經濟主體存在著信息的不完全、信息不對稱等現實情況,人(政府、企業中的決策者及社會個人)都有自己的效用函數,對信息的加工能力也是有限的,各經濟主體之間的選擇存在著許多相互依
賴關系。
博弈論在西方經濟學及經濟實踐中已得到廣泛應用,顯然我國經濟理論研究引入博弈論理論和研究方法,對于利用新的科學方法和科學成果推動我國經濟學的發展,為我國經濟建設和經濟改革提供必要的理
論指導,具有重要意義。
我國市場經濟經濟運行中,政府制定什么政策會收到什么效果,可以通過構建博弈模型進行研究,考慮博弈中各主體的效用函數等,研究不同博弈規則下的均衡。在轉型時期政府的許多政策并不能采取指令性規定強制實施,只能依靠宏觀調控的手段進行,因此,政府在制定政策時必須考慮政策實施的效果,要研究博弈主體決策行為的相互依賴和相互影響,考慮經濟主體的預期以及所獲信息對博弈均衡的制約和影響。個人的各項經濟決策,要考慮到社會經濟活動中其他相關主體的影響。企業作為生產者,目標是利潤極大。從這個目標出發,它對投入、產出的種類和數量進行選擇,對自己的收入轉化為積累與個人的收入分配比例進行選擇,這個過程是一個重大的博弈決策過程。經濟體制改革改變了政府控制整個經濟活動的局面,企業和個人在經濟活動中的獨立性與能動性日益增強,研究各經濟主體在經濟活動中的博弈和均衡是研究經濟運行機制和規律的重要內容,而專門研究相互依賴、相互影響的理性決策行為的博弈論方法,為政府利用經濟理論分析政策問題提供了一種有效的手段。信息經濟學是不對稱信息博弈論在經濟學上的應用,即研究在給定信息結構的條件下,進行最優的契約安排。我國經濟轉型時期的許多工作需要信息經濟學的理論。信息經濟學中信息的不對稱包括不對稱發生的時間和不對稱信息的內容。從不對稱發生的時間看,債轉股的不對稱可能發生在相關利益者簽約之前,也可能發生在簽約之后,分別稱事前不對稱和事后不對稱。研究事前不對稱信息博弈的模型稱為逆向選擇模型,研究事后不對稱的模型稱為道德風險模型。在信息經濟學中,將博弈中擁有私人信息的參與人稱為代理人,不擁有私人信息的參與人稱為委托人。信息經濟學的所有模型都可以在委托人一代理人的框架下分析。債轉股政府、資產管理公司和債轉股國有企業之間的關系就存在特殊的值得深入探討的委托代理關系。博弈論理論的成熟,極大地促進了委托代理理論的發展,委托代理理論可以模型化如下一類的問題:委托人(如政府)想使代理人(如債轉股國有企業的經營者)按照前者的利益選擇行動(如使股權回購和國有資產保值增值),但委托人不能直接觀測到代理人選擇了什么行動,能觀測到的只是另一些變量(如企業效益、產品的市場占有率等),這些變量由代理人的行動和其他的外生的隨機因素共同決定,因而充其量只是代理人行動的不完全信息。委托人的問題是如何根據這些觀測到的信息來獎懲代理人,以激勵其選擇對委托人最有利的行動。委托人在簽約時要使自己期望效用極大化,而此時會面臨來自代理人的兩個約束:一個是參與約束,即代理人從接受合同中得到的期望效用不能小于不接受合同時能得到的最大期望效用;另一個是代理人的激勵相容約束,即代理人總是選擇使自己的期望效用最大化的行動,如果委托人希望的行動正好能使代理人的期望效用最大,那么代理人就會選擇它。
第四篇:博弈論發展簡述
博弈論發展簡述
博弈論,又稱為對策論,英文名稱為Game Theory,是研究主體行為發生直接相互作用時的決策以及這種決策的均衡問題的理論。Game一詞在英文中的基本意思時游戲、比賽,故而在博弈論剛被介紹到中國時,有的學者根據其英文名稱,直譯其為游戲理論。博弈的“博”字是競爭的意思,“弈”是對弈,是一種關于在競爭中選擇策略,爭取最好結果的技藝。
其實,博弈論是用嚴謹的數學模型來研究現實世界中沖突對抗條件下最優決策問題的理論,最初發源于數學。自20世紀40年代,博弈論從數學家之手產生之后,就很快被借用到經濟學領域,并在幾代經濟學大師的研究和推動之下,廣泛應用于經濟學、社會科學、管理科學、國際政治、生態學工商業活動以及人們的日常的生活之中。
博弈論的創始者是匈牙利的天才數學家馮·諾依曼(1903~1957),他不僅是經濟博弈論的創立者,同時也是計算機的發明者。20世紀初,馮·諾依曼、塞梅魯(Zemelo)、鮑羅(Borel)就開始研究博弈的準確的數學表達。1939年,馮·諾依曼和經濟學家奧斯卡·摩根斯坦(Oskar Morgenstem)合作,從而使博弈論進入經濟學的廣闊領域。1944年,二人共同出版了著作《博弈論與經濟行為》,書中介紹了博弈的理論和方法,提出了標準型、擴展性和合作型博弈模型解的概念和分析方法,從而奠定了博弈學科的利率基礎,標志著現代系統的博弈理論初步形成,也象征著博弈學科的正式建立。20世紀50年代,合作型博弈的研究和應用達到頂峰。但是,諾依曼的博弈論的局限性在于,由于過于抽象,大大限制了它的應用范圍,在相當一段時間里,人們對博弈論的研究很少,只是少數數學家的專利,影響力有限。
正在此時,另一位博弈論大師納什(Nash)博士于1950年11月在美國全國科學院的每月公報上刊登了兩篇論文,將馮·諾依曼的“最小最大原理”推廣到非合作博弈領域,找到了普遍化的方法和均衡點,其理論比馮·諾依曼的合作博弈論更能反映現實的情況。非合作博弈思想,即“納什均衡”理論的提出,標志這博弈理論新時代的開始。作為一位天才人物,納什從上大學開始就從事純數學的博弈論研究。后來,他在經濟博弈論領域做出了劃時代的貢獻。他提出的納什均衡的概念在非合作博弈理論中起著核心的作用,其后續的研究者對博弈論的貢獻,幾乎都是建立在這一概念之上的。由于納什均衡的提出和不斷完善,為博弈論廣泛應用于經濟學、管理學、社會學、政治學、軍事科學等領域奠定了堅實的理論基礎。
自20世紀50年代以來,由于納什、澤爾騰(Selten)、海薩尼(Harsanyi)等人的努力,使博弈理論逐漸成熟并進入實用。尤其在經濟學領域,博弈論引發了經濟學的“博弈論革命”。博弈論的概念和方法改造了經濟學的思維,也從而推進了經濟學的研究。1994年諾貝爾經濟學獎授予納什、澤爾騰和海薩尼3位博弈論專家,有力地證明了博弈論在現代經濟學研究中的地位,也進一步激發了人們了解博弈論的熱情。博弈論作為現代經濟學的前沿領域,已經成為占據主流地位的基本分析工具。
博弈論在20世紀40年代產生時,最初是運籌學的一個分支,是較純粹的數學方法,但是由于其理論的普遍性,被逐步推廣應用到許多研究領域,尤其是在經濟學領域,博弈論改變了經濟學家的思維方式,至今引領著該領域的前沿。同時,對博弈論的研究也就方興未艾,各種博弈理論分支更是層出不窮,演化博弈論就是一個時期以來在原有的理論基礎上發展起來的博弈論家族中的熱門和新興分支。
博弈論的組成要素
博弈論由3個基本要素組成:一是決策主體(player),又可譯為參與人、局中人或博弈方。指的是博弈中能獨立決策、獨立行動并承擔決策結果的個人或組織。小到一個人,大到一個跨國公司乃至一個國家,只要能獨立決策和行動,都可以成為一個博弈方,形成決策主體;二是給定的策略空間(strategy space),就是信息結構,又叫策略集,指參與人可選擇的策略和行動空間,是可選擇策略的集合。每一個策略都對應一個相應的結果,因此每個博弈方可選擇的策略數量越多,博弈就越復雜;三是效用(Utility),是可以定義或量化的參與人的利益,也是所有參與人真正關心的東西,又稱偏好或支付函數。上述參與人、策略空間和效用3個要素就構成了一個基本的博弈。
博弈理論認為,一個完整的博弈應當包括一下五個方面的內容:第一,博弈的參加者,即博弈過程中獨立決策、獨立承擔后果的個人和組織;第二,博弈信息,即博弈者所掌握的對選擇策略有幫助的情報資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后順序;第五,博弈方的收益,即博弈方做出決策選擇后的所得所失。
常見的博弈類型
通過博弈論學者們的研究歸納,通俗地講,常見的博弈類型有以下幾種:第一種是合作博弈和非合作博弈。二者的主要區別在于參與者之間的博弈行為相互作用時,他們能否達成一個具有約束力的協議,如果有,就是合作博弈,如果沒有,就是非合作博弈。合作博弈強調的是團體理性、效率、公正和誠信,非合作博弈強調的是個人理性、個人最優決策,其結果可能是有效率的,也可能是無效率的;第二種是重復博弈和非重復博弈。非重復博弈就是博弈的雙方博弈之后各自走人,從此不會再來博弈。重復博弈則具有連續性的特點,同一博弈可以重復下去。非重復博弈由于是一次性的,所以容易出現欺詐等道德問題,而重復博弈由于是連續性的,所以道德和規則的約束力較強,參與者不僅要追求一次博弈的目標最大化,而且要追求多次博弈平均目標的最大化,這就會迫使參與者高度重視信譽,并由對抗走向合作;第三種是零和博弈和非零和博弈。零和博弈的特點是博弈雙方的成本和所得會相互換位,也即:你的所失正是我的所得,反之一樣。不具有這樣特征的博弈就是非零和博弈。第四種是靜態博弈和動態博弈。參與雙方同時決策或同時行動的,叫靜態博弈,決策或行動有先后順序的叫動態博弈。顯然,有沒有先后順序,博弈結果和采取的策略是不同的;第五種是完全信息博弈和不完全信息博弈。信息就是知識,但不是一般的知識,是指與決策目標和決策對象有關的特定信息,是參與人有關博弈的知識。按博弈雙方擁有的程度分為:①完全信息:博弈雙發對產生博弈的事情的知識都是共同知識;②對稱信息:博弈雙方有關信息的掌握程度是相等的;③不對稱信息:博弈雙方對實現某一個目標所掌握的信息及采取的策略掌握程度不同,信息在雙方之間的分布是不均勻、不對稱的。
博弈論的經典模型:囚徒困境
囚徒困境(Prisoner’s Dilemma)。“囚徒困境”至今仍然是博弈研究的重要課題。這個故事是說,兩個罪犯犯罪后被抓,分別關押,不能見面,警察審問時分別對他們說,坦白吧,坦白你會被放走,你不坦白另一個人坦白了,你將被判10年。實際上兩個囚徒面臨的情況是:一個坦白,另一個不坦白,坦白的將被釋放,不坦白的會判10年;如果兩個人都坦白,各判5年;兩個人都不坦白,都放。根據理性人的假設,甲乙兩個罪犯都會尋找自己最優目標,那就是自己被釋放。如果兩個人都不坦白,都會被釋放,但甲會想:如果我不坦白,乙坦白了,他會被釋放,我要判10年。我坦白了,不管乙是否坦白,我最多判5年,也有可能乙不坦白,我被釋放。罪犯乙其實也是這么想。結果他們都坦白了,分別判了5年。在坦白這一點上形成策略均衡,實現了目標最大化。實際上囚徒困境這個模型揭示了合作與競爭(或叫對抗)的關系道理。囚徒困境的情況在生活中最常見的就是擠公共汽車。從集體理性的角度來看,按次序上車是最有效率的做法,但是你擠我不擠,我就可能上得慢,所以每個人的最優戰略都是擠。其中的納什均衡就是大家都擠,結果上車更慢了,每個人采取的都是最優戰略,但是結果卻是最劣,原因在于個人理性和集體理性之間存在著沖突。
博弈論的經典模型:智豬博弈
智豬博弈(Boxed Pigs)。有兩頭豬生活在同一豬舍里,一頭大豬,一頭小豬,共用一個長食槽。食槽的一頭有一個開關,豬用嘴一拱,食槽的另一端會掉下包子。假定按一下會掉下10個包子,而跑去按開關的豬會耗費兩個包子的能量。如果小豬按開關,大豬先吃,等小豬按完跑過來時,大豬會吃掉9各包子,小豬只能吃到1個;如果大豬先按開關,按完后跑過來,小豬會吃掉4個包子,大豬可以吃到6個。如果不去按開關,就會被一起餓死。這個模型的最優策略組合只有一個答案:在任何情況下,都要大豬按開關,小豬等待。因為這樣,大豬會吃到6個包子,減掉耗費掉的2個,剩4個,與小豬一樣。但讓小豬按開關,它只能吃到1個包子,減掉耗費的2個,虧1個。智慧型的豬不會干賠本的買賣。但如果大豬也不動,只能雙雙餓死。這個模型也解釋了在博弈過程中,多勞者不一定多得。
博弈論的經典模型:情侶博弈
情侶博弈。假定一對熱戀中的情侶,每周末見一次,必須見,否則活不下去。男的喜歡看足球,女的喜歡看電影。見面后,面臨選擇,看足球還是看電影?熱戀中的情侶因為愛,會犧牲自己的愛好去滿足對方。如果去看足球,男的滿足程度為四個單位,女的滿足程度是兩個單位;去看電影,女的滿足程度是四個單位,男的滿足程度是兩個單位。在這個博弈中,有三個變量非常重要。一個變量是順序,就是誰先提出來,比如男的先提出來,女方盡管更愿意看電影,但是男方已經提出來了,她不愿意違背他,只好同意,結果他們就去看足球。相反的情況也是一樣。第二個是一次博弈還是多次博弈。如果是多次博弈,雙方就會大體上形成一種默契,這一周看電影,下一周看足球。第三個取決于感情的深度。處于依賴程度比較高的一方,對對方更加順從照顧一些。一般而言,情侶之間的博弈是一個動態過程,因為戀愛就是雙方之間較長時期的磨合、了解過程。如果我們假定情侶博弈是一個動態博弈,而且總是男的先決策,女的后決策,那么就會出現一種非常有趣的決策情景。就女方來說,無論男的是選擇足球,還是選擇電影,她的決策均為四個:一個是追隨決策,就是男的選擇什么,她就選擇什么;二是對抗策略,就是男的選擇什么,她偏不選什么;三是偏好策略,就是無論男的選什么,她都選電影,因為這是她的偏好;四是成全策略,就是無論男的選什么,她都選足球,因為足球是男的偏好,她寧可犧牲自己的偏好,而成全男方。情侶博弈在現實生活中到處存在,它讓人們思考如何人去關心別人、理解別人,處理好人際關系。
博弈論的經典模型:斗雞模型
斗雞博弈(Chicken Game).在西方,雞是膽小的象征,斗雞博弈指在競爭關系中,誰的膽小,誰先失敗。現在假設,有兩個人要過一條獨木橋,這條橋一次只能過一個人,兩個人同時相向而進,在河中間碰上了。這個博弈的結果第一種就是如果兩個人繼續前進,雙方都會掉水里,雙方丟面子,這是一種組合。第二種是,雙方都退下來,雙方也都是丟面子,但是都掉不到水里去。第三種結果,甲方退下來,丟面子,乙過去。第四種結果,乙退下來,丟面子,甲順利通過。在這四種結果中,第一種是兩敗俱傷;
三、四兩種是一勝一敗,第二種是兩敗不傷,這就是斗雞博弈。在這個模型中,最優策略有兩個,就是第三、第四兩種選擇,即甲退下來乙先過去,或者乙退下來甲先過去。因為兩種選擇對整個社會來說效益最大,損失最小。兩虎相爭勇者勝,如何處理競爭中的兩虎關系呢?一般有四種辦法:第一種是談判,雙方約定一個條件,其中一個先退下來;第二種是制度,建立一種制度,規定從南到北的先退,或者從北到南的先退,或者后上橋者先退;第三種是時間,雙方僵持一段時間,誰先吃不住勁誰先退;第四種是妥協,妥協不一定是最優策略,但是至少可以保證取得次優結果。在工作生活中乃至處理國際關系時,得饒人處且饒人,退一步還擴天空,都是從斗雞博弈可以總結出的道理。
博弈論的經典模型:威懾模型
威懾博弈的完整名稱是進入威懾博弈,是研究參與者想進入某領域,而與該領域已有競爭者的博弈模型。假定有兩個參與人,一個想進入某行業,稱之為進入者,另一個已在同一行業占有一席之地,稱之為先入者。對進入者來說,不管先入者是否設置壁壘,其最優目標都是進入。而對先入者來說,要設置壁壘,必須付出巨大成本,否則不如默許。進入威懾博弈模型的啟示是:要做一件事情,必須確定一個可行的目標,不怕困難,全力以赴向目標努力,目標就會實現。另外,不是所有的威懾都沒有用處,付出巨大成本的威懾是起作用的,而要想使威懾起作用的,必須付出巨大成本。同時,進入威懾博弈也提出了一個問題,就是威脅和承諾的可信度問題,威脅實際上也是一種承諾。威脅和承諾是否可行,取決于其成本的大小,取決于其成本和收益的比較。一般而言,成本巨大的,或者成本高于收益的威脅和承諾,可信度就比較高,反之則低。實際生活中有些制度見效甚微,就是因為懲罰力度太小,使得違規者的違規收益高于違規成本。
第五篇:博弈論的發展歷程.
博弈論的發展歷程
雖然早在18世紀初以前便開始了對具有策略依存特點的決策問題的零星研究,但博弈論真正的發展還是在20世紀。20世紀初期是博弈論的萌芽階段,其研究對象主要是從競賽與游戲中引申出來的嚴格競爭博弈,即二人零和博弈。這類博弈中不存在合作或聯合行為,對弈兩方的利益嚴格對立,一方所得必意味著存在另一方的等量損失。這符合下棋等二人室內游戲的情形,但應用在經濟與政治上,則大多數情況并不合適。此時,關于二人零和博弈理論有豐碩的研究成果,尤其是提出了博弈擴展型策略、混合策略等重要概念,為日后研究對象范圍的拓展與研究的深化奠定了基礎。這一階段最重要的成就是澤梅羅定理(1913)與馮·諾伊曼的最小最大定理(1928),后者為二人零和博弈提供了解法,同時對博弈論的發展產生了重大影響,例如非合作幾人博弈中的基本概念——納什均衡就是最小最大定理的延伸與推廣。
1944年,美國數學家馮·諾伊曼(Von Neumann)和摩根斯坦(Morgensien)合著的《博弈論與經濟行為》一書的出版,標志著系統的博弈理論的初步形成。該巨著匯集了當時博弈論的研究成果,將其框架首次完整而清晰地表述出來,使其作為一門學科獲得了應有的地位。同時身為經濟學家的摩根斯頓首先清楚而全面地確認,經濟行為者在決策時應考慮到經濟學上的利益沖突性質。該書詳盡地討論了二人零和博弈,并對合作博弈作了深入探討,開辟了一些新的研究領域。更重要的是將博弈論加以空前廣泛的應用,尤其是在經濟學上,由于博弈論數學上的嚴整性與經濟學應用上的廣泛性,一些經濟學家將該巨著的出版視為數理經濟學確立的里程碑。
接下來的一段時期對合作博弈的研究有了長足進步。按豪爾紹尼(1966)的觀點,如果一博弈中意愿表示——協議、承諾、威脅——具有完全的約束力并可強制執行,則該博弈是合作的。如意愿表示不可強制執行,則為非合作博弈。非合作博弈隨后發展起來,納什、澤爾滕和豪爾紹尼因此而獲獎,但當時注意力主要集中在合作博弈上。事實上,合作博弈可視為非合作博弈的特殊情況,它略去非合作個體之間建立合作關系的過程而著重研究合作的可能性與形式。由于省去從非合作到合作過程中繁復的難以盡述的細節,合作博弈能對合作問題有更清晰的把握。為了解決合作博弈中所遇到的問題,這一期間提出了聯盟博弈、穩定集、解概念、可轉移效用、核心等重要概念與思想。1950年代是博弈論的成長期,納什為非合作博弈的一般理論奠定了基礎,提出了博弈論中最為重要的概念——納什均衡,開辟了一個全新的研究領域。非合作理論發展起來,如阿爾·塔克的囚徒困境、重復博弈概念等。合作博弈理論在這個階段得到進一步發展,如沙普利值概念、核概念等。博弈論的研究隊伍開始擴大,蘭德公司在圣基尼卡開業,在隨后的許多年里,這里成為博弈論的研究中心。此經濟學逐漸成為博弈論最重要的應用領域。1960年代是博弈論的成熟期。不完全信息與非轉移效用聯盟博弈那樣的擴充使理論變得更具廣泛應用性。常識性的基本概念得到了系統闡述與澄清。博弈論成了完整而系統的體系。更重要的是,博弈論與數理經濟及經濟理論建立了牢固而持久的關系。例如,等價性原理說明博弈論與經濟理論間存在競爭市場經濟的價格均衡與相應博弈的重
要解概念之間的對應關系。豪爾紹尼與澤爾滕正是在這一時期開始他們的工作,豪爾紹尼提出了不完全信息理論,澤爾滕開始其均衡選擇問題的研究。1970年代至今是博弈論的豐富壯大期。博弈論在所有研究領域都得到重大突破。博弈論開始對其它學科的研究產生強有力的影響,計算機技術的飛速發展使得研究復雜與涉及大規模計算的博弈模型發展起來。在理論上,博弈論從基本概念到理論推演均形成了一個完整與內容豐富的體系。在應用上,政治與經濟模型有了深入研究,非合作博弈理論應用到大批特殊的經濟模型。同時博弈論應用到生物學、計算機科學、道德哲學等領域,如隨機策略這樣的概念得到了重新解釋。漸漸地,博弈論變得大眾化起來。不再是僅為少數研究者所知。要對每年所發表的有關博弈論數以千計的文獻進行了解已不是件容易的事。至今,博弈論仍在不斷發展與深化,預測其可能出現的創新與成就是很困難的。
在博弈論的發展過程中,納什奠定了非合作博弈的理論框架與概念基礎,他的名字與博弈論的中心概念——納什均衡聯在一起;豪爾紹尼與澤爾滕則致力于博弈論的進一步發展與應用。
在非合作博弈論和經濟分析里所應用的博弈論思想中,納什均衡都處于核心地位。克雷普斯(D.Kreps)教授認為,如今在每一個經濟學領域及與其相關的金融、會計、市場學甚至政治學等領域,在消化其近期研究成果過程中,對納什均衡概念的理解均起著重要作用。雖然作為先驅者的古諾(Cournot)已在其研究中開創這一思想的先河,但其目前的形式則是納什獨立完成得出的卓越成就。美國普林斯頓大學的數學家和統計學家納什。從1950年至1954年,他發表了多篇論述博弈論的文章,為非合作的一般理論和合作博弈的談判理論奠定了基礎。他規定了非合作博弈的形式,并定義了著名的“納什均衡點”。納什最先對合作與非合作進行了區別。納什認為以前的理論包含著某種被稱為合作類型的n人博弈思想,它以一種對能由局中人形成的不同合作之間相互關系的分析為基礎;與此相反,納什認為他自己的理論則“以缺乏合作為基礎,在其中假定每個參與者都各行其是,與其他人之間沒有合作與溝通”。該思想拓展了博弈論的研究范圍,并增強了其應用性。在闡明了合作與非合作之間區別的基礎上,納什定義了著名的“納什均衡點”,并對它的存在進行了證明。納什均衡的定義一般是通過簡單確定一個正常形式的有限局中人和行動的博弈來給出的。在純策略中,它是指這樣一種策略分布:假使其他局中人不變換其策略,則任何一個局中人都不能以單方面變換自己的策略來增加其效用。納什還證明,在一個有限局中人和行動的博弈中,至少總存在一個納什均衡,雖然當我們考察混合策略時才能完全保證其存在,因為有例子表明,存在著沒有純策略均衡的對策。這一定義實際上包含著一個前提假定,即局中人對游戲結構有充分的了解,也就是說擁有完全信息,以便能夠導出他們自己的預測。納什均衡的意義直到現在仍是探討與爭論的題目。一般認為,它是隨不同情況而變化的一種過程。例如,假設在某種博弈中,局中人通過某些非強制手段就局中人的策略選擇達成協議,這項協議具體確定了每個局中人選擇的策略。由于協議無強制力量,局中人如果能通過違背協議而獲得利益,則該協議無效。所以,為了保證協議有效,必須有一種局中人不可能因單方面違背協議而獲益的機制,即形成一種納什均衡。即,納什均衡使得協議能夠自我約束,無外力作用下也能保證協議的生效。這里納
什均衡的意義在于保證協議的自我強制執行。但這并不是說每個納什均衡都具有自我強制性,就多個局中人背信問題而言可能得出不同的結論。此外,這里并未討論協議如何實施及無協議時的情況。納什均衡在上述情況中的含義是有差別的。納什均衡刻畫了人們理性選擇的結果:利益沖突達到一種穩態以至無人會單方面加以改變。納什均衡并未對這一結果做出福利上即總體上優與劣的判斷。這就允許存在一種情形:由于人們的不合作使得每個人都達不到可能的最大收益。在囚徒困境中表現得十分明顯,其中唯一的納什均衡是雙方均交待,因為在其它策略組合下均有一方能因改變策略而獲益。但是這一局勢中的帕累托最優是雙方均不交待。這表明,帕累托最優并不一定能在納什均衡點上實現。也即,在存在利益沖突的情況下,利己主義個人理性選擇的結果在總體上可能并不是最有效的。進而,西方經濟學中在經濟人假設下,市場經濟會達到或者趨向帕累托最優這一結論在引入利益沖突后有可能無法成立。在囚徒困境中,雙方雖可在均不交待的情況下達到帕累托最優,卻難以實現這一結果。這是由于缺乏對對方的信任。因對方可把策略改為交待而使自己獲釋得利,故無法信任對方會信守承諾。每個人追求自身利益最大化這個理性人假設更使這種信任失去基礎。這說明,個人利己的理性選擇并不能保證人們的處境都得到改善,結果可能對大家都不利。就此而言,納什均衡揭示了利己理性的弱點。在人人求得自利的同時,如何防止對一切人均不利的結果出現,這已成為今天博弈論和經濟學中研究的熱點問題。
實際上,納什的研究是基于“一個時期的模式”而做出的,是靜態的,即在穩定的環境條件下,雙方在不改變策略的情況下進行。但現實卻在不斷變化,并常有重復。后來人們在利用策略均衡分析特定的經濟模型時,發現擴展形式的每一步在給定一局中人信息的情況下,納什定義忽視了“離開均衡路線”的偶然性。為彌補這一不現實假設的缺陷,澤爾滕發展了動態的適應于每個不同時期的博弈,從而以此為開端,促進對策略均衡的各種精細改進的定義的出現。并且,在納什均衡中還有一個完全信息的重要假設,即局中人都了解其對手要采取的策略。這種假設在以下一些情況中看來特別不可信:某些局中人起初擁有其他人所缺乏的關于他們自己的愛好、能力甚至博弈規則方面的知識。如在經濟學的應用中,這種不確定性可能反映為一個廠商起初對其競爭者的財務或人力資本資源等信息的不確定性。因此,要把納什均衡分析運用于那種情景就不明智了。為此,豪爾紹尼建立了所謂不完全信息博弈,從而擴展了納什分析的應用范圍。
澤爾滕的研究成果使納什均衡概念進一步精致化與詳細化,并推動了博弈論在各學科中的應用。針對納什均衡概念的不完善性,納什以后的不少研究者試圖精化原來的概念,附加條件以便排除無說服力的納什均衡點。澤爾滕在這方面提出了兩個著名的新概念:子博弈完美均衡點(或簡稱子博弈完美點)和顫抖手完美均衡點(或簡稱“顫抖手完美點)。子博弈完美點是澤爾滕1965年提出的。他認為在局中人選擇應變計劃的博弈中,并非所有納什均衡點都是同樣合理的,因為某些均衡解要求局中人具有實施“空洞威脅”(empty threat)的能力,即采用事實上無法實施的應變計劃,從而這類均衡解失去實際意義。澤爾滕提出子博弈完美點的概念,是要把依賴于這類威脅的均衡點排除在考慮之外,即在原則上排除直觀不合理的納什均衡。在擴展型模式中,其思想表明了先行者利用其先行地位及后行者必然
理性地反應的事實,來達到對其最有利的納什均衡點。求解子博弈完美點的方法是逆向歸納法(倒推法)。這一概念可以推廣到動態多時段博弈的情況。澤爾滕的子博弈完美點概念簡單、直觀,且與經濟學中許多實際情況如寡頭市場等相符合。在許多情景中,由于局中人的策略選擇會引起一系列層次的連鎖反應,在策略選擇時就應對此加以考慮。但子博弈均衡點集合取決于擴展型博弈的細節,同時不能完全排除所有不直觀不合理的納什均衡點。為彌補不足,澤爾滕(1975)提出了“顫抖手完美點”的概念。“顫抖手完美點”概念的意蘊是:在博弈中每個局中人按納什均衡點進行策略選擇時難免會犯錯誤,即偶爾會偏離均衡策略(形象地說,可能手會顫抖)。這樣局中人應該選擇那樣的納什均衡點,使得自己犯錯誤時,其它人按照他們的最佳反應策略,仍如同自己未發生錯誤一樣做出同樣的策略選擇。事實上,這意味著局中人在策略選擇時應考慮到自己有可能做出錯誤選擇,從而會力圖避免因自己的偶然錯誤而蒙受其它局中人改變相應策略給自己帶來的損失。當然這一概念假定對任一方的顫抖概率都是一樣的。其實,在博弈中人們會更小心地避免在損失大的方向上犯錯誤,這樣向不同方向的顫抖概率就會不同。由此麥遜(R.Myerson)提出了“適當均衡點”的概念,進一步完善了顫抖手均衡點。在顫抖手均衡點概念中,澤爾滕利用人類行為包含非理性因素(局中人會犯錯)這一特點,形成對理性概念的一種新理解。這種方法無疑是博弈理論的一個重大突破。此外,澤爾滕在把博弈論應用于具體經濟分析方面做出了卓越成就,如對非合作博弈中的聯盟形成和議價模型等的深入研究。他在把博弈論應用于實驗研究和生物學等方面也有突出貢獻。總之,澤爾滕在納什均衡概念的擴展與深化及博弈論在各學科的應用上都做出突出貢獻,從而與豪爾紹尼一起推動了博弈論理論體系的豐富與完善。
在納什博弈中,博弈雙方的信息是完全的,即假定博弈雙方都能認清對方每次對局的情況。而在現實生活中,博弈各方要想獲得完全的信息可能性極小,而且即使可能獲得完全信息也要付出高昂成本。因此,豪爾紹尼就以納什均衡的出發點和以現實的不完全信息為條件,證明了如何分析不完全信息下的博弈,從而為研究信息經濟學奠定了理論基礎。他是在納什均衡的基礎上,吸取了貝葉斯的研究成果,以貝葉斯理性原則為出發點,對納什均衡做了全面廣泛的展開。首先是不完全信息理論。豪爾紹尼對博弈論最大的貢獻在于他在不完全信息問題上的突破。古典經濟模型幾乎無一例外地假設,個人(或廠商)的資源與偏好情況不僅為自己,也為他們的競爭對手所知,即完全信息假設。這顯然不符合實際。不過,這并非模型建立者本身所希望的,而只是因為缺乏解決不完全信息問題的工具而不得不做出的簡化。博弈論的發展也遇到同樣問題。由于對不完全信息問題一度苦無良策,博弈論曾受到嚴厲批評。因為局中人事實上不可能清楚關于對手決策的所有信息。由此導致博弈理論建模的應用范圍也受到了限制。豪爾紹尼對這一問題的解決方法是將不完全信息建模為自然完成的一種抽彩。這種抽彩決定局中人的特征。而這些特征是局中人偏好與經驗的總和,其中,每個局中人清楚自己的特征,但不知道別人的真實特征。即他對整個博弈局勢只有不完全信息。據其特征,局中人可分為一些類型。每個局中人知道自己的類型,不知道別人的類型,但知道類型上的聯合分布,從而能對其它局人的類型作出先驗分布判斷。不完全信息的這種博弈局勢把實際中
千變萬化的不完全信息都№歸結為局中人對他人的主觀判斷。這種方法成功地將不易建模的不完全信息轉化為數學上可處理的不完善信息:即局中人根據經驗與知識對對手的類型得出關于可能性大小的主觀判斷,即數學上的一種先驗分布。不完全信息博弈的解是由納什均衡概念推廣而來的。其均衡點(貝葉斯均衡點)是一個n重策略,每個局中人每種類型的個人策略均是對其它局中人的(n-1)重策略的那種類型的最佳應對。以類型為基礎的不完全信息博弈是豪爾紹尼(1967~1968年)提出的。他運用這種方法來克服將局中人的信息與偏好以及他對其它局中人信息與偏好的了解進行建模時所遇到的復雜性。這一思路極富創造性,使不完全信息博弈成為解決經濟問題的一個有力工具。其次是關于混合戰略的解釋。混合戰略概念的傳統解釋是,局中人應用一種隨機方法來決定所選擇的純戰略。這種解釋在理論與實際上均不能令人滿意。豪爾紹尼對此提出杰出的解釋方法。他說明在每一真實的博弈形勢中,總受一些微小的隨機波動因素影響。在一標準型博弈模型中,這些影響表現為微小的獨立連續隨機變量,每個局中人的每一策略均對應一個。這些隨機變量的具體取值僅為相關局中人所知,這種知識即成為私有信息;而聯合分布則是博弈者的共有信息。這稱為變動收益博弈。變動收益博弈適用豪爾紹尼的不完全信息博弈理論,各隨機變量的一種取值類型影響著一個博弈者的收益。在適當的技術條件下,變動收益博弈所形成的純策略組合與對應無隨機影響的標準型博弈的混合戰略組合恰好一致。豪爾紹尼證明,當隨機變量趨于零時,變動收益博弈的純戰略均衡點轉化為對應無隨機影響的標準型博弈的混合戰略均衡點。豪爾紹尼的變動收益博弈理論提供了對混合戰略均衡點具有說服力的解釋。局中人只是表面上以混合戰略博弈,實際上,他們是在各種略為不同的博弈情形中以純戰略博弈。這種重新解釋是一個具有重大意義的概念創新,是豪爾紹尼對博弈論所采用的貝葉斯研究方法的一塊基石。再次就是關于合作博弈的通解。豪爾紹尼關于博弈論的第一篇論文(1956)把納什的合作理論與Zeuthen的議價模型結合,這是他建立n人合作博弈的通用議價模型(1959,1965)的第一步。絕大多數合作解概念基于具有或不具有旁支付(side payment)的特征方程型博弈。而他的通用議價模型是第一個適用于標準型博弈問題的幾人合作理論。通過對均衡時效用權重與聯盟對局中人分紅具有獨創性的構造,他成功地定義了一種議價解法,與非合作博弈的一種均衡點非常相似。直至現在,他的幾人議價模型仍是合作博弈理論中最為重要的理論之一。最后是關于對合作的非合作形式建模。現在一種觀點已被廣泛接受,即有關一種博弈形勢的充分詳細的模型必為一個非合作博弈理論。而在1960年代以前,一般觀點認為,合作理論比非合作理論更為重要。豪爾紹尼是促使產生這種觀念變遷的博弈論研究者之一。他首先認識到合作機會以非合作博弈形式建模的必要性。由此觀點,合作理論可視為一個簡化形式,需要建立具有更多細節的非合作模型。以這種思路,豪爾紹尼(1974)為特征方程型博弈中一個重要的合作理論——馮·諾伊曼——摩根斯頓穩定集——進行了創造性的非合作形式重建。豪爾紹尼的議價模型中為一個具有可轉移效用的零和特征方程型博弈設計了一個收益向量序列,以其序列遞推過程描述聯盟的選擇過程。其理論利用非直接優勢概念形成了修正的穩定集概念。豪爾紹尼對穩定集概念的非合作重建為考察聯盟形成的非合作模型構造提供了方法上的突破。
對不可置信威脅的研究引出了博弈論中一個很重要的概念,即承諾行動。承諾行動是博弈中的主體使自己的威脅戰略變得可置信的行動。一種威脅是否可以置信,取決于當事人在不施行這種威脅時是否會遭受更大的損失。承諾行動意味著當事人要為自己的失信付出成本,盡管這種成本并不一定真的發生,但承諾行動給當事人帶來很大的好處,因為它會改變均衡結果。
隨著現代經濟的迅猛發展,博弈論日益為人們所認識,并應用于經濟現象的分析與研究中。博弈論已成為博大精深的體系,廣泛應用于經濟學、政治學、軍事決策、計算機科學、生物演化等研究。同時與數學、心理學、統計學以及認識論、倫理學等學科有重要聯系。它與各學科之間相互影響、相互促進,一方面借鑒其它學科的思想成果,另一方面也促進了其它學科的發展。博弈論與經濟學的關系尤為密切,其最直接的應用領域是在契約、合作及各種公共產品等領域,博弈論的影響廣及市場理論、契約與合同、政府行為等諸多方面,為研究各種經濟現象開辟了全新視野。
博弈論思想也對經濟學家的思維方式產生了深刻影響。人們越來越認識到,大多數經濟問題可以作為博弈過程來分析。克雷普斯指出,僅就在經濟學上的應用而言,博弈論的主旨是幫助經濟學家理解和預測在經濟環境中已經發生與將要發生的事情。博弈論工具的應用的確加深了對經濟現象的理解。近年來,許多學者嘗試運用博弈論研究微觀和宏觀經濟理論問題,甚至想通過這條途徑重新建構理論框架。這一趨勢已逐漸深入到每一個經濟學及相關的領域。博弈論的傳統應用領域是產業組織或市場結構的研究以及對投票和公共物品供給的分析等。諸如重復囚犯困境、交錯出價的議價模型、時間選擇博弈和先買權博弈,都在產業組織理論分析中得到應用。而豪爾紹尼的貝葉斯納什均衡解,作為許多博弈推理分析的基石,則應用于機制設計問題。其中包括非線性價格歧視、最佳拍賣、對公共物品偏好的顯示以及信息不完備情況下的契約失效等。在對掠奪行為和就業市場信號的分析中所應用的一系列解的概念——完全貝葉斯均衡解、克雷普斯和威爾森序列均衡解、澤爾滕顫抖手完美點均衡解,體現著經擴展的不完全信息博弈中子博弈完美點的思想。近年來,博弈論被應用到對不同拍賣行為的分析、委托人——代理人的關系及激勵機制問題,以及公共財政學領域等。我國學者近年來對博弈論在經濟研究中的應用進行了有益嘗試。如對經濟調整中的社會博弈問題的研究、對中央政府與地方政府的博弈關系和規則的探討等。博弈論作為一種有力的分析手段,在經濟學中有著廣泛的應用前景。博弈、合作與經濟制度緊密相聯,諾斯則認為對經濟制度的研究實質上就是對合作的機制的研究。我們認為,近年來經濟學的一系列突出成就和最新進展越來越集中地表現出人們對經濟行為主體認識的深化。作為洞察主體行為規律和分析經濟現象背后機制形成的認識工具,博弈論在研究變革社會的秩序演進與制度創新方面應用潛力巨大。
博弈論在西方經濟學及經濟實踐中已得到廣泛應用,顯然我國經濟理論研究引入博弈論理論和研究方法,對于利用新的科學方法和科學成果推動我國經濟學的發展,為我國經濟建設和經濟改革提供必要的理論指導,具有重要意義。
經濟學在為現實經濟提供理論指導的同時其自身也要不斷發展,凱恩斯以后的西方經濟學,在戰后已發展起了一個新的體系,即以研究資本主義經濟運行為對象的宏觀經濟學和微觀經濟學。在改革前,我國的經濟研究原是以生產關系為研究對象的政治經濟學,主要探討社會主義經濟制度不斷完善的途徑,并不研究經濟運行的過程,在當時計劃經濟體制下人們對經濟活動的關心也主要局限在對政府行為的理解和落實上,而忽視對企業和個人行為的分析、更不考慮各經濟主體之間的相互影響和相互對立,忽視經濟主體在資源配置問題上的矛盾和博弈。我國在確立社會主義市場經濟目標以后,重塑經濟主體、轉變經濟主體的職能、增強各經濟主體的活力,是重要的任務。博弈論分析我國轉型時期宏微觀經濟運行的重要工具,因為在我國社會主義市場經濟中,經濟主體存在著信息的不完全、信息不對稱等現實情況,人(政府、企業中的決策者及社會個人)都有自己的效用函數,對信息的加工能力也是有限的,各經濟主體之間的選擇存在著許多相互依賴關系。
博弈論在西方經濟學及經濟實踐中已得到廣泛應用,顯然我國經濟理論研究引入博弈論理論和研究方法,對于利用新的科學方法和科學成果推動我國經濟學的發展,為我國經濟建設和經濟改革提供必要的理論指導,具有重要意義。我國市場經濟經濟運行中,政府制定什么政策會收到什么效果,可以通過構建博弈模型進行研究,考慮博弈中各主體的效用函數等,研究不同博弈規則下的均衡。在轉型時期政府的許多政策并不能采取指令性規定強制實施,只能依靠宏觀調控的手段進行,因此,政府在制定政策時必須考慮政策實施的效果,要研究博弈主體決策行為的相互依賴和相互影響,考慮經濟主體的預期以及所獲信息對博弈均衡的制約和影響。個人的各項經濟決策,要考慮到社會經濟活動中其他相關主體的影響。企業作為生產者,目標是利潤極大。從這個目標出發,它對投入、產出的種類和數量進行選擇,對自己的收入轉化為積累與個人的收入分配比例進行選擇,這個過程是一個重大的博弈決策過程。經濟體制改革改變了政府控制整個經濟活動的局面,企業和個人在經濟活動中的獨立性與能動性日益增強,研究各經濟主體在經濟活動中的博弈和均衡是研究經濟運行機制和規律的重要內容,而專門研究相互依賴、相互影響的理性決策行為的博弈論方法,為政府利用經濟理論分析政策問題提供了一種有效的手段。信息經濟學是不對稱信息博弈論在經濟學上的應用,即研究在給定信息結構的條件下,進行最優的契約安排。我國經濟轉型時期的許多工作需要信息經濟學的理論。信息經濟學中信息的不對稱包括不對稱發生的時間和不對稱信息的內容。從不對稱發生的時間看,債轉股的不對稱可能發生在相關利益者簽約之前,也可能發生在簽約之后,分別稱事前不對稱和事后不對稱。研究事前不對稱信息博弈的模型稱為逆向選擇模型,研究事后不對稱的模型稱為道德風險模型。在信息經濟學中,將博弈中擁有私人信息的參與人稱為代理人,不擁有私人信息的參與人稱為委托人。信息經濟學的所有模型都可以在委托人一代理人的框架下分析。債轉股政府、資產管理公司和債轉股國有企業之間的關系就存在特殊的值得深入探討的委托代理關系。博弈論理論的成熟,極大地促進了委托代理理論的發展,委托代理理論可以模型化如下一類的問題:委托人(如政府)想使代理人(如債轉股國有企業的經營者)按照前者的利益選擇行動(如使股權回購和國有資產保值增值),但委托人不能直接觀測到代理人選擇了什么行動,能觀測到的只是另一些變
量(如企業效益、產品的市場占有率等),這些變量由代理人的行動和其他的外生的隨機因素共同決定,因而充其量只是代理人行動的不完全信息。委托人的問題是如何根據這些觀測到的信息來獎懲代理人,以激勵其選擇對委托人最有利的行動。委托人在簽約時要使自己期望效用極大化,而此時會面臨來自代理人的兩個約束:一個是參與約束,即代理人從接受合同中得到的期望效用不能小于不接受合同時能得到的最大期望效用;另一個是代理人的激勵相容約束,即代理人總是選擇使自己的期望效用最大化的行動,如果委托人希望的行動正好能使代理人的期望效用最大,那么代理人就會選擇它。