2007年10月6日 星期六

賽局高手@全方位策略與運用

  花了一個下午,仔仔細細的把我有興趣的部分讀了一遍,雖然最後面有一個部分沒有讀通,但是還是先上來寫一點東西,沒通的部份就交給時間囉,多看幾次、有機會找老師討論一下。(我的導師寶塔對這個應該很有研究,因為個經專題是他開的XD)

  書本的網路簡介與出版社,請按此進入該篇文章,有連結。

  本書一共分成十個部份,先從賽局理論的奠基者 約翰。納許說起,納許即是電影美麗境界的主人翁,同時他的博士論文,關於納許均衡,後來得到諾貝爾獎,這個部份就請各位自己上網搜尋了。

  本書與政治上的情勢等作了相當程度的聯結與分析,但因為個人對於政治很反感,所以只有簡單的翻閱過去,我比較注重在賽局這個概念的引導與介紹,因此我推薦幾個章節,標題一併附上:

  Ch 1 天才與迷亂
     2 什麼是賽局?
     3 靜態賽局
     6 動態賽局
     9 不對稱訊息、拍賣與談判賽局
    10 如何應用賽局策略

##CONTINUE##
  有件事情要先說,接下來整理的內容多數是我從書的內容摘下或者是濃縮,並不是我自己原作喔,如果有不妥的地方我再撤下這篇文章。再來,本書出版的日期是02'年,蠻多實例的內容是當時的事情,比較缺發現今的內容,不過學好這套方法之後,相信大家有能力自己去對現下情勢做判讀。

  我寫這篇文章也沒有任何利可圖,只是想分享讀書心得而已。

  來談談我在某篇文章裡面提到的零和賽局的定義吧:一方得利、另一方必受害的零合模式。零合賽局在應用上相當受限,因為在很多實際應用上,像國際關係裡,國與國之間互相依存,既競爭又合作,這樣的非零賽局引起相當廣泛的研究興趣。

  在政治、經濟、心理學上都相當有名且廣為人知的就是那囚犯困境(Prisoner's Dilemma)。囚犯困境最簡單的例子:將兩個囚犯隔離審訊,如果都坦承犯行不諱,考量有悔改表現,判刑三年;如果都拒絕坦承犯行,因為缺乏足夠的證據,關一星期還是只能放人;但是,萬一有一方坦承犯行,一方不承認,那麼坦承犯行者有悔改誠意,放人,不承認的一方則判重刑六年,符合"坦白從寬,拒絕從嚴"的賞罰原則。

  最好的情況、最壞的情況、次佳的情況,請大家自己想想。結果,因為推想對方可能會承認,想想還是自己承認算了,最後兩個囚犯失去對自己最有利的機會,都選擇了次佳的結果,兩個人就是再怎麼想辦法,也無法跳離此結局,是為困境。

  在特定的報酬結構下會出現囚犯困境(以簡單的囚犯困境來說,因警察採取了分離偵訊,以避免串供,又採"坦白從寬,抗拒從嚴"的原則)。合作是好的結果,但有一方不合作可獲利時,自利行為使原始的合作結果很難維持下去。

  什麼是納許均衡(Nash Equilibrium)?到達均衡後,任一參賽者均無誘因單方面偏離此均衡,以此作為檢驗Nash Equilibrium的標準。另一方法是定義Nash Equilibrium為一組最適反應的策略組合,因為已是最適反應,所以任一方均無誘因單方面偏離,這兩個定義是等值的。

  賽局就是多想幾步,想到對手怎麼做,然後決定自己該怎麼做。

  賽局可分為合作賽局與不合作賽局二種。合作賽局允許參賽者之間形成某種約定,並依約定決定如何分配利得;不合作賽局只允許個人的自立動機決定結果,任何約定一旦違反自利動機便無法維持下去。

  *要注意不合作賽局的特性。

  像在囚犯困境中,事先或有約定要否認罪行,但到警局後會因自利動機而毀約,這樣的事先約定在不合作賽局中沒有任何效力。當然在重複賽局中又因動態策略可跨期懲罰或獎賞,可用不合作賽局的動態策略支持一個合作解的隱性約定,但基本上還是不合作賽局在動態環境中的均衡解。

  *優勢策略的均衡未必存在。何謂優勢策略?一個優勢策略均衡必定是一個Nash Equilibrium,反之未必成立。

  *撇開獨占、寡占不談,賽局理論建議我們:有時要保持所採策略的Unpredictability或充滿驚奇性。

  *賽局的架構可依靜態/動態完全訊息/不完全訊息二種分類標準,分為四種不同的賽局,也因此而有相應的均衡觀念。

     完全訊息    不完全訊息

靜態   納許均衡    貝氏納許均衡
     (NE)    (BNE)

動態   子賽局     完美貝氏納許均衡(PBNE)
     完美納許均衡  or
     (SPNE)  序列均衡(SE)


  *動態賽局可分為:靜態均衡,即同時出招
           動態均衡,即出招有先後之別

  囚犯困境在短期一次出招的情下可能彼此受害,但在長期互動以後,理性的個人可能達到某種隱藏性勾結(Tacit Collusion)

  再繼續打下去就把書內容都寫完了XD,這樣不太好。在動態賽局這個章節裡面,有寫到如何可以脫離囚犯困境,採取何種策略最佳、最有利。也提到重複賽局的無名氏定理(Folk Theorem),在長期動態互動過程中,任何參賽者只要偏離均衡,其他參賽者皆可予以懲罰,使之只能獲得最大的極小報酬(Max-Min payoffs),直到她回歸納許均衡為止,因此形成隱藏性勾結。長期的互動與獎懲提供了一個跳脫囚犯困境的途徑,也是近年來研究賽局的一個重要結果。

  最後兩個章節談到不對稱訊息、拍賣和談判賽局,以及如何應用賽局策略,因為我還沒有完全讀透,所以還需要時間消化再看個幾次。

  呼~賽局是好物啊!這本書讓我對賽局的興趣大增!GO了!

沒有留言:

張貼留言