1 / 26

第八 章 混合策略納許均衡

第八 章 混合策略納許均衡. 本章大綱. 8.1 棒球賽中的投手與打者之戰 8.2 純策略與混合策略的納許均衡 8.3 特價活動 8.4 混合策略與純策略均衡並存 8.5 以圖形分析混合策略. 本章觀念預讀. 純策略:純策略是指於標準式中表述之各列與各行伴隨報酬的策略。 混合或隨機策略:混合策略就是賦予標準式中的純策略一機率分配。 混合策略均衡:若一納許均衡中,有一參賽者的策略是混合策略,則此均衡即稱之為混合策略均衡。. 棒球賽中的投手與打者之戰. 理性的假設下,投手與打者將選擇不可測的策略

indra
Download Presentation

第八 章 混合策略納許均衡

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第八章 混合策略納許均衡

  2. 本章大綱 • 8.1 棒球賽中的投手與打者之戰 • 8.2 純策略與混合策略的納許均衡 • 8.3 特價活動 • 8.4 混合策略與純策略均衡並存 • 8.5 以圖形分析混合策略

  3. 本章觀念預讀 • 純策略:純策略是指於標準式中表述之各列與各行伴隨報酬的策略。 • 混合或隨機策略:混合策略就是賦予標準式中的純策略一機率分配。 • 混合策略均衡:若一納許均衡中,有一參賽者的策略是混合策略,則此均衡即稱之為混合策略均衡。

  4. 棒球賽中的投手與打者之戰 • 理性的假設下,投手與打者將選擇不可測的策略 • 不可測的策略:參賽者選擇的是一純策略的機率分配,又稱為混和策略。 • 純策略就是表述在標準式中的策略,混合策略就是賦予標準式中的純策略一機率分配。 • 混合策略納許均衡兩階段思考 • 打者先決定是否採取隨機策略 • 選擇特定的機率

  5. 表8.1 棒球投手與打者之報酬表

  6. 表8.2 打者不同策略下的期望值報酬

  7. 表8.3 投手不同策略下的期望值報酬

  8. 表8.4 各種機率選擇下的期望值報酬

  9. 重要觀念顯微鏡 • 當對手採取的隨機策略使你無論採取哪一個策略都得到相同的報酬時,你選擇哪一個策略都一樣。 • 理性的共有知識:不僅兩個參賽者是理性的,而且彼此都知道對手是理性的。 • 貝氏學習法則:根據更新的資訊來修正經驗 • 參賽者認為對手並非全然理性時,無法推論對手的策略為何,僅能根據經驗估測對手採取某純策略的機率

  10. 純策略與混合策略的納許均衡 • 純策略是指表述於標準式中各列與各行伴隨報酬的策略,而混合策略是指賦予多個純策略以一特定的機率分配。 • 馮紐曼與摩根斯坦證明兩人零和賽局的均衡必定存在 • 納許證明所有兩人賽局必存在納許均衡

  11. 特價活動 • 零售商的策略 • 今日特價 • 明日特價 • 消費者的策略 • 今日購物 • 明日購物 • 納許均衡可能是混合策略的組合

  12. 表8.5 特價活動賽局的報酬

  13. 表8.6 零售商不同策略下的期望值報酬

  14. 表8.7 消費者不同策略下的期望值報酬

  15. 混合策略與純策略均衡並存 • 阿羅與喬治互讓的賽局 • 等候 • 前進 • 三個均衡,包括兩個純策略均衡以及一個混合策略均衡 • 利特頓鎮與哈姆雷特鎮的鑿井策略 • 鑿淺井 • 鑿深井

  16. 表8.8 阿羅與喬治的報酬

  17. 表8.9 阿羅採取不同策略下的期望值報酬

  18. 表8.10 在混合策略均衡下,阿羅採取不同策略的期望值報酬

  19. 表8.11 利特頓鎮與哈姆雷特鎮的報酬

  20. 表8.12 利特頓鎮的期望值報酬

  21. 以圖形分析混合策略 • 以棒球賽投手與打者的賽局為例 • 只有當投手與打者都採取混合策略時,才會是納許均衡。 • 以阿羅與喬治的互讓賽局為例 • 混合策略是不穩定的 • 一般情形下,一賽菊若有兩個純策略均衡與混合一個策略均衡,此混合策略均衡也經常是不穩定的 • 以廣告賽局為例 • 當我們擴大參賽者的可選擇策略集合至混合策略時,社會困境均衡仍可能是一優勢策略均衡。

  22. 圖8.1 棒球中打者的期望值報酬

  23. 圖8.2 阿羅與喬治的期望值報酬

  24. 表8.13 廣告賽局(複製自表1.3)

  25. 圖8.3 廣告賽局的期望值報酬

  26. 本章摘要 • 不確定性可能來自於「自然」,也可能是人類的選擇。在賽局標準式中,兩側的策略稱為純策略。而當參賽者使用純策略時,很容易會被看穿,進而陷入脆弱的地位。因此,參賽者為使策略不可測,可賦予純策略某一機率分配,即為混合策略。 • 因為策略是不確定的,只能以期望值報酬來加以評量報酬,因此,參賽者的最適反應就是選擇一個可以極大化期望值報酬的機率分配。按此,所有兩人賽局皆有納許均衡,縱使賽局沒有純策略均衡,也一定會有混合策略均衡。在某些賽局(如協調賽局)中,會同時存在純策略與混合策略均衡,但是,混合策略均衡在這些賽局裡是不穩定的。

More Related