Unformatted text preview: ﺑﻪ ﻧﺎم ﺧﺪا 62/7/88 ﺗﻨﻈﻴﻢ: ﻫﺎﺟﺮ ﻧﺎﺟﻲ ﻧﻈﺮﻳﻪ ﺑﺎزيﻫﺎ ﻳﺎدداﺷﺖﻫﺎي ﺟﻠﺴﻪ ﭘﻨﺠﻢ اﺳﺘﺎد: دﻛﺘﺮ ﻣﺤﻤﺪﻋﻠﻲ ﺻﻔﺮي
ﻓﻬﺮﺳﺖ ﻣﻮﺿﻮﻋﺎت:
1. zero-sum games .2. existence of N.E .3. correlated Eq ﭼﻜﻴﺪه:
در اﻳﻦ ﺟﻠﺴﻪ اﺑﺘﺪا ﺑﺎ اﺳﺘﻔﺎده از دوﮔﺎنﻳﺎﺑﻲ، ﺛﺎﺑﺖ ﻣﻲﻛﻨﻴﻢ ﻛﻪ ﻫﻤﻴﺸﻪ ﻣﻲﺗﻮان ﺗﻌﺎدل ﻧﺶ در ﺑﺎزيﻫﺎي zero-sumرا در زﻣﺎن ﭼﻨﺪ ﺟﻤﻠﻪاي ﺑﻪ دﺳﺖ آورد. ﺳﭙﺲ ﻗﻀﺎﻳﺎي دوﮔﺎﻧﻲ ﺿﻌﻴﻒ و ﻗﻮي ﻣﻌﺮﻓﻲ ﻣﻲﺷﻮﻧﺪ. ﭘﺲ از آن ﺑﻪ ﻛﻤﻚ ﻗﻀﻴﻪ ﻧﻘﻄﻪ ﺛﺎﺑﺖ ﺑﺮوﻧﺮ و اﺛﺒﺎت آن، در ﻣﻮرد وﺟﻮد ﺗﻌﺎدل ﻧﺶ در ﻫﺮ ﺑﺎزي ﺑﺎ ﺗﻌﺪاد ﻋﻤﻞ ﻣﺤﺪود ﺑﺤﺚ ﻣﻲﺷﻮد. در ﭘﺎﻳﺎن ﺑﺎ ذﻛﺮ ﻣﺜﺎل ﺗﻘﺎﻃﻊ و ﭼﺮاغ راﻫﻨﻤﺎﻳﻲ ﻣﺴﺎﻟﻪي correlated Equilibriumﺗﻮﺿﻴﺢ داده ﻣﻲﺷﻮد.
1. zero-sum games
1q 1p 2q ﺑﺎزي دوﻧﻔﺮهي zero-sumروﺑﺮو )1-5( را در ﻧﻈﺮ ﺑﮕﻴﺮﻳﺪ:
3 1 2 4 2p ﺑﺮاي ﺑﺎزﻳﻜﻦ اول ﻣﻲﺧﻮاﻫﻴﻢ ﺳﻮد ) (utilityرا ﻣﺎﻛﺰﻳﻤﻢ ﻛﻨﻴﻢ. ﺣﺪاﻗﻞ آن را 1 λﻣﻲﻧﺎﻣﻴﻢ. در ﻧﺘﻴﺠﻪ دو ﻧﺎﻣﻌﺎدﻟﻪ، ﻳﻚ ﻣﻌﺎدﻟﻪ و ﻳﻚ ﻫﺪف دارﻳﻢ:
1max λ 13 p1 + p2 ≥ λ 12 p1 + 4 p2 ≥ λ 1 = 2p1 + p ﺑﻪ ﻫﻤﻴﻦ ﺗﺮﺗﻴﺐ ﺑﺮاي ﺑﺎزﻳﻜﻦ دوم دارﻳﻢ:
2min λ 23q1 + 2q2 ≤ λ 2q1 + 2q2 ≤ λ 1 = 2q1 + q ﻣﻮﺿﻮع Nashﻳﻚ ﻗﻀﻴﻪي وﺟﻮدي اﺳﺖ، اﻟﮕﻮرﻳﺘﻤﻲ ﻧﻴﺴﺖ؛ وﻟﻲ ﭼﻮن (Linear Programming) LPاﺳﺖ ﻣﺎ اﻟﮕﻮرﻳﺘﻤﻲ ﺣﻞ ﻣﻲﻛﻨﻴﻢ. ﺑﻌﺪا اﺛﺒﺎت دﻳﮕﺮي ﻣﻲﻛﻨﻴﻢ و ﻧﺸﺎن ﻣﻲدﻫﻴﻢ ﻛﻪ اﻳﻦ دو دﺳﺘﮕﺎه، دوﮔﺎن1 ﻫﻢ ﻫﺴﺘﻨﺪ. ﻣﻘﺪﻣﻪاي ﺑﺮ ﺑﺮﻧﺎﻣﻪرﻳﺰي ﺧﻄﻲ:
ﻳﻚ دﺳﺘﮕﺎه ﻣﻌﺎدﻻت ﺧﻄﻲ و ﻳﻚ ﺳﺮي ﻧﺎﻣﻌﺎدﻻت ﺧﻄﻲ دارﻳﻢ. ﻣﻌﻤﻮﻻ ﻳﻚ ﻫﺪف2 ﻫﻢ ﻗﺮار ﻣﻲدﻫﻴﻢ ﺗﺎ ﺑﻪدﺳﺖ آورﻳﻢ. ﻣﺜﺎل ﻳﻚ :(5-2) LP
0 ≥ x, y ) max( x + 2 y 5 ≤ 2x + 3y 6 ≤ 5x + y ﻣﺴﺄﻟﻪي LPاﮔﺮ ﺑﻪ IPﺗﺒﺪﻳﻞ ﺷﻮد )ﻳﻌﻨﻲ دﻧﺒﺎل ﺟﻮاﺑﻬﺎي integerﺑﺎﺷﻴﻢ( NP-Completeﻣﻲﺷﻮد. ﺧﻴﻠﻲ راﺣﺖ ﻣﻲﺗﻮان SAT را ﺑﺎ دﺳﺘﮕﺎه ﻣﻌﺎدﻻت ﺧﻄﻲ ﻣﻌﺎدل ﻛﺮد. ﻣﺜﻼ x ∨ y ∨ z = cﺑﻪ 1 ≥ ) x + y + (1 − zﻛﺎﻫﺶ3 ﻣﻲﻳﺎﺑﺪ. ﻧﻜﺘﻪ اﻳﻨﺠﺎﺳﺖ ﻛﻪ در SATﻓﻘﻂ ﭘﺎﺳﺦ ﺻﻔﺮ و ﻳﻚ ﻣﻲﺧﻮاﻫﻴﻢ ﻧﻪ 5/0 و 6/0 و 7/0. ﻳﻚ راه ﺣﻞ اﻳﻦ اﺳﺖ ﻛﻪ ﻫﺮ ﻣﺘﻐﻴﺮ را ﺑﺎ اﺣﺘﻤﺎل ﻫﻤﺎن ﻋﺪدي ﻛﻪ ﺑﻪدﺳﺖ آﻣﺪه 1 ﻣﻲﻛﻨﻨﺪ. در ﻣﺜﺎل 5-2 ﺑﺎ ﺟﻤﻊ دو ﻧﺎﻣﻌﺎدﻟﻪ دارﻳﻢ:
≤ 2( x + 2 y ) ≤ 7 x + 4 y ≤ 11 ⇒ x + 2 y 11 2 1 2 3 dual Objective function reduce ﺣﺎل ﺗﻌﻤﻴﻢ ﻣﻲدﻫﻴﻢ. ﻧﺎﻣﻌدﻟﻪي اول را در αو ﻧﺎﻣﻌﺎدﻟﻪي دوم را در ) βﻫﺮ دو ﻣﺜﺒﺖ( ﺿﺮب ﻣﻲﻛﻨﻴﻢ. اﻛﻨﻮن دارﻳﻢ:
x + 2 y ≤ x × (2α + 5β ) + y × (3α + β ) ≤ 5α + 6β از ﻧﺎﻣﺴﺎويﻫﺎي ﺑﺎﻻ دوﮔﺎن زﻳﺮ ﺑﻪدﺳﺖ ﻣﻲآﻳﺪ:
1 ≥ 2α + 5β 2 ≥ 3α + β ) min(5α + 6β در ﺣﺎﻟﺖ ﻛﻠﻲ ﻣﻲﺗﻮان ﻣﺴﺄﻟﻪ را ﺑﻪ ﺷﻜﻞ زﻳﺮ ﻧﻮﺷﺖ:
max cx + dy ⎫ ⎡a ⎪ 1 ⎢ = α ← a1 x + b1 y ≤ c1 ⎬ ⇒ A 2⎣a ⎪ 2β ← a2 x + b2 y ≤ c ⎭ ⎤ 1b ⎡ c1 ⎤ T ⎥, B = ⎢c ⎥, C = [c ⎦ 2b ⎦2 ⎣ ]d دوﮔﺎن ﻣﺴﺄﻟﻪي ﺑﺎﻻ ﺑﻪ ﺻﻮرت زﻳﺮ ﺑﻪدﺳﺖ ﻣﻲآﻳﺪ:
⎫ a1α + a 2 β ≥ c ⎡a ⎪ 1 ⎢ = b1α + b2 β ≥ d ⎬ ⇒ AT 1⎣b ⎪ min c1α + c2 β ⎭ ⎤ 2a ⎡c ⎤ T 1⎥, C = ⎢d ⎥, B = [c ⎦ 2b ⎦⎣ ] 2c ﺑﻪ ﻃﻮر ﺧﻼﺻﻪ دوﮔﺎن ﺑﻪ ﺣﺎﻟﺖ زﻳﺮ ﺑﺪﺳﺖ ﻣﻲآﻳﺪ: ) * X * , Yﺟﻮاب ﺑﻬﻴﻨﻪ4 ﻫﺴﺘﻨﺪ.(
max C T . X ⎫ ⎧ AT .Y ≤ C ⎪⎪ A. X ≤ B ⎬ ⇒ ⎨min B T .Y *⎪ ⎪ Y *X ⎩⎭ ﻗﻀﻴﻪي دوﮔﺎﻧﻲ ﺿﻌﻴﻒ5: ﻫﺮ ﺟﻮاﺑﻲ ﺣﺘﻲ ﺟﻮاب ﺑﻬﻴﻨﻪ، از ﺟﻮاب دوﮔﺎن ﻛﻤﺘﺮ اﺳﺖ. در ﻣﺜﺎل )2-5( ﻗﻀﻴﻪي دوﮔﺎﻧﻲ ﺿﻌﻴﻒ را ﻣﻲﺗﻮان ﻣﺸﺎﻫﺪه ﻛﺮد:
* 5α + 6β ≥ ( 2x * + 3 y * ) α + ( 5x * + y * ) β ≥ ( 2α + 5β ) x * + ( 5α + β ) y * ≥ x * + 2 y 4 5 optimal weak duality theorem ﻳﻚ ﻣﺴﺄﻟﻪ ﻣﻲﺧﻮاﻫﺪ ﻛﺎﻫﺶ ﻳﺎﺑﺪ و ﻳﻜﻲ اﻓﺰاﻳﺶ و ﺑﺎﻻﻳﻲ ﻫﻤﻴﺸﻪ ﺑﺎﻻﺗﺮ اﺳﺖ و ﻛﺮان ﺑﺎﻻي ﺧﻮﺑﻲ اﺳﺖ و ﺟﺎﻟﺐ اﻳﻨﻜﻪ در ﺣﺎﻟﺖ
6 optimalاﻳﻦ دو ﺑﻪ ﻫﻢ ﻣﻲرﺳﻨﺪ = ﻗﻀﻴﻪ دوﮔﺎﻧﻲ ﻗﻮي ﺑﺮﮔﺮدﻳﻢ ﺑﻪ ﻧﻈﺮﻳﻪ ﺑﺎزيﻫﺎ: دوﺑﺎره ﻫﻤﺎن ﺑﺎزي دو ﻧﻔﺮه (5-1) zero-sumرا در ﻧﻈﺮ ﺑﮕﻴﺮﻳﻢ. ﺛﺎﺑﺖ ﻛﻨﻴﻢ دو دﺳﺘﮕﺎه ذﻛﺮ ﺷﺪه، دوﮔﺎن ﻫﻢ ﻫﺴﺘﻨﺪ. اﮔﺮ 1 = 2 P1 + Pرا ﺑﻪ 1 ≤ 2 P1 + Pﺗﺒﺪﻳﻞ ﻛﻨﻴﻢ، ﻣﺸﻜﻞ اﻳﺠﺎد ﻧﻤﻲﺷﻮد. ﻓﺮﺿﺎ ﺟﻤﻊ آن دو 5/0 ﺷﻮد. ﻫﺮ دو را در 2 ﺿﺮب ﻣﻲﻛﻨﻴﻢ. ﻃﺒﻌﺎ 1 λﻫﻢ دوﺑﺮاﺑﺮ ﻣﻲﺷﻮد. ﻫﺮ دو ﻧﺎﻣﺴﺎويﻫﺎ را ﻳﻚ ﻃﺮف ﻣﻲﺑﺮﻳﻢ.
1max λ 0 ≥ 13 p1 + p2 − λ 0 ≥ 12 p1 + 4 p2 − λ 2min λ 0 ≤ 23q1 + 2q2 − λ 0 ≤ 2q1 + 2q2 − λ در دﺳﺘﮕﺎه ﺳﻤﺖ ﭼﭗ، از ﺗﻜﻨﻴﻚ ﺗﺮاﻧﻬﺎده ﻛﺮدن ﺑﻪدﺳﺖ ﻣﻲآورﻳﻢ :
0 ≥ 2−3q1 − 2q 2 + λ 0 ≥ 2−q1 − 4q 2 + λ 2min λ ﻣﻲﺑﻴﻨﻴﻢ ﻛﻪ ﻫﻤﺎن دوآل ﺷﺪ. ﻳﻌﻨﻲ دﺳﺘﮕﺎه ﺳﻤﺖ راﺳﺖ ﺑﺪﺳﺖ آﻣﺪ. ﺗﻮﺟﻪ ﻛﻨﻴﺪ ﻛﻪ ﻫﻤﻴﺸﻪ 0 ≥ 2. p1 , p2 , q1 , q ﻧﺘﻴﺠﻪ اﻳﻦ ﻛﻪ در زﻣﺎن ﭼﻨﺪﺟﻤﻠﻪاي، ﻫﻤﻴﺸﻪ ﻣﻲﺗﻮان . N.Eﻳﻚ zero-sumرا ﺑﻪدﺳﺖ آورد.
.2. Existence of N.E ﺑﺎزي ﺑﺎ ﺗﻌﺪاد ﻋﻤﻞﻫﺎي ﻣﺤﺪود. ﻫﺮﺑﺎزي ﺣﺪاﻗﻞ داراي ﻳﻚ . N.Eﻫﺴﺖ )ﻗﻀﻴﻪ( )15‘ (Nash . N.Eﻟﺰوﻣﺎ ﻳﻜﺘﺎ ﻧﻴﺴﺖ اﻣﺎ ﻣﻘﺪار ﻳﻜﺘﺎ دارد. 6 strong duality theorem ﻗﻀﻴﻪ :Brouner Fixed Point ﻳﻚ ﺗﺎﺑﻊ ﻫﺮ ﻃﻮري از ]1,0[ ﺑﻪ ]1,0[ ﺑﺎﺷﺪ، ﻳﻚ ﻧﻘﻄﻪ ﺛﺎﺑﺖ دارد. ﺣﺘﻲ ﺑﺮاي ﭼﻨﺪ ﺑﻌﺪي. ﻳﻌﻨﻲ :
]1,0[ → ]1,0[ : f
d d d ∃x ∈ [0,1] : f ( x ) = x ﺷﺮط اﺻﻠﻲ ﻗﻀﻴﻪ اﻳﻦ اﺳﺖ ﻛﻪ ﺗﺎﺑﻊ ﭘﻴﻮﺳﺘﻪ ﺑﺎﺷﺪ. • اﻳﻦ ﻗﻀﻴﻪ در ﻧﺴﺨﻪﻫﺎي ﻣﺨﺘﻠﻒ ﻟﺰوﻣﺎ ﺑﻴﻦ ﺻﻔﺮ و ﻳﻚ ﻧﻴﺴﺖ. وﻟﻲ ﻣﺎ ﻓﻘﻂ اﻳﻦ ﺟﺎ ﺑﺎ اﻳﻦ ﻧﺎﺣﻴﻪ ﻛﺎر دارﻳﻢ. ﻧﺤﻮه اﺛﺒﺎت ﻣﺎ: ﻫﺮ ﺑﺎزي nﺑﺎزيﻛﻦ ﺑﺎ mاﺳﺘﺮاﺗﮋي دارد.
n 1 2 X ⊆ R mn X = P11 , P21 , P31 ,..., Pm , P12 , P22 , P32 ,..., Pm ,..., P1n , P2n , P3n ,..., Pm [ f :X →X n n n 1 1 2 2 2 → q1 , q1 , q3 ,..., q1 , q12 , q2 , q3 ,..., qm ,..., q1n , q2 , q3 ,..., qm m 2 [ ] ] اﻳﺪه : X ⇔ f (x ) = xﻣﺘﻨﺎﻇﺮ ﺑﺎ ﻳﻚ . N.Eﺑﺎﺷﺪ.
: BRi ( X −i ) = kﺑﺎزﻳﻜﻦ i α = U i (a, X −i ) − U i ( X ) = kλ
) a ∈ BRi ( X −i ﻛﻪ kاﻧﺪازه ) BRiﺗﻌﺪاد ﻋﻤﻞﻫﺎ( اﺳﺖ. اﮔﺮ 0 = αﻛﻪ . N.Eاﺳﺖ و اﮔﺮ ﻧﺒﺎﺷﺪ، . N.Eرا ﻣﻲﻳﺎﺑﻴﻢ.
⎧ Pji k + ) j ∈ BRi ( X −i ⎪ ⎪1 + kλ 1 + kλ i q j = ⎨ iﻳﻌﻨﻲ ﺑﺮاي ﻋﻤﻞ j ⎪ Pj ) ⎪1 + kλ j ∉ BRi ( X −i ⎩ ﻣﺎ ﻳﻚ ﺳﺮي xدارﻳﻢ و ) f ( xﻫﺎ )ﻫﻤﺎن qﻫﺎ( را ﻣﻲﺧﻮاﻫﻴﻢ. ﺑﺮاي ﻫﺮ ﺑﺎزﻳﻜﻦ اﮔﺮ ﻋﻤﻞ jدر BRﺑﻮد ﻛﻪ ﻫﻴﭻ، ﻣﻬﻢ اﻳﻦ اﺳﺖ ﻛﻪ ﺟﻤﻊ اﺣﺘﻤﺎﻟﻬﺎ ﻫﻤﭽﻨﺎن 1 ﺑﺎﻗﻲ ﺑﻤﺎﻧﺪ. اﮔﺮ ﻧﺒﻮد اﺣﺘﻤﺎل آن را ﻛﻢ ﻣﻲﻛﻨﻴﻢ. )ﺷﻬﻮدي درﺳﺖ اﺳﺖ( اﺣﺘﻤﺎل را ﻛﻪ ﻛﻢ ﻣﻲﻛﻨﻴﻢ ﺑﺎﻳﺪ ﺑﻴﻦ 0 و 1 ﺑﺎﺷﺪ. ﭘﺲ ﺑﺮ ﻋﺪدي ﺑﻴﺶ از 1 ﺗﻘﺴﻴﻢ ﻣﻲﻛﻨﻴﻢ: . 1 + k λدر اﻓﺰاﻳﺶ اﺣﺘﻤﺎل ﻫﻢ ﺑﺎﻳﺪ ﺟﻤﻊ 1 ﺷﻮد. ﺑﺮاي ﻫﻤﻴﻦ ﺑﺎ ﺟﻤﻊ ﻣﻲﻛﻨﻴﻢ.
λ
1+ k λ ﺣﺎﻻ ﻫﺮ دو ﻃﺮف ﻗﻀﻴﻪ ﺛﺎﺑﺖ ﺷﺪ.
.3. Correlated Eq ﻣﺜﺎل: ﻳﻚ ﺗﻘﺎﻃﻊ دارﻳﻢ ﺑﺪون ﭼﺮاغ راﻫﻨﻤﺎﻳﻲ. ﻫﺮ ﻛﺪام از دو ﺧﻮدرو ﻣﻲﺗﻮاﻧﻨﺪ ﻳﺎ ﺑﺎﻳﺴﺘﻨﺪ ) (stopﻳﺎ ﻋﺒﻮر ﻛﻨﻨﺪ ) (crossﺟﺪول ﺳﻮد ﻫﺮ دو ﺑﺎزﻳﻜﻦ ﺑﻪ ﺷﺮح زﻳﺮ اﺳﺖ:
p
cross 1− p
stop 0,1 0,0 q cross stop 001-,001- 1,0 1− q ﺧﺎﻧﻪﻫﺎي 1,0 و 0,1 ﻫﺮ دو . pure N.Eﻫﺴﺘﻨﺪ. ﺑﺮاي ﺑﺎزﻳﻜﻦ دوم دارﻳﻢ:
⎫ cross : −100 p + 1 − p = 1 − 101p 1 = ⎬ ⇒ 1 − 101p = 0 ⇒ p 0 : stop 101 ⎭ ×1 = expected utilityﻛﻪ ﻣﻨﺠﺮ ﺑﻪ ﻓﺎﺟﻌﻪ 001 1 1 1 ﭼﻮن ﺟﺪول ﺑﺎزي ﻗﺮﻳﻨﻪ اﺳﺖ، = qﻧﻴﺰ ﻫﺴﺖ. ﺑﻨﺎﺑﺮاﻳﻦ × ≤ 101 101 101 101 ﻣﻲﺷﻮد. اﻣﺎ اﮔﺮ ﺷﺨﺺ ﺛﺎﻟﺚ ﺳﻜﻪ ﺑﻴﻨﺪازد، اﻳﻦ ﻋﺪد 05 ﺑﺮاﺑﺮ ﻣﻲﺷﻮد ﻳﻌﻨﻲ 5/0. ﺑﻪ اﻳﻦ اﻳﺪهي ﺷﺨﺺ ﺛﺎﻟﺚ، ﻫﻤﻜﺎري )ﺗﻌﺎﻣﻞ دو ﻃﺮﻓﻪ( ﮔﻮﻳﻨﺪ.
) ∀s i , s i′ : ∑ s U i ( s i + s − i ) × p (s i , s − i ) ≥ ∑U i ( s i′ + s − i ) × p (s i , s − i
−i ﺣﺎﻟﺖ . correlated eqوﻗﺘﻲ اﺳﺖ ﻛﻪ در ﻫﻴﭻ ﺣﺎﻟﺖ دﻳﮕﺮي ﺑﻪ ﻧﻔﻊ ﻣﺎ ﻧﺒﺎﺷﺪ آن را ﻋﻮض ﻛﻨﻴﻢ. correlatedواﺿﺢ اﺳﺖ ﻛﻪ ﺷﻬﻮدي ﻧﻴﺴﺖ؛ ﻳﻌﻨﻲ ﻣﺮدم ﻃﺒﻌﺎ اﻳﻦ ﻛﺎر را ﻧﻤﻲﻛﻨﻨﺪ اﻣﺎ ﺑﺎﻳﺪ راﺿﻲ )ﻗﺎﻧﻊ( ﺷﻮﻧﺪ ﻛﻪ ﺑﻪ ﻧﻔﻌﺸﺎن اﺳﺖ. ﭘﺲ ﺑﺮاي ﭼﻚ ﻛﺮدن، ﻫﻤﻴﺸﻪ ﻣﻲ ﺑﻴﻨﻴﻢ آﻳﺎ ﺣﺎﺿﺮ ﻫﺴﺘﻴﻢ ﻋﻤﻞ دﻳﮕﺮي )ﺟﺰ آﻧﻜﻪ ﺑﺎ ﺷﺨﺺ ﺛﺎﻟﺚ ﺗﻌﺎﻣﻞ ﻛﺮدﻳﻢ( اﻧﺠﺎم دﻫﻴﻢ ﻳﺎ ﻧﻪ؟ ...
View
Full Document
- Spring '10
- safari
-
Click to edit the document details