1930-ականներին Ջոն ֆոն Նոյմանը և Օսկար Մորգենշթերնը դարձան մաթեմատիկայի նոր և հետաքրքիր ճյուղի հիմնադիրները, որը կոչվում էր «խաղերի տեսություն»: 1950-ականներին երիտասարդ մաթեմատիկոս Ջոն Նեշը հետաքրքրվեց այս ուղղությամբ։ Հավասարակշռության տեսությունը դարձավ նրա դիսերտացիայի թեման, որը նա գրել է 21 տարեկանում։ Այսպիսով ծնվեց նոր խաղային ռազմավարություն, որը կոչվում էր «Nash Equilibrium», որը Նոբելյան մրցանակի արժանացավ շատ տարիներ անց՝ 1994 թվականին։։
Ատենախոսություն գրելու և ընդհանուր ճանաչման միջև երկարատև անջրպետը մաթեմատիկոսի համար թեստ է դարձել: Առանց ճանաչման հանճարը հանգեցրեց լուրջ հոգեկան խանգարումների, բայց Ջոն Նեշը կարողացավ լուծել այս խնդիրը իր հիանալի տրամաբանական մտքի շնորհիվ: Նրա Նեշի հավասարակշռության տեսությունը Նոբելյան մրցանակի արժանացավ, և նրա կյանքը նկարահանվեց Գեղեցիկ մտքում:
Համառոտ խաղերի տեսության մասին
Քանի որ Նեշի հավասարակշռության տեսությունը բացատրում է մարդկանց վարքագիծը փոխազդեցության պայմաններում, արժե հաշվի առնել խաղերի տեսության հիմնական հասկացությունները:
Խաղերի տեսությունը ուսումնասիրում է մասնակիցների (գործակալների) վարքագիծը միմյանց հետ փոխգործակցության առումով խաղի նման, երբ արդյունքը կախված է մի քանի մարդկանց որոշումից և վարքագծից:Մասնակիցը որոշումներ է կայացնում՝ հիմնվելով ուրիշների վարքագծի վերաբերյալ իր կանխատեսումների վրա, ինչը կոչվում է խաղի ռազմավարություն։
Կա նաև գերիշխող ռազմավարություն, որտեղ մասնակիցը լավագույն արդյունքն է ստանում այլ մասնակիցների ցանկացած վարքագծի համար: Սա խաղացողի լավագույն հաղթանակ-հաղթող ռազմավարությունն է:
Բանտարկյալի երկընտրանք և գիտական բեկում
Բանտարկյալի երկընտրանքը խաղի դեպք է, որտեղ մասնակիցները ստիպված են լինում ռացիոնալ որոշումներ կայացնել՝ հասնելով ընդհանուր նպատակին՝ այլընտրանքների բախման պայմաններում: Հարցն այն է, թե այս տարբերակներից որն է նա ընտրելու՝ գիտակցելով անձնական և ընդհանուր շահը, ինչպես նաև երկուսն էլ ձեռք բերելու անհնարինությունը։ Խաղացողները կարծես բանտարկված լինեն կոշտ խաղային միջավայրում, ինչը երբեմն ստիպում է նրանց շատ արդյունավետ մտածել:
Այս երկընտրանքն ուսումնասիրել է ամերիկացի մաթեմատիկոս Ջոն Նեշը: Նրա հասցրած հավասարակշռությունը յուրովի հեղափոխական էր։ Հատկապես այս նոր միտքը ազդեց տնտեսագետների կարծիքի վրա այն մասին, թե ինչպես են շուկայի խաղացողները ընտրություն կատարում՝ հաշվի առնելով ուրիշների շահերը՝ սերտ փոխազդեցությամբ և շահերի հատմամբ:
Խաղերի տեսությունը լավագույնն է ուսումնասիրել կոնկրետ օրինակների միջոցով, քանի որ այս մաթեմատիկական դիսցիպլինն ինքնին չոր տեսական չէ:
Բանտարկյալի երկընտրանքի օրինակ
Օրինակ՝ երկու հոգի գողություն են կատարել, ընկել ոստիկանների ձեռքը և հարցաքննվում են առանձին խցերում։ Միաժամանակ, ոստիկանության աշխատակիցները յուրաքանչյուր մասնակցի առաջարկում են բարենպաստ պայմաններ, որոնց դեպքում նա ազատ կարձակվի, եթե ցուցմունք տա իր գործընկերոջ դեմ։ Յուրաքանչյուրըհանցագործներն ունեն հետևյալ ռազմավարությունների շարքը, որոնք նա կքննարկի.
- Երկուսն էլ միաժամանակ ցուցմունք են տալիս և ստանում 2,5 տարվա ազատազրկում։
- Երկուսն էլ միաժամանակ լռում են և ստանում են 1-ական տարի, քանի որ այս դեպքում նրանց մեղավորության ապացույցները քիչ են լինելու։
- Մեկը ցուցմունք է տալիս և ազատ է արձակվում, իսկ մյուսը լռում է և ստանում 5 տարվա ազատազրկում։
Ակնհայտ է, որ գործի ելքը կախված է երկու մասնակիցների որոշումից, սակայն նրանք չեն կարողանում համաձայնվել, քանի որ նստած են տարբեր խցերում։ Հստակ տեսանելի է նաև նրանց անձնական շահերի բախումը ընդհանուր շահի համար պայքարում։ Բանտարկյալներից յուրաքանչյուրն ունի գործողության երկու տարբերակ և արդյունքների 4 տարբերակ։
Տրամաբանական եզրակացությունների շղթա
Այսպիսով, իրավախախտ Ա-ն դիտարկում է հետևյալ տարբերակները՝
- Ես լռում եմ, իսկ իմ գործընկերը լռում է. երկուսս էլ 1 տարվա ազատազրկման ենք ենթարկվելու.
- Ես հանձնում եմ իմ զուգընկերոջը, և նա ինձ հանձնում է. մենք երկուսս էլ 2,5 տարվա ազատազրկում ենք ստանում:
- Ես լռում եմ, և իմ գործընկերը դավաճանում է ինձ. ես կստանամ 5 տարվա ազատազրկում, և նա ազատ կլինի.
- Հանձնում եմ զուգընկերոջս, բայց նա լռում է - ես ազատություն եմ ստանում, իսկ նա՝ 5 տարի ազատազրկում.
Հստակության համար տանք հնարավոր լուծումների և արդյունքների մատրիցա:
Բանտարկյալի երկընտրանքի հնարավոր արդյունքների աղյուսակ.
Հարցն այն է, թե ինչ է ընտրելու յուրաքանչյուր մասնակից:
«Լռիր, չես կարող խոսել» կամ «Չես կարող լռել, չես կարող խոսել»
Մասնակիցի ընտրությունը հասկանալու համար անհրաժեշտ է անցնել նրա մտքերի շղթան։ Հետևելով հանցագործ Ա-ի պատճառաբանությանը. եթե ես լռեմ, իսկ իմ գործընկերը լռի, մենք կստանանք նվազագույն ժամկետ (1 տարի), բայց ես. Չգիտեմ՝ ինչպես կպահի իրեն։ Եթե իմ դեմ ցուցմունք է տալիս, ապա ավելի լավ է ես ցուցմունք տամ, թե չէ կարող եմ 5 տարի նստել։ Ես նախընտրում եմ նստել 2,5 տարի, քան 5 տարի: Եթե նա լռի, ապա առավել եւս ես պետք է ցուցմունք տամ, քանի որ այդպես ես կստանամ իմ ազատությունը։ Մասնակից Բ.
Դժվար չէ հասկանալ, որ հանցագործներից յուրաքանչյուրի համար գերիշխող ռազմավարությունը ցուցմունք տալն է: Այս խաղի օպտիմալ կետը գալիս է, երբ երկու հանցագործներն էլ ցուցմունք են տալիս, և ստանում են իրենց «մրցանակը»՝ 2,5 տարվա ազատազրկում։ Նեշի խաղերի տեսությունը սա անվանում է հավասարակշռություն։
Ոչ օպտիմալ օպտիմալ Nash լուծում
Նաշյան տեսակետի հեղափոխական բնույթն այն է, որ նման հավասարակշռությունը օպտիմալ չէ, երբ հաշվի է առնվում առանձին մասնակցի և նրա անձնական շահը: Ի վերջո, լավագույն տարբերակը լռելն ու ազատվելն է։
Նեշի հավասարակշռությունը շահերի մերձեցման կետ է, որտեղ յուրաքանչյուր մասնակից ընտրում է իր համար օպտիմալ տարբերակը միայն այն դեպքում, եթե մյուս մասնակիցներն ընտրեն որոշակի ռազմավարություն:
Հաշվի առնելով այն տարբերակը, երբ երկու հանցագործներն էլ լռում են և ստանում են ընդամենը 1 տարի, մենք կարող ենք դա անվանել պարետո-օպտիմալ տարբերակ։ Սակայն դա հնարավոր է միայն այն դեպքում, եթե հանցագործները կարողանան նախապես պայմանավորվել։ Բայց նույնիսկ դա չի երաշխավորի այս արդյունքը, քանի որ պայմանավորվածությունից նահանջելու և պատժից խուսափելու գայթակղությունը մեծ է։ Իրար նկատմամբ լիակատար վստահության բացակայությունը և 5 տարի ստանալու վտանգը ստիպեցին ճանաչման տարբերակ ընտրել։ Մտածեք, թե ինչին են հավատարիմ մնալու մասնակիցներըԼռությամբ տարբերակը՝ համերգային գործելաոճը, ուղղակի իռացիոնալ է։ Նման եզրակացություն կարելի է անել, եթե ուսումնասիրենք Նեշի հավասարակշռությունը։ Օրինակները միայն ապացուցում են, որ դուք ճիշտ եք:
Եսասեր, թե ռացիոնալ
Նեշի հավասարակշռության տեսությունը ապշեցուցիչ եզրակացություններ տվեց, որոնք հերքում էին նախկինում գոյություն ունեցող սկզբունքները: Օրինակ՝ Ադամ Սմիթը մասնակիցներից յուրաքանչյուրի պահվածքը համարել է միանգամայն եսասիրական, ինչը հավասարակշռության է բերել համակարգը։ Այս տեսությունը կոչվում էր «շուկայի անտեսանելի ձեռք»:
Ջոն Նեշը տեսավ, որ եթե բոլոր մասնակիցները գործեն իրենց շահերից ելնելով, դա երբեք չի հանգեցնի խմբային օպտիմալ արդյունքի: Հաշվի առնելով, որ ռացիոնալ մտածողությունը բնորոշ է յուրաքանչյուր մասնակցի, Նեշի հավասարակշռության ռազմավարությամբ առաջարկվող ընտրությունն ավելի հավանական է:
Զուտ արական փորձ
Հստակ օրինակ է շիկահեր պարադոքս խաղը, որը թեև անտեղի է թվում, բայց հստակ ցույց է տալիս, թե ինչպես է աշխատում Նեշի խաղերի տեսությունը:
Այս խաղում դուք պետք է պատկերացնեք, որ ազատ տղաների ընկերակցությունը եկել է բար: Մոտակայքում աղջիկների ընկերություն է, որոնցից մեկը մյուսներից նախընտրելի է, ասենք մի շիկահեր։ Ինչպե՞ս են տղաները վարվում իրենց համար լավագույն ընկերուհին գտնելու համար:
Ուրեմն տղաների պատճառաբանությունը՝ եթե բոլորը սկսեն ծանոթանալ շիկահերի հետ, ապա, ամենայն հավանականությամբ, ոչ ոք չի հասնի, ապա նրա ընկերները չեն ցանկանա ծանոթանալ։ Ոչ ոք չի ուզում լինել երկրորդ հետնորդը: Բայց եթե տղաները որոշեն խուսափելշիկահեր, ուրեմն տղաներից յուրաքանչյուրի համար աղջիկների մեջ լավ ընկերուհի գտնելու հավանականությունը մեծ է։
Նեշի հավասարակշռության իրավիճակը տղաների համար օպտիմալ չէ, քանի որ հետապնդելով միայն սեփական եսասիրական շահերը՝ բոլորը կընտրեին շիկահերին։ Տեսանելի է, որ միայն եսասիրական շահերի հետապնդումը հավասարազոր է լինելու խմբակային շահերի փլուզմանը։ Նեշի հավասարակշռությունը կնշանակի, որ յուրաքանչյուր տղա գործում է իր շահերից ելնելով, որոնք շփվում են ամբողջ խմբի շահերի հետ: Սա լավագույն տարբերակը չէ անձամբ բոլորի համար, բայց լավագույնը բոլորի համար՝ հիմնված հաջողության ընդհանուր ռազմավարության վրա:
Մեր ամբողջ կյանքը խաղ է
Իրական աշխարհում որոշումներ կայացնելը շատ նման է խաղի, որտեղ դուք ակնկալում եք որոշակի ռացիոնալ վարքագիծ նաև այլ մասնակիցներից: Բիզնեսում, աշխատավայրում, թիմում, ընկերությունում և նույնիսկ հակառակ սեռի հետ հարաբերություններում: Մեծ գործարքներից մինչև սովորական կյանքի իրավիճակներ, ամեն ինչ ենթարկվում է այս կամ այն օրենքին:
Իհարկե, հանցագործների և բարի հետ վերը նշված խաղային իրավիճակները պարզապես հիանալի նկարազարդումներ են, որոնք ցույց են տալիս Նեշի հավասարակշռությունը: Նման երկընտրանքների օրինակները շատ հաճախ են առաջանում իրական շուկայում, և դա գործում է հատկապես այն դեպքերում, երբ շուկան վերահսկում են երկու մոնոպոլիստներ։
Խառը ռազմավարություններ
Հաճախ մենք ներգրավված ենք ոչ թե մեկ, այլ միանգամից մի քանի խաղի մեջ։ Ընտրելով մեկ խաղի տարբերակներից մեկը՝ առաջնորդվելով ռացիոնալ ռազմավարությամբ, բայց դուք հայտնվում եք մեկ այլ խաղի մեջ: Մի քանի ռացիոնալ որոշումներից հետո դուք կարող եք պարզել, որ ձեր արդյունքը ձեր սրտով չէ: Ինչվերցնել?
Եկեք դիտարկենք ռազմավարության երկու տեսակ՝
- Մաքուր ռազմավարությունը մասնակցի վարքագիծն է, որը բխում է այլ մասնակիցների հնարավոր վարքագծի մասին մտածելուց:
- Խառը ռազմավարությունը կամ պատահական ռազմավարությունը պատահականորեն զուտ ռազմավարությունների փոփոխությունն է կամ որոշակի հավանականությամբ մաքուր ռազմավարության ընտրությունը: Այս ռազմավարությունը կոչվում է նաև պատահական:
Հաշվի առնելով այս վարքագիծը, մենք նոր տեսք ենք ստանում Նեշի հավասարակշռությանը: Եթե նախկինում ասվում էր, որ խաղացողը մեկ անգամ է ընտրում ռազմավարություն, ապա կարելի է այլ վարքագիծ պատկերացնել։ Կարելի է ենթադրել, որ խաղացողները ռազմավարություն են ընտրում պատահականորեն՝ որոշակի հավանականությամբ։ Խաղերը, որոնք չեն կարողանում գտնել Նեշի հավասարակշռությունը մաքուր ռազմավարություններում, դրանք միշտ ունեն խառը ռազմավարություններ:
Նեշի հավասարակշռությունը խառը ռազմավարություններում կոչվում է խառը հավասարակշռություն: Սա հավասարակշռություն է, որտեղ յուրաքանչյուր մասնակից ընտրում է իր ռազմավարությունների ընտրության օպտիմալ հաճախականությունը, պայմանով, որ մյուս մասնակիցներն ընտրեն իրենց ռազմավարությունները տվյալ հաճախականությամբ:
Տուգանքներ և խառը ռազմավարություն
Խառը ռազմավարության օրինակ կարելի է գտնել ֆուտբոլային խաղում: Խառը ռազմավարության լավագույն օրինակը թերեւս 11 մետրանոց հարվածաշարն է: Այսպիսով, մենք ունենք դարպասապահ, ով կարող է ցատկել միայն մեկ անկյունում, և խաղացող, ով կիրականացնի 11 մետրանոցը:
Այսպիսով, եթե առաջին անգամ խաղացողը ընտրում է ձախ անկյունը հարվածելու մարտավարությունը, և դարպասապահը նույնպես ընկնում է այս անկյունը և բռնում գնդակը, ինչպե՞ս կարող են իրադարձությունները զարգանալ երկրորդ անգամ: Եթե խաղացողըկխփի հակառակ անկյունում, սա, ամենայն հավանականությամբ, չափազանց ակնհայտ է, բայց նույն անկյունում հարվածելը պակաս ակնհայտ չէ: Հետևաբար, և՛ դարպասապահը, և՛ գոլահարը այլ ելք չունեն, քան հույսը դնել պատահական ընտրության վրա։
Այսպիսով, փոխարինելով պատահական ընտրությունը որոշակի մաքուր ռազմավարությամբ, խաղացողը և դարպասապահը փորձում են ստանալ առավելագույն արդյունք։