Matematisk spilteori. Eksempler på optagelse og løsning af spil fra livet

Reparationer

Federal Agency for Education

Statens uddannelsesinstitution for højere faglig uddannelse

"Chelyabinsk State Pedagogical University"

Institut for Informatik og Teknologi Undervisning Computer Science

Kvalificerende arbejde

Teori om spil i grundskolen

Eksekutor:

Novikova Ksenia Sergeevna,

studerende af gruppe 591.

Videnskabelig rådgiver:

Dmitrieva O.A.,

assistent Department Impei.

Hoved Afdeling:

Matros D. Sh.,

dOKT. Ped. Videnskab, professor

Dato tolerance for beskyttelse:

Chelyabinsk 2007.

Introduktion

1.2 Beslutning af et matrixspil i rene strategier

1.3 Løsning af matrixspil i blandede strategier

1.4 Game Solution Graphic Method

1.5 Minimering af matrix spil til lineært programmeringsproblem

1.6 Spil med naturen

Konklusioner af i kapitel

KAPITEL II Udvikling af et valgfag "Elementer af teorien om spil i grundskolen"

2.1 Computer sted i grundskolen

2.3 Spil som en metode til træning i grundskolen

2.4 Analyse af program og standardinformation i grundskolen

2.5 Valgfag

2.6 Pædagogisk eksperiment

2.7 Software Beskrivelse.

Konklusioner af II kapitel

Konklusion.

Liste over brugt litteratur

Applikationer

Introduktion

Teorien om spil blev grundlagt af John Von Neumanan og Oscar Morgetn i deres første arbejde "Teori om spil og økonomisk adfærd" offentliggjort i 1944. I 1928 blev en artikel "på teorien om offentlige spil" offentliggjort i matematiske annaler, hvor begrebet "spilteori" først blev anvendt. Brugen af \u200b\u200bdette koncept er forklaret af ligheden af \u200b\u200bbeslutningstagende logik i spil som skak og poker. Karakteristisk for sådanne situationer er, at resultatet for beslutningstageren ikke kun afhænger af dens løsning, men også fra hvilken beslutning der vil blive accepteret af andre. Derfor kan det optimale resultat ikke opnås som følge af beslutningsprocessen af \u200b\u200ben person.

En anden forgænger af teorien om spil anses for at være fransk matematiker E. Borel (1871-1956). Nogle grundlæggende ideer blev uafhængigt tilbudt A. Womdom (1902-1950), som lagde grundlaget for den nye tilgang til den statistiske teori om beslutningstagning.

De første applikationer af teorien om spil, der findes i matematiske statistikker. Under anden verdenskrig og straks efter det var militærteori alvorligt interesseret i spillet, som så enheden til at studere strategiske beslutninger. Det blev brugt som en frugtbar kilde til teoretiske modeller i økonomi og sociologi. Metoder til spilteori anvendes også i teorien om operationer og i lineær programmering.

I grundskolen er forskellige regler og instruktioner brugt til at uddanne børn, så i denne alder kan du udvikle algoritmisk tænkning, som ikke kun fører til en stærkere læring af viden, men også at komme ind i computerverdenen.

Undersøgelsen af \u200b\u200b"Game Theory" i grundskolen vil bidrage til at danne evnen til at analysere tilstanden af \u200b\u200bproblemet hos børn, tænke over sekvensen af \u200b\u200bhandlinger, der tager sigte på at opfylde det. For at kontrollere rigtigheden af \u200b\u200bsine handlinger på alle stadier af arbejdet og justere dem i tilfælde af fejlen af \u200b\u200bfejlen, det vil sige at sende elever til dannelsen af \u200b\u200ben bred vifte af færdigheder, der vil være nødvendige i fremtidige uddannelses- og arbejdsaktiviteter af barnet og i fremtiden og eventuelle faglige aktiviteter.

Formål: undersøgelse af teoretiske bestemmelser om teorien om spil og oprettelsen af \u200b\u200bet valgfag "Elementer af teorien om spil i grundskolen" med metodisk støtte.

Studieformål: Game Theory.

Undersøgelse: Træne teorien om spil i grundskolen.

Forskningsopgaver:

udforsk teoretisk materiale

vælg opgaver for praktisk implementering

udvikle problemer med at løse algoritmer

programmatisk implementere udvalgte opgaver

udvikle et valgfag

opret en elektronisk manual

Hypotese: Hvis i læringsprocessen for at bruge begrebet en vindende strategi vil det bidrage til udviklingen af \u200b\u200blogisk tænkning og intelligens blandt yngre elever, og vil også øge det overordnede niveau af datalogi.

Nyhed af arbejde ligger i følgende:

I øjeblikket er der ingen skole kursus på teorien om spilteori i grundskolen.

Software support er oprettet, hvilket gør det muligt at udføre en effektiv undersøgelse af dette emne i grundskolen.

Et valgfag "elementer af spilteori i grundskolen" og software og metodologisk støtte til den er udviklet.

KAPITEL I Hovedbestemmelserne i spillets teori

1.1 Emne og mål for spillets teori

I processen med målrettet menneskelig aktivitet opstår der situationer, hvor interesser for enkeltpersoner (deltagere, grupper, fester) er enten direkte modsatte (antagonistiske) eller uden at være uforenelige, stadig ikke falder sammen. De enkleste og mest visuelle eksempler på sådanne situationer er sportsspil, voldgiftskonflikter, militære øvelser (manøvrer), kampen mellem klipper af vælgerne for deres kandidater, i internationale relationer - forsvarer deres stats interesser mv. Her søger hver af deltagerne bevidst at opnå det bedste resultat på bekostning af en anden deltager. Denne form for situation findes også på forskellige områder af produktionsaktiviteter.

Alle situationer, hvor effektiviteten af \u200b\u200ben af \u200b\u200bdeltagerne afhænger af andres handlinger, kan opdeles i to typer: deltagernes interesser falder sammen, og de kan blive enige om fælles aktioner; Deltagernes interesser falder ikke sammen. I disse tilfælde kan det være urentabelt at rapportere til andre deltagere deres beslutninger, da nogle af dem vil kunne udnytte kendskabet til andres beslutninger og vil modtage større gevinster på bekostning af andre deltagere. Situationer af denne type kaldes konflikt.

For disse situationer er det karakteristisk, at effektiviteten af \u200b\u200bde beslutninger, der træffes under hver af parternes konflikt, væsentligt afhænger af den anden parts handlinger. I dette tilfælde kan ingen af \u200b\u200bparterne fuldt ud kontrollere situationen, da den anden side af beslutningen skal træffes under usikkerhedsbetingelser. Ved fastsættelsen af \u200b\u200bproduktionsmængden i en virksomhed er det således umuligt at tage hensyn til størrelsen af \u200b\u200bproduktionen af \u200b\u200blignende produkter i andre virksomheder. I reelle forhold er der ofte situationer, hvor antagonisme er fraværende, men der er modsatte trends. For eksempel for den normale produktionsfunktion på den ene side er tilstedeværelsen af \u200b\u200breserver af forskellige ressourcer nødvendig, men på den anden side forårsager ønsket om en nødforhøjelse i disse reserver yderligere omkostninger for deres indhold og opbevaring. I eksemplerne på eksemplerne opstår der konfliktsituationer som følge af bevidste aktiviteter hos mennesker. I praksis er der imidlertid usikkerheder, der genereres af en uforholdsmæssig modstand fra den anden part, men utilstrækkelig bevidsthed om betingelserne i den planlagte operation.

Sektionen af \u200b\u200bmatematikundersøgelse af konfliktsituationer baseret på deres matematiske modeller kaldes teori om spil. Således er teorien om spil en matematisk teori om konfliktsituationer, der udvikler anbefalinger om det mest rationelle billede af hver af deltagerne under konfliktsituationen, dvs. Sådanne handlinger, der ville give ham det bedste resultat. Gaming ordning kan gives til mange situationer i økonomien. Her kan gevinsten være effektiviteten af \u200b\u200bbrugen af \u200b\u200bknappe ressourcer, produktionsaktiver, mængden af \u200b\u200boverskud, omkostninger mv.

Det er nødvendigt at understrege, at metoderne og anbefalingerne fra spillets teori udvikles i forhold til sådanne specifikke konfliktsituationer, der har egenskaben af \u200b\u200bflere repeterbarhed. Hvis konfliktsituationen er implementeret en gang eller begrænset til antallet af gange, betyder anbefalingerne fra spilteori.

For at analysere konfliktsituationen på sin matematiske model skal situationen være lettere, idet der kun tages hensyn til de vigtigste faktorer, der væsentligt påvirker konfliktens forløb.

Definition 1. Spil En forenklet matematisk model af en konfliktsituation kaldes, der afviger fra en reel konflikt ved hvad der udføres i henhold til visse regler.

Spillet er en helhed af regler, der bestemmer mulige handlinger (netto strategier) af deltagerne i spillet. Essensen af \u200b\u200bspillet er, at hver af deltagerne tager sådanne løsninger i udviklingen af \u200b\u200bkonfliktsituationen, som den mener, kan give det det bedste resultat. Resultatet af spillet er betydningen af \u200b\u200ben funktion kaldet funktion Win. (Betalingsfunktion), som kan indstilles enten ved hjælp af et analytisk udtryk eller bord (matrix). Størrelsen af \u200b\u200bgevinsten afhænger af den strategi, som spilleren anvender.

Menneskeheden har længe brugt sådanne formaliserede modeller af konfliktsituationer, der er spil I den bogstavelige forstand af ordet. Eksempler kan servere checkers, skak, kortspil osv. Alle disse spil er arten af \u200b\u200bkonkurrencen, der strømmer gennem de velkendte regler og slutter "sejren" (sejr) af en spiller.

Sådanne formelt regulerede, kunstigt organiserede spil er det mest hensigtsmæssige materiale til at illustrere og mestre de grundlæggende begreber af spilteori. Terminologi, lånt fra praksis af sådanne spil, gælder, og når de analyserer andre konfliktsituationer: Parter, der er involveret i dem, er konventionelt henvist til spillere ", Og resultatet af kollisionen -" vinde "En af parterne.

Game Theory. - en kombination af matematiske metoder til løsning af konfliktsituationer (kollisioner af interesser). I teorien om spil kaldes spillet Matematisk model af en konflikt situation. Emnet for særlig interesse for spilteori er undersøgelsen af \u200b\u2for deltagerne i spillet under usikkerhedsbetingelser. Usikkerhed er relateret til, at to eller flere sider forfølger modsatte mål, og resultaterne af enhver handling af hver del afhænger af partnerens bevægelser. Samtidig søger hver af parterne at foretage optimale løsninger, der implementerer de mål, der er rejst i størst grad.

Den mest konsistente spilteori anvendes i økonomien, hvor konfliktsituationer opstår, for eksempel i forholdet mellem leverandøren og forbrugeren, køberen og sælgeren, banken og klienten. Brugen af \u200b\u200bspilteori findes i politik, sociologi, biologi, militær kunst.

Fra historien om spilteori

Historie om teorien om spil Da en uafhængig disciplin begynder i 1944, da John Von Neuman og Oscar Morgenstern offentliggjorde en bog "teori om spil og økonomisk adfærd" ("teori om spil og økonomisk adfærd"). Selv om eksemplerne på spilteorien var lige før: Den babylonske Talmuds afhandling om divisionen af \u200b\u200bden afdøde mand mellem hans hustruer, kortspil i det 18. århundrede, udviklingen af \u200b\u200ben skakspilteori i begyndelsen af \u200b\u200bdet 20. århundrede, Bevis for Minimax sætning af samme John von Neuman i 1928 år, uden hvilket der ikke ville være nogen spilteori.

I 50'erne af det 20. århundrede, Melvin DRRESHER og MERYL FLOD FRA Rand Corporation. Den første eksperimentelt anvendte filen af \u200b\u200bfangen, John Nash i arbejdet på ligevægtstilstanden i spillene hos to personer udviklede konceptet Nash-ligevægt.

Reinhard Salten i 1965 offentliggjorde bogen "Behandling af oligopoly i teorien om spil på krav" ("Spieltheoretische behandlung eines oligomodells mit nachfrageträgethit"), som brugen af \u200b\u200bspilteori i økonomien modtog en ny drivkraft. Et skridt fremad i udviklingen af \u200b\u200bspillets teori er forbundet med arbejdet i John Mainard Smith "Evolutionary Stabile Strategy" ("Evolutionary Stabile Strategy", 1974). Fængsels dilemma blev populeret i Book of Robert Axelrod "Udviklingen af \u200b\u200bsamarbejdet" ("Udviklingen af \u200b\u200bsamarbejdet"), der blev offentliggjort i 1984. I 1994 var det for bidraget til teorien om nobelprisspil, John Nash, John Harsania og Reinhard Salten.

Teori om spil i liv og forretning

Lad os dvæle på essensen af \u200b\u200bkaffesituationen (kollision af interesser) i den forstand, da det forstås i spillets teori for yderligere modellering af forskellige situationer i liv og forretning. Lad en person være i en position, der fører til en af \u200b\u200bflere mulige resultater, og individet har nogle personlige præferencer i forhold til disse resultater. Men selv om det i nogen grad kan kontrollere de variable faktorer, der bestemmer resultatet, har det ikke fuldstændig kraft over dem. Nogle gange er kontrollen i flere enkeltpersoners hænder, som som ham har nogle præferencer i forhold til mulige resultater, men i den generelle er disse enkeltpersoners interesser ikke konsekvente. I andre tilfælde kan det endelige resultat afhænge af både tilfældighed (som i retsvidenskab undertiden betegnes som naturkatastrofer) og fra andre personer. Teorien om spil systematiserer observationer af sådanne situationer og ordlyden af \u200b\u200bgenerelle principper for ledelsen af \u200b\u200brimelige handlinger i sådanne situationer.

I nogle henseender er navnet "Theory of Games" mislykket, da det tyder på, at teorien om spil kun overvejer ikke at have en social værdi af sammenstød, der forekommer i salonspilene, men stadig denne teori er betydeligt mere bredt.

Følgende økonomiske situation kan give en ide om brugen af \u200b\u200bspilteori. Lad der være flere iværksættere, som hver især søger at få en maksimal fortjeneste, mens du kun har begrænset magt over de variabler, der bestemmer dette overskud. Entreprenøren har ikke magt over variablerne, som den anden iværksætter disponerer, men som i høj grad kan påvirke den første indkomst. Fortolkning af denne situation som spil kan forårsage følgende indvendinger. Spilmodellen forudsætter, at hver iværksætter gør et valg fra området for mulige valg, og disse enkeltvalg bestemmes af overskud. Det kan naturligvis næsten ikke være i virkeligheden, da der i denne branche ikke ville være noget komplekst ledelsesapparat. Der er simpelthen en række løsninger og modifikationer af disse løsninger, som afhænger af de valg, som andre deltagere har begået i det økonomiske system (spillere). Men i princippet kan du forestille dig, at enhver administrator vil forudse alle mulige tilfældigheder og beskriver i detaljer den handling, der skal tages i hvert enkelt tilfælde, i stedet for at løse hver opgave som den opstår.

Militær coflict, pr. Definition, er der et sammenstød af interesser, hvor ingen af \u200b\u200bparterne bortskaffer helt variabler, der bestemmer resultatet, som er løst af en række kampe. Du kan simpelthen overveje resultatet af det vindende eller tab og tildele dem numeriske værdier 1 og 0.

Et af de mest enkle konfliktsituationer, der kan optages og løses i spillets teori - en duel, som er en konflikt med to spillere 1 og 2 p. og q. Skud. For hver spiller er der en funktion, der angiver sandsynligheden for, at spiller skudt jEG. På tidspunktet for tiden t. vil give en faldende, som vil være dødelig.

Som følge heraf kommer teorien om spil til en sådan ordlyd af nogle klasser af interessekollisioner: n. Spillere, og alle har brug for at vælge en mulighed fra et bestemt sæt, og når du vælger et valg fra afspilleren, er der ingen oplysninger om valget af andre spillere. Området af spillerens mulige valg kan indeholde elementer som "TUI PIC", "produktion af tanke i stedet for biler" eller i generel forstand en strategi, der definerer alle de handlinger, der skal udføres under alle mulige omstændigheder. Før hver spiller er en udfordring: Hvilket valg skal han gøre, at dets private indflydelse på resultatet bragte til ham som en større sejr?

Matematisk model i teorien om spil og formalisering af opgaver

Som vi har bemærket, spillet er en matematisk model af en konfliktsituation. og kræver følgende komponent:

interesserede parter;
mulige handlinger på hver side;
parternes interesser.

Interesseret i at spille spillet kaldes spillere Hver af dem kan tage mindst to handlinger (hvis der kun er en handling på spillerens rådighed, så deltager det ikke faktisk i spillet, da det er kendt på forhånd, at han vil tage). Resultatet af spillet kaldes at vinde .

Den reelle konfliktsituation er ikke altid, men spillet (i begrebet teori om spil) - altid - fortsætter med definerede regler som præcist bestemmer:

muligheder for spillere;
mængden af \u200b\u200boplysninger fra hver spiller på en partneres adfærd;
vinder til hvilken hver kombination af handlinger fører.

Eksempler på formaliserede spil er fodbold, kortspil, skak.

Men i økonomien opstår kundens model for adfærd fra spillere, når flere virksomheder søger at tage et bedre sted på markedet, forsøger flere personer at dele nogen fordel (ressourcer, finansiering), så alle får flere muligheder. Spillere i konfliktsituationer i økonomien, som kan modellere i form af spillet, er firmaer, banker, enkeltpersoner og andre økonomiske agenter. Til gengæld, i forholdene i krigen, bruges spillemodellen f.eks. I valget af bedre våben (af den eksisterende eller potentielt mulige) at besejre fjenden eller beskytte mod angrebet.

For spillet er præget af usikkerheden om resultatet . Årsager til usikkerhed kan fordeles i følgende grupper:

combinatorial (begge i skak);
effekten af \u200b\u200btilfældige faktorer (som i spillet "Eagle eller Rush", knogler, kortspil);
strategisk (spilleren ved ikke, hvilken handling fjenden vil tage).

Spiller Strategy. Der er et sæt regler, der bestemmer sine handlinger på hver tid afhængigt af den nuværende situation.

Formålet med teorien om spil er definitionen af \u200b\u200ben optimal strategi for hver spiller. Bestem denne strategi - det betyder at løse spillet. Strategi Optimalitet Det opnås, når en af \u200b\u200bspillerne skal få de maksimale gevinster, på trods af at den anden overholder sin strategi. Og den anden spiller skal have et minimumstab, hvis den første overholder sin strategi.

Klassificering af spil

Klassificering af antallet af spillere (spil af to eller flere personer). De to personers spil optager et centralt sted i hele teorien om spil. Hovedkonceptet for spilteori for spillet af to personer er en generalisering af en meget væsentlig ide om ligevægt, som naturligvis forekommer i spillene hos to personer. Hvad angår spillene n. Personer, så en del af spilteorien er afsat til spil, hvor samarbejdet mellem spillerne er forbudt. I en anden del af spilteorien n. Personer antages, at spillerne kan samarbejde om gensidig fordel (se nedenfor i dette afsnit om ikke-opoperative og samarbejdsspil).
Klassificering af antallet af spillere og deres strategier (Antallet af strategier for mindst to kan være uendeligt).
Klassificering af antallet af oplysninger Med hensyn til tidligere bevægelser: Spil med fuld information og ufuldstændig information. Lad der være en spiller 1 - Køber og spiller 2 - Sælger. Hvis afspilleren 1 ikke har fuldstændige oplysninger om spillerens handlinger 2, kan afspilleren 1 ikke skelne mellem to alternativer, mellem hvilke han skal vælge. For eksempel vælger mellem to arter af noget produkt og ikke at vide det for nogle tegn EN. Værre varer. B., Spiller 1 kan ikke se forskellene mellem alternativer.
Klassificering baseret på vindende principper : Samarbejdsvillig, koalition på den ene side og ikke-opoperativ, impalmed på den anden side. I neooperative spil , for ellers - infaluction spil , Spillerne vælger strategier på samme tid, uden at vide, hvilken strategi der vælger den anden spiller. Kommunikation mellem spillere er umulig. I cooperative Game. , for ellers - koalitionspil Spillerne kan forene sig i koalitionen og tage kollektive handlinger for at øge deres gevinster.
Det ultimative spil af to personer med nulbeløb Eller et antogonistisk spil er et strategisk spil med fuld information, hvor parterne er involveret i modsatte interesser. Anatagonistiske spil er matrix Games. .

Et klassisk eksempel fra teorien om spil - fangeren af \u200b\u200bfangen

To mistænkte tager i forvaring og isolerer bortset fra hinanden. Distriktets anklagemyndighed er overbevist om, at de gjorde en alvorlig forbrydelse, men har ikke tilstrækkelige beviser til at pålægge en domstolsafgift. Han siger til hver af de fanger, at han har to alternativer: at tilstå en forbrydelse, som ved overbevisning begik, eller ikke indrømme. Hvis begge ikke anerkendes, vil distriktsforvalteren opkræve dem i nogen mindre kriminalitet, for eksempel lille tyveri eller ulovlig besiddelse af våben, og de vil begge modtage en lille straf. Hvis de begge tiltrækker, vil de blive underlagt retsansvar, men det vil ikke kræve den strengeste sætning. Hvis man er anerkendt, og den anden ikke er, så vil sætningen blive afslappet for udstedelsen af \u200b\u200bmedskyldigheden, mens vedvarende vil modtage "på den fulde spole."

Hvis denne strategiske opgave er at formulere i fristerne, kommer den ned til følgende:

Således, hvis begge fanger ikke anerkendes, modtager de hvert år hver. Hvis begge er anerkendt, vil alle modtage i 8 år. Og hvis man indrømmer, er den anden ikke anerkendt, så den, der indrømmes, adskilles af de tre måneder af konklusionen, og den, der ikke anerkendes, vil modtage 10 år. Den resulterende matrix afspejler korrekt filtilemmaet: Før hver er der et spørgsmål - at indrømme eller ikke indrømme. Spillet, som distriktets anklager tilbyder fanger, er neooperative spil for ellers infalliac spil . Hvis begge fanger havde mulighed for at samarbejde (det vil sige spillet ville være samarbejdsvillige for ellers koalitionspil ), Begge ville ikke indrømme og modtog fængslet hvert år.

Eksempler på at bruge matematiske midler til spilteori

Nu går vi til overvejelsen af \u200b\u200bløsninger til eksempler på fælles klasser af spil, for hvilke der findes forsknings- og løsningsmetoder i teorien om spil.

Et eksempel på formalisering af et ikke-opoperativt (infalliacal) spil af to personer

I det foregående afsnit har vi allerede overvejet et eksempel på et ikke-optisk (ufordelagtigt) spil (fange dilemma). Lad os løse vores færdigheder. Til dette er den klassiske historie også velegnet til "eventyr af Sherlock Holmes" Arthur Conan Doyle. Du kan selvfølgelig argumentere: Et eksempel er ikke fra livet, men fra litteratur, men fordi Conan Doyle ikke har bevist sig selv som en science fiction forfatter! Classic er også fordi opgaven er lavet af Oscar Morgetern, som vi allerede er installeret - en af \u200b\u200bgrundlæggerne af teorien om spil.

Eksempel 1. En forkortet præsentation af fragmentet af en af \u200b\u200bSherlock Holmes vil blive givet. Ifølge de velkendte begreber i spilteorien, lav en model af en konfliktsituation og formelt optage spillet.

Sherlock Holmes har til hensigt at gå fra London til Dover med yderligere gå til kontinentet (europæisk) for at undslippe fra professor Moriarty, der forfølger ham. Frø I toget så han på professor Moriarty's faglige platform. Sherlock Holmes indrømmer, at Moriarty kan vælge et specielt tog og overvinde det. Sherlock Holmes har to alternativer: Fortsæt turen til Dover eller gå væk på Canterberry Station, som er den eneste mellemliggende station på sin rute. Vi accepterer, at hans modstander er ret intelligent for at bestemme Holmes's evner, så der er to alternativer foran ham. Begge fjender skal vælge en station for at komme væk på den fra toget, ikke at vide, hvilken beslutning der vil tage hver af dem. Hvis der som følge af beslutningstagningen både vil være på samme station, kan du utvetydigt antage, at Sherlock Holmes vil blive dræbt af professor Moriarty. Hvis Sherlock Holmes sikkert kommer til Dover, bliver han gemt.

Afgørelse. Heroes Conan Doyle kan ses som deltagere i spillet, det vil sige spillere. Til rådighed for hver spiller jEG. (jEG.\u003d 1,2) To netstrategier:

skær i Dover (Strategi s.i1 ( jEG.=1,2) );
gå ud på den mellemliggende station (strategi s.i2 ( jEG.=1,2) )

Afhængigt af hvilken af \u200b\u200bde to strategier vælger hver af to spillere en særlig kombination af strategier som et par vil blive oprettet. s. = (s.1 , s.2 ) .

Hver kombination kan sættes i overensstemmelse med en begivenhed - resultatet af forsøget på at dræbe Sherlock Holmes af professor Moriarty. Vi laver en matrix af dette spil med mulige begivenheder.

Under hver af begivenhederne er et indeks angivet, at det betyder erhvervelse af professor Moriarty og beregnet afhængigt af Holmes's frelse. Begge helte vælger strategien på samme tid, ikke ved at vide, at han ville vælge fjenden. Således er spillet neooperativt, da for det første er spillere i forskellige tog, og for det andet har de modsatte interesser.

Et eksempel på formalisering og løsninger af Cooperative (Coalition) spil n. Personer

I dette afsnit vil den praktiske del, det vil sige, at beslutningen om opgaven vil blive præsenteret den teoretiske del, hvor vi vil opfylde begreberne spilteori for at løse kooperative (infallus) spil. For denne opgave tilbyder teorien om spil:

en karakteristisk funktion (hvis den er forenklet, afspejler den størrelsen af \u200b\u200bfordelene ved at kombinere spillerne i koalitionen);
begrebet additivitet (egenskaberne af de værdier, som værdien af \u200b\u200bden værdi, der svarer til hele objektet, er lig med summen af \u200b\u200bværdierne af de værdier, der svarer til dens dele, i en bestemt klasse af partitionering af Objektet på delen) og superadditivitet (værdien af \u200b\u200bværdien svarende til et helt objekt, mere end mængden af \u200b\u200bværdier af værdierne, de tilsvarende dele) af den karakteristiske funktion.

Superditivitetskarakteristika tyder på, at foreningen i koalition er gavnlig for spillere, da værdien af \u200b\u200bkoalitionen vinder øges med en stigning i antallet af spillere.

For at formalisere spillet skal vi indføre formelle betegnelser for de ovennævnte begreber.

Til spil n. Betegner mange af alle sine spillere som N. \u003d (1.2, ..., n) Enhver ikke-tom delpunkt af sættet N. Betegner T. (herunder SAM. N. og alle undergrupper bestående af et element). Webstedet har en lektion " Sætter og sætter på sæt ", Som når linket klikker, åbnes du i et nyt vindue.

Den karakteristiske funktion er angivet som v. og dets definitionsområde består af mulige delsæt af sættet N.. v.(T.) - værdien af \u200b\u200bden karakteristiske funktion for en eller anden delmængde, for eksempel indkomsten opnået af koalitionen, herunder muligvis bestående af en spiller. Dette er vigtigt af grunden til, at teorien om spil kræver at kontrollere tilstedeværelsen af \u200b\u200bsuperadditivitet for værdierne af den karakteristiske funktion af alle beboede koalitioner.

For to ikke-tomme koalitioner fra undergrupper T.1 og T.2 Additiviteten af \u200b\u200bden karakteristiske funktion af kooperativet (koalition) spillet er skrevet som følger:

Og superadditivitet så:

Eksempel 2. Tre studerende på musikskolen arbejder i forskellige klubber, de modtager deres indtægter fra klubbesøgende. Installer, om de er gavnlige for at kombinere deres styrker (i bekræftende fald med hvilke betingelser) ved hjælp af begreberne Game Theory for at løse Cooperative Games n. Personer under følgende kildedata.

I gennemsnit udgjorde deres indtægter om en aften:

på de violinistiske 600 enheder;
på en guitarist 700 enheder;
sanger har 900 enheder.

Forsøger at øge indtægterne, har eleverne oprettet forskellige grupper i flere måneder. Resultaterne viste, at de for samlet kan øge deres indtægter for aftenen som følger:

violinist + guitarist tjente 1500 enheder;
violinist + sanger tjente 1.800 enheder;
guitarist + sanger tjente 1900 enheder;
violinist + guitarist + sanger tjente 3000 enheder.

Afgørelse. I dette eksempel er antallet af deltagere i spillet n. \u003d 3 Derfor består feltet for bestemmelse af den karakteristiske funktion af spillet af 2 μl \u003d 8 mulige undergrupper af en flerhed af alle spillere. Liste alle mulige koalitioner T.:

koalitioner fra et element, der hver især består af en spiller - en musiker: T.{1} , T.{2} , T.{3} ;
koalitioner af to elementer: T.{1,2} , T.{1,3} , T.{2,3} ;
koalition af tre elementer: T.{1,2,3} .

Hver af spillerne tildeler sekvensnummeret:

violinist - 1. spiller;
guitarist - 2nd Player;
sangeren er den tredje afspiller.

Ifølge opgaven definerer vi den karakteristiske funktion af spillet. v.:

v (t (1)) \u003d 600; V (t (2)) \u003d 700; V (t (3)) \u003d 900; Disse værdier af den karakteristiske funktion bestemmes ud fra henholdsvis gevinsten af \u200b\u200bden første, anden og tredje spillere, når de ikke kombineres i koalitionen;

v (t (1,2)) \u003d 1500; V (t (1,3)) \u003d 1800; V (t (2,3)) \u003d 1900; Disse værdier af den karakteristiske funktion bestemmes af indtægterne for hvert par spillere, der forenede i koalitionen;

v (t (1,2,3)) \u003d 3000; Denne værdi af den karakteristiske funktion bestemmes af mellemstore indtægter i sagen, når spillerne kombineres i tredobbelen.

Således har vi listet alle mulige koalitioner af spillere, de viste sig otte, da det skulle være, da området for at bestemme den karakteristiske funktion af spillet består netop af otte mulige undergrupper af mange spillere. Som kræver teori om spil, da vi skal kontrollere tilstedeværelsen af \u200b\u200bsuperadditivitet for værdierne af den karakteristiske funktion af alle beboelige koalitioner.

Hvordan er vilkårene for superadditivitet i dette eksempel? Vi definerer, hvordan spillere udgør indbyggerbalitioner T.1 og T.2 . Hvis en del af spillerne går ind i koalitionen T.1 Alle andre spillere går ind i koalitionen T.2 Og pr. Definition er denne koalition dannet som forskellen mellem hele sæt af spillere og mange T.1 . Så, hvis T.1 - koalition fra en spiller, derefter i koalition T.2 vil være den anden og tredje spillere, hvis i koalitionen T.1 Der vil være den første og tredje spillere, så koalitionen T.2 Det vil kun bestå af den anden spiller, og så videre.

Et sjovt eksempel på at anvende spilteori er i fantasybogen Anthony Pier "Brave Golem"

Mange tekst.

- Betydningen af \u200b\u200bdet, jeg vil demonstrere for alle nu, - Grande begyndte, - er sæt af det krævede antal point. Point kan være de mest anderledes - det hele afhænger af kombinationen af \u200b\u200bløsninger, der accepteres af deltagerne i spillet. For eksempel antage, at hver deltager vidner om hans kammerat på spillet. I dette tilfælde kan hver deltager tildeles et punkt!
- Et point! - sagde havheksen, der viste uventet interesse for spillet. Selvfølgelig ønskede sorceressen at sikre, at Golem ikke havde nogen chance for, at Demon Xunt var tilfreds med dem.
- Og nu lad os antage, at hver af deltagerne i spillet ikke vidner om deres kammerat! - Fortsat Grande. - I dette tilfælde kan hver enkelt tildele tre punkter. Jeg vil især bemærke, at så længe alle deltagere handler lige så, bliver de tildelt det samme antal point. Ingen har ingen fordele over for andre.
- Tre point! - sagde den anden heks.
"Men nu har vi ret til at foreslå, at en af \u200b\u200bspillerne begyndte at vidne om det andet, og den anden er stadig stille! - sagde grande. - I dette tilfælde modtager den, der giver dette vidnesbyrd, fem point på én gang, og den, der er tavs, modtager ikke et enkelt punkt!
- Ja! - Begge hekse blev udbrød i en stemme, rovende likkende læber. Det var klart, at begge af dem klart ville få fem point.
- Jeg har mistet mine briller hele tiden! - udbrød dæmonen. - Men du har jo bare skitseret situationen, og metoden til dens tilladelse er endnu ikke introduceret! Så hvad er din strategi? Træk ikke tiden!
- Vent, nu vil jeg forklare alt! - udbrød grande. - Hver af os fire - vi er her to golems og to hekse - vil kæmpe mod deres modstandere. Selvfølgelig vil hekserne forsøge at ingen i noget ...
- Jo da! - udbrød begge hekser i fællesskab igen. De forstod perfekt Golem fra Poluslov!
"Og den anden Golem vil følge min taktik," fortsatte granden roligt. Han så på hans tvilling. - Du ved selvfølgelig?
- Ja selvfølgelig! Jeg er din kopi! Jeg forstår alt, hvad jeg forstår, hvad du synes!
- Det er godt! I dette tilfælde, lad os gøre det første skridt, så dæmonen kan se alt selv. Hver kamp vil være flere runder, så hele strategien kan manifestere sig til enden og imponere det holistiske system. Måske skal jeg starte.

- Nu skal hver af os anvende mærker på deres ark papir! - Han ansøgte om heksen. - Først skal du tegne et smilende ansigt. Dette vil betyde, at vi ikke vil vidne til kammeratet om konklusionen. Du kan også tegne et lilla ansigt, der betyder, at vi kun tænker på dig selv og det nødvendige vidnesbyrd om din kammerat giver. Vi er begge opmærksomme på, at det ville være bedre, hvis ingen viste sig for at være det mest folkerige ansigt, men på den anden side modtager en andrager visse fordele over smilende! Men essensen er, at hver af os ikke ved, hvad den anden vil vælge! Vi vil ikke vide indtil da, så længe partnerens partner ikke vil åbne sin tegning!
- Start dig, bastard! - Heksen skåret ud. Hun kunne som altid ikke gøre uden parangulære epithets!
- Klar! - udbrød Grandi, der har trukket et stort smilende ansigt på sit ark papir, så heksen ikke kunne se, hvad han skildrede der. Heksen gjorde sin tur, også ved at skildre en person. Vi må tænke, hun skildrede helt sikkert den uvenlige fysiognom!
"Nå, nu kan vi kun vise vores tegninger til hinanden," meddelte Grande. Indpakket tilbage, han åbnede tegningen til offentligheden og viste det i alle retninger, så tegningen kunne se alt. Noget forsvandt, den samme heks gjorde det samme.
Som Grande og jeg forventede, med tegningen af \u200b\u200bsorceressen så jeg et ondt, utilfreds ansigt.
"Nu har du, kære seere," sagde Grandi højtideligt, "ser du, at heksen valgte at give mig et vidnesbyrd. Jeg vil ikke gøre det. Således vælger Sea Witch fem point. Og jeg får derfor ikke en enkelt score. Og her…
I tilskuerne af tilskuerne rullede en let slum igen. Alle klart sympatiserede med Gola og lidenskabeligt ønskede at miste havhekset.
Men spillet startede lige! Hvis kun hans strategi var trofast ...
- Nu kan vi gå til anden runde! - Annonceret Grande højtideligt. - Vi skal gentage bevægelserne igen. Hver maler ansigtet, der er tættere på ham!
Så gjort. Grande afbildet nu det dystre, utilfredse ansigt.
Så snart spillerne viste deres tegninger, så offentligheden, at begge af dem afbildte onde ansigter.
- To point til alle! - sagde grande.
- Syv to til min fordel! - Heksen råbte glædeligt. - Du vil ikke gå overalt herfra, barfodet!
- Vi starter igen! - udbrød grande. De gjorde i den næste tegning og viste dem til offentligheden. Igen de samme onde ansigter.
- Hver af os gentog det foregående træk, han opførte sig egoistisk, og derfor synes det mig, det er bedre ikke at ændre brillerne! - sagde Golem.
- Men jeg fører stadig i spillet! - sagde heksen, lykkeligt at gnide sine hænder.
- Okay, ikke shumi! - sagde grande. - Spillet er ikke forbi. Lad os se, hvad der vil ske! Så kære offentligheden, vi starter den fjerde runde af runde!
Spillere lavede igen billeder, der viste offentligheden, hvad de var afbildet på deres ark. Begge blade viste sig igen for publikum den samme onde fysiognomi.
- otte - tre! - Heksen råbte, hældte det onde grin. - Du gravede op vores dumme strategi, Golem!
- Femte runde! - råbte granden. Gentaget det samme som i de tidligere runder - igen onde ansigter, kun bekostning ændret - han begyndte ni - fire til fordel for trollkarlen.
- Nu den sidste, sjette runde! - Han meddelte Grande. Hans foreløbige beregninger viste, at denne række skulle være skæbnesvangfru. Nu skulle teorien bekræftes eller blive afvist med praksis.
Flere hurtige og nerveformer på blyanten på papir - og begge billeder dukkede op for offentlighedens øjne. Igen to ansigter, nu selv med revnede tænder!
- Ti - fem til min fordel! Mit spil! Jeg vandt! - Havhitchet brændt.

"Du har virkelig vundet," var en aftalt i dyster. Publikum var tavs.
Demonen flyttede var læber for at sige noget.

- Men vores konkurrence har endnu ikke afsluttet! - råbte Grand Walk. - Det var bare den første del af spillet.
- Ja, du har en hel evighed! - råbte dæmon xant utilfreds.
- Det er rigtigt! - sagde Grandi roligt. - Men en tur løser ikke noget, kun metoden angiver det bedste resultat.
Nu gik Golem til en anden heks.
- Jeg vil gerne spille denne tur med en anden modstander! - Han meddelte. - Hver af os vil skildre ansigter som det var i det foregående tidspunkt, så vil det vise den offentliggjorte offentlighed!
Så de gjorde. Resultatet var det samme som sidste gang - Grandi trak et smilende ansigt i ansigtet, og heksen er så generelt en kraniet. Hun fik straks en fordel i hele fem punkter og forlod granden bagved.
De resterende fem runder sluttede med de resultater, der kunne forventes. Igen var scoren ti - fem til fordel for en havheks.
- Golem, jeg kan virkelig godt lide din strategi! - Latter Sordogne.
- Så har du set to runder af spil, kære seere! - udbrød grande. - Så scorede dermed ti point, og mine rivaler - tyve!
Publikum, der også førte tællingspunkterne, skyllede grundigt sine hoveder. Deres tælling faldt sammen med beregningerne af golem. Kun en sky ved navn FriTo syntes meget tilfreds, selvom det selvfølgelig også ikke sympatiserede med heksen.
Men Rapunzelia smilede godkendt af Glau - hun fortsatte med at tro på ham. Hun har måske været den eneste, der troede ham nu. Grande håbede, at han ville retfærdiggøre denne ubegrænsede tillid.
Nu nærede Grandi sin tredje modstander - hans tvilling. Han var nødt til at blive sin sidste modstander. Hurtigt chirking blyanter på papir, viste Golems bladene til offentligheden. Alle så to grinende ansigter.
- Bemærk, dyre seere, hver af os valgte at være en god camer! - udbrød grande. - Og derfor har ingen af \u200b\u200bos modtaget i dette spil den nødvendige fordel over modstanderen. Således får vi begge tre punkter og fortsætter til næste runde!
Anden runde begyndte. Resultatet var det samme som forrige gang. Så de resterende runder. Og i hver runde fik begge fjender tre point igen! Det var bare utroligt, men publikum var klar til at bekræfte alt, hvad der skete.

Endelig kom denne tur til slutningen, og Grande, der hurtigt kørte sin blyant på papir, begyndte at tælle resultatet. Endelig annoncerede han højtideligt:
- Atten til atten! I alt scorede jeg otteogtyve punkter, og mine rivaler scorede tredive otte!
"Så du tabte:" Havheksen hørte glædeligt. - Vinderen bliver, så en af \u200b\u200bos!
- Måske! - Relt svarede Grande. Nu har der været et andet vigtigt punkt. Hvis alt går som det var opfattet ...
- Du skal bringe punktet til slutningen! - udbrød den anden golem. - Jeg skal også kæmpe med to marine heks! Spillet er ikke færdigt endnu!
- Ja, selvfølgelig, kom nu! - sagde grande. - Men kun guidet strategien!
- Ja selvfølgelig! - Hans skumring forsikrede ham.
Denne gallen gik til en af \u200b\u200bheksene, og turen begyndte. Han sluttede med det samme resultat, som granden selv kom ud af en sådan runde, var ti-fem til fordel for heksen. Heksen blev konstant skinnet fra en uforudsigelig glæde, og offentligheden stille stille. Demon Xant kiggede lidt træt, hvilket ikke var for venligt en formason.
Nu er den sidste runde kommet - en heks skulle kæmpe mod det andet. Hver havde i aktivet for tyve point, hun kunne få, kæmper med gollets.
"Og nu, hvis du lader mig få mindst et par ekstra briller ..." den maritime heks hviskede til sin tvilling.
Grandi forsøgte at bevare roen i det mindste udadtil, selvom han i sin sjæl rede han til orkanen af \u200b\u200bmodstridende følelser. Hans held var nu afhængig af, hvor sandt han forudsagde den mulige opførsel af begge hekse - fordi deres karakter var i det væsentlige det samme!
Nu mest, måske det kritiske øjeblik. Men hvis han var forkert!
- Hvad er disse ting, jeg skal give op! - Skry på den anden heks først. - Jeg vil selv have flere point og komme ud herfra!
- Nå, hvis du så jubler dig selv, - Contenderen skreg, - så vil jeg afslutte dig nu, så du ikke længere vil være som mig!
Hekse, der giver hinanden med hadede synspunkter, tegner deres tegninger og viste dem til offentligheden. Selvfølgelig, intet andet, bortset fra to kranier, kunne der simpelthen ikke! Hvert trak et punkt.
Hekse, brusebad hver anden forbandelse, startede anden runde. Resultatet er igen det samme - igen to Coryato trukket kranier. Heksen scorede derfor et andet punkt. Det offentlige flittigt fikseret alt.
Så fortsatte i fremtiden. Da turen sluttede, fandt trætte hekse, at hver af dem scorede seks point. Igen en tegning!
- Lad os nu beregne de resulterende resultater, og alt vil være sammenligneligt! - Grandi sagde triumferende. - Hver af heksene scorede seksogtyve point, og Golems scorede otteogtyve punkter. Så hvad har vi? Og vi har det resultat, at golemerne har flere point!
På publikums rækker fejede et suk af overraskelse. Spændte tilskuere begyndte at skrive på deres plader af tyngelser af tal, kontrollere nøjagtigheden af \u200b\u200btællingen. Mange i denne tid overvejede simpelthen ikke antallet af point scoret og troede på, at resultatet af spillet allerede var kendt. Begge hekse begyndte at grine fra indignation, det er ikke klart, hvem der netop beskylder, hvad der skete. Demon Xanta's øjne blev igen ild med en forsigtig ild. Hans tillid var berettiget!
"Jeg spørger dig, kære offentligheden, være opmærksom på, at" Grandens hånd hævede, krævede at roe sig ned fra publikum, "at ingen af \u200b\u200bGolems vandt en enkelt runde. Men den endelige sejr vil stadig være på en af \u200b\u200bos, fra Golems. Resultaterne bliver mere veltalende, hvis konkurrencen fortsætter videre! Jeg vil gerne sige mine kære tilskuere, at i den evige kamp vil min strategi altid være fordelagtig!
Demon Xunt blev lyttet til, at han talte Grande. Endelig åbnede han, de emitterende klubber af parret, sin mund:
- Hvad er din strategi?
- Jeg kalder det "for at være solid, men ærlig"! - Forklaret Grande. - Jeg begynder at spille ærligt, men så begynder jeg at tabe, fordi jeg kommer på tværs af meget specifikke partnere. Derfor, i første runde, når det viser sig, at havhekset begynder at give vidnesbyrd mod mig, forbliver jeg automatisk taberen og i anden runde - og så fortsætter til slutningen. Resultatet kan være anderledes, hvis heksen vil ændre sin spille taktik. Men da hun ikke engang kunne komme i tankerne, fortsatte vi med at spille på den tidligere skabelon. Da jeg begyndte at lege med min dobbelte, blev han godt behandlet for mig, og jeg behandlede ham godt i næste runde af spillet. Derfor gik vi til spillet for anderledes og lidt monotont, da vi ikke ønskede at ændre taktikken ...
- Men du vandt ikke en enkelt tur! - Demonen protesterede.
- Ja, og disse hekse miste ikke nogen tur! - Bekræftet Grandi. - Men sejren går ikke automatisk til den, der forblev ture. Victory går til den, der scorede flere point, og det er en helt anden ting! Jeg formåede at score flere point, da vi spillede med min tvilling, end da jeg spillede med heks. Deres egoistiske holdning bragte dem en øjeblikkelig sejr, men i form af mere langsigtet viste det sig, at det var på grund af dette, at de havde mistet spillet helt. Det sker ofte og det!

Det er ikke kun nødvendigt for at ** alt i præference eller i skjul og søge.

Game Theory er en videnskab, der studerer principperne om beslutningstagning i situationer, hvor flere agenter interagerer med hinanden. Løsninger taget af nogen påvirker de øvrige beslutninger og på resultatet af samspillet generelt. Interaktionerne af denne type kaldes strategisk.

Ordet "spil" bør ikke være vildledende. Dette koncept i teorien om spil er forlænget bredere end i hverdagen. Situationen for strategisk interaktion kan beskrives som en model, som kaldes spillet. Således vil spillet i spilletorien blive betragtet som ikke kun et skakspil, men også en stemme i FN's Sikkerhedsråd og sælgeren til sælgeren med køberen på markedet.

Strategiske interaktioner findes på næsten enhver sfære af vores liv. Et eksempel fra økonomien: Flere virksomheder, der konkurrerer på markedet, når beslutninger skal se på konkurrenternes handlinger. Hvis vi taler om politik, tager kandidaterne, der konkurrerer i valget, idet de erklærer deres valgplatform, naturligvis, tage hensyn til de andre kandidaters positioner i forhold til dette spørgsmål. Og hvis vi studerer samspillet mellem mennesker i samfundet, så ved hjælp af teorien om spil kan du lære en masse interessante ting om menneskers tendens til samarbejde.

Repræsentanter for samfundsvidenskab bruger ofte teorien om spil som et værktøj, der giver dig mulighed for at løse deres opgaver. Forenkling, teoretisk og spilmodellering kan opdeles i to faser.

For det første, ved en reel livssituation, skal du bygge en formel model. I modellen skal du i modellen afspejle de tre hovedkarakteristika for livssituationen: som interagerer med hinanden (sådanne agenter i teorien om spil kaldes spillere), hvilke beslutninger spillere kan modtage og hvilke betalinger de er som en Resultatet af denne interaktion. Den formelle model kaldes spillet.

Så snart vi byggede spillet, skal det løses på en eller anden måde. På dette stadium abstrakte vi fuldt ud fra virkeligheden, og vi studerer den udelukkende formelle model. Hvordan arrangeres modelløsningen? Vi skal fastsætte begrebet spillere af spillere i spillet, det vil sige principperne for de beslutninger, de har. Så snart vi registrerede dette koncept, kan vi forsøge at løse spillet med det, det vil sige at gøre resultatet til at afslutte spillet.

Ved hjælp af forskellige teoretiske og spilkoncepter kan du løse forskellige klasser af spil. Et af de smukkeste teoretiske resultater af spilteorien viser, at i nogle meget brede klasse af modeller er det garanteret at finde en løsning. Jeg mener resultatet af John Nash, modtaget af ham i 1950: I ethvert ultimativt spil i en normal form kan du altid finde mindst en ligevægt i blandede strategier. Kronologisk var det det første universelle teoretiske og spilkoncept, som giver dig mulighed for at blive garanteret at finde en løsning i en meget bred klasse af modeller.

I modsætning til repræsentanter for samfundsvidenskab er matematik-spil mere interesserede i de interne egenskaber af spil og begreberne af deres beslutning. Det er takket være sådanne teoretiske resultater, vi kan være sikre på, at vi bygger og løser dette eller den teoretiske og spilmodel, vi til sidst får en løsning med de nødvendige egenskaber.

Selvfølgelig er John Nash ikke den eneste forfatter af spilteorien. Teorien om spil som en selvstændig videnskab begyndte at udvikle sig lidt tidligere, i begyndelsen af \u200b\u200bdet tyvende århundrede. De første forsøg på formelt at identificere spillene, spillerens strategier og begrebet spilløsninger til at stige til navnene på Emil Borel og John von Neuman. Det var dog Nash, der præsenterede begrebet ligevægt, der giver dig mulighed for at blive garanteret at finde en løsning i de ultimative spil. Til ære for forfatteren af \u200b\u200bsætningen om eksistensen af \u200b\u200bligevægt i blandede strategier i de ultimative spil begyndte denne ligevægt at blive kaldt Nash's ligevægt.

I 1994 godkendte den første nobelpris for resultater inden for spilteori (John Nashu, Reinhard Zelten og John Harsanka) faktisk status for spilteorien som en uafhængig videnskabelig retning med sine opgaver og metoder til deres beslutninger. De næste få nobelpriser efter dette blev tildelt både grundlæggende teoretiske og spilresultater og for apps teorien om spil til en eller anden side af vores liv. I førende universiteter i verden i programmer og i økonomi, og på politiske videnskaber, er teorien om spil nødvendigvis inkluderet i standard sæt kurser. Ofte studerer psykologer og matematik det.

I dag, hvis du ser på de dele af store konferencer og på artikler i førende videnskabelige tidsskrifter på teorien om spil, er antallet af værker, der bruger apparatet af spilteori til løsning af anvendte opgaver, meget større end antallet af grundlæggende teoretiske og spil resultater. Den aktuelle tilstand af disciplin kan beskrives som følger: I teorien om spil er der dannet en ret kraftfuld kerne, videnreservoir, som giver mulighed for at opnå gode og interessante resultater for forskere fra relaterede regioner.

Ikke desto mindre er nye interessante forskningsområder og teorien om spil altid åbne. Så takket være udviklingen af \u200b\u200bberegningsteknologier fremgik nye teoretiske og gaming koncepter under hensyntagen til mulighederne og begrænsningerne af computermaskiner. Takket være dem har de mulighed for at løse nye opgaver. Resultatet af 2015 er på ligevægt i en af \u200b\u200bde versioner af poker, der er opnået ved Bowling, Berech, Johanson og Tammlin, er et vidunderligt eksempel på at bruge moderne teorier og teknologier.

Den matematiske teori om spil, der opstod i firserne i XX århundrede, anvendes oftest i økonomien. Men hvordan man simulerer folks opførsel i samfundet ved hjælp af spilkonceptet? Hvorfor studerer økonomer, på hvilken vinkel fodboldspillere bliver oftere slået, og hvordan man vinder i "sten, saks, papir" i deres foredrag fortalte seniorlæreren af \u200b\u200bDepartment of Microøkonomisk Analyse HSE Danil Fedorov.

John Nash og Blonde i baren

Spillet er enhver situation, hvor agentens fortjeneste ikke kun afhænger af sine egne handlinger, men også fra andre deltagers adfærd. Hvis du lader solitairehuset, fra synspunktet for økonom og teorien om spil, er dette ikke et spil. Det indebærer den obligatoriske tilstedeværelse af kollisioner af interesse.

I filmen "Mind Games" om John Nash, Nobelpristageren i økonomi, er der en scene med en blondine i baren. Det viser ideen, som en videnskabsmand og modtog en præmie, er ideen om en Nash-ligevægt, som han selv kaldte kontroldynamikken.

Spillet - Enhver situation, hvor gevinsten af \u200b\u200bagenter er afhængige af hinanden.

Strategi - en beskrivelse af spillerens handlinger i alle mulige situationer.

Exodus - en kombination af udvalgte strategier.

Så fra teorets synspunkt er spillerne i denne situation kun mænd, det vil sige dem, der beslutter. Deres præferencer er enkle: Blonde er bedre brunette, og brunetten er bedre end ingenting. Du kan handle på to måder: Gå til blondine eller til "din" brunette. Spillet består af et enkelt træk, beslutninger accepteres på samme tid (det vil sige, du kan ikke se, hvor resten gik, og efter at du kan lide dig selv). Hvis en pige afviser en mand, slutter spillet: det er umuligt at vende tilbage til det eller vælge en anden.

Hvad er den sandsynlige finale af denne spil situation? Det vil sige, hvad er dens stabile konfiguration, hvorfra alle vil forstå, hvad der gjorde det bedste valg? For det første, som Nash er korrekt, hvis alle går til en blondine, vil det ikke ende. Derfor foreslår forskeren, at alle skal gå til brunetter. Men så, hvis det er kendt, at alle går til brunetter, skal han gå til blonde, fordi det er bedre.

Dette er en reel ligevægt - resultatet, hvor man går til blonde, og resten - til brunetter. Det kan synes, at det er uretfærdigt. Men i en situation med ligevægt kan ingen fortryde sit valg: dem, der går til brunetter, forstår, at de stadig ikke fik nogen alligevel fra blonde. Således er balancen af \u200b\u200bNash en konfiguration, hvor ingen vælger at ændre den strategi, der vælges af alle. Det vil sige, at de afspejler i slutningen af \u200b\u200bspillet, forstår hver deltager, at selv at vide, hvordan andre skjuler, ville han gøre det samme. En anden måde kan kaldes dette resultat, hvor hver deltager optimalt besvarer resten.

"Sten saks papir"

Overvej andre spil for ligevægt. For eksempel i "sten, saks, papir" er der ingen ligevægt på Nash: I alle sine sandsynlige resultater er der ingen mulighed, hvor begge deltagere ville være tilfredse med deres valg. Ikke desto mindre er der et verdensmesterskab og World Rock Paper Scissors Society, indsamler spilstatistik. Selvfølgelig kan du forbedre dine chancer for at vinde, hvis du ved noget om den sædvanlige opførsel af mennesker i dette spil.

Netstrategien i spillet er en sådan strategi, hvor en person altid spiller det samme, vælger de samme bevægelser.

Ifølge World RPS-samfundet er stenen den mest valgte bevægelse (37,8%). Papir sæt 32,6%, saks - 29,6%. Nu ved du, at du skal vælge papir. Men hvis du spiller med dem, der også ved, behøver du ikke længere at vælge papir, fordi det samme forventes. Der er en berømt sag: I 2005 besluttede to Sotheby's auktionshuse "s og Christie" s, at en meget stor masse vil få - en samling af Picasso og Van Gogh med en startpris på $ 20 millioner. Ejeren foreslog, at de spiller "sten, saks, papir", og husstandsrepræsentanter sendte ham deres e-mail-muligheder. Sotheby s, som de senere fortalte, valgte, valgte papir. Vandt Christie s. Ved at beslutte, vendte de sig til en ekspert - en 11-årig datter af en af \u200b\u200bde øverste ledere. Hun sagde: "Stenen virker den stærkeste, så de fleste vælger ham. Men hvis vi ikke spiller med en meget dum nykommer, vil han ikke kaste en sten, det vil forvente, at vi vil gøre, og mig selv vil smide papiret. Men vi vil tænke på flytningen og kaste saks. "

Således kan du tænke fremad, men det vil ikke nødvendigvis lede dig til sejr, fordi du måske ikke ved din modstanders kompetence. Derfor er det nogle gange i stedet for netstrategier, mere korrekt at vælge blandet, det vil sige at træffe beslutninger tilfældigt. Så i "sten, saks, papir" balancen, som vi ikke fandt før, er kun i blandede strategier: Vælg hver af de tre rejsemuligheder med en sandsynlighed for en tredjedel. Hvis du vælger stenen oftere, justerer modstanderen sit valg. At kende det, vil du justere din, og ligevægt vil ikke fungere. Men ingen af \u200b\u200bjer begynder at ændre adfærd, hvis alle bare vælger en sten, sakse eller papir med samme sandsynlighed. Alt for i blandede strategier for tidligere handlinger er det umuligt at forudsige dit næste skridt.

Blandede strategier og sport

Flere alvorlige eksempler på blandede strategier er meget. For eksempel at tjene i tennis eller beat / tage en straf i fodbold. Hvis du ikke ved noget om din rival eller bare lege mod forskellige, vil den bedste strategi komme mere eller mindre tilfældigt. Professor i London School of Economics Ignacio Palacios-Wert I 2003 offentliggjorde et job i amerikansk økonomisk gennemgang, hvis essens var at søge efter en ligevægt på Nash i blandede strategier. Emnet for undersøgelsen af \u200b\u200bPalacios værd valgte fodbold og i forbindelse med dette så over 1.400 slag af straffen. Selvfølgelig er alt i sport, at alt er udstyret med snedigere end i "sten, saks, papir": der er en stærk fod af atleten, komme i forskellige vinkler, når du rammer al kraft og lignende. Nash-ligevægt Her ligger her i beregningen af \u200b\u200bmulighederne, det vil sige for eksempel bestemmelsen af \u200b\u200bgatens vinkler, hvor det er nødvendigt at slå for at vinde med større sandsynlighed, idet de kender deres svage og styrker. Statistik for hver fodboldspiller og balancen fundet i de blandede strategier, der blev fundet i det, viste, at spillerne kommer omtrent som økonomer forudsiger. Det er usandsynligt, at det er værd at sige, at folk, der slog en straf, læste lærebøger på spilteori og engageret i temmelig vanskelige matematik. Mest sandsynligt er der forskellige måder at lære at opføre sig optimalt på: Du kan være en strålende fodboldspiller og føle, hvad de skal gøre, men er en økonom og kigger efter en ligevægt i blandede strategier.

I 2008 mødte professor Ignasio Palacios-Werhta Abraham Grant, Chelsea Coach, der spillede Champions League finaler i Moskva. Forskeren skrev en note af træneren med anbefalinger om straffesparkskonkurrencen, som bekymrede adfærd af den rivaliserende målmand - Edwina van der Sara fra Manchester United. For eksempel, ifølge statistikker, slår det næsten altid af strejker på et gennemsnitligt niveau, og derudover skyndte sig til en naturlig side af en straf. Som vi bestemmes ovenfor, er det mere korrekt at randomisere deres adfærd, idet man tager højde for modstanderens viden. Da straffekontoen allerede var 6: 5, måtte Nicolas Anelka, Chelsea angriber score. Van der Sar spurgt af Anelka, vil ikke slå derhen.

Bundlinjen er, at alle tidligere strejker "Chelsea" blev anvendt i nøjagtigt højre fra stansningsvinklen. Vi ved ikke præcis, hvorfor, måske på grund af høringen af \u200b\u200ben økonomsat i den unaturlige side for dem, for ifølge statistikker, er Van der SAR klar til dette. De fleste chelsea fodboldspillere var højrehåndterer: rammer det rigtige hjørne i en unaturlig for sig selv, alle dem, undtagen terry scoret. Tilsyneladende var strategien, at Anelka slog der. Men Van der Sar, det ser ud til, at det forstod. Han kom ind i genial: Jeg viste det til venstre hjørne "der skulle jeg slå?", Fra hvad Anelka, sandsynligvis kom til rædsel, fordi det blev løst. I sidste øjeblik besluttede han at handle anderledes, ramte den naturlige side for sig selv, som var nødvendig af Van der Sarah, som tog dette slag og leverede "Manchester" sejr. Denne situation lærer et tilfældigt valg, for ellers kan din beslutning beregnes, og du vil tabe.

"Fængsels dilemma"

Sandsynligvis det mest berømte spil med hvilke universitetskurser på teorien om spil starter - dette er en "fangers dilemma". Ifølge legenden om to mistænkte i en alvorlig forbrydelse fangede de og låste i forskellige kameraer. Der er tegn på, at de lagrede våben, og det giver dig mulighed for at sætte dem i en kort kort tid. Bevis for, at de begik denne forfærdelige forbrydelse, er dog ikke. Hver enkelt individuelt fortæller efterforskeren om vilkårene i spillet. Hvis begge kriminelle er tilstået, vil begge sidde i tre år. Hvis man tilstrækkes alene, og medskyldigheden vil være tavs, vil den selvsikker vil komme straks, og den anden vil sætte i fem år. Hvis den første ikke erkender, og den anden vil videregive det, vil den første sidde i fem år, og den anden kommer straks. Hvis ingen er begrænset, vil begge være i et år for opbevaring af våben.

NASH Equilibrium Her er i den første kombination, når begge mistænkte ikke er tavse og begge sidder i tre år. Begrundelsen for hver sådan er: "Hvis jeg taler, vil jeg sidde i tre år, hvis du er tavs - i fem år. Hvis den anden vil være tavs, skal jeg også sige bedre: ikke at sidde bedre end at sidde på året. " Dette er en dominerende strategi: det er rentabelt at tale, uanset hvad en anden. Det har imidlertid et problem - tilgængeligheden af \u200b\u200ben mulighed er bedre, fordi at sidde i tre år værre end at sidde på et år (hvis du kun overvejer historien fra deltagerne og ikke tager højde for moralske spørgsmål) . Men det er umuligt at sidde i et år, for som vi forstod ovenfor, er det ufordelagtigt at være tavs af begge kriminelle.

Emploitering af pareto.

Der er en berømt metafor om den usynlige hånd af markedet, ejet af Adam Smith. Han sagde, at hvis slagteren selv begyndte at tjene penge for sig selv, vil det være bedre for alle: Han vil lave et lækkert kød, der vil købe en tyr for penge fra salget af tyre, som han igen også vil være nødt til at Gør lækkert at sælge dem. Men det viser sig, at denne usynlige hånd ikke altid virker, og sådanne situationer, når alle arbejder for sig selv, og alle er dårlige, meget.

Derfor tænker økonomerne og specialister i teorien om spil ikke på hver spillers optimale opførsel, det vil sige ikke om ligevægten på NASH, men om det resultat, hvor det bliver bedre end samfundet (i "Dilemma" Et samfund består af to kriminelle). Ud fra dette synspunkt er resultatet effektivt, når der ikke er nogen forbedring i pareto, det vil sige det er umuligt at gøre nogen bedre uden at gøre det værre end andre. Hvis folk simpelthen skifter til varer og tjenesteydelser, er det en forbipasserende forbedring: de gør det frivilligt, og det er næppe dårligt for nogen. Men nogle gange, hvis du bare giver folk til at interagere og ikke engang forstyrre, vil det, de vil komme til, ikke være optimale i pareto. Dette sker i "fanger dilemma". I det, hvis vi giver alle til at handle, da det er rentabelt, viser det sig, at alle er dårlige. Alle ville være bedre, hvis alle handler ikke optimalt for sig selv, det er stille.

Tragedie fællesskab

"Fængsels Dilemma" er en legetøjsstyliseret historie. Det er usandsynligt, at du forventer at være i en lignende situation, men lignende virkninger er overalt omkring os. Overvej et "dilemma" med et stort antal spillere, det kaldes undertiden samfundets tragedie. For eksempel på vejene - trafikpropper, og jeg beslutter at gå på arbejde: i bil eller med bus. Resten laver resten. Hvis jeg går på bilen, og alle vil beslutte at gøre det samme, vil der være et stik, men vi kommer komfortabel. Hvis jeg går på bussen, vil trafikproppen stadig være, men jeg vil være ubehagelig og ikke meget hurtigere, så et sådant resultat er endnu værre. Hvis det i gennemsnit foregår alt på bussen, så jeg gør det samme, hurtigt afsætte uden trafikpropper. Men hvis under sådanne forhold går i bil, vil jeg også dø hurtigt, men også med komfort. Så tilstedeværelsen af \u200b\u200ben trafikprop ikke afhænger af mine handlinger. Ligevægt på Nash her - i en situation, hvor alle vælger at gå i bil. Hvad ville ikke gøre resten, jeg vælger bedre en bil, fordi der vil være et stik eller ej, det er ukendt, men i hvert fald vil jeg blive komfortabel. Dette er en dominerende strategi, så i sidste ende går alt i bil, og vi har det, vi har. Statens opgave er at gøre en bus ride den bedste løsning i det mindste for nogle, så betalt adgang til centrum, parkering og så videre.

En anden klassisk historie er den rationelle uvidenhed om vælgeren. Forestil dig at du ikke kender resultatet af valget på forhånd. Du kan udforske programmet for alle kandidater, lytte til debatter og efter afstemning for det bedste. Den anden strategi er at komme til stedet og stemme som det faldt eller den, der blev mere sandsynligt vist på tv. Hvilken adfærd er optimal, hvis det aldrig afhænger af min stemme, hvem vil vinde (og i en 140 millioner land vil en stemme aldrig bestemme noget)? Selvfølgelig vil jeg have, at landet er en god præsident, men jeg ved, at ingen andre vil studere kandidatprogrammerne omhyggeligt. Derfor må du ikke bruge tid - den dominerende adfærdsstrategi.

Når du bliver kaldt til at komme til lørdagen, vil ingen af \u200b\u200bnogen i nogen afhænge af, gården bliver ren eller ej: Hvis jeg forlader en, kan jeg ikke fjerne alt, eller hvis alt kommer ud, så kommer jeg ikke ud , fordi alt og uden mig fjernet. Et andet eksempel er godstransport i Kina, som jeg lærte i den vidunderlige bog i Stephen Landswburg "Economist on sofaen". 100-150 år siden i Kina blev distribueret en masse godstransport på: Alt var i form i en stor krop, som blev trukket af syv personer. Kunder betalt, hvis lasten blev leveret til tiden. Forestil dig at du er en af \u200b\u200bdisse seks. Du kan gøre en indsats og trække vores bedste, og hvis alle gør det, vil lasten komme i tide. Hvis nogen ikke gør denne, vil alle komme til tiden. Alle mener: "Hvis alt resten trækker som det burde, hvorfor gør det, og hvis alle de andre ikke er trukket med al magt, så kan jeg ikke ændre noget." Som følge heraf, med leveringstidspunktet, var alt meget dårligt, og bevægelserne selv fandt en vej ud: de begyndte at ansætte syvende og betale ham penge for at han kunne dampede doven. Selve tilstedeværelsen af \u200b\u200ben sådan person tvang alle til at arbejde sammen med al sin magt, for ellers alle faldt i en dårlig balance, hvorfra den er adskilt for at komme ud af overskud.

Det samme eksempel kan observeres i naturen. Et træ, der vokser i haven, adskiller sig fra, hvad der vokser i skoven, dens krone. I det første tilfælde omgiver den hele bagagerummet, i den anden - er kun øverst. I skoven er det ligevægt på Nash. Hvis alle træerne var enige om og voksede det samme, ville de ligeligt fordelte antallet af fotoner, og alt ville være bedre. Men det er urentabelt for nogen individuelt. Derfor ønsker hvert træ at vokse lidt højere.

Forpligtelsesanordning.

I mange situationer kan en af \u200b\u200bdeltagerne i spillet få brug for et værktøj, der vil overbevise andre om, at han ikke bluffer. Det hedder engagementsanordning. For eksempel forbyder lovgivningen i nogle lande at betale indløsningen af \u200b\u200bmennesker til abductors for at reducere de kriminelle motivation. Denne lovgivning virker dog ofte ikke. Hvis din slægtning er fanget, og du har mulighed for at gemme den, omgå loven, vil du gøre det. Forestil dig den situation, som loven kan omgå, men slægtninge viste sig for at være de fattige og løsepenge til at betale det ingenting. Kriminelle i denne situation har to måder: lad gå eller dræbe offeret. Han kan ikke lide at dræbe, men han kan ikke lide fængsel mere. Det offer, der igen blev frigivet, kan enten give indikationer, så kidnapperen blev straffet, eller være tavs. Det bedste resultat for kriminel: Lad det offer, han ikke vil videregive det. Offret ønsker også at blive frigivet og give vidnesbyrd.

Equilibrium Her er, at terroristen ikke ønsker at blive fanget, og derfor dør offeret. Men dette er ikke en ligevægt ved pareto, fordi der er en mulighed, hvor alt er bedre - offeret ofres for frihed. Men for dette skal du gøre det for at være tavse, det var rentabelt. Et eller andet sted læser jeg muligheden, når hun kan bede terroristen om at arrangere en erotisk fotosession. Hvis kriminel er plantet, vil dens medskyldige poster på internettet. Nu, hvis kidnapperen forbliver fri - det er dårligt, men billederne i åben adgang - endnu værre, derfor er det en ligevægt. For offeret er dette en måde at holde sig i live på.

Andre eksempler på spil:

Model Berran.

Da vi taler om økonomien, overvej det økonomiske eksempel. I Berran-modellen sælger to butikker det samme produkt, der køber det fra producenten til en pris. Hvis priserne i butikkerne er de samme, så omtrent det samme og deres overskud, fordi købere vælger butikken tilfældigt. Den eneste saldo på Nash her er at sælge varer til kostpris. Men butikker vil tjene. Derfor, hvis man sætter prisen på 10 rubler, vil den anden reducere det for en øre, og derved have øget sine indtægter to gange såvel som alle købere vil gå til ham. Derfor reducerer markedsdeltagerne rentabelt priserne og derved distribuerer deres overskud indbyrdes.

Række

Overvej eksempler på valg mellem to mulige ligevægter. Forestil dig, at Petya og Masha går hen imod hinanden i en smal vej. Vejen er så smal, at begge skal gå til siden af \u200b\u200bvejen. Hvis de beslutter at dreje til venstre eller højre fra sig selv, vil de simpelthen bryde. Hvis man vender til højre, og den anden venstre fra sig selv eller omvendt, sker der en ulykke. Hvordan vælger du, hvor de skal hen? For at hjælpe med at kigge efter en ligevægt i sådanne spil, er der for eksempel vejregler. I Rusland skal alle dreje til højre.

I den sjove Chiken, når to mennesker går med høj hastighed mod hinanden, er der også to ligevægter. Hvis begge afkøles til vejsiden, en situation, der kaldes Chiken ud, hvis begge ikke er foldet, så dør i en forfærdelig ulykke. Hvis jeg ved, at min modstander går lige, finder jeg det rentabelt for mig at overleve. Hvis jeg ved, at min modstander vil spise, så er det rentabelt for mig at gå direkte for at få 100 dollars. Det er svært at forudsige, hvad der sker faktisk, men hver af spillerne har deres egen metode til at vinde. Forestil dig at jeg sikrede rattet, så det ikke kan drejes, og viste det til min modstander. At vide, at jeg ikke har noget valg, vil modstanderen hoppe.

Qwerty-effe.

Nogle gange er det meget svært at flytte fra en ligevægt til en anden, selvom det betyder at være til gavn for alle. QWERTY layoutet blev oprettet for at bremse udskrivningshastigheden. Da alting blev trykt for hurtigt, ville hovedet på den trykte maskine, der slog på papir, klamrer sig til hinanden. Derfor stod Christopher Scholes ofte i nærheden af \u200b\u200bbogstaverne så meget som muligt. Hvis du går til tastaturindstillingerne på din computer, kan du vælge DVORAK-layoutet der og udskrive meget hurtigere, da der ikke er problemer med analoge trykte maskiner. Gården forventede, at verden ville gå til sit tastatur, men vi lever stadig med QWERTY. Selvfølgelig, hvis vi gik til gården af \u200b\u200bgården, ville den fremtidige generation være taknemmelig for os. Vi alle ville vedhæfte indsatsen og reinkound, som følge heraf ville være en balance, hvor alt er trykt hurtigt. Nu er vi også i ligevægt - i det dårlige. Men det er ikke fordelagtigt at være den eneste, der trækker sig på, for i enhver computer, bortset fra personlig, vil det fungere ubehageligt.