Spring til indhold

Fangernes dilemma

Fra Wikipedia, den frie encyklopædi

Fangernes dilemma eller fangens dilemma er et berømt spil fra spilteorien. Det er et spil mellem to deltagere, der kan vælge enten at optræde imødekommende eller aggressivt overfor modparten. Spillets paradoks er, at det er individuelt rationelt for begge spillere at optræde aggressivt, men det medfører samtidig en ligevægt, der giver begge et dårligere udbytte, end hvis de begge havde været imødekommende. Navnet skyldes, at spillet ofte præsenteres som en historiefortælling, hvor de to spillere er to fængslede personer, der afhøres af politiet. De kan enten vælge at vidne imod den anden fange (optræde aggressivt) eller holde mund med, hvad de ved om modparten (være imødekommende). Der er dog egentlig tale om et abstrakt og generelt spil, der kan afspejle mange forskellige situationer.

Spillet tilsigter at vise, hvordan samarbejde og mistillid påvirker beslutningstagning, især når man ikke kan kommunikere direkte. Det illustrerer, hvordan to rationelle individer kan vælge at handle på en måde, der ikke er optimal for nogen af dem, fordi de ikke kan stole på hinanden. Spillet viser, hvordan samarbejde og mistillid påvirker beslutningstagning, især når spillerne ikke kan indgå bindende aftaler med hinanden.

Teorien bag fangernes dilemma stammer fra spilteori, som er en gren af matematikken, der analyserer strategiske beslutninger mellem to eller flere aktører. Det centrale teoretiske begreb kaldes Nash-ligevægt, navngivet efter John Forbes Nash. Dilemmaets struktur bygger på fire delelementer, som rangordnes efter de mulige udfald:

  • Fristelsen til at opnå et positivt udfald
  • Belønningen for at samarbejde
  • Den mulige straf
  • Forræderens mulige belønning

Spillernes overvejelser resulterer i tre mulige udfald:

  • Hvis begge nægter at tilstå, får de begge en mild straf (fx 1 år)
  • Hvis den ene tilstår og den anden tier, går den, der tilstår, fri, mens den anden får en hård straf (fx 10 år)
  • Hvis begge tilstår, får de begge en mellemstraf (fx 5 år).[1]

Spillets forløb

[redigér | rediger kildetekst]

Spillet spilles af to personer, som hver især kan vælge at samarbejde med eller forråde den anden. Dette skaber et dilemma.

To mistænkte er blevet anholdt af politiet. De to personer holdes adskilt, så de ikke kan kommunikere, og samtidig holdes uvidende om den anden parts vidnesbyrd. Politiet har ikke beviser nok til at få dem dømt for deres grove forbrydelse, men de kan få de mistænkte fængslet i et halvt år for en mindre forbrydelse. I den oprindelige version giver politiet hver af de mistænkte dette valg: De kan vælge at forråde den anden eller holde mund. Hvis begge holder mund, får de hver et halvt års fængsel, hvis den ene forråder den anden og den anden holder mund, slipper forræderen fri og den anden får ti års fængsel, og hvis begge forråder den anden, får de hver fem års fængsel. Skal de mistænkte forråde den anden, eller skal de holde mund?
Holder mund Forråder
Holder mund -½,-½ -10, 0
Forråder 0, -10 -5, -5
Fangernes dilemma

Modellen viser, at begge fanger har incitament til at tilstå for at opnå en kortere straf, uanset hvad den anden gør. Det betyder, at det mest sandsynlige udfald er, at begge tilstår (”snyder”), selvom de ville få en mildere straf ved begge at tie (samarbejde). Det bedste resultat for gruppen opnås altså kun, hvis begge samarbejder, men den rationelle egoistiske strategi er at snyde[1] I illustrationen vises det samme dilemma skrevet op som en udbyttematrix. Det ses, at uanset hvad den anden fange gør, får man den korteste straf, hvis man forråder den anden ved at tilstå. Men hvis begge forråder den anden, får begge fem års fængsel, hvilket er værre for begge parter end det halve års fængsel, de ville få hvis begge holdt mund. Spillets formål er således at undersøge betingelserne for, at individuelle rationelle beslutninger kan give kollektive gevinster.[2]

I denne klassiske udgave er udfaldet a priori deterministisk, idet den rationelle beslutning er at begge tilstår. Uanset om strafudmålingen ændres vil udfaldet være det samme, således at dilemmaet fastholdes. Hvis spillet gentages kan denne determinisme omgås ved en "gengæld for gengæld"[3][note 1] Formelt kan hver spillers optimale strategi udregnes ved at sammenligne payoff-værdierne og vælge den handling, der maksimerer deres egen forventede gevinst, når modpartens mulige valg er givet. Dette er grundlæggende i overensstemmelse med Rational choice-teoriens teoreme.[4][note 2]

Den teoretiske baggrund for spilkonceptet kan illustreres i en matematisk formel. Hvis begge samarbejder, får de belønningen "R" (fra engelsk:Reward). Hvis den ene fristes til at snyde og den anden samarbejder: snyderen får belønning for at lade sig friste "T" (fra engelsk: Temptation), samarbejderen får "sorteper" (på engelsk S (Sucker). Hvis begge fristes til at snyde, før begge en straf "P" (fra engelsk:Punishment)[5]

Nu gælder forholdet: T > R > P > S. Det vil sige, at fristelsen (T) er højere end belønningen for at samarbejde (R), som igen er højere end straffen for gensidig snyd (P). Dårligste udfald opstår, hvis man bliver snydt, mens man selv samarbejder (S).

Dette benyttes i praksis til at understrege, at gensidig tillid og evnen til at indgå bindende aftaler er af afgørende betydning, hvis det i et socialt system skal forhindres, at rationelle aktører ofte med at træffe valg, der giver et dårligere samlet resultat, hvilket kaldes for en suboptimal eller inefficient ligevægt.[5]

Opfindelsen af spillet tilskrives normalt Merrill Flood og Melvin Dresher, to ansatte ved tænketanken RAND Corporation, der i 1950 gennemførte et eksperiment, hvor de lod to af deres kollegaer spille et spil med strukturen fra Fangernes Dilemma 100 gange i træk. Resultaterne fra eksperimentet blev offentliggjort i 1952 i en RAND-rapport. Den ledsagende illustrative historie med fanger og fængselsstraffe tilskrives den canadiske matematiker Albert W. Tucker i et forsøg på at gøre ideen bag Flood og Dreshers spil mere tilgængeligt for en gruppe psykologer fra Stanford University.[6]

En af de førende teoretikere på området er Robert Axelrod, som har opstillet teoretiske forudsøtninger og udgiver flere publikationer om emnet.[note 3]

Hvis fangernes dilemma spilles et endeligt antal gange, og begge spillere ved dette, så er den dominerende strategi ifølge Nash-ligevægten at snyde i alle runder. Beviset er induktivt: man kan lige så godt snyde i sidste runde, da modstanderen ikke får en chance for at vende tilbage. Derfor vil begge spillere forsøge at snyde i sidste runde. Det samme grundprincip gælder, hvis spillets længde er ukendt, men har en kendt øvre grænse.

For at et bedre samarbejde kan opstå mellem rationelle spillere, skal antallet af runder være ukendt eller uendeligt. I så fald er "altid snyd" ikke nødvendigvis længere en dominerende strategi. Et centralt begreb i denne forbindelse, især når spillet gentages flere gange, er strategien ”Tit for Tat”. Kernen i denne strategi er, at man i første runde samarbejder, og derefter gør præcis det samme som modparten gjorde i forrige runde: hvis den anden samarbejder, samarbejder man selv; hvis den anden snyder, snyder man også. Strategien får derfor ikke den oprindelige betydning, fordi den både belønner samarbejde og straffer snyd.

Denne strategi er oprindelig påvist af Robert Aumann i en artikel fra 1959, hvor konklusionen er, at rationelle spillere, der gentagne gange interagerer i et spil uden fast afslutning, kan få en gevinst ved at samarbejde.[3] Omvendt har sandsynligheden for at samarbejde en tendens til at stige over tid, fordi der opstår en slags "stille aftale" mellem deltagerne. I eksperimentelle situationer kan samarbejde forekomme, selv når begge deltagere ved, hvor mange runder der spilles.[7] Ifølge et eksperimentelt studie fra 2019 i American Economic Review, der undersøgte hvilke strategier rigtige forsøgspersoner brugte i gentagne fangernes dilemma-spil med overvågning, var de mest valgte strategier altid at snyde.[8]

De eksperimentelle forsøg har medført, at flere forskere har angivet muligheder for ar udvide analysen med supplerende modeller. En af mulighederne er at inddrage stokastiske variable, hvor spillernes valg ikke er fastlagt a priori, men i stedet bestemmes på baggrund af sandsynligheder.[9] Det vil sige, at nu har spillerne et valg mellem at samarbejde eller snyde med den angivne sandsynlighed.

På denne måde kan man estimere variationer i adfærden, hvilket ofte er mere realistisk i virkelige situationer end en forudsætning om forudbestemt adfærd. I praksis betyder det, at sandsynligheden for spillernes valg benyttes til at beregne den forventede gevinst for hver enkelt strategi.[10]

Stokastiske strategier kan suppleres med at inddrage Markov-kæder i analysen. Her antages det, at spillet gentages flere gange, og at sandsynligheden for en spillers næste valg afhænger af den forrige spiltilstand. Hver mulig kombination af handlinger (begge samarbejder, én snyder, begge snyder) udgør en tilstand i Markov-kæden.

Overgangssandsynlighederne mellem disse tilstande kan opstilles i en overgangsmatrix, hvor hver indgang angiver sandsynligheden for at gå fra én position til en anden, givet spillernes strategier. Ved at analysere denne matrix kan man finde den langsigtede sandsynlighed for at befinde sig i hver enkelt tilstand. Denne fordeling gør det muligt at beregne den gennemsnitlige payoff for hver spiller over tid, hvilket giver et mere nuanceret billede af strategiernes effektivitet i gentagne spil.[11]

En Markov-kædeanalyse kan typisk anvendes til at undersøge dynamikken mellem samarbejde og snyd. Teorien bag Markovanalyserne omfatter overgangsligninger og ligevægtsligninger, hvor overgangsligninger beskriver udviklingen af sandsynligheder fra runde til runde, mens ligevægtsligninger beskriver den stationære fordeling i situationer, hvor sandsynlighederne ikke længere ændrer sig.[12][13][14]

Situationer, som minder om fangernes dilemma, angives som velkendte i mange virkelige sammenhænge. Det nævnes ofte, at den værste situation, man kan havne i, er at tage sin del af slæbet, uden at der kommer noget ud af den samlede indsats. Man betaler så at sige prisen to gange.

Et eksempel er to konkurrerende handlende, som deltager i en priskrig. Hver af de handlende ved, at hvis han sænker sin pris, vil han tiltrække nogle af konkurrentens kunder og kan dermed forøge sin profit. Begge vælger derfor at sænke priserne, hvormed resultatet bliver, at ingen af dem får flere kunder, men begge en lavere profit end før. Ligeledes kan landmænd, der forøger deres produktion, anskues som eksempler på dilemmaet. En enkelt landmand kan tjene flere penge ved at forøge sin produktion, men gør alle landmændene det, bliver markedet oversvømmet, og priserne falder til ugunst for alle udbyderne.[15]

I den akademiske verden anvendes spillet ofte til at opstille modeller i undervisningen på de videregående uddannelser. I økonomi anvendes det typisk til at analysere konkurrencesituationer mellem virksomheder, der har valget mellem at samarbejde om prisfastsættelse eller konkurrere ved at sænke priserne. Selvom det ville være bedst for begge at holde priserne høje, ender de ofte med at konkurrere, hvilket kan det føre til en mindre gunstig løsning for alle involverede parter.[16]

I faget international politik nævnes fx eksemplet stater, der deltager i et våbenkapløb, Hvis to stater begge samtidig anskaffer sig nye dyre våben for at blive militært overlegne, bliver de begge fattigere, uden at et af dem får et afgørende militært forspring.[15] Konceptet er også blevet anvendt til at analysere dilemmaer blandt lande, der skal beslutte sig for, om de skal reducere CO₂-udledningen. Hvis alle samarbejder, gavner det miljøet, men samtidig er der er et incitament til at snyde og lade andre tage byrden. Resultatet kan blive, at ingen reducerer udledningen tilstrækkeligt, hvilket antages at være til skade for alle parter på lang sigt.

Ved et ”fangernes dilemma” har det enkelte land et incitament til at undslå sig forpligtelser og lade andre påtage sig byrden. Derfor kan det let ende med, at ingen tager nogen del af byrden.[17]

I biologi anvendes Fangernes dilemma ligeledes primært til at forstå adfærdsmønstre. I forbindelse med biologiske systemer bruges det til at analysere, "hvorfor nogle arter udviser samarbejde, mens andre udviser konkurrence. Det kan også bruges til at forstå, hvordan samarbejdende adfærd kan udvikle sig gennem evolutionære processer."[16]

I fagene sociologi og adfærdspsykologi er spillets forudsætninger omstridte. Nobelprisvinderen i økonomi Elinor Ostrom har peget på, at sociale situationer i praksis ofte er mere komplekse end simple matrixmodeller kan opfange. Hun bringer ligeledes eksempler på, at mennesket har egenskaber, der i praksis kan udvikle gensidig tillid, fælles normer og gensidig forståelse. Derfor er samarbejde muligt, selv når den snævert gevinstmaksimerende strategi ville være at snyde.[18]

Også Herbert Gintis og andre med interesse i adfærdsøkonomien har påpeget, at menneskers beslutninger ikke altid følger den snævre, egeninteresse-baserede logik, som modellen antager. Disse kritikere fremhæver især betydningen af kommunikation, gentagne spil og sociale relationer, som kan ændre udfaldet markant i forhold til det klassiske fangernes dilemma. Dette er i overensstemmelse med begrebet "begrænset rationalitet".[19]

  1. 1 2 Poundstone 1993, s. 118
  2. Axelrod (2006), s. 113-114
  3. 1 2 Aumann, Robert J. (2016-03-02), "16. Acceptable Points in General Cooperative n-Person Games", Contributions to the Theory of Games (AM-40), Volume IV (engelsk), Princeton University Press, s. 287-324, doi:10.1515/9781400882168-018, ISBN 978-1-4008-8216-8, hentet 2024-05-14
  4. Blume, Lawrence E. og David Easley (2008): "rationality." The New Palgrave Dictionary of Economics. Second Edition. Red. Steven N. Durlauf og Lawrence E. Blume. Palgrave Macmillan, 2008. The New Palgrave Dictionary of Economics Online. Palgrave Macmillan. Besøgt 2. oktober 2017.
  5. 1 2 Watson, Joel (2013). Strategy: An Introduction to Game Theory. W. pany.
  6. Kuhn, Steven (24. oktober 2025). "Prisoner's Dilemma". The Stanford Encyclopedia of Philosophy. Metaphysics Research Lab, Stanford University. Hentet 2. december 2025.
  7. Cooper, Russell; DeJong, Douglas V.; Forsythe, Robert; Ross, Thomas W. (1996). "Cooperation without Reputation: Experimental Evidence from Prisoner's Dilemma Games". Games and Economic Behavior. 12 (2): 187-218. doi:10.1006/game.1996.0013.
  8. Dal Bó, Pedro; Fréchette, Guillaume R. (2019). "Strategy Choice in the Infinitely Repeated Prisoner's Dilemma". American Economic Review (engelsk). 109 (11): 3929-3952. doi:10.1257/aer.20181480. ISSN 0002-8282. S2CID 216726890.
  9. Blitzstein, Joe; Hwang, Jessica (2014). Introduction to Probability. CRC Press. ISBN 9781466575592.
  10. L. Castañeda; V. Arunachalam & S. Dharmaraja (2012). Introduction to Probability and Stochastic Processes with Applications. Wiley. s. 67. ISBN 9781118344941.
  11. Sheldon M. Ross (1996). Stochastic processes. Wiley. s. 174 and 231. ISBN 978-0-471-12062-9.
  12. Parzen, E. (1962) Stochastic Processes, Holden-Day. ISBN 0-8162-6664-6 (Table 6.1)
  13. Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms, OUP. ISBN 0-19-920613-9 (entry for "Markov chain")
  14. Dodge, Y. The Oxford Dictionary of Statistical Terms, OUP. ISBN 0-19-920613-9
  15. 1 2 Davis, Morton D., Brams, Steven J.. "game theory". Encyclopedia Britannica, 21 november 2025, besøgt 3. december 2025.
  16. 1 2 Fangernes Dilemma: En Dybdegående Forklaring og Analyse, House of energy, hentet 5. december 2025
  17. "Cepos: Klimatopmøder uden synlige spor - Altinget". www.altinget.dk. 2015-11-12. Hentet 2025-12-05.
  18. Ostrom, Elinor: Governing the Commons. Cambridge University Press, 1990.
  19. Flyvbjerg, Bent (1991):Rationalitet og magt, Bd I-II, Akademisk Forlag, ISBN 9788750029939
Noter
  1. "Tit for tat" er et engelsk udtryk for en strategi, hvor den ene fanges beslutning afhænger af den anden fanges beslutning i den foregående runde. Dermed illustrerer det fangernes dilemma, hvordan rationelle valg på individniveau kan føre til mindre optimale resultater for gruppen som helhed.
  2. Netop tesen om egennytte og rationelle valg er omstridt iblandt de førende teoretikere, jf. artiklen Beslutningstagen
  3. Han udfolder bl.a. teorien og dens implikationer i: Axelrod (2006)
  • Bjørnskov, Christian: Samfundsøkonomi – Teori og praksis. Hans Reitzels Forlag, 2016.
  • Kurrild-Klitgaard, Peter: Spilteori og samfundsvidenskab. Jurist- og Økonomforbundets Forlag, 2006.

Engelsksproget

[redigér | rediger kildetekst]