18 maj 2016

Donald Trump som manipulerbar robot


Journalisten Michael Wolraich gör i senaste numret av Rolling Stone ett försök att analysera Donald Trump som spelteoretisk robot. Grundobservationen Wolraich gör är att Donald Trump är snäll mot dem som är snälla mot honom (till exempel Vladimir Putin) och dum mot de som är dumma mot honom (till exempel Fox News-journalisten Megan Kelly). Han agerar helt enkelt i linje med optimalt beteende i en av de mest väl kända spelteoretiska uppställningarna: Fångarnas dilemma.

Fångarnas dilemma handlar om två fångar, A och B, som båda ställs inför samma val. Varje fånge kan antingen tjalla på den andre eller samarbeta med sin medfånge genom att hålla tyst. Båda fångarna vet att den andre fången har samma val, men de kan inte kommunicera med varandra. Tjallar A medan B håller tyst får A en belöning i form av straffrihet, medan B åker in på ett längre fängelsestraff (t.ex. 10 år). Tjallar båda, åker båda in på ett medellångt straff (4 år), medan om båda håller tyst får de bara ett kort straff (1 år).

Lägger man samman straffen för de båda fångarna tjänar de på att inte tjalla (1 + 1 = 2 år), men det är förstås frestande att kunna få gå helt fri även om den sammanlagda strafftiden då blir högre (10 + 0 = 10 år) och så löper man förstås risken att den andre också tjallar (4 + 4 = 8 år). Den värsta risken är att själv låta bli att tjalla men bli blåst och hamna 10 år i fängelse.

Hur ska man tänka om man hamnar i den här situationen? Se rationellt på problemet. Säg att du är A. Om B håller tyst tjänar du på att tjalla, eftersom du då går fri i stället för att få tillbringa ett år i fängelse. Om B å andra sidan väljer att tjalla på dig, tjänar du också på att tjalla, eftersom du då får en mindre tid i fängelse – fyra år i stället för tio.

Det verkar alltså som om du alltid tjänar på att tjalla. Det var väl inget svårt dilemma att lösa?

Dilemmat uppstår när spelet upprepas. Om man spelar fångarnas dilemma med samma medspelare om och om igen så kommer det löna det sig för varje individ att låta bli att tjalla och i stället samarbeta. Den totala fängelsetiden för dig som spelare blir då som lägst över många spelomgångar. Du hamnar hela tiden i fängelse, men bara i ett år (båda samarbetar) i stället för i fyra år (båda tjallar).

Fast finns det inget snyggt sätt att fuska sig till en fördel? Om man till exempel lyckas med konststycket att tjalla någon gång ibland, då skulle man ju få ännu större fördel? Kanske kan man komma på någon sorts listig formel att arbeta efter för att verkligen minimera sina år i fängelse? Men samma sak gäller rimligtvis motspelaren. Denne arbetar också för att försöka minimera sina år i fängelset. Hur ska man gardera sig mot något sådant?

Två forskare, statsvetaren Robert Axelrod och evolutionsbiologen Bill Hamilton tog den här frågan ett steg vidare i två klassiska datorturneringar där de inbjöd vem som ville vara med att skicka en strategi för upprepat spel av fångarnas dilemma. Många spelteoretiker skickade in strategier, den ena mer avancerad än den andra. Det fanns exempelvis en som modellerade motståndarens beteende och använde matematiska beslutsformler för att komma fram till nästa steg. Dessutom kördes strategier som samarbetade och tjallade helt slumpmässigt. Och strategier som alltid tjallade, eller alltid samarbetade.

Vann gjorde dock en av de enklaste strategierna av dem alla: tit-for-tat. Strategin hade bara två regler: Första gången, samarbeta. Andra gången, gör vad din motståndare gjorde föregående gång (på svenska: ”svara med samma mynt”). Inget sätt att bete sig på fungerade bättre i längden.*

Det är enligt den här principen Donald Trump verkar agera, menar Wolraich. Är någon vänlig mot honom är han vänlig tillbaka. Ett exempel på detta gäller Vladimir Putin, som kallat Trump för ”briljant och begåvad person”. Efter detta har Trump i princip inte haft ett ont ord att säga om Putin. De som har kritiserat Trump har å andra sidan blivit mobbade från hans pulpet på ett sätt som saknar motstycke i amerikansk historia. Motståndarna i de republikanska primärvalen har till exempel gått under i en dödsspiral av förolämpningar.

Problemet är att det här gör Trump extremt lättmanipulerad. För någon som påstår sig vara en bra förhandlare är det här förstås problematiskt. Vill du ha någonting, säg bara något snällt om honom. Det här är något slipade politiker förstås vet att använda, så det är ur den synvinkeln inget märkligt att Putin omfamnar Trump.

Finns det någon spelteoretisk visdom att använda för Hillary Clinton mot den här typen av motståndare? Ja, menar Wolraich. Hon måste vara smart så hon inte hamnar i ett ständigt utbyte av förolämpningar – Trump excellerar i sådant. Samtidigt kan hon inte låta förolämpningar gå obesvarade, det verkar svagt.

Så det handlar om att vara statsmannalik själv och låta någon annan göra det smutsiga arbetet. Trump sluggar mot alla, så att locka honom i en sådan fälla torde inte vara svårt. Idealet vore att hitta en kvinna eller någon från en minoritetsgrupp som kunde agera förkämpe så att Trump hela tiden tvingas slå nedåt.

Men vad innebär detta för den spelteoretiska förståelsen av situationen? Alldeles nyss var ju Trumps strategi ju den optimala? Dock – sådana insikter gäller bara inom spelet. Står man utanför och analyserar vad som händer går det alldeles utmärkt att manipulera förutsättningarna, till exempel genom att lägga till fler spelare, som i det här fallet. Så svårt är det egentligen inte att besegra någon som agerar i enlighet med några rader programmeringskod. Men då måste man förstås först lista ut vad det är för system som ska manipuleras.

Så vad tro ni - har Wolraich rätt i sin analys?

* Forskare har sedermera noterat att historien inte är riktigt så enkel och att det faktiskt finns andra tänkbara stabila strategier. Tit-for-tat är till exempel inte förlåtande mot andras misstag, utan hamnar i en oändlig cirkel av hämnd efter att en tit-for-tat-opponent har tjallat en gång. Man har därför konstruerat mer avancerade strategier som tit-for-two-tats (som straffar först efter att motspelaren tjallat två gånger), generös tit-for-tat (som förlåter angiveri med en specificerad sannolikhet), och win-stay, lose-shift (som gör samma sak som förra gången om den interaktionen lyckades, annars byts strategi). I det stora hela står sig dock de generella slutsatserna. Det mest stabila sättet att samarbeta på i en interaktion mellan två parter där det ingår en initial kostnad är att besluta vad du ska göra utifrån nyliga interaktioner med samarbetspartnern.

8 kommentarer:

Lennart W sa...

Dilemmat vid EN spelomgång är alltså att det är rationellt för båda, var för sig, att tjalla, trots att båda förlorar på det jämfört med om de kunde samarbeta och lita på varandra.

Nu är det iofs så att i det verkliga livet så är det ofta så att fångar INTE tjallar i såna här situationer. Varför? Kanske inte alls för att de irrationella. T ex kanske den verkliga spelplanen inte ser ut riktigt så där. Tjallar du på maffian så blir det noll år i fängelse men du blir mördad istället. För att spelteori ska säga något om verkligheten så måste man ha med de verkliga utfallen, eller iaf såsom dessa uppfattas av aktörerna.

Men spelar man gång på gång så ändras som sagt förutsättningarna jmf m bara en gång. Den optimala strategin har ofta ett slumpelement. Gör si eller så med 30% resp 70% sannolikhet. Iaf med någon sorts utfall är det nog bra om man i tit-for-tat prövar ibland med en generösare respons.

Trump... Intressant analys. Dock är det väl inget som garanterar att han inte plötsligt byter strategi? Speciellt nu när hans tit for tat-strategi är avslöjad. Det han ju ffa inte vill vara är förutsägbar av sina motståndare på ett sätt som de kan utnyttja till sin fördel.

---

Vill bara passa på att tipsa om en nätt liten bok om spelteori som var min egen introduktion till ämnet:

Game Theory: A Very Short Introduction av Ken Binmore.

Matten är egentligen ganska enkel. Tyckte det här var väldigt bra på nätet (kan också köpas från t ex Amazon):

The Compleat Strategyst av J.D. Williams på RAND.

Patrik Lindenfors sa...

Jag gjorde ett tappert försök att sätta mig in lite mer grundligt i spelteori för några år sedan, med hjälp av just Binmore. Han har skrivit flera böcker i ämnet, så jag skaffade tre. Det visade sig dock att han återanvänder text, så vissa nyckelförklaringar är helt identiska i böckerna. Detta var något jag klagade på när jag senare stötte på honom på en konferens, men han tyckte mer att det var jag som var konstig som läste tre böcker om samma ämne från samma författare. Jag var tydligen den förste som klagat. Nu funderar jag på om han räknat ut det där. I vilket fall är han en väldigt klok person som gör just det du efterlyser, Lennart, nämligen envisas med att dra in verkligheten i resonemangen hela tiden.

Lennart W sa...

Alltså, jag håller med om att han inte förklarar så bra i boken HUR man räknar ut vilka strategier som är bäst. Var just pga en viss frustration över detta (och efter egna mer eller mindre lyckade försök) som jag även läste annat, t ex The Compleat Strategyst (som faktiskt även är ganska kul skriven). Dock är Binmores bok (very short introduction) bra för att den berör så väldigt många olika områden i spelteori, så man får lite hum om hur brett ämnet är.

Filmen A Beautiful Mind om den psykiskt sjuke Nobelprisbelönade och geniala spelteoretikern John Nash kan nog också ge en liten glimt.

Göran sa...

Bästa strategin är att bägge blir etiska och gottgör sina brott och blir goda samhällsmedborgare. Ingen som tänkte på det?

Erik M sa...

Göran,

Vi vet inte om fångarna faktiskt är skyldiga eller båda eller någon av dem är oskyldigt anklagade.

Göran sa...

Erik M,
i så fall ändras förutsättningarna drastiskt. I en fungerande rättsstat så borde i så fall risken för att någon skulle tjalla framgångsrikt vara väldigt liten och möjligheten att bevisa sin oskuld vara väldigt god.

Erik M sa...

Göran,

Nej, det ändrar inte förutsättningarna det minsta. Scenariots centrala premisser är att polisen kan och kommer att straffa fångarna på olika sätt beroende på om de anger varandra eller ej. Fångarnas mål är att tillbringa så lite tid som möjligt i fängelse och deras eventuella oskuld är ovidkommande. Vi vet inte om landet scenariot utspelar sig i är en fungerande rättsstat, men utifrån det lilla vi vet låter det knappast så.

Man kan säga att detta scenario är orealistiskt, men då missar man lite av poängen. Det är lite som att höra paradoxen med Theseusskeppet och avfärda den med invändningen att Theseus och hans skepp är mytologiska och inte fanns på riktigt.

Göran sa...

Erik M, men det måste väl ändå vara mitt val om jag väljer att koppla en teori till verkligheten. Även om jag då riskerar att ses som en historieförstörare.
Det är ju f ö vad evolutionsforskaren och hans kompanjon försöker sig på att göra med ett kanske inte helt övertygande resultat.

 
Religion Blogg listad på Bloggtoppen.se