Teoria dei Giochi ed Equilibrio di Nash

Che cos’è la teoria dei giochi?

La teoria dei giochi è una scienza che si avvale delle applicazioni matematiche più complesse per costruire modelli e strategie volte a prendere le decisioni statisticamente più corrette nelle decisioni. La teoria si ricava dalle posizioni del libro Theory of Games and Economic Behavior, pubblicato da da John von Neumann e Oskar Morgenstern negli anni quaranta.

Di fatto questa teoria ha definito in termini matematici la modalità con cui gli individui si comportano quando si trovano un una situazione che può portare ad una vincita. Volendo sintetizzare sono state applicate regole matematiche per descrivere e misurare l’andamento di un gioco o di uno scenario reale.

Possiamo dire, quindi, che si tratti una applicazione dell’economia comportamentale, ovvero l’applicazione concreta della matematica nelle scelte di ogni giorno. In pratica, la teoria dei giochi analizza come ciascun soggetto coinvolto in una competizione possa sviluppare strategie e maturare le giuste decisioni per ottenerne il massimo vantaggio. Si tratta di una teoria che si può applicare in tutti gli aspetti della nostra vita: dalla partita a poker con gli amici, alle scelte sugli investimenti finanziari ra multinazionali, perfino, per le scelte quotidiane, come la ragazza con cui uscire.

Il contributo fondamentale allo sviluppo della teoria dei giochi (ed in particolare per i c.d. “giochi non cooperativi”) la si deve a John Forbes Nash, matematico ed economista statunitense, che per questo è stato insignito del premio Nobel per l’economia nel 1994.

La descrizione dei giochi non cooperativi

Nei giochi non cooperativi i partecipanti sono in concorrenza tra loro e non possono stipulare accordi. Questo significa che ognuno segue lo scopo di perseguire la strategia più vantaggiosa per lui. Di fatto, ogni partecipante cerca di vincere, ovvero massimizzare la propria vincita. In termini matematici ogni scelta del partecipante che porta ad un risultato (vincita) è una regola (o funzione di pagamenti). Ogni partecipante ha la possibilità di effettuare un numero finito (o infinito) di azioni che determinano una vincita. Il risultato del gioco è influenzato dalle scelte prese da ogni singolo giocatore, anche in funzione delle scelte compiute dagli altri.

All’interno di questi parametri, nel caso in cui esista una strategia di gioco in grado di massimizzare le vincite (guadagni) di tutti i partecipanti siano di fronte a quello che viene definito “punto di equilibrio” o “equilibrio di Nash“. Quando siamo di fronte a tale equilibrio nessun partecipante (razionale) ha interesse a modificare la propria scelta. L’aspetto veramente interessante è che l’equilibrio di Nash non rappresenta la soluzione migliore singolarmente ma la soluzione migliore per ogni partecipante al gioco.

Infatti, nel caso in cui i partecipanti al gioco decidessero di allontanarsi congiuntamente dalla situazione di equilibrio potrebbero (in alcuni casi) migliorare la propria vincita personale (ma altri otterrebbero una vincita minore). In questo modo l’equilibrio di Nash è il punto dove i partecipanti al gioco ottengono congiuntamente la massima vincita possibile (sempre inferiore alla vincita che singolarmente potrebbe ottenere ogni partecipante a scapito degli altri).

Se hai dei dubbi riguardanti l’applicazione concreta dell’equilibrio di Nash nei giochi non cooperativi puoi dilettarti nella lettura e nell’applicazione di questo punto di equilibrio nella raffigurazione più famosa della teoria dei giochi, ovvero il dilemma del prigioniero.

Che cos’è l’equilibrio di Nash?

Nei giochi non cooperativi (o a somma zero) l’equilibrio di Nash si raggiunge quando la strategia adottata da ogni singolo giocatore consente la massimizzazione della vincita (guadagno) di ogni partecipante al gioco. Naturalmente, la vincita legata al punto di equilibrio è più bassa rispetto a quella che il singolo partecipante al gioco otterrebbe nel momento in cui, invece, di perseguire l’interesse comune (di massimizzazione della vincita) perseguisse il proprio vantaggio personale (vincita massima) a scapito degli altri (che quindi avrebbero vincite più basse a quella di equilibrio).

Possiamo dire, quindi, che esiste un punto di equilibrio (o equilibrio di Nash) per ogni gioco non cooperativo a somma zero (ovvero un gioco dove il valore di una vincita di un soggetto corrisponde lo stesso valore ma di perdita su un altro soggetto, la cui somma è, appunto, zero). L’applicazione più famosa di un gioco a somma zero (non cooperativo) dove individuare l’equilibrio di Nash è il dilemma del prigioniero che, di seguito, andiamo a spiegare.

Il Dilemma del prigioniero di John Nash

Per dare un’applicazione concreata a quanto indicato sino a questo momento vediamo un esempio che ripropone il c.d. “dilemma del prigioniero” sviluppato da John Nash.

Ipotizziamo che due criminali vengano accusati dalla Polizia di aver compiuto una rapina. La polizia non dispone di prove sufficienti per trovare direttamente il colpevole. Quindi, dopo aver rinchiuso i due prigionieri in due celle diverse, interroga entrambi offrendo loro prospettive interessanti. Vediamole:

Confessare l’accaduto (C); oppure

Non confessare (NC).

L’ispettore di polizia, comunica separatamente ai due prigionieri quanto segue. Fate attenzione, queste sono le condizioni della teoria:

Nel caso in cui solo uno dei due confessa, chi ha confessato evita la pena, mentre l’altro viene condannato a 10 anni di carcere;
Se entrambi confessano, vengono condannati entrambi a 5 anni di carcere;
Se nessuno dei due confessa entrambi vengono condannati ad 1 anno;
Ogni prigioniero può riflettere sulla strategia da scegliere, ma in ogni caso, nessuno dei due potrà conoscere la scelta fatta dall’altro.

Al fine di comprendere meglio la situazione appena descritta provo a riepilogarla utilizzando la tabella sottostante. Si tratta di una matrice a doppia entrata, che evidenzia le strategie dei due e i guadagni derivanti dalle combinazioni delle loro decisioni.

Strategia del prigioniero A/B	Non confessare	Confessare
Non confessare	Pena di 1 anno ciascuno	Evita la pena/condanna a 10 anni
Confessare	Condanna a 10 anni/evita la pena	Pena di 5 anni ciascuno

Ovviamente, senza sapere la scelta dell’altro soggetto la scelta da prendere non è semplice, ogni soluzione è influenzata dalla scelta dell’altro prigioniero. La scelta del primo prigioniero di non confessare, potrebbe evitare la pena, se l’altro confessa, ma portare ad una situazione di 1 anno di pena per entrambi. Allo stesso modo la scelta di confessare può portare ad una condanna a 10 anni se l’altro non confessa o ad una pena di 5 anni ciascuno. Insomma, come avrai sicuramente capito, non è detto che la scelta migliore per il singolo, rappresenti anche la scelta migliore anche per tutto il gruppo.

Come trovare in questo gioco l’equilibrio di Nash?

Secondo la teoria dei giochi, siamo di fronte ad un gioco non cooperativo dove il punto di equilibrio, ovvero il guadagno migliore per il gruppo si ottiene attraverso la scelta di “confessare“. In questo gioco la strategia di confessare è detta la “strategia dominante“. Ed è infatti definita come la strategia ottimale indipendentemente da ciò che fa l’altro partecipante (prigioniero). In pratica, qualunque sia la scelta dell’altro, scegliere di confessare garantisce sempre un guadagno maggiore rispetto a scegliere non confessare.

Anche se appare evidente come in realtà sarebbe molto più conveniente per entrambi i prigionieri non confessare, poiché così facendo sconterebbero entrambi soltanto 1 anno di detenzione. Tuttavia, non ci si deve dimenticare che siamo di fronte ad un gioco non cooperativo, dove i giocatori non hanno la possibilità di accordarsi.

In questa situazione scegliere di non confessare è molto rischioso, poiché se l’avversario confessasse (come è razionale che faccia) allora chi non ha confessato sconterebbe ben 10 anni di carcere, mentre l’avversario sarebbe libero.

L’unica variante che renderebbe vantaggioso per entrambi non confessare è che si tratti di un gioco cooperativo, ovvero che i due giocatori abbiano la possibilità di accordarsi preventivamente sulla strategia da adottare.

La ratio del dilemma del prigioniero

L’idea che la razionalità individuale preceda quella collettiva sottende e giustifica il concetto di equilibrio di Nash. Infatti, dato un gioco, il giocatore ha il diritto di scegliere la strategia che preferisce nell’insieme di tutte le strategie attuabili. Ipotizzando che il giocatore sia un soggetto razionale agirà attuando la strategia che gli consente di massimizzare il suo guadagno. Pertanto, una stessa strategia sarà adottata da più giocatori soltanto nel caso in cui questa massimizzi l’utilità di ciascun giocatore quando tutti attuano la stessa soluzione.

Da questa semplice premessa possiamo come un gioco ammette almeno un Equilibrio di Nash, quando ogni agente ha a disposizione almeno una strategia dalla quale non ha alcun interesse ad allontanarsi se tutti gli altri giocatori hanno giocato la propria strategia. Se ne deduce quindi che se i giocatori raggiungono un equilibrio di Nash, nessuno può più migliorare il proprio risultato modificando solo la propria strategia, ed è quindi vincolato alle scelte degli altri.

Poiché questo vale per tutti i giocatori, è evidente che se esiste un equilibrio di Nash ed è unico, esso rappresenta la soluzione del gioco, in quanto nessuno dei giocatori ha interesse a cambiare strategia. Il contributo più importante dato da John Nash alla teoria dei giochi è la dimostrazione matematica dell’esistenza di questo equilibrio.

In particolare egli ha dimostrato che ogni gioco finito ha almeno un equilibrio di Nash. Con gli anni il l’equilibrio di Nash è diventato un criterio fondamentale per giudicare la plausibilità di una specifica strategia come soluzione di un gioco, mettendo a disposizione degli studiosi un test molto semplice a cui sottoporre le loro teorie.

Se il comportamento previsto dal loro modello economico si discosta dall’equilibrio di Nash, allora sarà difficile sostenere la verificabilità del modello stesso, in quanto almeno uno degli agenti preferirà cambiare la propria strategia!

A questo punto, per riportare l’esempio astratto alla realtà, riprendiamo l’esempio precedente e sostituiamo gli Stati Uniti e l’URSS ai due prigionieri e al posto della confessione la decisione dell’’armamento con l’atomica (ovviamente la non confessione con la decisione di non armamento). In questo modo il dilemma descrive compiutamente come per le due nazioni fosse inevitabile al tempo della Guerra Fredda la corsa agli armamenti, benché questo risultato finale fosse non ottimale per nessuna delle due superpotenze (e per il mondo), con le conseguenze che noi tutti sappiamo.

Conclusioni

Le conclusione che possiamo trarre è che il dilemma del prigioniero mette in risalto il conflitto tra:

Razionalità individuale: nel senso di massimizzazione dell’interesse personale;
Efficienza: ovvero miglior risultato possibile, sia individuale che collettivo.

Applicando una strategia individualistica infatti si ottiene un esito inferiore rispetto a quanto ottenibile nel caso in cui si possa raggiungere un accordo negoziale. Questo è il ragionamento che sta alla base delle teorie matematiche connesse alla teoria dei giochi ed al raggiungimento del punto di equilibrio (massimo guadagno per tutti i partecipanti al gioco), ovvero la strategia che se applicata da tutti i partecipanti massimizza il guadagno collettivo e dove ogni giocatore non ha interesse ad allontanarsi.

La Teoria dei Giochi e l’equilibrio di Nash