Principal » Entreprise » Comment la stratégie de la théorie des jeux améliore la prise de décision

Comment la stratégie de la théorie des jeux améliore la prise de décision

Entreprise : Comment la stratégie de la théorie des jeux améliore la prise de décision

La théorie des jeux, l'étude de la prise de décision stratégique, regroupe des disciplines variées telles que les mathématiques, la psychologie et la philosophie. La théorie des jeux a été inventée par John von Neumann et Oskar Morgenstern en 1944 et a parcouru un long chemin depuis. L’importance de la théorie des jeux pour l’analyse et la prise de décision modernes se mesure au fait que depuis 1970, pas moins de 12 économistes et scientifiques ont été récompensés par le prix Nobel de sciences économiques pour leurs contributions à la théorie des jeux.

La théorie des jeux est appliquée dans un certain nombre de domaines, notamment les affaires, la finance, l'économie, les sciences politiques et la psychologie. Il est important de comprendre les stratégies de la théorie des jeux - les stratégies les plus populaires et certains stratagèmes relativement moins connus - pour améliorer ses capacités de raisonnement et de prise de décision dans un monde complexe.

Le dilemme du prisonnier

L'une des stratégies les plus populaires et les plus fondamentales de la théorie des jeux est le dilemme du prisonnier. Ce concept explore la stratégie de prise de décision prise par deux personnes qui, agissant dans leur propre intérêt, obtiennent des résultats encore pires que si elles avaient coopéré les unes avec les autres.

Dans le dilemme du prisonnier, deux suspects appréhendés pour un crime sont détenus dans des pièces séparées et ne peuvent pas communiquer l'un avec l'autre. Le procureur informe individuellement les suspects 1 et 2 que, s’il avoue et témoigne contre l’autre, il peut être libéré, mais s’il ne coopère pas et que l’autre suspect coopère, il sera condamné à trois ans de prison. S'ils avouent tous les deux, ils se verront infliger une peine de deux ans et, à défaut, ils seront condamnés à un an de prison.

Bien que la coopération soit la meilleure stratégie pour les deux suspects, face à un tel dilemme, les recherches montrent que la plupart des personnes rationnelles préfèrent se confesser et témoigner contre l'autre personne plutôt que de garder le silence et de laisser le risque à l'autre partie de s'avouer.

(Pour une lecture connexe, voir: Le dilemme du prisonnier dans le monde des affaires et de l'économie .)

Stratégies de la théorie des jeux

Le dilemme du prisonnier jette les bases de stratégies avancées de la théorie des jeux, parmi lesquelles les plus populaires incluent:

Centimes correspondants

Il s'agit d'un jeu à somme nulle qui implique deux joueurs (appelez-les joueurs A et B) plaçant simultanément un sou sur la table, le gain étant fonction de la correspondance entre les centimes. Si les deux sous sont des queues ou des queues, le joueur A gagne et conserve le sou du joueur B. S'ils ne correspondent pas, le joueur B gagne et conserve le sou du joueur A.

Impasse

Ceci est un scénario de dilemme social comme le dilemme du prisonnier en ce que deux joueurs peuvent coopérer ou se défaire (c'est-à-dire ne pas coopérer). Dans une impasse, si le joueur A et le joueur B coopèrent, ils obtiennent chacun un gain de 1 et s’ils présentent un défaut, ils obtiennent chacun un gain de 2. Mais si le joueur A coopère et que le joueur B est défectueux, alors A obtient un gain. sur 0 et B obtient un gain de 3. Dans le diagramme de gain ci-dessous, le premier chiffre des cellules (a) à (d) représente le gain du joueur A et le second chiffre est celui du joueur B:

Matrice des gains de blocageJoueur bJoueur b
CoopérerDéfaut
Joueur aCoopérer(a) 1, 1(b) 0, 3
Défaut(c) 3, 0(d) 2, 2

L'impasse diffère du dilemme du prisonnier en ce que l'action la plus bénéfique pour tous (c'est-à-dire les deux défauts) constitue également la stratégie dominante. Une stratégie dominante pour un joueur est définie comme une stratégie qui produit le rendement le plus élevé parmi toutes les stratégies disponibles, quelles que soient les stratégies utilisées par les autres joueurs.

Un exemple d'impasse couramment cité est celui de deux puissances nucléaires essayant de parvenir à un accord pour éliminer leurs arsenaux de bombes nucléaires. Dans ce cas, la coopération implique l'adhésion à l'accord, tandis que la défection signifie renier secrètement l'accord et conserver l'arsenal nucléaire. Le meilleur résultat pour l'un ou l'autre pays, malheureusement, est de revenir sur l'accord et de conserver l'option nucléaire pendant que l'autre pays élimine son arsenal, ce qui conférerait à celui-ci un avantage caché considérable sur le dernier si la guerre éclatait entre eux. La deuxième meilleure option est que les deux défigurent ou ne coopèrent pas, ce qui leur permet de conserver leur statut de puissance nucléaire.

Concours Cournot

Ce modèle est aussi conceptuellement similaire au dilemme du prisonnier et tire son nom du mathématicien français Augustin Cournot, qui l’a introduit en 1838. L’application la plus courante du modèle Cournot consiste à décrire un duopole ou deux des principaux producteurs d’un marché.

Par exemple, supposons que les sociétés A et B produisent un produit identique et peuvent produire des quantités élevées ou faibles. S'ils coopèrent et acceptent de produire à de faibles niveaux, une offre limitée se traduira par un prix élevé du produit sur le marché et des bénéfices substantiels pour les deux sociétés. En revanche, s’ils présentent des défauts et produisent à des niveaux élevés, le marché sera submergé et le prix du produit sera bas, ce qui réduira les bénéfices des deux. Mais si l’un coopère (c’est-à-dire produit à de faibles niveaux) et les autres défauts (c’est-à-dire qu’il produit subrepticement à des niveaux élevés), alors les premiers s’équilibrent tandis que les seconds dégagent un bénéfice plus élevé que si les deux coopèrent.

La matrice de retombées pour les sociétés A et B est indiquée (les chiffres représentent les bénéfices en millions de dollars). Ainsi, si A coopère et produit à de faibles niveaux tandis que B présente des défauts et produit à des niveaux élevés, le gain est celui indiqué dans la cellule (b) - seuil de rentabilité même pour la société A et bénéfices de 7 millions de dollars pour la société B.

Cournot Payoff MatrixSociété BSociété B
CoopérerDéfaut
Société ACoopérer(a) 4, 4(b) 0, 7
Défaut(c) 7, 0(d) 2, 2

Coordination

En coordination, les joueurs gagnent plus quand ils choisissent le même plan d'action.

A titre d'exemple, considérons deux géants de la technologie qui décident d'introduire une nouvelle technologie radicale dans les puces de mémoire pouvant leur rapporter des centaines de millions de dollars, ou une version révisée d'une technologie plus ancienne qui leur rapporterait beaucoup moins. Si une seule entreprise décidait d'adopter la nouvelle technologie, le taux d'adoption par les consommateurs serait considérablement inférieur et, par conséquent, le gain serait moindre que si les deux entreprises décidaient de suivre la même voie. La matrice de gains est présentée ci-dessous (les chiffres représentent les bénéfices en millions de dollars).

Ainsi, si les deux entreprises décidaient d'introduire la nouvelle technologie, elles gagneraient chacune 600 millions de dollars, tandis que l'introduction d'une version révisée de l'ancienne technologie leur rapporterait 300 millions de dollars chacune, comme indiqué dans la cellule (d). Mais si la société A décidait seule d'introduire la nouvelle technologie, elle ne gagnerait que 150 millions de dollars, même si la société B gagnerait 0 $ (sans doute parce que les consommateurs pourraient ne pas être disposés à payer pour sa technologie désormais obsolète). Dans ce cas, il est logique que les deux sociétés travaillent ensemble plutôt que par elles-mêmes.

Matrice des séries éliminatoiresSociété BSociété B
Nouvelle technologieAncienne technologie
Société ANouvelle technologiea) 600, 600(b) 0, 150
Ancienne technologie(c) 150, 0(d) 300, 300

Jeu de mille-pattes

Il s’agit d’un jeu très complet dans lequel deux joueurs ont la chance de prendre la plus grande part d’une réserve d’argent en augmentation lente. Le jeu de mille-pattes est séquentiel puisque les joueurs font leurs mouvements les uns après les autres plutôt que simultanément; chaque joueur connaît également les stratégies choisies par les joueurs qui ont joué avant lui. Le jeu se termine dès qu'un joueur s'empare de la réserve, ce joueur obtenant la plus grande partie et l'autre joueur, la plus petite.

Par exemple, supposons que le joueur A commence en premier et doit décider s’il doit ou non «prendre» la réserve, ce qui représente actuellement 2 $. S'il prend, alors A et B gagnent 1 $ chacun, mais si A passe, la décision de prendre ou de passer doit maintenant être prise par le joueur B. Si B prend, il gagne 3 $ (c'est-à-dire la réserve précédente de 2 $ + 1 $) et A obtient 0 $. Mais si B réussit, A doit maintenant décider de prendre ou de passer, et ainsi de suite. Si les deux joueurs choisissent toujours de passer, ils reçoivent chacun un gain de 100 $ à la fin de la partie.

Le but du jeu est que si A et B coopèrent et continuent de passer jusqu'à la fin du jeu, ils obtiendront le paiement maximum de 100 $ chacun. Mais s’ils se méfient de l’autre joueur et s’attendent à ce qu’ils «prennent» à la première occasion, l’équilibre de Nash prédit que les joueurs prendront le montant le moins élevé possible (1 $ dans ce cas). Des études expérimentales ont toutefois montré que ce comportement «rationnel» (tel que prédit par la théorie des jeux) est rarement présenté dans la vie réelle. Cela n’a rien d’étonnant, compte tenu de la taille minime du premier versement par rapport au dernier. Des comportements similaires chez des sujets expérimentaux ont également été exposés dans le dilemme du voyageur.

Le dilemme du voyageur

L'économiste Kaushik Basu a conçu ce jeu à somme non nulle, dans lequel les deux joueurs tentent de maximiser leur propre rémunération sans tenir compte de l'autre, en 1994. Par exemple, dans le dilemme du voyageur, une compagnie aérienne accepte de verser une indemnité à deux voyageurs à des articles identiques. Cependant, les deux voyageurs sont tenus séparément d'estimer la valeur de l'article, avec un minimum de 2 $ et un maximum de 100 $. Si les deux écrivent la même valeur, la compagnie aérienne leur remboursera ce montant. Mais si les valeurs diffèrent, la compagnie aérienne leur versera la valeur la plus basse, avec un bonus de 2 $ pour le voyageur qui a noté cette valeur inférieure et une pénalité de 2 $ pour le voyageur qui a noté la valeur supérieure.

Le niveau d'équilibre de Nash, basé sur l'induction en arrière, est de 2 $ dans ce scénario. Mais comme dans le jeu des centipèdes, les expériences en laboratoire démontrent systématiquement que la plupart des participants choisissent, naïvement ou non, un nombre beaucoup plus élevé que 2 $.

Le dilemme du voyageur peut être appliqué pour analyser diverses situations de la vie réelle. Le processus d'induction en amont, par exemple, peut aider à expliquer comment deux entreprises engagées dans une concurrence sans merci peuvent régulièrement faire baisser les prix des produits afin de gagner des parts de marché, ce qui peut entraîner des pertes de plus en plus importantes.

Bataille des sexes

C'est une autre forme du jeu de coordination décrit précédemment, mais avec quelques asymétries de gain. Il s’agit essentiellement d’un couple qui tente de coordonner sa soirée. Bien qu'ils aient accepté de se rencontrer soit au jeu de base-ball (préférence de l'homme), soit à un jeu (préférence de la femme), ils ont oublié ce qu'ils avaient décidé et, pour aggraver le problème, ils ne peuvent pas communiquer entre eux. Où devraient-ils aller? La matrice de gains est illustrée ci-dessous avec les chiffres dans les cellules représentant le degré de jouissance relative de l'événement pour la femme et pour l'homme, respectivement. Par exemple, la cellule (a) représente le gain (en termes de niveau de jouissance) de la femme et de l’homme présents (elle l’aime beaucoup plus que lui). La cellule (d) est la récompense si les deux joueurs se rendent au jeu de base-ball (il en profite plus qu'elle ne le fait). La cellule (c) représente le mécontentement si les deux vont non seulement au mauvais endroit, mais aussi à l’événement qui leur plaît le moins - la femme au match de baseball et l’homme au match.

Matrice de gains de la bataille des sexesHommeHomme
JouerJeu de balle
FemmeJouer(a) 6, 3(b) 2, 2
Jeu de balle(c) 0, 0(d) 3, 6

Jeu de dictateur

Il s’agit d’un jeu simple dans lequel le joueur A doit décider comment partager un prix en argent avec le joueur B, qui n’a aucune influence sur la décision du joueur A. Bien que ce ne soit pas une stratégie de la théorie des jeux en soi, cela fournit quelques informations intéressantes sur le comportement des gens. Les expériences ont révélé qu'environ 50% gardaient tout l'argent pour eux-mêmes, 5% le partageaient à parts égales et les 45% restants accordaient une part moindre à l'autre participant. Le jeu du dictateur est étroitement lié au jeu de l'ultimatum, dans lequel le joueur A reçoit un montant d'argent fixe, dont une partie doit être donnée au joueur B, qui peut accepter ou refuser le montant donné. Le problème est que si le deuxième joueur refuse le montant offert, A et B n’obtiennent rien. Les jeux du dictateur et de l’ultimatum contiennent des leçons importantes pour des questions telles que les dons de bienfaisance et la philanthropie.

Guerre de paix

Il s’agit d’une variante du dilemme du prisonnier dans laquelle les décisions de «coopérer ou d’éviter» sont remplacées par «de paix ou de guerre». Une analogie pourrait consister en deux sociétés engagées dans une guerre des prix. Si les deux s'abstiennent de réduire leurs prix, ils jouissent d'une prospérité relative (cellule a), mais une guerre des prix réduirait considérablement les retombées (cellule d). Toutefois, si A s'engage dans la réduction des prix (guerre) mais pas B, il obtiendra un gain plus élevé de 4 puisqu'il pourra peut-être conquérir une part de marché substantielle et que ce volume plus élevé compenserait les prix plus bas des produits.

Matrice des gains paix-guerreSociété BSociété B
PaixGuerre
Société APaix(a) 3, 3(b) 0, 4
Guerre(c) 4, 0(d) 1, 1

Le dilemme du bénévole

Dans le dilemme d'un volontaire, quelqu'un doit entreprendre une tâche ou un travail pour le bien commun. Le pire résultat possible est obtenu si personne ne se porte volontaire. Par exemple, imaginons une entreprise où la fraude comptable est généralisée mais que la haute direction n’en sait pas. Certains employés subalternes du service de la comptabilité sont conscients de la fraude mais hésitent à en informer la direction car cela entraînerait le licenciement des employés impliqués dans la fraude et le plus susceptible d’être poursuivis en justice.

Le fait d'être étiqueté en tant que lanceur d'alerte peut également avoir des répercussions sur toute la ligne. Mais si personne ne se porte volontaire, la fraude à grande échelle peut entraîner la faillite éventuelle de l'entreprise et la perte des emplois de chacun.

Le résultat final

La théorie des jeux peut être utilisée très efficacement comme outil de prise de décision, que ce soit dans un contexte économique, professionnel ou personnel.

(Pour une lecture connexe, voir: Théorie des jeux: Au-delà de l'essentiel .)

Comparaison des comptes d'investissement Nom du fournisseur Description Divulgation par l'annonceur × Les offres figurant dans ce tableau proviennent de partenariats avec lesquels Investopedia reçoit une rémunération.
Recommandé
Laissez Vos Commentaires