LE CACTUS HEURISTIQUE
I - D'abord un peu de théorie (c'est le cas de le dire)...
(Les astérisques dans le texte renvoient aux définitions dans le glossaire (lien) situé dans un autre article : indispensable pour bien comprendre le sens de certains termes).
Ce premier article jette les bases de la théorie des jeux appliquée à l'évolution biologique, en préambule à plusieurs articles traitant de cas pratiques (à venir) au niveau des plantes succulentes.
Bien qu'il s'agisse d'une théorie mathématique, le formalisme mathématique de cet article est minimal pour
des raisons de lisibilité. L'article reste cependant très théorique : les cas concrets seront abordés dans les exemples à venir.
II - La théorie des jeux classique
Les concepts abordés par la théorie des jeux ont pendant des siècles été abordés de manière empirique dans de nombreux domaines des sciences, de la politique, de la morale et
de la philosophie, mais la théorie des jeux n'a pris sa véritable forme mathématique qu'à partir des années 1940, et la publication en 1944 de Théorie des jeux et comportement économique
(Theory of Games and Economic Behavior) par les mathématiciens américains John Von Neumann et Oskar Morgenstern. La théorie des jeux à ensuite connu un succès croissant et, en 1994, John
Nash, Reinhard Selten et John Harsanyi ont obtenu le prix Nobel d'économie pour leurs travaux sur la théorie des jeux.
La théorie des jeux est une théorie des sciences sociales, politiques et économiques qui étudie les interactions entre des protagonistes, généralement dans des situations d'antagonisme*, à travers des modèles appelés jeux*. Elle constitue une approche mathématique des différentes stratégies* de chacun des joueurs* et cherche à définir quelle est la solution* - ou les solutions - optimale(s) du jeu pour les joueurs.
Tout jeu comporte une liste de joueurs, un ensemble de stratégies possibles pour chacun, et des règles* qui donnent les gains* des joueurs. Chaque choix stratégique d'un joueur a un impact sur les gains d'un autre joueur, et on parle donc aussi de « théorie de la décision en interaction » . L'hypothèse première de la théorie des jeux est que chaque joueur cherche à maximiser ses gains (quels que soient ces gains et la façon dont on les mesure).
Comme domaines divers d'application de la théorie des jeux on peut citer :
♦ Les jeux de société, qui sont les premiers à venir à l'esprit (jeux de cartes, Monopoly, etc)
Le monde professionnel de l'entreprise (il y a les joueurs que sont les employés, les règles de fonctionnement entre collègues et avec la
hiérarchie, les intérêts divers et les objectifs à atteindre, etc)
Les champs d'application de la théorie des jeux sont quasiment universels.
III - La théorie des jeux évolutionnistes
Une branche particulière de la théorie des jeux, développée par des biologistes de l'évolution à partir des
années 1970, s'est détachée de la théorie initiale (ici dénommée « théorie des jeux classique ») : c'est la théorie des jeux évolutionnistes (on parle parfois
aussi de jeux évolutifs). Les biologistes ont utilisé les principes de la théorie des jeux pour modéliser certains aspects de l'évolution biologique, tels que décrits dans le paradigme
darwinien.
La théorie des jeux évolutionnistes a l'avantage d'éviter le problème majeur de la théorie des jeux classique : la caractérisation des comportements rationnels et la nécessité d'anticiper
les actions des autres joueurs. En effet, à ses débuts la théorie des jeux classique se proposait de réfléchir sur les comportements de joueurs rationnels en interactions, c'est-à-dire conscients
des situations et réfléchissant à augmenter leurs gains. Face aux difficultés insurmontables introduites dans les jeux par les notions de croyance*, de niveau d'information* et de subjectivité
des joueurs, le concept de rationalité* ne peut jamais être cerné. Dans les jeux évolutionnistes toute idée de choix* stratégique et d'anticipation* - et donc de rationalité - est
abandonnée.
Les théoriciens des jeux, qui essayaient depuis les années 1990 de limiter l'emprise de la rationalité dans
le concept de solution du jeu, et de faire adopter aux joueurs des stratégies relativement simples, se sont tournés vers les jeux évolutionnistes. Ces jeux ont largement débordé la biologie et
ont connu un succès considérable à partir des années 1990, notamment en économie, du fait qu'ils reposent sur des hypothèses comportementales simples. Elles supposent que les stratégies qui
perdurent dans les jeux évolutionnistes sont celles qui ont obtenu les meilleurs gains sur la durée.
Ce sont le professeur en science politique Robert Axelrod et le généticien John Maynard Smith qui ont été les plus éminents théoriciens de cette branche de la théorie des jeux appliquée à l'évolution biologique.
Les jeux évolutionnistes sont surtout basés sur le modèle du dilemme du prisonnier.
Le dilemme du prisonnier est le modèle le plus célèbre de la théorie des jeux. Il est d'une simplicité enfantine, mais sa simplicité n'est qu'apparente. Il a rempli des rayons entiers de bibliothèques et a fasciné des générations de psychologues et de stratèges, qui pensent qu'il est à la base de toutes les interactions entre protagonistes.
Le problème de l'information est bien mis en évidence dans le dilemme du prisonnier. Il est emblématique du fait que les gains qu'obtiennent chacun des protagonistes en choisissant une stratégie apparemment rationnelle ne sont pas optimaux.
|
Mais le choix, quasi inéluctable, de la dénonciation par les deux prisonniers aboutit à une
solution qui n'est pas optimale pour eux : Ils seront donc tous les 2 emprisonnés pendant 3 ans, alors que la stratégie de non dénonciation mutuelle aurait conduit à une peine plus
légère. Le dilemme tient au fait que le seul équilibre de Nash qui existe n'est pas optimal. |
Quand il n'y a que 2 joueurs comme ci-dessus, avec un nombre limité de stratégies possibles, le calcul des gains et des pertes de chacun peut s'établir facilement avec un
tableau à double entrée (ou matrice de gains) :
|
|
B se tait |
B dénonce |
|
A se tait |
(-1,-1) |
(-5,0) |
|
A dénonce |
(0,-5) |
(-3,-3) |
Les lignes correspondent aux stratégies possibles de A et les colonnes aux stratégies possibles de B. Les gains sont notés au croisement des lignes et des colonnes par un
vecteur dont le premier élément est le gain de A et le second le gain de B (dans le cas des prisonniers ce sont des gains négatifs, c'est-à-dire des pertes : les années de
prison).
Quand un prisonnier dénonce l’autre, d’une certain manière il l’exploite
à son profit. Le tableau peut se lire ainsi :
|
|
B se tait (B n'exploite pas A) |
B dénonce (B exploite A) |
|
A se tait (A n'exploite pas B) |
Pertes faibles
|
Résultats déséquilibrés Perte très important pour l'un, aucune perte pour l'autre
|
|
A dénonce (A exploite B) |
Résultats déséquilibrés Perte très important pour l'un, aucune perte pour l'autre |
Pertes importantes |
Tous les jeux basés sur le dilemme du prisonnier sont construits sur une même règle : à chances égales d'exploiter l'autre ou de se faire exploiter, la moyenne des gains comprenant une
exploitation sera inférieure à ceux issus de la non-exploitation mutuelle (dans l'exemple des prisonniers ci-dessus un gain négatif correspond à une perte : T= 0, S= 5 et R = 1, et la
moyenne des pertes (T+S)/2 est supérieure à R).
Pour résumer, pour un prisonnier :
- la dénonciation doit lui donner un meilleur gain que la non-dénonciation mutuelle,
- la non-dénonciation mutuelle lui donne un meilleur gain que la dénonciation mutuelle,
- la dénonciation mutuelle lui donne un meilleur gain que quand il est seul à être dénoncé.
Ce type de situation est très fréquent : c'est celle où chacun est poussé à agir en fonction de son propre intérêt et provoque ainsi un résultat moins bon que ce qu'il aurait pu être. Les
protagonistes ont intérêt à s'entendre : si chacun accepte de ne pas choisir la stratégie qui lui apporte le gain maximum alors tout le monde peut bénéficier du résultat, qui ne serait pas
possible sans cette contribution de chacun à l'équilibre final. L'équilibre de Nash montre ici les limites de la rationalité et doit être dépassé. Nous reviendrons sur ce point lors de la discussion sur la coopération.
Comme nous le verrons dans les articles sur des cas concrets, une solution à ce problème passe par la répétition du jeu de base avec les mêmes joueurs, qui doit permettre aux actions présentes d'influencer le futur. Avec les jeux répétés* (ou superjeu*), les joueurs peuvent modifier leurs choix quand ceux-ci ne sont pas optimaux, de manière à augmenter leurs gains.
Dans le « dilemme du prisonnier répété » les mêmes joueurs doivent rejouer la partie, encore et encore (itération), mais indéfiniment.
Pourquoi jouer indéfiniment ? Si le jeu est répété un nombre fini de fois alors les deux prisonniers peuvent anticiper le déroulement du jeu et vont raisonner à rebours en anticipant la fin : au dernier coup ils se retrouveront dans une situation identique à celle du jeu de base où chacun devra dénoncer en s'attendant à ce l'autre en fasse autant. A l'avant dernier coup, chacun peut prévoir ce qui se passera au dernier coup, et en déduit donc qu'il doit dénoncer l'autre avant que celui-ci le fasse ; et ainsi de suite jusqu'en remontant au premier coup. Donc le jeu répété avec un nombre de coups fini comporte le même équilibre de Nash que celui du jeu de base : la stratégie de dénonciation est dominante et son choix s'impose de la même façon que dans le jeu à un seul coup.
Alors que dans le dilemme du prisonnier simple il n'y a que 2 stratégies possibles - dénoncer (exploiter l'autre) ou se taire (se faire exploiter) - le dilemme du prisonnier répété indéfiniment voit apparaître de nouvelles stratégies, qui prennent en compte les résultats des coups précédents.
Robert Axelrod et le biologiste William D. Hamilton pensaient que la plupart des animaux et des plantes
sont impliqués dans des parties sans fin de dilemme du prisonnier depuis la nuit des temps.
En effet, le dilemme du prisonnier se rapproche des situations rencontrées en biologie par 2 caractéristiques :
En cas de jeux répétés, et à partir des 2 interactions agression et fuite ci-dessus, on peut classer les stratégies biologiques en 3 groupes :
Un point très important, et qu'il ne faut pas perdre de vue lors de toutes les interactions des protagonistes, est que dans les jeux évolutionnistes il n'existe qu'un seul
type de gain pour un organisme vivant : c'est l'augmentation de sa fitness*, ou valeur sélective, qui correspond au pouvoir de reproduction et à la capacité à
engendrer un nombre plus ou moins grand de descendants.
La théorie des jeux est une théorie économique. Lorsqu'une stratégie est mise en œuvre par un organisme pour arriver à une augmentation de sa fitness, il doit tenir compte du coût* de la ressource à conquérir ou à conserver, c'est-à-dire tenir compte de l'investissement à apporter pour l'obtention ou la conservation de la ressource : un gain ne peut être enregistré que si la ressource vaut plus cher que l'investissement apporté pour sa conquête ou sa conservation.
Comme précisé plus haut et dans le glossaire, il faut bien distinguer le jeu à un seul coup (le jeu de base à
un moment donné) et les jeux répétés sur la durée : les interactions entre organismes biologiques se déroulent au cours des temps géologiques et évoluent sur le long terme, elles
correspondent donc à des jeux répétés sur une durée de temps infinie.
L'utilisation de la théorie des jeux dans une approche évolutionniste se comprend mieux si on raisonne non pas sur des confrontations d'individus mais de populations. Chaque individu représente un type de stratégie (faucon ou colombe) et on peut donc définir des proportions de types de stratégies dans la population. Pour les biologistes il convient de déterminer quelles sont les possibilités pour de nouvelles stratégies qui apparaissent chez des organismes mutants, ou qui sont utilisées par des organismes étrangers invasifs, de s'imposer sur le long terme face aux stratégies existant dans des populations d'organismes stables. Une stratégie nouvelle envahit une population en se propageant avec la descendance des mutants, ou des organismes étrangers, si elle permet à ses utilisateurs d'obtenir une meilleure fitness que celle de la population d'origine (la transmission d'une stratégie à la descendance d'un individu implique qu'elle soit déterminée, au moins en partie, génétiquement : c'est la base de la fitness).
On cherche alors les répartitions de types de stratégies qui constituent des équilibres* stables, dans le sens où les proportions de types de stratégies perdurent (c'est-à-dire x% de faucons et 1-x% de colombes). La fitness associée à une stratégie lors des interactions dépend de la fréquence de chaque type de stratégies dans la population.
L'objectif final des biologistes est de déterminer quelles sont les stratégies stables du point de vue de l'évolution* (SES) et définir des équilibres biologiques (la théorie des jeux évolutionnistes est une théorie normative*). La solution du jeu qui est une stratégie évolutionnairement stable indique que les individus qui l'utilisent obtiennent un gain plus grand lorsqu'ils sont confrontés les uns aux autres que lorsqu'ils sont confrontés à des individus utilisant d'autre stratégies : les individus d'une population utilisant une stratégie évolutionnairement stable produisent plus de descendants que ceux auxquels ils sont confrontés et résiste mieux à l'invasion d'une nouvelle stratégie dans la population.
L'équilibre final qui s'établit entre stratégies biologiques est parfois considéré comme un équilibre de Nash, bien qu'il n'en soit pas un, même si les résultats des SES sont parfois identiques à un équilibre de Nash.
A partir des années 1980, le fait de disposer d'ordinateurs de plus en plus puissants a permis d'établir des modèles mathématiques pour chaque stratégie et de les confronter 2 à 2 les unes après les autres sur ordinateur, en calculant les gains à l'issue d'une longue série de jeux répétés. Une stratégie l'emporte sur une autre si ses gains sur la durée sont supérieurs à ceux de l'autre stratégie. En biologie, les gains d'un organisme ou d'un génotype sont directement mesurables par le nombre de ses descendants.
Dans ce type de modélisation le résultat à l'issue de chaque jeu de base est facile à établir : par exemple un faucon remporte toujours le gain du jeu de base face à une colombe, et la colombe est toujours perdante (la colombe ne livre jamais aucun combat pour une ressource, et fuit systématiquement le combat). Ce qui est moins évident, et ne peut se déduire d'emblée à partir du résultat du jeu de base seul, c'est l'équilibre final obtenu et la distribution des stratégies (les SES) dans une population à l'issue d'une longue série de jeux répétés.
Ces tournois de stratégies ont montré que la stratégie qui supplante les autres sur la durée est toujours la stratégie donnant-donnant, celle ou un joueur adopte d'emblée un comportement de non-agression puis imite les comportements qu'ont eu les autres joueurs.
L'analyse des confrontations de stratégies a révélé quatre paramètres qui contribuent au succès d'un joueur face aux autres protagonistes dans des jeux répétés indéfiniment :
Dans le domaine de la coopération, l'apport de la théorie des jeux a été considérable. L'adage selon lequel l'union fait la force suppose un certain nombre de conditions qui doivent être réunies, et qui sont toutes entières dépendantes des intérêts
personnels des protagonistes. Comme cela a été vu plus haut, dans certaines circonstances un comportement égoïste des joueurs prévaut, non du fait d'une faute stratégique des joueurs mais à cause
du caractère ponctuel de l'interaction : si un joueur coopère sans que l'autre joueur le fasse, ce dernier s'en tire mieux. La coopération ne peut se mettre en place que quand le futur prend
plus d'importance que le présent (c’est-à-dire quand il y a un avenir à
influencer).
Sur la durée, le dilemme du prisonnier répété a permis de montrer que les stratégies consistant à ne pas exploiter l'autre protagoniste (stratégie colombe) - et ceci tant que ce dernier ne le fait pas - procurent plus de gains, en moyenne, que les stratégies agressives (stratégie faucon) : la coopération entre individus devient payante, du fait de la réciprocité des intérêts, et peut donc s'installer dans une population.
En biologie la coopération entre organismes vivants est appelée mutualisme, et elle ne peut s'installer que dans des interactions répétées indéfiniment. Les bases de la coopération entre protagonistes mises en évidence dans les jeux évolutionnistes comportent les caractéristiques suivantes :
La théorie des jeux évolutionnistes reste un modèle très fécond, qui suscite de nombreux travaux, et dont les mises en évidence expérimentales ou au sein des milieux naturels sont constantes. Même sans passer par les équations du modèle mathématique qui la sous-tend, chacun peut intuitivement en comprendre les mécanismes.
GLOSSAIRE (lien) : du fait de sa taille importante, le glossaire a été placé dans un article séparé.
Articles connexes : Des mouches sur mon Stapelia et Sélection de parentèle et coopération chez les plantes.
Commentaires