LE CACTUS HEURISTIQUE
Ce glossaire est celui de l'article sur la théorie des jeux évolutionnistes (lien).
Agression : le terme « agression » ne doit pas être pris au sens strict : ce peut être le combat, mais aussi la tromperie, le vol, etc. Au sens large c'est
toute interaction anti-coopérative ou qui se manifeste par une recherche de gains au dépend de l'autre protagoniste lors d'une confrontation : une stratégie qui cherche à exploiter l'autre
joueur. Attention, il n'y a ici aucune valeur morale associée à ce terme.
Antagonisme : En biologie, comme dans les la plupart des autres domaines, les jeux ont avant tout des bases économiques. Les jeux placent les joueurs dans des
situations de confrontation pour la conquête de ressources existantes et, même si le jeu est à somme non-nulle (voir ce terme), les stratégies des uns et des autres influent sur les gains de
chacun. Cet antagonisme entre protagonistes a pour source un principe d'économie appelé l'optimum de Pareto ou optimum paretien (ou Pareto-optimaux), qui postule que
l'augmentation des richesses de certains individus implique la réduction des richesses d'au moins un autre individu. Dans le milieu naturel les ressources dont disposent tous les organismes pour
vivre sont limitées, et il y a forcément compétition et antagonisme entre eux pour disposer de ces ressources : c'est la base de la sélection naturelle.
Anticipation : La recherche d'une solution au jeu avec un équilibre de Nash part du principe que les joueurs sont rationnels et que chacun essaye de
maximiser son gain en prenant en compte ce que font les autres. Les anticipations sur les stratégies des autres joueurs sont donc au cœur de l'équilibre de Nash. Or comment savoir quelle
est la stratégie des autres ? Les anticipations se basent sur les croyances des joueurs qui, elles mêmes, sont issues de l'information dont ils disposent. Il y a donc une
forte corrélation entre équilibre, croyances et anticipation qui constitue la principale faiblesse de l'équilibre de Nash. L'équilibre de Nash peut donc ne pas être optimal pour
les joueurs : il peut exister une solution qui procure aux joueurs des gains supérieurs à ceux obtenus dans l'équilibre. Le dilemme du prisonnier attire tout particulièrement l'attention sur ce
problème.
Choix : dans la théorie des jeux classique le choix est conscient et se base sur des calculs rationnels faits par les joueurs, même si le principe de rationalité est
discutable (voir ce terme). Cependant il n'y a pas de choix possible dans la théorie des jeux évolutionnistes, car un joueur s'identifie à une stratégie, il ne la choisit pas. Ceci se comprends
quand on admet que le choix est déterminé, au moins en partie, génétiquement (un organisme ne choisit pas son génome).
Coût : toute stratégie qui est mise en œuvre implique un
investissement de base, et donc un coût. Le principe économique appelé « coût d'opportunité » permet de calculer le coût d'obtention des ressources qui sont en jeu. Le coût
d'opportunité est le coût de tout ce à quoi il faut renoncer pour pouvoir disposer de ces ressources : si une occasion de gain se présente (une opportunité), le cout d'obtention de ce gain (= l'investissement que je dois apporter pour sa conquête) peut se
mesurer par le cout de tout ce à quoi je dois renoncer pour obtenir ce gain, ou par l'investissement que je détourne de la conquête d'un autre gain pour le consacrer à
celui-ci. Ce prix à payer est essentiel pour déterminer les performances des stratégies des
jeux évolutionnistes : il rentre directement dans le calcul de gains et des pertes.
Un exemple : quand un guépard poursuit une gazelle il court simplement pour un repas, et sa fitness est peu engagée : la nécessité d'un investissement du guépard dans la course doit être évaluée à partir des ressources de nourriture apportées par la gazelle, et des chances d'en disposer. Pour la gazelle c'est bien différent, elle court pour sa vie et sa fitness est totalement engagée : le coût de son investissement dans la course est toujours dérisoire comparé au gain qu'elle espère en tirer (sa survie). Son investissement dans la course doit être maximal.
Deuxième exemple : pour un merle, les ressources utilisées pendant l'été pour se constituer des réserves de graisse pour passer l'hiver se payent sur les ressources qu'il ne pourra pas consacrer à nourrir ses oisillons actuels. La question se pose pour lui de savoir si l'investissement dans ces réserves de graisse augmente plus sa fitness (= ses chances de survie hivernale, et donc les possibilités de futures couvées) que si il les investissait dans le nourrissage de ses oisillons actuels (= favoriser les chances de survie de la couvée actuelle) : quelle est la stratégie de moindre coût ?
Croyance : c'est toute idée ou opinion sur le jeu, sur les stratégies et les futurs coups des autres joueurs sur lesquelles un joueur se base pour faire des choix de stratégies. Les croyances dépendent de l'information dont disposent les joueurs et sont au cœur de l'équilibre de Nash, principalement dans les jeux à plusieurs coups, et elles en constituent également sa faiblesse majeure. Les théoriciens des jeux travaillent activement à essayer de réduire le rôle des croyances dans les solutions des jeux. Les croyances n'existent pas, ou sont sans effet, dans les jeux évolutionnistes. Voir également le terme « Anticipation ».
Equilibre évolutionnairement stable : En biologie de l'évolution, cet équilibre résultant est un équilibre au sein d'une population entre différentes
stratégies et entre différents génomes à la base de ces stratégies : on parle aussi d'état évolutionnairement stable. Dans la théorie des jeux évolutionnistes il convient de bien
différencier cet équilibre évolutionnairement stable de l'équilibre de Nash, au cœur de la théorie des jeux classique : l'approche rationnelle propre à l'équilibre de Nash est
inexistante dans le cadre de l'évolution. Bien qu'il puisse coïncider avec l'équilibre de Nash, l'apparition d'un équilibre issu d'une stratégie évolutionnairement stable (SES) est quasi
mécanique. En biologie des populations les concepts de SES et d'équilibre sont étroitement liés mais décrivent des situations différentes. Une population est à un équilibre biologique quand sa
composition génétique sera restaurée par la sélection naturelle après une légère perturbation. Un équilibre évolutionnairement stable est un état dynamique d'une population qui revient à
une stratégie - ou un mélange de stratégies - de base après que son état initial ait été perturbé.
Exemple : une population de plantes exploite les rayons du soleil qui frappent ses feuilles, et produit des graines qui donneront des plantes identiques. Parmi les plantules apparait un mutant qui produit une tige plus haute que la moyenne des longueurs des tiges de la population. Cette plante domine la plupart des autres, leur fait de l'ombre et bénéficie plus largement du soleil, ce qui lui permet de produire plus de graines que la moyenne de la population : sa fitness est supérieure. Cette grande plante transmet son patrimoine génétique à ses graines, qui donnent également des plantes de grande taille, et de ce fait qui produisent également plus de graines. Peu à peu l'information génétique et la stratégie "grande taille" envahissent la population.
Equilibre de Nash : définit par John Forbes Nash, c'est le concept de solution traditionnel dans la théorie des jeux classique. Il désigne un équilibre entre stratégies
obtenu à partir des comportements et des choix rationnels et conscients de plusieurs joueurs, conscients du jeu dans lequel ils sont impliqués et tenants compte des stratégies possibles des
autres joueurs. Un équilibre de Nash est la combinaison des stratégies de tous les joueurs telle que chacun maximise son gain en tenant compte de ce que font les autres.
Si chaque joueur a choisit une stratégie et qu'aucun joueur ne peut tirer avantage d'un changement unilatéral de sa stratégie si les autres joueurs conservent leurs stratégies, alors l'ensemble
des stratégies présentes et de leurs gains constitue un équilibre de Nash. En d'autres termes, pour qu'un équilibre de Nash existe, chaque joueur doit répondre négativement à la question
suivante : « connaissant la stratégie des autres joueurs et considérant qu'ils ne vont pas la changer, puis-je tirer avantage d'un changement de ma stratégie ? ». Vu les
différences d'approches stratégiques entre joueurs classiques et joueurs évolutionnistes, il est étonnant que les SES et l'équilibre de Nash coïncident souvent, c'est le cas dans la plupart des
jeux simples.
Fitness ou valeur sélective : c'est la mesure du succès de reproduction d'un organisme et plus spécifiquement de la diffusion de son information génétique dans
une population. La fitness se définie donc pour un génotype particulier et est en lien direct avec l'adaptation d'un organisme à son environnement.
Suivant les auteurs, la fitness se mesure par le nombre de descendants à la première génération (les enfants) ou à la 2ième génération (les petits-enfants, voir la théorie de Trivers-Willard). Concernant cette deuxième définition, elle se justifie par le
fait qu'en cas d'hybridation la descendance de première génération peut-être stérile et peut donc aboutir à un cul-de-sac dans la diffusion des gènes d'un individu.
Tout gain en nourriture ou en territoire pour un individu est sans intérêt s'il n'induit pas une augmentation du succès reproductif, et ne favorise pas la diffusion de son information génétique
dans la population.
La mesure de la fitness est utilisée en génétique des populations : on parle de fitness absolue (ou darwinienne) et de fitness relative. La fitness absolue d'un génotype correspond à peu
près au nombre de descendants portant le même génotype. Mais c'est la fitness relative qui est surtout utile et qui se mesure en divisant la fitness absolue d'un organisme par la fitness absolue
la plus élevée d'une population : c'est une comparaison de la fitness d'un génotype par rapport à la fitness des autres génotypes de la population. Voir également le terme
« Perte » et l'exemple de la mante religieuse, qui montre que la fitness ne doit surtout pas être confondue avec la notion de vie ou d'adaptation à l'environnement, mais
représente bien le pouvoir de reproduction.
Pourquoi cette importance de la fitness par rapport à tout autre gain ? Cela peut se comprendre intuitivement. Une population se compose d'organismes qui naissent, se reproduisent et
meurent : la seule entité qui perdure c'est l'information génétique transmise de génération en génération au sein de la population, et c'est donc sur cette transmission seule que peut se
mesurer les gains. Une stratégie efficace assure la meilleure transmission de l'information génétique au cours du temps.
Fuite : le terme « fuite» ne doit pas être pris au sens strict : ce peut être le simple refus de l'affrontement, la non-agression, l'ignorance de l'autre
protagoniste, etc. Au sens large c'est toute interaction non-agressive ou toute interaction qui se manifeste par une absence de recherche de gain au dépend de l'autre protagoniste :
c'est-à-dire une stratégie qui ne cherche pas à exploiter l'autre joueur. Attention il n'y a ici aucune valeur morale associée à ce terme.
Gain : La théorie des jeux est avant tout une théorie économique
et le gain a avant tout un sens économique (à ne surtout pas assimiler systématiquement à « financier » !).
On pense bien sûr à des gains financiers dans les jeux de bourse, des gains matériels ou des territoires conquis en cas de conflit armés entre nations, etc. Le gain correspond généralement à tout
ce qui permet à un joueur de se maintenir dans le jeu et d'y progresser.
Le seul gain pour un organisme vivant impliqué dans des jeux évolutionnistes est l'augmentation de la fitness (des gains intermédiaires provenant de la conquête de ressources, comme de
la nourriture, la domination des autres protagonistes ou la conquête d'un territoire devront toujours avoir pour finalité l'augmentation de la fitness pour pouvoir être enregistrés comme
gains). Les gains d'un organisme vivant ont aussi un sens économique : ils influent directement ou indirectement sur la quantité et la qualité de sa descendance au sein d'une population, et
sur la transmission de son information génétique à la population. On peut dire que les gains enregistrés sont tout autant ceux d'un organisme que ceux de son génotype : Les gains se mesurent par
la diffusion des gènes dans une population.
Information : Dans le cas des jeux répétés, les stratégies sont des listes d'instructions à choisir pour chacun des coups possibles, et déterminées en fonction
des coups précédents. Pour que ces instructions puissent être correctement choisies, il est nécessaire que les joueurs connaissent l'ensemble des coups possibles : l'information dont dispose
chacun est un paramètre essentiel de la théorie des jeux classiques.
On dit qu'il y a information complète quand chacun des protagonistes connaît tout du jeu : sa propre stratégie et celles des autres joueurs, ainsi que leurs motivations et les diverses solutions possibles du jeu. Cela signifie que chaque joueur sait que les autres savent qu'il sait, et qu'il sait qu'ils savent. La seule incertitude devient alors la décision des autres joueurs : quelle stratégie vont-ils choisir ? Poser cette question fait apparaitre un paradoxe : l'information n'est pas complète. Un moyen de contourner cette situation est d'attribuer des probabilités à chaque choix, en supposant que ces probabilités sont connues de tous les joueurs. Ceci conduira le joueur à opter pour une décision « moyenne » plutôt que ciblée, de manière à tenir compte des risques liés aux incertitudes.
Interaction non-coopérative : dans ce jeu les joueurs sont toujours seuls au départ,
la possibilité de coopération ou de coalition entre joueurs n'est pas répertoriée dans les règles du jeu, et elle ne survenir que comme résultat ou solution du jeu. Tous les jeux
évolutionnistes sont par définition des jeux non-coopératifs, car une coalition entre joueurs supposerait une anticipation ou un choix rationnel de leur part, qui n'existent pas dans ces types
de jeu. Le principal concept de solution dans un jeu classique non-coopératif est l'équilibre de Nash, mais c'est l'équilibre évolutionnairement stable dans les jeux
évolutionnistes.
Jeu : il s'agit des modèles de la théorie des jeux, dont la représentation peut être faite à l'aide de symboles mathématiques. Un jeu représente une situation pouvant
déboucher sur un certain nombre de résultats. Tout jeu comporte une liste de joueurs, un ensemble de stratégies pour chacun des joueurs et une fonction qui définie le montant des gains de chacun
des joueurs dans toutes les situations possibles à l'intérieur du jeu.
Jeux répétés : ce sont simplement des jeux à plusieurs coups, chaque coup étant appelé « jeu de base » ou « jeu constitutif ».
Important : l'existence de coups successifs peut faire penser à un processus « dynamiques » mais c'est trompeur, et il n'en est rien. les jeux répétés sont statiques, et absolument pas des jeux qui impliquent une dynamique (dans le sens ou un joueur ne peut pas modifier sa stratégie d'ensemble en tenant compte des résultats des coups précédents). Dans les jeux répétés les joueurs sélectionnent simplement des instructions à partir d'une liste définie d'instructions (une liste statique) : chaque joueur possède sa stratégie au départ et ne la modifie pas. Le concept de solution du jeu y est donc aussi purement statique.
Joueur : c'est le protagoniste qui est impliqué dans le jeu et confronté à d'autres protagonistes : le joueur est toujours en interaction avec d'autres
joueurs. Toutes les actions du joueur visent à essayer d'augmenter ses gains (ce qui ne signifie pas qu'il y parvient...). Dans les jeux évolutionnistes le joueur s'identifie quasiment à sa
stratégie. En biologie le joueur est à la fois l'organisme vivant et son génotype : toute stratégie a une base génétique.
Perte : mathématiquement c'est le gain de valeur négative. En théorie des jeux évolutionnistes cette perte corresponds à une baisse de la fitness, et peut
aller jusqu'à la perte de la vie du protagoniste, qui est habituellement la plus grosse perte car la valeur de la fitness devient alors définitivement nulle. Attention cependant, il
convient de raisonner globalement et en terme de transfert d'information génétique à la descendance, une stratégie qui conduit à la mort du protagoniste peut parfois augmenter sa
fitness : il y a gain dans ce cas et non perte (Que l'on pense à la stratégie du mâle de la mante religieuse qui se laisse dévorer par la femelle après l'accouplement, ce qui
conduit à nourrir la femelle, participe à la constitution des œufs et donc favorise la descendance du mâle : la stratégie « se faire dévorer après fécondation » augmente
plus la fitness du mâle que la stratégie opposée « ne pas se laisser dévorer après fécondation », et aurait donc été sélectionnée par l'évolution. Je précise que cette
hypothèse est toujours discutée : il pourrait aussi s'agir d'un conflit sexuel). Les stratégies par lesquelles un organisme se condamne, ou ne se reproduit pas lui même, pour mieux
transmettre son information génétique se rencontrent fréquement dans les phénomènes de sélection de parentèle.
Rationalité : la rationalité doit concourir à atteindre les objectifs que s'est fixé le joueur et elle a toujours pour but de maximiser le gain des joueurs. Mais
qu'est ce qu'un comportement rationnel ? Il n'y a pas de réponse claire à cette question car le choix rationnel implique d'anticiper au mieux les actions des autres joueurs, ce qui sous
entend une information totale (on parle « d'information complète ») sur le jeu, les choix et les stratégies des autres joueurs, ce qui n'est jamais possible. De plus la notion de
rationalité renvoie à des problèmes de perception, des normes de comportement (culture, conventions, habitudes, traditions, etc) et de croyance des joueurs. Si la théorie des jeux classique avait
pour but de réfléchir sur les choix de joueurs rationnels qui essayent volontairement de maximiser leurs gains, cette approche a depuis été largement abandonnée, du fait qu'il est apparu de
plus en plus que la caractérisation des comportements rationnels est très loin d'être évidente (que l'on pense au dilemme du prisonnier...).
Règle : Les règles sont définies au départ du jeu et sont les mêmes pour tous les joueurs, leur application va conduite à des gains ou des pertes pour les joueurs.
Pensez aux règles des jeux de société, au code de la route, ou aux lois d'un pays, qui correspondent aux types de règles de la théorie des jeux.
Solution d'un jeu : dans un jeu les protagonistes doivent mettre en œuvre une stratégie, dans le cadre de règles précises, pour aboutir à une solution qui leur apportera des gains. Dans un jeu les ressources à conquérir sont toujours limitées (sinon il n'y aurait pas de jeu) et, en biologie, cette limitation est le fondement de la sélection naturelle : les joueurs ont donc intérêt à entrer dans le jeu pour conquérir les ressources, chacun voulant obtenir le gain maximum. Mais la situation dans laquelle une solution s'impose en permettant à tous d'obtenir un gain maximum est exceptionnelle : en règle générale, la solution qui permet à un joueur d'obtenir le gain maximum n'est pas celle qui procure le gain maximum à un autre. Un consensus pour une solution est extrêmement rare.
Somme d'un jeu : un jeu est dit à « somme nulle » quand le fait qu'un joueur gagne entraine systématiquement que l'autre joueur perde (comme
dans un match de foot) : gain et perte s'équilibrent et la somme est nulle. Cette situation se rencontre principalement quand il y a lutte pour une ressource fixe qui ne peut pas être
conquise par plusieurs joueurs en même temps, ou bien que l'investissement du joueur perdant n'est pas remboursé par la ressource qu'il a conquit.
Exemple : deux écureuils convoitent un unique fruit dans un arbre, un combat s'engage entre eux et le plus fort, ou le plus agile, attrape le fruit et s'enfuit avec. Le perdant a dépensé du temps et de l'énergie à combattre en pure perte.
Un jeu est à « somme non-nulle » quand les deux joueurs peuvent gagner tous les deux lors de l'interaction, sans forcément que les gains soient équivalents. Cette situation se rencontre principalement quand les ressources à conquérir peuvent se partager et que chaque joueur qui a investit dans le jeu peut rembourser son investissement avec la ressource conquise.
Stratégie : c'est l'ensemble des procédés, règles ou instructions que le joueur adopte pour se confronter aux autres joueurs et
augmenter ses gains et qui, dans la théorie des jeux, sont décidés a priori. Il est important de comprendre que la stratégie se définie comme une tactique globale, et non pas au coup par
coup : on peut représenter un jeu comme un arbre de décision ou, à chaque embranchement, un joueur choisit une action (dans les jeux évolutionnistes cette action s'impose
automatiquement). L'ensemble de toutes ces possibilités d'actions compose une stratégie. En général il n'est pas nécessaire d'évaluer dans le détail les conséquences précises d'une stratégie,
mais simplement de pouvoir déterminer quelle stratégie est meilleure que telle autre.
Lors des jeux répétés la stratégie d'un joueur est une liste de conduites à tenir - d'instructions - à appliquer dans toutes les éventualités possibles qui peuvent se présenter à chaque coup : la stratégie est donc établie pour l'ensemble du jeu répété et il n'y a pas une stratégie différente par coup. Dans la théorie des jeux évolutionnistes, l'organisme vivant étant considéré comme une sorte d'automate, la stratégie est une politique de comportement préprogrammée qui n'est pas consciemment élaborée par l'individu : elle a une détermination génétique et est héritable. Le joueur n'a pas conscience d'être impliqué dans un jeu et ne choisit pas ses actions, il les subit. La stratégie d'un organisme biologique englobe la totalité des paramètres qui ont un rôle dans sa vie et sa reproduction : toute attitude, comportement, type d'interaction avec les membres de sa propres espèce ou d'une autre espèce ; ainsi que la physiologie, le métabolisme, la résistance aux parasites, etc. Tout ce qui a un impact - de près ou de loin - dans son succès reproductif .
Stratégie stable du point de vue de l'évolution ou stratégie évolutionnairement stable (SES) : c'est un concept central et très important de la
théorie de l'évolution, formalisée par J. Maynard Smith, et qui est au cœur de la théorie des jeux évolutionnistes.
La SES pourrait être assimilée à un équilibre de Nash élargit, ou un équilibre de Nash qui n'aurait pas pour base des stratégies rationnelles.
Une SES se déploie au sein de populations d'individus qui coexistent en utilisant des stratégies différentes, et elle constitue une approche statistique des performances de l'évolution. Une SES se caractérise dans le cadre d'une invasion : une population qui applique une stratégie A pour la conquête des ressources lui permettant de vivre voit arriver un individu qui utilise une stratégie B pour la conquête de ces mêmes ressources. Ce joueur est envahissant si sa stratégie B lui permet d'être plus performant que la moyenne des performances de la population initiale. Ceci conduira la stratégie B à envahir progressivement la population initiale car ses descendants, qui adopteront la même stratégie, seront plus performants. Sachant que dans la plupart des cas les performances de la stratégie B vont alors décroitre avec l'augmentation du nombre de joueurs qui l'utilisent, on aboutit alors à un rapport équilibré entre les deux stratégies A et B (équilibre évolutionnairement stable). Ainsi, une population composée exclusivement de colombes n'est pas évolutionnairement stable, puisque tout faucon qui l'envahie ou apparaît par mutation aura une descendance plus importante en accaparant les ressources des colombes. Ceci est vrai tant que la proportion de faucons ne devient pas trop importante : une population formée exclusivement de faucons n'est pas non plus évolutionnairement stable.
La stratégie "vigilance" est ici une SES : elle s'en sort mieux que la stratégie "non-vigilance" face à des copies d'elle même. Chaque individu "vigilant" bénéficie de l'investissement qu'il consacre au groupe, malgré le fait que son gain individuel de fitness serait supérieur s'il passait tout son temps à la recherche de nourriture comme les "non-vigilants". L'information génétique "non-vigilance" ne sera cependant jamais totalement éliminée : il subsistera toujours quelques individus "non-vigilants" qui bénéficieront du rôle des guetteurs, mais ils ne pourront jamais atteindre un nombre trop élevé sous peine de faire chuter la fitness de la population et mettre en danger, par contrecoup, la propagation de leur information génétique "non-vigilance".
Superjeu : si on considère un jeu de base, ou jeu constitutif à un coup, dans lequel les joueurs effectuent leur coup de manière simultanée (comme dans le dilemme
du prisonnier), et que ce jeu est répété un nombre fini ou infini de fois, on obtient un nouveau jeu que l'on appelle superjeu, pour le distinguer du jeu de base.
Théorie normative : le théoricien qui met une situation sous forme de jeu a pour objectif de faire un tri entre les différents résultats et en retenir certains,
voire un seul si possible, qui sera considéré comme la solution du jeu. Il est important de comprendre que les critères choisit pour définir les solutions ne peuvent pas être arbitraire, et c'est
particulièrement vrai pour la théorie des jeux évolutionnistes. La théorie des jeux évolutionnistes est une théorie normative car elle définie le résultat qui « doit être », dans le
sens ou il est bon du point de vue des gains des joueurs.
Commentaires