Informations

Comment est née la réciprocité interespèces impliquant des labres plus propres ?

Comment est née la réciprocité interespèces impliquant des labres plus propres ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Le petit napoléon nettoyeur de rayures bleues (Labroides dimidiatus) s'approchera d'un poisson beaucoup plus gros (par exemple un mérou tel que Cephalopholis miniata), pénètre dans sa bouche et passe plusieurs minutes à se nettoyer les dents. Comment ce comportement a-t-il évolué ? Le premier labre plus propre qui était assez audacieux pour s'approcher d'un poisson plus gros n'aurait-il pas été immédiatement mangé ? Puisque, dans cette rencontre, le comportement des deux poissons n'est pas appris, il doit être encodé dans leurs génomes. Comment le codage approprié pourrait-il évoluer progressivement ?


Le labre plus propre ne nettoie pas seulement dans la bouche ; bien que certaines espèces puissent se spécialiser dans le nettoyage de la bouche, il est probable que ce comportement ait commencé par un nettoyage ailleurs sur le corps du poisson.

Certaines études (par exemple Bshary, 2003) suggèrent un effet important des nettoyeurs sur les populations/la diversité des poissons, il semble donc qu'il y ait de fortes pressions sélectives pour l'évolution du comportement permettant de nettoyer les poissons.

Les nettoyeurs eux-mêmes semblent avoir évolué à de nombreuses reprises dans leurs caractéristiques de nettoyage (voir Baliga & Law, 2016). Bien qu'il existe certaines espèces de nettoyeurs obligatoires, il est plus courant que les nettoyeurs nettoient en tant que jeunes, et la transition la plus courante entre les comportements de nettoyeurs est celle des non-nettoyeurs aux nettoyeurs juvéniles.

Par conséquent, il semble que les premiers nettoyeurs étaient de très petits poissons en dehors de la taille cible typique du poisson nettoyé. S'il existe une forte sélection envers les individus qui tolèrent ces petits nettoyants non proies, il est raisonnable de s'attendre à ce que ce comportement s'étende aux plus gros nettoyants, et éventuellement aux versions les plus extrêmes du comportement comme autoriser les nettoyants dans la bouche.


Baliga, V. B., & Law, C. J. (2016). Nettoyeurs parmi les labres : phylogénétique et modèles évolutifs du comportement de nettoyage chez les Labridae. Phylogénétique moléculaire et évolution, 94, 424-435.

Bshary, R. (2003). Le labre plus propre, Labroides dimidiatus, est un organisme clé pour la diversité des poissons de récif dans le parc national de Ras Mohammed, en Égypte. Journal d'écologie animale, 72 (1), 169-176.


Le comportement est bénéfique pour les deux espèces. Pour utiliser votre explication, peut-être que le premier L. dimidiatus qui était assez audacieux pour s'approcher de C. miniata a été immédiatement mangé, mais une certaine proportion de C. miniata n'a pas mangé le L. dimidiatus, et les allèles responsables du comportement coopératif ont augmenté en fréquence pour les deux espèces, tandis que les allèles responsables du comportement non coopératif ont diminué en fréquence.

Voir la symbiose


Les labres nettoyeurs adultes surpassent les singes capucins, les chimpanzés et les orangs-outans dans une tâche de recherche de nourriture complexe dérivée de la coopération Cleaner - Client Reef Fish

Affiliations Département de biologie, Université de Neuchâtel, Neuchâtel, Suisse, Département de psychologie et Centre de recherche linguistique, Georgia State University, Atlanta, Géorgie, États-Unis d'Amérique

A contribué également à ce travail avec : Lucie H. Salwiczek, Laurent Prétôt, Lanila Demarta

Affiliation Département de biologie, Université de Neuchâtel, Neuchâtel, Suisse

Affiliation Department of Psychology and Language Research Center, Georgia State University, Atlanta, Géorgie, États-Unis d'Amérique

Affiliation Department of Psychology and Language Research Center, Georgia State University, Atlanta, Géorgie, États-Unis d'Amérique

Affiliation Département de biologie, Université de Neuchâtel, Neuchâtel, Suisse

Affiliations Département de biologie, Université de Neuchâtel, Neuchâtel, Suisse, Institut de biologie évolutive et d'études environnementales, Université de Zurich, Zurich, Suisse

Affiliation Zoo Atlanta, Atlanta, Géorgie, États-Unis d'Amérique

Affiliation Department of Psychology and Language Research Center, Georgia State University, Atlanta, Géorgie, États-Unis d'Amérique

Affiliation Département de biologie, Université de Neuchâtel, Neuchâtel, Suisse


Le pouvoir et la tentation provoquent des glissements entre exploitation et coopération dans un mutualisme plus propre

Dans de nombreux cas de coopération, un seul individu a à la fois le potentiel et l'incitation à « tricher » et à exploiter son partenaire. Dans ces conditions asymétriques, un modèle simple prédit que la variation de la tentation de tricher et de la capacité de la victime potentielle à contrôler son partenaire conduit à des glissements entre exploitation et coopération. Ici, nous montrons que la menace de la fin prématurée d'une interaction était suffisante pour induire des napoléons plus propres. Labroides dimidiatus à se nourrir sélectivement contre leur préférence (ce qui correspond à la consommation coopérative d'ectoparasites de poissons clients), à condition que leur préférence pour une alimentation alternative soit faible. Dans des conditions opposées, les nettoyeurs se nourrissaient sélectivement selon leur propre préférence (ce qui correspond à une tricherie en mangeant du mucus du client). En revanche, une espèce de poisson non nettoyeuse, Halichoeres melanurus, n'a pas réussi à ajuster son comportement de recherche de nourriture dans ces mêmes conditions. Ainsi, les nettoyeurs semblent avoir développé le pouvoir d'ajuster stratégiquement leurs niveaux de coopération en fonction des circonstances.

1. Introduction

Ces dernières années, les biologistes sont devenus de plus en plus conscients qu'il existe de nombreux mécanismes possibles de contrôle des partenaires, qui peuvent tous hypothétiquement supprimer la tricherie, et donc maintenir la coopération entre des individus non apparentés [1-9]. Les preuves empiriques suggèrent que de nombreuses formes de coopération, en particulier les mutualismes interspécifiques, présentent une asymétrie marquée entre les individus en interaction dans la possibilité de tricher ou de choisir un partenaire [1,3,10]. En conséquence, l'attention s'est déplacée de la réciprocité (telle qu'explorée dans les jeux réitérés du dilemme du prisonnier) vers des mécanismes de contrôle alternatifs, tels que la punition [11,12], les sanctions [13], le changement de partenaire [14,15] ou la réciprocité indirecte basée sur l'image. notation [16,17]. Plusieurs modèles de coopération se concentrent explicitement sur de telles formes de contrôle du partenaire dans des contextes asymétriques [14,16,18–22].

Les preuves empiriques de l'importance de ces mécanismes de contrôle alternatifs s'accumulent également et ont même conduit au développement de certains des articles théoriques cités précédemment. Cependant, alors que la collecte de données expérimentales quantitatives sur le comportement coopératif a traditionnellement impliqué des sujets humains (voir [23-26] parmi de nombreux autres exemples), les expériences sur la coopération non humaine ont généralement été uniquement de nature qualitative [20,27-30] . Les exceptions sont fournies par Kiers et al. [31], qui a quantifié les échanges de nutriments entre les plantes et les rhizobiums, et par Raihani et al. [32], qui ont testé comment les hommes de ménage ajustent les niveaux de punition en fonction de l'ampleur des dommages qui leur sont infligés en trompant leurs partenaires féminines.

Une approche plus quantitative est nécessaire pour au moins deux raisons. Premièrement, pour bien comprendre l'évolution et le maintien de la coopération, nous devons déterminer dans quelle mesure les animaux ajustent les niveaux de coopération à des conditions variables. Des conditions variables peuvent affecter la coopération de plusieurs manières, comme par les effets d'états internes sur le comportement [22,33] ou par l'introduction d'erreurs dues à l'incertitude : la « main tremblante » [34] est une variable clé favorisant la coopération, et la variable les conditions peuvent fournir une base biologique pour les erreurs. En outre, des conditions variables peuvent sélectionner des capacités cognitives accrues nécessaires pour affiner le comportement [35], mais aussi pour le développement de règles empiriques simples qui fonctionnent globalement bien tout en ignorant largement la complexité de l'environnement [36]. Dans les deux cas, les règles de décision des individus doivent être connues pour déterminer dans quelles conditions la coopération est stable. Une deuxième raison d'utiliser une approche plus quantitative est d'identifier les variables qui ont un effet majeur sur le potentiel de conflit. Dans l'état actuel des choses, il est notoirement difficile de mesurer les conséquences exactes sur la condition physique de la tricherie/être trompé, punir/être puni, etc., chez les animaux. Peu d'études en laboratoire ont développé des conceptions expérimentales qui mesurent des gains précis [37] alors que la grande majorité des études ne peuvent offrir que des suppositions éclairées sur les gains relatifs. Des comportements variables selon les conditions peuvent permettre d'identifier des situations dans lesquelles le conflit est minimal et la coopération maximale, et d'identifier les conditions dans lesquelles l'efficacité des mécanismes de contrôle du partenaire comme la punition peut s'effondrer, conduisant à la fin des interactions ou au parasitisme [ dix].

Ici, nous proposons une étude quantitative sur les niveaux de coopération, avec l'intention de tester un modèle simple de contrôle des partenaires qui explique potentiellement comment le résultat d'une interaction peut passer de la coopération à l'exploitation (c'est-à-dire du mutualisme au parasitisme) et vice versa [21 ]. Le modèle suppose qu'une interaction entre deux joueurs dure une durée variable qui dépend des décisions des deux joueurs. Un seul joueur a la possibilité de tricher, tandis que le partenaire n'a pas cette option. Au lieu de cela, la victime potentielle a la capacité de mettre fin ou au moins de raccourcir la durée de leur interaction. Le modèle prédit des résultats coopératifs tant que (i) le gain par unité de temps pour la tricherie est suffisamment faible par rapport au gain par unité de temps pour la coopération (c'est-à-dire que la tentation de tricher est suffisamment faible), et (ii) la victime potentielle a un contrôle suffisant sur la durée de l'interaction (c'est-à-dire que la menace de résiliation est suffisamment forte). Comme de nombreuses interactions réelles sont caractérisées par des asymétries dans les options stratégiques [3,10] et une durée d'action prolongée [38], le modèle est potentiellement d'une large pertinence.

Le mutualisme de nettoyage impliquant le labre nettoyeur Labroides dimidiatus fournit un système modèle pour étudier la coopération dans des jeux asymétriques tels que celui-ci : les nettoyeurs peuvent coopérer avec les poissons clients en consommant leurs ectoparasites, ce qui entraîne des bénéfices nets pour les clients [39,40] mais les exploitent préférentiellement en mangeant du mucus [41], tandis que non- les clients prédateurs n'ont pas la possibilité de tricher en retour (ils ne peuvent pas manger un nettoyeur). N'ayant pas la possibilité de rendre la pareille, les clients sont confrontés au défi d'inciter les nettoyeurs à se nourrir contre leur préférence, afin d'obtenir un bon service de nettoyage. Une observation fréquente sur le terrain est que les clients mettent fin aux interactions de nettoyage plus tôt en réponse à la tricherie d'un nettoyeur [42]. Nous avons mené une expérience en laboratoire pour déterminer si la menace de départ anticipé des clients pouvait suffire à supprimer l'exploitation du filet par le partenaire, comme le suggère le modèle décrit précédemment [21].

Afin de manipuler tous les paramètres d'intérêt, nous avons remplacé les clients par des plaques en plexiglas, et leur mucus et leurs ectoparasites étaient respectivement un aliment alternatif préféré et moins préféré. Les plaques étaient fixées à un levier, permettant à l'expérimentateur de réagir au comportement de recherche de nourriture des nettoyeurs de manières prédéterminées. Comme le modèle simple prédit que l'efficacité de ce mécanisme de contrôle du partenaire devrait dépendre des avantages potentiels de la tricherie et de la facilité avec laquelle les victimes peuvent échapper à l'exploitation, nous avons manipulé les deux paramètres et mesuré leur impact relatif sur le comportement de recherche de nourriture des nettoyeurs.

Toute preuve que les nettoyeurs ajustent leur comportement de recherche de nourriture pourrait être interprétée de deux manières. Premièrement, les ajustements peuvent refléter une capacité évoluée à ajuster les niveaux de coopération aux circonstances, car notre conception expérimentale correspondait à l'alimentation d'ectoparasites ou de mucus sur des poissons de récif clients mobiles. Cependant, il existe une explication alternative selon laquelle nous avons testé les nettoyeurs avec une tâche d'apprentissage qui impliquait des décisions de recherche de nourriture optimales. Ainsi, la tâche peut ne pas être liée à une adaptation aux interactions avec les poissons de récif clients et pourrait donc être tout aussi bien résolue par des espèces qui ne s'engagent pas dans des interactions de nettoyage. Par conséquent, afin d'évaluer si l'expérience avait la pertinence écologique recherchée, nous avons également testé une espèce de poisson non plus propre, le napoléon Halichoeres melanurus. Les deux espèces appartiennent aux Labridae, une grande famille née il y a environ 65 millions d'années et contenant plus de 600 espèces. Les genres Labroides et Halichoères font partie d'un clade plus récent qui a vu le jour il y a environ 30 millions d'années [43]. Les deux espèces sont similaires en ce qui concerne l'habitat et la taille corporelle (longueur totale maximale de 11,5 cm pour L. dimidiatus et 12 cm pour H. melanurus) [44].

2. Matériel et méthodes

Des expériences avec L. dimidiatus ont été menées en juin-juillet 2004 à Lizard Island Research Station, Grande Barrière de Corail, Australie (14°40′ S, 145°28′ E). Des expériences impliquant H. melanurus ont été menées en janvier-février 2012 sur le même site. Seize labres nettoyeurs adultes et 14 adultes H. melanurus ont été capturés avec un filet barrière et maintenus seuls ou par paires dans des aquariums de différentes tailles pendant au moins 20 jours avant les expériences. Pendant la phase d'acclimatation, les nettoyeurs ont été entraînés à se nourrir de purée de crevettes et de flocons de poisson mélangés à des crevettes (appelées plus loin « flocon ») étalés sur des plaques de plexiglas de différentes couleurs. Au cours de la même phase, H. melanurus les individus ont également été entraînés à se nourrir de purée de crevettes étalée sur des assiettes similaires.

Comme les nettoyeurs ont une forte préférence pour les crevettes par rapport aux flocons [45], ces deux types d'aliments pourraient être utilisés dans nos expériences. De façon intéressante, H. melanurus n'avait pas la même préférence. Par conséquent, pendant l'acclimatation, des combinaisons de divers types d'aliments ont été proposées aux H. melanurus pour trouver une combinaison appropriée. Le protocole a suivi Bshary & Grutter [45] : H. melanurus les individus ont reçu des assiettes recouvertes de sept articles de chacun des deux types d'aliments testés. Nous avons considéré qu'un individu avait atteint une préférence lorsque, dans les sept premiers éléments de chaque essai, un type d'aliment était choisi plus de 80 % du temps au cours de trois essais ultérieurs. Nous avons finalement trouvé que tous les individus montraient une telle préférence pour un mélange 80 : 20 crevettes : flocons contre un mélange 70 : 30 sable : crevettes. Dans le processus de détermination d'une combinaison appropriée d'aliments, H. melanurus expérimenté au total entre 29 et 51 essais alimentaires.

La conception expérimentale de base est très similaire au protocole utilisé dans les précédentes études expérimentales en laboratoire sur L. dimidiatus [45] et ne seront donc décrits ici que brièvement. Dans un premier temps avant l'expérience proprement dite, tous les poissons ont été familiarisés avec la situation dans laquelle une assiette contenant à la fois des éléments préférés et moins préférés resterait dans leur aquarium tant qu'ils mangeaient les éléments moins préférés, mais serait immédiatement retirée si ils ont mangé un article préféré. Une réaction immédiate était possible car la plaque était fixée à un levier tenu par l'expérimentateur. Par conséquent, les poissons devaient se nourrir contre leur préférence s'ils voulaient augmenter leur consommation de nourriture. Au cours de six essais, 14 éléments moins préférés ont été présentés avec seulement deux éléments préférés. Dans cette condition, tous les poissons mangeaient régulièrement des aliments moins appréciés et subissaient ainsi à la fois les conséquences positives et négatives de leurs décisions de recherche de nourriture, leur donnant ainsi l'opportunité d'apprendre.

Au cours de l'expérience, nous avons offert au poisson deux assiettes en plexiglas (12 × 7 cm) avec de nouveaux motifs de couleurs distincts et avec six cercles noirs (1 cm de diamètre), chaque cercle contenant un aliment. Trois articles étaient du type d'aliment préféré et trois articles étaient du type moins préféré. Les assiettes étaient retirées avec un levier dès que le poisson mangeait un élément préféré. Pour chaque poisson, une assiette était toujours retirée si rapidement (moins de 1 s) que l'individu ne pouvait pas en manger un autre (ce qui correspond à un fort contrôle de la victime sur la durée de l'interaction), tandis que l'autre assiette était retirée suffisamment lentement pour que le poisson pourrait manger d'autres éléments (correspondant à un faible contrôle de la victime sur la durée de l'interaction). Le retrait lent a été ajusté à la vitesse des sujets en quête de nourriture et prendrait généralement 2 à 3 s. L'élimination lente a fonctionné comme prévu, car tous les poissons ont mangé des aliments supplémentaires dans ces essais (valeurs moyennes pour les individus : minimum, médiane, maximum d'éléments par tour : 1,1, 1,5, 1,9, respectivement, pour L. dimidiatus et 0,9, 1,6, 2 pour H. melanurus). La variation de la concentration du type d'aliment moins apprécié (50 ou 10 % de flocons dans le mélange crevettes-flocons pour les nettoyeurs 70 ou 20 % de sable dans le mélange sable-crevettes pour les rayures) a donné lieu à une tentation élevée ou faible de manger le article préféré. Tous les poissons ont été confrontés sept fois à chacune des quatre combinaisons de vitesse de prélèvement et de tentation (figure 1), ce qui a donné un total de 28 essais par animal. La moitié des sujets ont d'abord terminé les 14 essais impliquant une faible tentation le premier jour, puis les 14 essais de forte tentation le deuxième jour, tandis que l'autre moitié a été exposée à l'ordre inverse. Dans les 14 unités d'essai, la séquence d'essais de plaques lentes et rapides était contrebalancée. Toutes les combinaisons de couleur de plaque avec la vitesse de retrait de plaque étaient également équilibrées entre tous les individus de chaque espèce pour éviter tout effet de couleur expliquant les résultats. Tous les poissons ont été relâchés sur le site de capture après l'expérience.

Figure 1. Diagrammes en boîte et en moustache du nombre moyen d'aliments moins appréciés consommés par tour par (une) 16 napoléons nettoyeurs Labroides dimidiatus et (b) 14 napoléons non nettoyeurs Halichoeres melanurus dans quatre combinaisons de traitement différentes. La tentation de tricher était soit « faible » en raison d'une grande proportion du type d'aliment préféré dans l'aliment moins préféré, soit « élevée » en raison d'une plus petite proportion du type d'aliment préféré dans l'aliment moins préféré, et après qu'un poisson ait mangé un aliment préféré, l'assiette a été retirée soit rapidement (plus d'alimentation possible = contrôle élevé de la victime sur la durée) ou lentement (plus d'alimentation possible = faible contrôle de la victime sur la durée). Pour L. dimidiatus, les lettres indiquent des différences significatives entre les groupes de traitement. Il n'y avait pas de différences significatives entre les traitements pour H. melanurus. Les astérisques indiquent des différences significatives avec la valeur attendue de la recherche de nourriture aléatoire (ligne pointillée, calculée en supposant qu'à chaque bouchée, la probabilité de manger un élément moins apprécié correspond à son abondance relative). Un astérisque indique un p-valeur comprise entre 0,05 et 0,01, deux astérisques indiquent une p-valeur inférieure à 0,01. Les valeurs aberrantes sont représentées par des cercles.

Pour chaque interaction, nous avons évalué le nombre d'articles moins appréciés consommés par un individu avant de manger un article préféré.Le nombre d'items moins appréciés a ensuite été utilisé comme variable de réponse dans un modèle mixte généralisé (GLMM) avec le traitement comme variable explicative et l'individu comme facteur de regroupement. Des comparaisons par paires entre les traitements ont été obtenues avec des contrastes de Tukey pour chaque espèce séparément. Afin d'évaluer l'effet de l'espèce et le traitement initial de la tentation, des modèles incluant ces variables explicatives supplémentaires ont été comparés au modèle original au moyen d'une ANOVA.

Pour calculer le nombre moyen d'éléments en flocons consommés avant le premier élément de crevettes sous l'hypothèse 0 selon laquelle les nettoyeurs mangent sans discernement, nous avons supposé que les nettoyeurs mangeaient des éléments à n'importe quel stade en fonction de leur disponibilité. Par conséquent, la probabilité que le premier élément mangé soit une crevette était de 0,5. La probabilité de manger un flocon suivi d'une crevette était de 0,5 × 0,6 = 0,3. La probabilité de manger des flocons, des flocons puis des crevettes était de 0,5 × 0,4 × 0,75 = 0,15, et la probabilité de manger tous les flocons avant une crevette était de 0,5 × 0,4 × 0,25 = 0,05. Par conséquent, l'hypothèse nulle prédit que les nettoyeurs ont mangé en moyenne 0,5 × 0 flocons plus 0,3 × 1 flocon plus 0,15 × 2 flocons plus 0,05 × 3 flocons = 0,75 flocons avant le premier élément de crevettes (ligne pointillée dans la figure 1). Nous avons comparé cette valeur au nombre moyen d'aliments moins appréciés consommés par tour pour chaque poisson dans chaque combinaison de traitement avec les tests de Wilcoxon. Toutes les statistiques ont été réalisées avec R v. 2.14.0 [46], les GLMM ont été réalisées avec le package R ‘lme4’ [47] et les contrastes Tukey ont été obtenus avec le package R ‘multcomp’ [48]. L'ensemble de données est disponible dans le référentiel Dryad (doi:10.5061/dryad.r70n0).

3. Résultats

Labre plus propre L. dimidiatus la recherche de nourriture variait considérablement entre les traitements (figure 1une). La tentation (forte tentation, HT faible tentation, LT) et le contrôle de la victime (contrôle élevé, HC faible contrôle, LC) ont eu des effets significatifs : toutes les comparaisons par paires étaient significatives (ajustement GLMM par Laplace : HT-LC versus HT-HC : z = −2.568, p = 0,049 HT–LC versus LT–LC : z = 5.041, p < 0,001 HT–LC par rapport à LT–HC : z = −6.567, p < 0,001 HT–HC par rapport à LT–LC : z = 2.653, p = 0,039 HT-HC versus LT-HC : z = 4.357, p < 0,001) sauf entre les traitements de contrôle bas et haut lorsque la tentation était faible (ajustement GLMM par Laplace : z = −1.781, p = 0,279). La combinaison d'une forte tentation et d'un faible contrôle des victimes a conduit les nettoyeurs à « exploiter » leurs « victimes » en privilégiant les crevettes préférées (comportement de recherche de nourriture observé contre les attentes aléatoires indiqué par la ligne pointillée dans la figure 1une m = 16, V = 8, p = 0,002). Lorsque la tentation de tricher et le contrôle de la victime étaient tous deux élevés, le comportement de recherche de nourriture n'était pas significativement différent du comportement aléatoire (m = 16, V = 67, p = 0,979). Enfin, dans les deux traitements dans lesquels la tentation de manger des crevettes était faible, les nettoyeurs ont « coopératif » en mangeant de manière significative contre leur préférence (LT-HC : m = 16, V = 113, p = 0.021, m = 16 TL–LC : m = 16, V = 113, p = 0.003).

La recherche de nourriture était significativement différente entre les deux espèces (comparaison entre les GLMM avec et sans espèce comme variable explicative : ANOVA, d.f. = 4, p < 0,001 chiffre 1b). En effet, H. melanurus la recherche de nourriture ne différait pas significativement entre les traitements (ajustement GLMM par Laplace : toutes les comparaisons par paires : –1 < z < 1.3, p > 0.5). Dans tous les traitements, ils ont mangé des aliments préférés beaucoup plus souvent que prévu par choix aléatoire (m = 14, tout V = 0, tout p 0,001). Que les individus aient commencé l'expérience avec le traitement à forte ou à faible tentation n'a pas affecté les résultats de manière significative (comparaison entre un GLMM avec à la fois l'espèce et la condition initiale comme variables explicatives et un GLMM avec uniquement l'espèce comme variable explicative : ANOVA, df = 8 , p = 0.109).

4. Discussion

Nos résultats fournissent des preuves expérimentales qu'un mécanisme de contrôle du partenaire le plus basique, la menace de la fin précoce d'une interaction, peut être suffisant pour maintenir un comportement coopératif dans le nettoyage du mutualisme tant que la tentation de tricher est faible. Dans notre expérience, le degré de tentation a influencé le comportement de recherche de nourriture des nettoyeurs plus fortement que l'étendue de leur contrôle sur la durée de l'interaction. Néanmoins, les deux paramètres ont eu une influence significative. En ce qui concerne les conditions naturelles probables, notons que la tentation de tricher devrait être relativement faible : si les nettoyeurs préféraient le mucus aux isopodes gnathiidae dans une expérience de choix, ils en consommaient néanmoins régulièrement. Un autre type abondant d'ectoparasites, les vers plats monogènes, a été consommé avec une probabilité similaire par rapport au mucus [41]. De plus, le contrôle du client sur la durée des interactions semble être très élevé [42]. Ainsi, les conditions favorisant une issue mutualiste, même en l'absence de mécanismes de contrôle supplémentaires, semblent remplies.

Mettre fin à une interaction en réponse à une tricherie présente des avantages immédiats pour le client en ce sens qu'il permet d'échapper à une exploitation ultérieure. De plus, il inflige un coût au nettoyeur puisqu'il réduit ses possibilités de recherche de nourriture. En conséquence, la coopération pourrait être promue comme un sous-produit d'un comportement égoïste (échapper à l'exploitation), qui est une forme de pseudo-réciprocité négative [6,11,49], également appelée « sanctions » par divers chercheurs [ 13,30]. Alors que certains auteurs se réfèrent à un tel mécanisme comme « punition intéressée » ou « punition sans frais » [50], nous préférons restreindre l'utilisation du terme punition aux actions qui entraînent un coût pour le coupable, à la suite de Clutton-Brock & Parker [12] et Rahiani et al. [11]. Les sanctions constituent un mécanisme relativement simple pour promouvoir la coopération. Contrairement à la punition, elle ne repose pas sur les bénéfices futurs découlant de l'augmentation du comportement coopératif de la cible pour être sous sélection positive [11]. Nos résultats ajoutent une preuve supplémentaire à la perception croissante que si des mécanismes plus complexes tels que la punition ou les effets sur la réputation peuvent recevoir plus d'attention de la part des chercheurs, des mécanismes de contrôle des partenaires plutôt simples comme les sanctions peuvent souvent être responsables d'une coopération stable dans des exemples naturels [2–4,35 ,49] : avortement sélectif des fruits infestés de larves granivores des espèces pollinisateurs [51], investissement sélectivement réduit d'une plante dans la croissance des racines dans les zones où la fixation d'azote par les bactéries rhizobium est faible [30,31], réduit la durée du sondage par un pollinisateur si les quantités de nectar sont faibles [52,53], l'évitement d'un labre plus propre qui a été observé en train de tromper un autre client [27] ou le départ prématuré d'un client en réponse à une tricherie plus propre [42].

Ce qui est intriguant dans nos résultats concernant les nettoyeurs, c'est qu'il existe des preuves expérimentales que les clients ne se contentent pas de mettre fin prématurément aux interactions en réponse à la tricherie, mais qu'ils peuvent en plus punir les nettoyeurs, passer à un autre nettoyeur pour leur prochaine inspection et peuvent observer un nettoyeur- interactions avec les clients pour éviter de tromper les nettoyeurs [27,45]. À l'avenir, nous devrions nous demander dans quelle mesure la punition ou le changement de partenaire, en plus de la menace de résiliation anticipée, peut pousser la qualité du service fourni par les nettoyeurs vers des niveaux de coopération plus élevés (pour les modèles traitant de cette question, voir [54-56] ). Plus généralement, étant donné qu'il existe tant de mécanismes possibles de contrôle des partenaires, nous suggérons que ce n'est qu'en étudiant l'impact de chaque mécanisme sur le niveau de coopération par rapport à l'exploitation que les études empiriques peuvent déterminer quelles formes de contrôle des partenaires ont une réelle signification biologique. .

Labre à fines rayures H. melanurus n'étaient pas capables de se nourrir contre leur préférence afin de maximiser leur apport alimentaire et aucun des traitements ne semblait influencer leur comportement de recherche de nourriture. Cette espèce non plus propre se nourrit de petits invertébrés des substrats [57] et ne devrait donc pas faire face à des décisions de recherche de nourriture applicables à nos expériences dans la vie réelle. Les résultats impliquant H. melanurus montrent que l'ajustement du comportement de recherche de nourriture au traitement expérimental n'est pas une tâche de recherche de nourriture optimale triviale qui peut être facilement résolue par n'importe quelle espèce. Au lieu de cela, nous concluons que l'expérience ne peut être résolue que par les espèces pour lesquelles le problème est écologiquement pertinent. Plus précisément, les non-nettoyeurs n'ont pas montré la capacité de se nourrir contre leur préférence. Nous prédisons que le labre plus propre L. dimidiatus sont en effet spécifiquement adaptés à ce problème, car il est très probable qu'il soit rare dans la nature qu'un animal soit confronté à ce problème. Même les gobies nettoyeurs peuvent se concentrer sur la consommation de leur nourriture préférée car ils préfèrent les ectoparasites de poisson au mucus [58], ce qui s'applique probablement aussi à la plupart des espèces de poissons nettoyeurs facultatifs [59]. Dans l'état actuel des choses, le labre nettoyeur L. dimidiatus montre des capacités stratégiques adaptées aux interactions avec les clients qui sont absentes chez les primates [60], malgré l'importance générale de la coopération dans la vie sociale des primates [61,62]. Comme les expériences impliquant des assiettes et de la nourriture représentent des tâches d'apprentissage, les performances supérieures du labre nettoyeur sont liées à des adaptations de la machinerie cognitive, comme le prédit l'approche écologique de la cognition [63,64].

En conclusion, dans les interactions dans lesquelles les gains sont une fonction positive de la durée, des résultats coopératifs peuvent être obtenus dans les cas où un seul joueur peut tricher, comme le prédisent les modèles de la théorie des jeux [20,21,65]. Le contrôle de la victime sur la fin précoce de l'interaction et la faible tentation de tricher se combinent pour affecter le niveau de coopération du tricheur potentiel. Malgré l'apparente simplicité du concept, il apparaît qu'une coopération stable dépend toujours de l'adaptation des partenaires aux spécificités de la structure du jeu.


2. Matériel et méthodes

Des expériences avec L. dimidiatus ont été menées en juin&# x02013juillet 2004 à Lizard Island Research Station, Great Barrier Reef, Australie (14끀′ S, 145뀨′ E). Des expériences impliquant H. melanurus ont été menées en janvier et février 2012 sur le même site. Seize labres nettoyeurs adultes et 14 adultes H. melanurus ont été capturés avec un filet barrière et maintenus seuls ou par paires dans des aquariums de différentes tailles pendant au moins 20 jours avant les expériences. Pendant la phase d'acclimatation, les nettoyeurs ont été entraînés à se nourrir de purée de crevettes et de flocons de poisson mélangés à des crevettes (appelées plus loin « flocons ») étalés sur des plaques de plexiglas de différentes couleurs. Au cours de la même phase, H. melanurus les individus ont également été entraînés à se nourrir de purée de crevettes étalée sur des assiettes similaires.

Comme les nettoyeurs ont une forte préférence pour les crevettes par rapport aux flocons [45], ces deux types d'aliments pourraient être utilisés dans nos expériences. De façon intéressante, H. melanurus n'avait pas la même préférence. Par conséquent, pendant l'acclimatation, des combinaisons de divers types d'aliments ont été proposées aux H. melanurus pour trouver une combinaison appropriée. Le protocole a suivi Bshary & Grutter [45] : H. melanurus les individus ont reçu des assiettes recouvertes de sept articles de chacun des deux types d'aliments testés. Nous avons considéré qu'un individu avait atteint une préférence lorsque, dans les sept premiers éléments de chaque essai, un type d'aliment était choisi plus de 80 % du temps au cours de trois essais ultérieurs. Nous avons finalement trouvé que tous les individus montraient une telle préférence pour un mélange 80 : 20 crevettes : flocons contre un mélange 70 : 30 sable : crevettes. Dans le processus de détermination d'une combinaison appropriée d'aliments, H. melanurus expérimenté au total entre 29 et 51 essais alimentaires.

La conception expérimentale de base est très similaire au protocole utilisé dans les précédentes études expérimentales en laboratoire sur L. dimidiatus [45] et ne seront donc décrits ici que brièvement. Dans un premier temps avant l'expérience proprement dite, tous les poissons ont été familiarisés avec la situation dans laquelle une assiette contenant à la fois des éléments préférés et moins préférés resterait dans leur aquarium tant qu'ils mangeaient les éléments moins préférés, mais serait immédiatement retirée si ils ont mangé un article préféré. Une réaction immédiate était possible car la plaque était fixée à un levier tenu par l'expérimentateur. Par conséquent, les poissons devaient se nourrir contre leur préférence s'ils voulaient augmenter leur consommation de nourriture. Au cours de six essais, 14 éléments moins préférés ont été présentés avec seulement deux éléments préférés. Dans cette condition, tous les poissons mangeaient régulièrement des aliments moins appréciés et subissaient ainsi à la fois les conséquences positives et négatives de leurs décisions de recherche de nourriture, leur donnant ainsi l'opportunité d'apprendre.

Au cours de l'expérience, nous avons offert au poisson deux assiettes en plexiglas (12 × 7 cm) avec de nouveaux motifs de couleurs distincts et avec six cercles noirs (1 cm de diamètre), chaque cercle contenant un aliment. Trois articles étaient du type d'aliment préféré et trois articles étaient du type moins préféré. Les assiettes étaient retirées avec un levier dès que le poisson mangeait un élément préféré. Pour chaque poisson, une assiette était toujours retirée si rapidement (moins de 1 s) que l'individu ne pouvait pas en manger un autre (ce qui correspond à un fort contrôle de la victime sur la durée de l'interaction), tandis que l'autre assiette était retirée suffisamment lentement pour que le poisson pourrait manger d'autres éléments (correspondant à un faible contrôle de la victime sur la durée de l'interaction). Le retrait lent a été ajusté à la vitesse de recherche de nourriture des sujets et prendrait généralement 2𠄳 s. L'élimination lente a fonctionné comme prévu, car tous les poissons ont mangé des aliments supplémentaires dans ces essais (valeurs moyennes pour les individus : minimum, médiane, maximum d'éléments par tour : 1,1, 1,5, 1,9, respectivement, pour L. dimidiatus et 0,9, 1,6, 2 pour H. melanurus). La variation de la concentration du type d'aliment moins apprécié (50 ou 10 % de flocons dans le mélange de flocons de crevettes pour les nettoyants 70 ou 20 % de sable dans le mélange de crevettes pour les rayures) a donné lieu à une tentation élevée ou faible de manger le article préféré. Tous les poissons ont été confrontés à chacune des quatre combinaisons de vitesse de prélèvement et de tentation (figure 1) sept fois, ce qui a donné un total de 28 essais par animal. La moitié des sujets ont d'abord terminé les 14 essais impliquant une faible tentation le premier jour, puis les 14 essais de forte tentation le deuxième jour, tandis que l'autre moitié a été exposée à l'ordre inverse. Dans les 14 unités d'essai, la séquence d'essais de plaques lentes et rapides était contrebalancée. Toutes les combinaisons de couleur de plaque avec la vitesse de retrait de plaque étaient également équilibrées entre tous les individus de chaque espèce pour éviter tout effet de couleur expliquant les résultats. Tous les poissons ont été relâchés sur le site de capture après l'expérience.

Diagrammes en boîte et en moustache du nombre moyen d'articles moins appréciés consommés par tour par (une) 16 napoléons nettoyeurs Labroides dimidiatus et (b) 14 napoléons non nettoyeurs Halichoeres melanurus dans quatre combinaisons de traitement différentes. La tentation de tricher était soit �ible’ en raison d'une grande proportion du type d'aliment préféré dans l'aliment moins préféré, soit ‘élevée’ en raison d'une plus petite proportion du type d'aliment préféré dans l'aliment moins préféré, et après qu'un poisson ait mangé un aliment préféré, l'assiette était retirée soit rapidement (plus d'alimentation possible = contrôle élevé de la victime sur la durée) ou lentement (plus d'alimentation possible = faible contrôle de la victime sur la durée). Pour L. dimidiatus, les lettres indiquent des différences significatives entre les groupes de traitement. Il n'y avait pas de différences significatives entre les traitements pour H. melanurus. Les astérisques indiquent des différences significatives avec la valeur attendue de la recherche de nourriture aléatoire (ligne pointillée, calculée en supposant qu'à chaque bouchée, la probabilité de manger un élément moins apprécié correspond à son abondance relative). Un astérisque indique un p-valeur comprise entre 0,05 et 0,01, deux astérisques indiquent une p-valeur inférieure à 0,01. Les valeurs aberrantes sont représentées par des cercles.

Pour chaque interaction, nous avons évalué le nombre d'articles moins appréciés consommés par un individu avant de manger un article préféré. Le nombre d'items moins appréciés a ensuite été utilisé comme variable de réponse dans un modèle mixte généralisé (GLMM) avec le traitement comme variable explicative et l'individu comme facteur de regroupement. Des comparaisons par paires entre les traitements ont été obtenues avec des contrastes de Tukey pour chaque espèce séparément. Afin d'évaluer l'effet de l'espèce et le traitement initial de la tentation, des modèles incluant ces variables explicatives supplémentaires ont été comparés au modèle original au moyen d'une ANOVA.

Pour calculer le nombre moyen d'éléments en flocons consommés avant le premier élément de crevettes sous l'hypothèse 0 selon laquelle les nettoyeurs mangent sans discernement, nous avons supposé que les nettoyeurs mangeaient des éléments à n'importe quel stade en fonction de leur disponibilité. Par conséquent, la probabilité que le premier élément mangé soit une crevette était de 0,5. La probabilité de manger un flocon suivi d'une crevette était de 0,5 × 0,6 = 0,3. La probabilité de manger des flocons, des flocons puis des crevettes était de 0,5 × 0,4 × 0,75 = 0,15, et la probabilité de manger tous les flocons avant une crevette était de 0,5 × 0,4 × 0,25 = 0,05. Par conséquent, l'hypothèse nulle prédit que les nettoyeurs mangeaient en moyenne 0,5 × 0 flocons plus 0,3 × 1 flocon plus 0,15 × 2 flocons plus 0,05 × 3 flocons = 0,75 flocons avant la première crevette (ligne pointillée dans la figure 1). Nous avons comparé cette valeur au nombre moyen d'aliments moins appréciés consommés par tour pour chaque poisson dans chaque combinaison de traitement avec les tests de Wilcoxon. Toutes les statistiques ont été réalisées avec R v. 2.14.0 [46], les GLMM ont été réalisées avec le package R ‘lme4’ [47] et les contrastes Tukey ont été obtenus avec le package R ‘multcomp’ [48]. L'ensemble de données est disponible dans le référentiel Dryad (doi:10.5061/dryad.r70n0).


Discussion

Nous démontrons que la crevette plus propre de Pederson, Ancylomenes pedersoni, ne font pas varier leur qualité de service dans le golfe du Honduras en fonction de la taille du groupe plus propre, de la position trophique du poisson de récif client, du site du récif ou de l'heure de la journée dans les directions hypothétiques (c'est-à-dire plus de tricherie sur les poissons non prédateurs que sur les poissons prédateurs, et plus de tricherie par des crevettes solitaires que par des groupes de nettoyeurs). Certains effets d'interaction significatifs ont été récupérés entre la taille du groupe et la position trophique du client tout en essayant de tenir compte des comportements biologiquement réalistes dans deux de nos ensembles de données. Ces effets suggèrent que la crevette peut être capable de discriminer et de répondre à certains aspects de l'interaction. Ce qui pourrait les causer reste incertain, et bien que nous ne puissions pas exclure certains effets de la taille du groupe de crevettes plus propres ou du type de client sur le taux de tricherie, les modèles que nous avons récupérés ne sont pas cohérents avec nos prédictions. De plus, les clients de A. pedersoni n'est pas parti immédiatement après un événement présumé de tricherie et n'a manifesté aucun comportement agressif envers les nettoyeurs, comme cela a été observé dans d'autres études sur cette crevette nettoyeuse.

À la lumière de nos résultats, lorsqu'ils sont considérés conjointement avec des études sur les gobies plus propres 19,20,21 , il apparaît que le système de nettoyage dans les Caraïbes (nettoyeurs et clients), bien que fonctionnellement et écologiquement analogue à ceux de l'Indo-Pacifique, a pas évolué les mêmes comportements de service stratégique ou mécanismes de contrôle des partenaires. s'envole et al. 19 différences précédemment notées dans les comportements de service stratégique et les mécanismes de contrôle des partenaires entre les gobies nettoyeurs des Caraïbes et L. dimidiatus, et nous arrivons à des conclusions similaires concernant les différences dans la fourniture de services stratégiques entre A. pedersoni dans les Caraïbes et A. longicarpus dans l'Indo-Pacifique. s'envole et al. 19 ont présenté trois hypothèses non mutuellement exclusives pour expliquer les différences dans l'évolution des stratégies comportementales entre les gobies plus propres dans les Caraïbes et les labres plus propres dans l'Indo-Pacifique qui, compte tenu des implications de nos résultats, peuvent également s'appliquer aux différences régionales entre Ancylomènes spp. Ce sont (1) l'hypothèse de la contrainte, (2) l'hypothèse du faible coût de la tricherie et (3) l'hypothèse de la préférence de recherche de nourriture.

L'hypothèse de la contrainte présente deux contraintes potentielles qui peuvent expliquer pourquoi les systèmes de nettoyage des Caraïbes n'ont pas développé la complexité comportementale des systèmes indo-pacifiques : (i) les nettoyeurs des Caraïbes sont moins dépendants d'un mode de vie de nettoyage que les nettoyeurs indo-pacifiques. Il a été démontré que les gobies nettoyeurs des Caraïbes, bien que considérés comme une espèce plus propre, obtenaient jusqu'à 85 % de leurs besoins alimentaires grâce au nettoyage tandis que les labres nettoyeurs L. dimidiatus acquiert 99% de leur alimentation grâce au nettoyage. Des données comparables pour des crevettes plus propres A. pedersoni et A. longicarpus n'existent pas, qui sont nécessaires pour évaluer cette hypothèse plus largement. (ii) Des différences dans la stratégie de nettoyage et le contrôle des partenaires entre les bassins océaniques pourraient survenir si les nettoyeurs sont limités dans leurs capacités cognitives à se souvenir de l'interaction et de l'identité du poisson client qui inflige une punition pour tricherie. Fait intéressant, contrairement à nos données sur A. pedersoni, Chapuis et Bshary 10 montrent que A. longicarpus peuvent faire la distinction entre les clients prédateurs et non prédateurs, bien qu'ils n'aient pas d'hypothèses spécifiques pour expliquer cette capacité. Des recherches récentes suggèrent cependant qu'il serait peu probable de différencier visuellement les clients, car deux crevettes plus propres de la famille des Palaemonidae (y compris A. pedersoni) se sont avérés avoir une faible sensibilité spectrale (c'est-à-dire une vision monochromatique) et une faible résolution spatiale 32 . Grottes et al. 32 concluent que la vision plus nette des crevettes est suffisante pour détecter des stimuli importants, mais ne peut probablement pas détecter les contours, les couleurs ou les motifs nets des clients potentiels ou des crevettes conspécifiques habitant la même station de nettoyage. Wicksten 33 suggère que les soies chimiosensorielles sur les antennes et les dactyles des crevettes pourraient aider à la reconnaissance du client, et que les composés trouvés dans le mucus des poissons pourraient avoir une fonction phéromonale 34 . Quoi qu'il en soit, les résultats de Chapuis et Bshary 10 démontrent que des capacités cognitives complexes peuvent évoluer chez une espèce de crevette étroitement apparentée. Des comparaisons cognitives entre les espèces de crevettes et de poissons au sein et entre les bassins océaniques seraient nécessaires pour tester correctement l'hypothèse de la contrainte cognitive.

L'hypothèse du faible coût de la tricherie indique qu'il existe une variation dans le niveau de coût qu'un nettoyeur inflige à un client lorsqu'il triche et enlève des écailles ou des tissus vivants plutôt que des parasites. Si le coût d'être trompé est suffisamment élevé, la sélection devrait orienter les stratégies des clients pour imposer des comportements honnêtes. s'envole et al. 19 noter que les différences de taille entre le napoléon nettoyeur bluestreak L. dimidiatus (12 cm de longueur totale) par rapport aux gobies nettoyeurs des Caraïbes (4 cm de longueur totale) peuvent être suffisants pour que la tricherie par L. dimidiatus pourrait infliger des blessures plus importantes aux poissons clients et, par conséquent, infliger un coût de tricherie plus élevé. Cela reste à mesurer, mais les données comparatives de A. longicarpus devrait fausser cette hypothèse quant à sa capacité à expliquer les différences entre les bassins océaniques. Tricher par A. longicarpus, une petite crevette palémonide délicate ne peut certainement pas infliger les mêmes types de coûts aux clients que les mâchoires vertébrées des gobies nettoyeurs des Caraïbes.

Enfin, l'hypothèse de la préférence alimentaire indique que les différences de complexité comportementale dans les symbioses de nettoyage entre les bassins océaniques pourraient être motivées par la préférence alimentaire des fournisseurs de services plus propres. Ici, les différences entre les poissons nettoyeurs des Caraïbes et de l'Indo-Pacifique sont faciles à expliquer : les gobies nettoyeurs des Caraïbes préfèrent les ectoparasites au mucus des clients tandis que les labres nettoyeurs de l'Indo-Pacifique préfèrent le mucus des clients aux ectoparasites 17,21. Ainsi, une incitation inhérente à tricher existe pour les labres plus propres, mais pas pour les gobies plus propres des Caraïbes. Les différences de préférence alimentaire entre les clients signifient que toutes les interactions avec les gobies plus propres devraient commencer en coopération avec les gobies qui recherchent des parasites. Les gobies n'auraient recours à la consommation d'écailles ou de tissus de poisson que si l'abondance des parasites est faible. L'explication des différences de comportement entre les crevettes A. pedersoni dans les Caraïbes et A. longicarpus dans l'Indo-Pacifique est moins clair. L'hypothèse de la préférence alimentaire présente l'explication la plus simple et la plus cohérente de l'évolution des différentes stratégies de nettoyage comportemental dans les deux bassins océaniques. À notre connaissance, aucune étude n'a évalué la préférence alimentaire chez les crevettes plus propres, ni mené une analyse du contenu intestinal de A. pedersoni.

Pour résumer, des recherches axées sur les préférences alimentaires des crevettes plus propres, les analyses du contenu intestinal et les comportements stratégiques d'autres espèces plus propres dans les Caraïbes et l'Indo-Pacifique sont nécessaires, mais à première vue, il semble que les stratégies de nettoyage aient évolué indépendamment dans les deux bassins océaniques. et que la stabilité de ces mutualismes est maintenue de différentes manières. La signalisation avancée, les comportements de triche, la morphologie du corps et des chélates, l'hébergement avec des anémones de mer, ainsi que des motifs et une coloration dorsale remarquables ont tous été notés comme des propriétés convergentes chez les espèces du genre Ancylomènes qui ont développé indépendamment des modes de vie dédiés au nettoyage sur les récifs coralliens de l'Indo-Pacifique et de l'Atlantique Ouest 31 . Nos données démontrent que les comportements qui maintiennent ces symbioses sont décidément différents.

Bien que dans l'ensemble, les Caraïbes semblent être un système où les deux espèces les plus nettoyantes ne varient pas leurs qualités de service et les clients ne punissent pas agressivement la tricherie, il existe des différences importantes dans les réponses des clients aux incidents de tricherie par les gobies et par les A. pedersoni. s'envole et al. 19 ont étudié la fréquence de la tricherie chez les gobies plus propres à la Barbade et ont constaté que la tricherie se produisait dans

40 % de toutes les interactions de nettoyage, une valeur similaire à nos résultats. Cependant, plus de 90 % de tous les incidents de tricherie par des gobies plus propres ont entraîné la fin immédiate de l'interaction par le client 19 . Nos données montrent que les incidents de tricherie par A. pedersoni a rarement abouti à ce que le client mette fin à un nettoyage. Même en faisant l'interprétation la plus libérale de nos données, seuls

27% de toutes les secousses enregistrées auraient pu entraîner la fin de l'interaction. Au total, nous avons enregistré 163 interactions de nettoyage avec au moins 2 incidents de triche et 72 interactions de nettoyage avec 3 incidents ou plus de tricherie. Nos données démontrent clairement que les clients tolèrent à plusieurs reprises la tricherie (ou des comportements qui ressemblent à de la triche) en A. pedersoni. Bien que l'hypothèse du « faible coût de la triche » semble ne pas expliquer les différences entre les bassins océaniques, elle peut fournir une explication valable pour expliquer pourquoi les clients tolèrent davantage la tricherie à A. pedersoni stations que des stations gobies plus propres.

Une hypothèse supplémentaire pour une tolérance accrue à la tricherie par A. pedersoni que par les gobies nettoyeurs est leur fourniture de « massages » par défaut pendant les interactions de nettoyage 10 . Il a été démontré que la stimulation tactile est importante pour le labre plus propre L. dimidiatus en manipulant les clients pour prolonger les nettoyages, se réconcilier avec les clients après la tricherie et en tant que stratégie de pré-conflit envers les prédateurs (par exemple 35,36), mais les crevettes plus propres peuvent fournir une stimulation tactile par inadvertance pendant une interaction 10 . Les crevettes plus propres sont en contact physique avec leurs clients à tout moment, et les crevettes marchant sur des mains humaines procurent une sensation de chatouillement (par exemple, 10 obs. pers.). Fournir une sensation similaire aux clients pourrait alors prolonger le nettoyage. De plus, il est possible que la stimulation tactile rende les clients moins dérangés par les tricheurs, ou que ces tricheurs soient moins perceptibles en raison de la sensation physique de contact avec des crevettes plus propres. Interactions de nettoyage à A. pedersoni Il a déjà été démontré que les stations sont plus longues que celles des stations gobies plus propres, même lorsqu'elles desservent les mêmes clients (par exemple 26 ). Les massages par défaut peuvent réduire les hormones de stress chez les clients (p.

Un aspect de la compréhension de l'évolution de la fourniture de services stratégiques dans les crevettes plus propres qui mérite plus d'attention est la signification des secousses des poissons des clients et s'il peut être confirmé qu'il s'agit d'un véritable proxy de la tricherie. Alors que les secousses sont largement acceptées comme indicateur de tricherie dans la littérature sur le nettoyage, ces études proviennent exclusivement de poissons plus propres [par ex. 6,20 ]. Dans leur étude de A. longicarpus. wrasse. Une étude récente de Vaughan et al. 38 jette en outre le doute que la corrélation entre les secousses et la tricherie est aussi forte chez les crevettes plus propres que chez les poissons plus propres. Utiliser la crevette nettoyeuse Indo-Pacifique Lysmata amboinensis et le poisson de récif Pseudanthias squammipinnis dans une expérience de manipulation en laboratoire, Vaughan et al. 38 ont montré que les clients de poissons individuels étaient responsables de 20 fois la variance du taux de secousses que les crevettes plus propres. Les poissons ont été déplacés dans des aquariums différents pour chaque traitement, et la même combinaison nettoyeur-client n'a jamais été réutilisée. Ils ont découvert que seulement 10 sur 54 P. squammipinnis les individus présentaient des secousses répétées et un comportement agressif envers les crevettes nettoyeuses. Bien que l'étude de Vaughan et al. 38 utilise une autre espèce de crevette nettoyeuse dans un environnement non naturel, avec une seule espèce cliente, il est possible que les sensibilités individuelles aux poissons clients soient en partie responsables des comportements de secousses que nous avons observés dans notre étude. Une étude ciblée analogue à celles qui ont été menées avec des poissons plus propres est nécessaire pour déterminer si les clients non parasités se secouent plus fréquemment en présence de crevettes plus propres que les clients parasités.

En conclusion, nos données présentent la première preuve que A. pedersoni, l'une des espèces les plus propres sur le plan écologique des récifs coralliens des Caraïbes, ne présente aucune preuve de comportements de service stratégique. Parce que notre étude est directement comparable à celles menées pour des poissons et des crevettes plus propres, notre travail améliore notre connaissance de la stabilité des mutualismes et du comportement de nettoyage sur les récifs coralliens, et démontre que des systèmes de nettoyage écologiquement analogues dans des bassins océaniques séparés ont développé des stratégies indépendantes pour réguler et régissent ces interactions comportementales complexes. Comme les recherches antérieures sur les gobies nettoyeurs des Caraïbes, notre étude démontre que la symbiose de nettoyage impliquant A. pedersoni ne répondent pas à toutes les attentes formulées par les modèles théoriques des jeux. Les manières fondamentalement différentes dont les symbioses de nettoyage dans les Caraïbes ont évolué ont des implications importantes pour les futures recherches testant des modèles théoriques de jeux utilisant des systèmes de nettoyage. À savoir, qu'il n'y a pas de comportement de service stratégique « standard » commun à tous les mutualismes de nettoyage. Des dizaines d'espèces de poissons et de crustacés sont classées comme espèces plus propres. Chacun peut avoir développé des comportements uniques qui aboutissent finalement à l'élimination des parasites importants sur le plan écologique des poissons de récif. Notre compréhension de ces systèmes devrait bénéficier d'études futures qui explorent les préférences alimentaires des crevettes plus propres, les capacités cognitives des crevettes plus propres dans les deux bassins océaniques et les réponses hormonales des poissons de récif clients lors des interactions de nettoyage avec des crevettes plus propres.


Reproduction de lompe en captivité

Pour fournir le nombre de lompes requis par l'industrie salmonicole, des recherches sont nécessaires sur la reproduction et le contrôle de la maturation pour une production toute l'année, éventuellement en utilisant la photopériode et le contrôle hormonal. En Grande-Bretagne, les adultes se reproduisent dans les eaux peu profondes sur des substrats rocheux pendant l'hiver (Blacker 1983 Davenport 1985 ) et atteignent généralement la maturité à l'âge de 3 à 5 ans (Anon 2003 Hedeholm et al. 2014 ), bien que certaines populations puissent arriver à maturité après seulement 2 ans (Albert et al. 2002). Les mâles sont généralement plus petits que les femelles, développent une plus grande ventouse et mûrissent plus tôt (Davenport & Lonning 1983 Hedeholm et al. 2014). La survie après la ponte est généralement faible, parfois aussi peu que 10 % (Stevenson & Baird 1988 Kasper et al. 2014 ), ce qui suggère que les poissons ne peuvent frayer qu'une seule fois. Une stratégie de vie sémelpare (c'est-à-dire une seule ponte) est également suggérée par l'investissement reproductif inhabituellement élevé des femelles et al. 2014 ).

Pour être utilisés comme géniteurs, les adultes sauvages sont généralement capturés pendant la saison de frai à l'aide de filets maillants déployés dans des eaux peu profondes (jusqu'à

30 m de profondeur) près du rivage. Un maillage de 267 mm est utilisé en Islande (Kennedy et al. 2014 ), et s'il est possible d'utiliser d'autres moyens de capture potentiellement moins dommageables (par exemple SCUBA, Killen et al. 2007a ), ceux-ci ont tendance à être moins efficaces. Les lompes n'ont pas de vessie natatoire, mais les adultes remontés rapidement à la surface peuvent subir un barotraumatisme. Cela peut être réduit en retournant les animaux en profondeur dans une cage, suivi d'une décompression progressive.

En captivité, la fécondation peut être réalisée selon la « méthode sèche », c'est-à-dire en mélangeant le sperme avec les ovules et en ajoutant de l'eau de mer pour activer le sperme (Fig. 3). Cependant, les mâles capturés dans la nature peuvent être difficiles à dépouiller et le sperme peut devoir être collecté après la dissection des testicules, qui sont ensuite macérés et passés au tamis pour obtenir le sperme. Il est possible d'obtenir du sperme viable à partir des testicules plusieurs jours après le prélèvement du poisson (Davenport 1983 ), et le sperme de lompe peut également être cryoconservé (Norðberg et al. 2015). Cependant, l'abattage des mâles pour obtenir du sperme n'est pas une approche viable à long terme (Kyûshin 1975 Davenport 1983 ) et limite grandement le développement d'un programme d'élevage en captivité efficace pour l'espèce. C'est un domaine où des améliorations sont nécessaires.

Les femelles sauvages fraient facilement dans de petits réservoirs et sans avoir besoin de substrat, mais ces œufs ont tendance à avoir une survie plus faible car ils sont difficiles à incuber de manière optimale une fois qu'ils ont durci pour cette raison, la fertilisation artificielle de la lompe est recommandée (Kyûshin 1975 Brown et al. 1992 Nytrø et al. 2014 ) car il permet de manipuler la masse d'œufs avant qu'elle ne durcisse. Lorsque la fécondation artificielle n'est pas possible, les amas d'œufs des femelles pondues naturelles peuvent être divisés en unités plus petites pour faciliter l'écoulement de l'eau sur les œufs (Benfey et Methven 1986 ). Cela a tendance à entraîner un développement embryonnaire plus uniforme et une survie plus élevée, car les embryons situés profondément dans les amas naturels ont tendance à recevoir moins d'oxygène et à se développer plus lentement (Davenport 1985).


La médiation dopaminergique dans le nettoyage

Des études, principalement sur des modèles de mammifères, et plus récemment sur des vertébrés, ont montré que la réciprocité, la coopération et les récompenses sociales activent les zones de traitement des récompenses avec une forte entrée dopaminergique (DA) (par exemple, Schultz et al., 1997 Salamone et Correa, 2002 Wickens et al., 2007 Aragona et Wang, 2009 O𠆜onnell et Hofmann, 2011, 2012). Cependant, l'implication de l'AD s'étend à l'évaluation des risques chez les animaux, influençant la perception de chaque action comportementale (construite sur le résultat d'expériences comportementales antérieures) soit comme appétitive ou aversive (Schultz, 1998 Salamone et Correa, 2002). En effet, DA fonctionne comme un signal d'enseignement, évoluant tout au long du processus d'apprentissage, permettant d'abord aux animaux d'associer un signal donné à une livraison de récompense, puis en permettant progressivement aux animaux d'anticiper la récompense, liée au signal prédictif (Schultz, 2002, voir Figure 2 ). De plus, lorsqu'une récompense est prédite mais ne se produit pas (omission de récompense), l'erreur de prédiction de récompense est signalée (Figure 2, Schultz et al., 1997). Ainsi, DA a été présenté comme un puissant médiateur candidat du processus de décision des nettoyeurs, prévu pour permettre l'attribution de différentes valeurs à différents types de clients, mais surtout à l'évaluation de l'anticipation du gain de récompense (ou du risque) associé à chaque nettoyage. interaction. La première étude, qui s'est concentrée sur l'inférence de manipulations exogènes au système DA des nettoyeurs, sur leur prédisposition à interagir dans des conditions naturelles, s'est uniquement avérée efficace pour réduire la transmission DA visant les récepteurs de type D1 (Messias et al., 2016a) . En effet, l'effet de la perturbation de l'AD sur la proactivité des nettoyeurs avait une tournure intéressante : les nettoyeurs approchaient et interagissaient avec les clients plus longtemps, pas nécessairement pour chercher de la nourriture mais pour fournir une stimulation tactile (Messias et al., 2016a). Il a été expliqué que cela se produisait parce que les réductions de la transmission de l'AD signalaient un résultat pire que prévu, qui anticipait une probabilité plus faible d'obtenir de la nourriture au cours d'une interaction ou, à défaut, une probabilité plus élevée d'être puni (en étant pourchassé ou en étant client partant, voir Messias et al., 2016a). Fait intéressant, l'augmentation réelle de l'investissement a été observée par le blocage des deux récepteurs testés (comme D1 et D2), les récepteurs D2 provoquant une augmentation des événements de stimulation tactile, mais pas le temps passé à le fournir tandis que le blocage D1 produisait une déficience plus forte. sur le comportement global des labres plus propres (Figure 3). L'influence de la perturbation de type récepteur D1 de DA sur la fourniture de stimulations tactiles aux nettoyeurs a été testée plus avant dans des conditions de laboratoire, révélant qu'elle dépend du niveau de familiarité avec leurs partenaires étant fortement exacerbée chaque fois que les clients ne sont pas familiers et passent inaperçus. lorsqu'il s'agit de sujets familiers (Soares et al., 2017b). Ces résultats globaux du blocage de DAergics D1-D2 sur le comportement des nettoyeurs contrastaient avec l'absence d'effets comportementaux mesurables des augmentations exogènes de DA.

Figure 2. Représentation de l'évolution de la réponse dopaminergique (DA) (DR) tout au long du processus d'apprentissage : (UNE) DR habituelle à un roman, récompense imprévue (B) une récompense est présentée après l'affichage d'un signal. Cela permet aux animaux d'associer la réception d'une récompense au signal précédemment affiché (C) après des rencontres répétées, ce DR passe progressivement de la récompense elle-même au signal précédent de prédiction de récompense, et maintenant les animaux peuvent s'attendre à une récompense à chaque fois que ce signal est présenté (prédiction) (RÉ) cependant, lorsqu'une récompense est prédite mais ne se produit pas (omission de récompense), une erreur de prédiction de récompense est signalée.

figure 3. Représentation hypothétique de la manipulation de l'AD sur la signalisation de la récompense chez les nettoyeurs : (UNE) La transmission DA est perturbée par l'administration de l'antagoniste D1, provoquant l'échec de la signalisation DA, même lorsque la récompense est atteinte, d'où la fourniture continue d'une stimulation tactile, même lorsque les labres plus propres ont accès à la surface corporelle de leur client (récompense hypothétique) (B) avec une transmission DA altérée par l'administration d'un antagoniste D2, le signal de prédiction qui devrait se déclencher lors de l'affichage du repère est perturbé et ne se produit pas. Cependant, DA signale toujours la récompense obtenue et les nettoyeurs cessent donc de fournir une stimulation tactile.

Il est intéressant de noter que les effets de la stimulation pharmacologique de l'AD n'étaient évidents que pendant le processus d'apprentissage (Schultz, 2006), au cours duquel les capacités d'apprentissage individuelles des nettoyeurs ont été testées dans des conditions de laboratoire, selon un protocole similaire à celui décrit dans la figure 1A (voir tableau 1). Les preuves ont indiqué un rôle plus important pour les voies des récepteurs D1 que les voies des récepteurs D2 dans les deux tâches d'apprentissage associatif de récompense, qui dépendaient putativement des régions dorsomédiales et dorsolatérales du télencéphale (Figure 1C Messias et al., 2016b). Cependant, lorsque l'indice et la récompense sont réduits par des délais et/ou une localisation imposés (par exemple, la récompense est donnée quelque temps après, sur un site différent), alors la valeur subjective de la récompense peut changer, ce qui peut se produire fréquemment dans le contexte de la coopération, lorsque les animaux doivent choisir une récompense immédiate inférieure s'ils veulent conserver des avantages futurs (Bshary et Côté, 2008). Dans ce cas, la signalisation DA est considérée comme cruciale pour les niveaux dans lesquels l'incitation suscitée par un signal lié à l'alimentation est capable de modifier les choix individuels (Flagel et al., 2011a,b). Pour les nettoyeurs, un délai temporel et spatial putatif entre la présentation d'un stimulus visuel discret et une récompense alimentaire s'est avéré favoriser de manière prédominante une stratégie de suivi des signes &# x0201D (par exemple, les nettoyeurs qui répondent immédiatement à la plaque de signal conditionnée, Soares et al., 2017a). Encore une fois, le blocage du récepteur D1 était responsable de la réduction du comportement de suivi des signes des nettoyeurs, presque au niveau de ceux qui étaient considérés comme des « trackers d'objectifs » (nettoyeurs qui attendent et/ou s'approchent de l'emplacement de la plaque de récompense au lieu de répondre au plaque de repère initiale), tandis que l'augmentation des niveaux de DA a entraîné une dévaluation du résultat, en réduisant la fourniture de stimulation tactile à la plaque de récompense (Soares et al., 2017a). Ainsi, les auteurs ont démontré que les variations de la signalisation DA (en particulier les voies des récepteurs D1) modulent les propriétés d'incitation des nettoyeurs associées aux signaux des clients, des changements sous-jacents dans le comportement impulsif des nettoyeurs et la variation conséquente des niveaux de coopération (Soares et al., 2017a). Cependant, dans la nature, les manipulations expérimentales dans le système DA des nettoyeurs adultes n'ont pas affecté leurs niveaux de recherche de nourriture coopérative et les taux de tricherie (Messias et al., 2016a). Par conséquent, il est prudent de supposer que la portée de l'influence de l'AD devrait être plus grande pendant les stades de développement cognitif des nettoyeurs (juvénile), par exemple, lorsqu'ils apprennent à préférer certaines espèces à d'autres et/ou, à manger contre leur préférence en tant que moyen de prolonger le temps de visite des clients (Bshary et Côté, 2008).


Pourquoi l'entraide dans la plupart des systèmes naturels n'est ni sans conflit ni basée sur un conflit maximal

L'entraide pour des bénéfices directs peut s'expliquer par divers modèles théoriques des jeux, qui diffèrent principalement en termes de conflit d'intérêts sous-jacent entre deux partenaires. Le conflit est minime si aider est égoïste et que le partenaire en bénéficie en tant que sous-produit. En revanche, le conflit est maximal si les partenaires sont confrontés au dilemme d'un prisonnier, les deux ayant l'option dominante de ne pas rendre l'investissement de l'autre. Ici, nous fournissons des arguments évolutionnistes et écologiques pour expliquer pourquoi ces deux extrêmes sont souvent instables dans des conditions naturelles et proposons que les interactions avec des niveaux intermédiaires de conflit sont des paramètres évolutifs fréquents. Nous soutenons que l'aide des sous-produits est susceptible de devenir un jeu d'investissement asymétrique puisque même une petite variation des avantages des sous-produits conduira à l'évolution du choix du partenaire, conduisant à des investissements par la classe choisie. Deuxièmement, les dilemmes répétés des détenus ont tendance à se produire dans des groupes sociaux stables où l'aptitude des partenaires est interdépendante, avec pour effet qu'un certain niveau d'aide est égoïste. En somme, des niveaux intermédiaires d'entraide sont attendus par nature, tandis qu'un suivi efficace des partenaires peut permettre d'atteindre des niveaux plus élevés.

1. Introduction

Aider, défini comme un acte qui augmente la forme physique directe d'un destinataire, a suscité un grand intérêt car il est en contradiction avec les notions darwiniennes générales de compétition et d'intérêt personnel. Une solution a été la théorie de sélection de la parenté de Hamilton [1,2] de l'altruisme où l'aide est dirigée vers des individus génétiquement apparentés. Cependant, la nature regorge d'exemples où les aides et les bénéficiaires ne sont pas liés, le plus évidemment dans les interactions interspécifiques, qui « ont joué un rôle central à la fois dans l'écologie et l'évolution de la vie sur Terre » [3, p. 3]. Au sein d'une même espèce, il existe également d'innombrables exemples d'individus aidant des congénères non apparentés, à condition que cela procure des avantages globaux directs pour la condition physique. Étant donné la grande confusion concernant la terminologie, le mieux que nous puissions faire est de définir chaque terme lors de sa première utilisation. Nous suivons Bshary & Bergmüller [4], qui rassemblent les définitions existantes de manière cohérente. Sur la base de Lehmann & Keller [5] et Bronstein [6,7], l'aide mutuelle pour l'adaptation directe a été appelée « coopération » si elle se produit entre les membres de la même espèce et « mutualisme » s'il se produit entre les membres d'espèces différentes (voir aussi [3]).

Les principaux thèmes de recherche sur l'aide sont de déterminer comment la structure de la population et l'histoire de vie conduisent à l'aide inconditionnelle et d'identifier les règles de décision et les mécanismes de contrôle des partenaires de l'aide conditionnelle [5]. Le contrôle du partenaire se produit si un coopérateur prend une mesure qui réduit le bénéfice d'un transfuge, par exemple en faisant défection, en punissant ou en sanctionnant le transfuge avec une résiliation prématurée et un refus d'interagir à nouveau, ou en passant à un nouveau partenaire [4].

Bien que l'entraide stable puisse s'expliquer par de nombreux modèles, la littérature est dominée par deux scénarios. Soit aider est intrinsèquement égoïste, sans risque de défection, soit il s'agit d'un « investissement » (une réduction des bénéfices indépendamment de l'action d'un partenaire) qui est compensé par des avantages futurs, ce qui crée une tentation de défection. Nous présenterons d'abord les deux scénarios en détail avant de soutenir que, dans la plupart des systèmes biologiques, les hypothèses sur lesquelles ils sont basés sont écologiquement invraisemblables. Nous soutiendrons en outre que, dans le monde réel, la plupart des cas d'entraide dyadique s'accompagnent d'un certain niveau de conflit, qui à son tour a sélectionné pour la surveillance et le contrôle des partenaires, à la fois entre des individus apparentés et non apparentés. Nous présenterons des jeux stylisés qui capturent ce qui pourrait bien être le point final stable le plus courant - les niveaux intermédiaires de conflit - et proposerons des moyens d'explorer ces jeux à l'avenir.

2. Aider avec des niveaux minimaux de conflit

On peut soutenir que la condition la plus simple pour une aide mutuelle stable est une situation dans laquelle chaque individu accomplit un acte égoïste qui profite à un partenaire en tant que sous-produit. Nous appelons cela « aide sous-produit » car cela peut se produire au sein des espèces et entre elles. Brown [8] a fait référence à la même condition comme « mutualisme de sous-produit », mais ce terme se heurte à l'utilisation originale du terme « mutualisme », c'est-à-dire la coopération entre les espèces [7]. Un bon exemple d'« aide des sous-produits » est l'effet « troupeau égoïste » [9]. Par exemple, les phoques réduisent les distances interindividuelles lorsqu'ils nagent dans des zones à grands requins blancs, ce qui est à la fois égoïste pour l'acteur et bénéfique pour le partenaire, car cela réduit le risque de prédation pour les deux [10]. Un autre exemple est la chasse coopérative, à condition que le succès de la chasse augmente avec la taille du groupe [11,12]. La chasse coopérative peut également se produire entre espèces, comme cela a été récemment décrit dans les interactions interspécifiques entre les mérous (un poisson prédateur) et d'autres espèces prédatrices [13,14]. Dans ces cas, les chasseurs se positionnent pour maximiser leur propre succès de chasse et avaler immédiatement toute proie capturée, sans partage [13]. Ainsi, les avantages découlent d'une coordination égoïste dans le temps et dans l'espace plutôt que grâce à des investissements mutuels.

Une deuxième forme d'aide stable sans défection est la pseudo-réciprocité positive [15]. La pseudo-réciprocité positive implique un investissement initial qui permet au bénéficiaire d'accomplir un acte égoïste qui à son tour profite à l'investisseur en tant que sous-produit. Un excellent exemple est l'interaction tritrophique entre les plantes, les insectes herbivores et les guêpes parasitoïdes [16]. Lorsqu'elle est attaquée par un herbivore, la plante produit des substances volatiles, qui permettent à la guêpe de détecter l'herbivore. La guêpe pondra alors ses œufs dans son propre intérêt dans l'herbivore, ce qui le tuera et profitera à la plante en tant que sous-produit. La pseudo-réciprocité positive peut aussi être mutuelle. Par exemple, dans les lichens, un organisme composite d'algues vivant dans les filaments d'un champignon, le champignon investit en produisant un abri qui améliore l'efficacité de la photosynthèse et de la production de nutriments de l'algue, ce qui permet au champignon de se développer plus rapidement et de produire plus d'abri. . Comme le champignon transfère les algues verticalement à la prochaine génération de champignons, la forme physique des deux partenaires est interdépendante, ce qui empêche la défection de chaque côté.

En raison de la stabilité inhérente de l'aide aux sous-produits et de la pseudo-réciprocité positive, divers auteurs ont émis l'hypothèse qu'ils devraient être abondants dans la nature [17–19]. Alors que de nombreux exemples bien documentés sont des mutualismes, c'est-à-dire des interactions entre espèces, il existe également des exemples de coopération, c'est-à-dire des interactions intraspécifiques, comme l'effet de troupeau égoïste [9].

3. Aider avec des niveaux maximaux de conflit

Nous définissons l'aide avec des niveaux maximaux de conflit d'intérêts comme des cas dans lesquels tous les individus feraient mieux de se séparer complètement les uns des autres (c'est-à-dire en l'absence d'un contrôle partenaire) comme stratégie stable sur le plan de l'évolution. L'aspect exploitation distingue notre conflit d'intérêts d'un manque de coopération potentiellement stable dans les jeux de coordination, dans lesquels les non-coordinateurs n'exploitent pas les coordinateurs. Dans les interactions avec un conflit maximal, un comportement d'aide ne peut émerger que si les partenaires sont en mesure de fournir des investissements mutuellement conditionnels. Nous utilisons le terme « investissement mutuellement conditionnel » comme équivalent à « l'altruisme réciproque » de Trivers [20], un terme que nous évitons car il se heurte à la définition de Hamilton [1,2] de « l'altruisme », c'est-à-dire aider les parents en raison de la sélection de la parenté. Nous évitons le terme « réciprocité » comme un raccourci pour l'altruisme réciproque, car le terme est actuellement utilisé de différentes manières. Le modèle standard pour les investissements directs mutuellement conditionnels est le dilemme répété du prisonnier, un jeu dans lequel deux joueurs choisissent à plusieurs reprises entre coopérer et faire défection. Les gains sont tels que la coopération mutuelle produit des gains plus élevés que la défection mutuelle, mais dans chaque interaction unique, la défection maximise les gains immédiats indépendamment de l'action du partenaire (figure 1). Ainsi, coopérer est un investissement, où les bénéfices de retour futurs ne peuvent être dus qu'au partenaire fournissant des investissements de retour. En raison de la structure de remboursement, cependant, la tentation de faire défaut est continuellement présente.

Figure 1. Matrices de gains relatifs pour quatre jeux stylisés différents. Dans chaque partie, deux joueurs ont le choix entre deux actions. Les gains dans la matrice sont ceux du joueur 1. Notez que dans la plupart de ces jeux, cela n'a pas de sens d'utiliser les termes « investir » et « défaut ». Dans le cas du jeu de la bataille des sexes, on ne peut même pas utiliser les termes « aide » et « pas d'aide » pour décrire les options comportementales.

Malgré une perpétuelle tentation de faire défection, divers mécanismes de contrôle des partenaires peuvent néanmoins conduire à des investissements mutuels stables. En fait, les économistes ont montré que des solutions avec presque n'importe quelle fréquence d'investissements sont possibles, à condition que l'entraide crée un excédent de gains et qu'un nombre suffisant de tours soient joués sans tour final connu et fixe (« théorème populaire » : [21] ). Largement inconscients de la littérature économique, les scientifiques à l'esprit évolutionniste ont consacré des efforts considérables à l'identification de stratégies réussies qui commencent en coopération et continuent de coopérer tant que le partenaire coopère également (examiné par Dugatkin [22]). Dans la stratégie la plus célèbre d'un jeu de dilemme du prisonnier itéré, du tac au tac, un individu coopère à la première itération du jeu et fait ensuite exactement ce que le partenaire a fait lors du coup précédent, c'est-à-dire faire défaut sur un transfuge ou coopérer avec un coopérateur [23]. Une solution alternative pour réaliser des investissements mutuellement conditionnels dans le jeu de type dilemme d'un prisonnier itéré est « l'investissement réciproque négatif », où un individu coopératif paie un coût pour réduire le gain d'un partenaire défaillant (« punition » [24]). Un autre mécanisme de contrôle des partenaires particulièrement puissant consiste à menacer de changer de partenaire, ce qui favorise les investissements mutuels, au moins dans des populations bien mélangées [25].

Divers biologistes ont fait valoir que, contrairement aux avantages des sous-produits et à la pseudo-réciprocité positive, l'investissement direct et réciproque est rarement trouvé chez les espèces non humaines, à la fois dans les interactions inter-espèces et intra-espèces [26-30], ce qui est à contradiction avec la littérature théorique. Il existe quelques exemples convaincants d'investissements mutuellement conditionnels, c'est-à-dire des études expérimentales démontrant une aide contingente : 34]), soutien apparent au toilettage chez les babouins [35] ou tolérance et soutien au toilettage chez les singes vervets [36]. Malgré ces exemples, il existe toujours un décalage entre la littérature de modélisation sur les investissements réciproques et les résultats empiriques.

L'écart entre les efforts théoriques et les preuves empiriques est compréhensible mais aussi surprenant. C'est compréhensible car les théoriciens ne sont pas intéressés à modéliser l'aide sans conflit car la stabilité de l'aide dans de tels cas est évidente et théoriquement inintéressante, alors que l'inverse est le cas pour aider à résoudre les conflits maximaux. Cependant, ce qui fait actuellement l'objet d'un débat, c'est pourquoi il existe peu d'exemples convaincants d'aide impliquant des investissements mutuellement conditionnels et ce que les « preuves rares » pourraient réellement signifier. Nous résumons donc rapidement et commentons certaines propositions d'explications ou d'opinions.

Un argument expliquant pourquoi les preuves d'investissements mutuellement conditionnels sont rares est qu'une telle aide ne peut évoluer que si deux mutations surviennent simultanément chez au moins deux individus qui sont des partenaires potentiels l'un de l'autre : investir et la capacité d'investir conditionnellement au retour sur investissement du partenaire [ 37]. Un tel scénario, certes peu probable sur le plan de l'évolution, est devenu connu sous le nom de problème d'amorçage ([37] voir aussi [38] pour quelques solutions potentielles). Alternativement, plusieurs auteurs ont souligné que les investissements mutuellement conditionnels pourraient être rares parce que les espèces non humaines n'ont pas les capacités cognitives nécessaires pour suivre le résultat des interactions sociales passées, surtout si cela implique des interactions avec plusieurs partenaires [27,28].

Bien que nous reconnaissions que l'évolutivité et les contraintes cognitives peuvent empêcher l'évolution d'investissements mutuellement conditionnels, dans de nombreux cas, nous ne pensons pas que ces explications suffisent à expliquer la rareté apparente des investissements mutuellement conditionnels dans la nature. L'argument de l'évolutivité semble être basé sur des hypothèses concernant les relations gène-comportement qui ne s'appliquent pas aux espèces dotées de cerveaux. Il a été démontré que les vertébrés et les invertébrés apprennent un comportement approprié via le conditionnement classique et opérant [39]. Dans ces derniers, les animaux conditionnent leur propre comportement en fonction des changements de l'environnement. Peu importe que l'environnement soit abiotique ou partenaire d'interaction, et que dans ce dernier cas la situation soit potentiellement coopérative ou compétitive. Il existe d'innombrables exemples dans la littérature sur la recherche de nourriture optimale montrant que de nombreuses espèces sont capables d'affiner efficacement leurs réponses aux différences de gain lors du déplacement entre les parcelles de nourriture [40], et Kacelnik [41] fait valoir que de telles décisions de recherche de nourriture peuvent être expliqué le plus parcimonieusement avec l'outil polyvalent « conditionnement opérant » plutôt qu'avec des règles empiriques/heuristiques évoluées spécifiques à la situation. Un point similaire a été avancé par Bshary & Oliveira [42], qui ont soutenu que la sélection sur le fonctionnement du cerveau fonctionne principalement sur les circuits fonctionnels supérieurs impliqués dans la prise de décision dans une variété de situations sociales différentes. À notre avis, le même raisonnement peut être appliqué pour expliquer l'aide conditionnelle spécifique à une situation. Il suffit d'expliquer l'évolution des règles d'apprentissage (comme la force du renforcement, la pesée des interactions passées, l'exploration du répertoire comportemental) qui permettent aux individus d'ajuster leur comportement au cours de leur vie. Dridi & Lehmann [43,44] donnent de merveilleux exemples de l'évolution des règles d'apprentissage par renforcement exploratoire par essais et erreurs qui permettent aux individus de résoudre le dilemme d'un prisonnier itéré.

L'argument avancé ci-dessus met l'accent sur l'hypothèse de la contrainte cognitive. À notre avis, cette hypothèse est difficile à concilier avec le fait que la reconnaissance individuelle est répandue au moins dans divers clades de vertébrés comme les mammifères, les oiseaux et les poissons [39,45], et a même été démontrée chez les insectes sociaux [46]. Le manque de mobilité permet une « reconnaissance individuelle » en fonction de la localisation, comme c'est le cas pour les fourmis interagissant avec leurs nombreuses espèces partenaires ou pour les pollinisateurs interagissant avec les plantes à fleurs. De plus, les capacités de mémoire sont apparemment suffisantes pour l'apprentissage par conditionnement opérant, avec l'évolution des paramètres cruciaux des règles d'apprentissage soumis à la sélection naturelle [43,44].En effet, il a été maintes fois soutenu que la résolution d'un jeu de dilemme du prisonnier répété n'était peut-être pas aussi rare qu'on le pense souvent, car les scientifiques recherchaient des stratégies proposées par les théoriciens, comme le tac-pour-le-tat, alors que les animaux prennent des décisions différemment. Par exemple, il a été avancé que les décisions concernant les investissements mutuellement conditionnels peuvent être fondées sur une évaluation plus générale des interactions sociales récentes (« réciprocité attitudinale », [47]), sur la qualité générale d'une relation (« réciprocité émotionnelle », [ 48]), ou sur l'expérience passée générale plutôt que sur un comptage précis avec chaque partenaire potentiel (« réciprocité généralisée », [49]) (voir aussi [50]). Tous ces mécanismes de décision proposés pourraient être basés sur la dynamique de l'apprentissage par conditionnement opérant (ou sur des processus cognitifs supérieurs si disponibles). Deux expériences sur le terrain sur des babouins et sur des singes vervets correspondent à l'idée d'investissements comportementaux ou émotionnels mutuellement conditionnels [35,36]. Surtout, avoir récemment soigné une autre personne augmente la probabilité de recevoir sa tolérance ou le soutien de la coalition. Cela implique que les investissements de retour ne sont pas « tout ou rien » en fait, bien que les effets qui dépendent d'un toilettage récent soient présents à la fois dans les paires liées/liées et dans les paires non liées/non liées, ils s'ajoutent à des valeurs de référence différentes. niveaux pour les interactions sans toilettage préalable. Diverses autres expériences (avec des résultats à la fois positifs et négatifs [47,51-66]) et un grand nombre d'études corrélationnelles [67] fournissent des preuves supplémentaires de ces investissements mutuellement conditionnels gradués chez les primates. Sur la base de ces preuves expérimentales et corrélationnelles étendues, nous prédisons que les investissements mutuellement conditionnels gradués sont en effet courants chez les primates et seront également trouvés chez d'autres taxons.

Cette affirmation s'applique non seulement aux contingences positives, mais aussi aux contingences négatives, c'est-à-dire à la punition, où les preuves corrélationnelles et expérimentales actuelles sont encore plus rares chez les animaux non humains [30]. Alors que les contraintes cognitives peuvent limiter l'utilité de la punition dans diverses situations [30,68], le fait que les réponses agressives à la tricherie puissent provoquer un comportement plus coopératif chez les poissons dans les interactions inter- et intraspécifiques [69-71] suggère qu'au moins de nombreux vertébrés les espèces devraient avoir les exigences cognitives pour utiliser la punition.

Cela nous amène à la question de savoir si le phénomène d'investissements strictement mutuellement conditionnels résolvant le dilemme d'un prisonnier itéré est vraiment rare, comme nous l'avons soutenu ci-dessus. Pour nous, c'est une question de perspective : si la structure du jeu de chaque cas d'aide pour des avantages directs était connue et que les sommes totales étaient faites, nous nous attendrions à de nombreux cas d'investissements mutuellement conditionnels résolvant une matrice de paiement itérée du dilemme du prisonnier (c'est-à-dire dans les années 1000, pour mettre une estimation assez préliminaire). Pour mettre cela en perspective, l'aide aux bénéfices directs est omniprésente, comme le montre la myriade de cas de mutualisme de pollinisation, d'interactions plantes-microbes dans le sol ou de mutualismes impliquant des fourmis protégeant des espèces partenaires. Un groupe de spécialistes du mutualisme a proposé en 2003 qu'aucun de ces cas n'est suspecté de résoudre un dilemme réitéré du prisonnier [26], un point de vue qui n'a guère changé depuis [3]. Nous espérons que ces illustrations mettent en perspective notre utilisation du terme « rare ». Les investissements mutuellement conditionnels sont si rares que nous pensons que des arguments supplémentaires doivent être explorés en plus (et non à la place) des arguments sur les contraintes génétiques/cognitives.

4. L'écologie de l'aide pour des bénéfices directs

Ici, nous suivons la possibilité que les structures de paiement de type dilemme du prisonnier soient rarement trouvées dans la nature pour des raisons écologiques [19]. Nous ne le faisons pas en termes mathématiques mais en développant des scénarios socio-écologiquement pertinents. Comme nous sommes tous les trois empiristes, nous nous excusons pour la possibilité réaliste que nous puissions passer à côté de modèles pertinents qui auraient déjà fait valoir nos arguments d'une manière plus élégante (c'est-à-dire mathématique). Aussi, alors que nous pensons que les modèles permettant des investissements continus sont biologiquement plus réalistes, nous illustrons nos points avec des jeux stylisés avec des options comportementales discrètes. Nous le faisons parce que nous pensons que la logique est plus facile à saisir et parce que nous nous intéressons à différentes classes de modèles, c'est-à-dire des modèles qui prédisent l'absence de conflit, le conflit intermédiaire et le conflit maximal (figure 1). Cette classification est valable à la fois pour les options comportementales continues et discrètes (voir [72] ou [73] pour les options continues dans les jeux de congère et de dilemme du prisonnier). Avant de remettre en question la validité écologique des matrices de gains de type dilemme du prisonnier, nous remettrons en question la notion selon laquelle la coopération/le mutualisme sans conflit est un point final stable de l'entraide dans la nature. Les deux scénarios (à commencer par les avantages des sous-produits ou avec la structure de remboursement du dilemme du prisonnier) ont en commun que les niveaux de conflit qui en résultent sont intermédiaires, c'est-à-dire que le comportement coopératif persisterait dans une certaine mesure même en l'absence de mécanismes de contrôle des partenaires. De plus, les deux scénarios ont en commun que la sélection entraîne des changements dans les espaces stratégiques individuels, ce qui à son tour entraîne des changements dans la structure du jeu et la matrice de paiement correspondante.

Un exemple spécifique est fourni par Friedman & Hammerstein [74] dans leur analyse du commerce des œufs chez les poissons de hameau simultanément hermaphrodites (voir [75, 76] pour d'autres modèles). Les hameaux forment des couples en fin d'après-midi. Les partenaires alternent plusieurs fois entre la libération des œufs et la fécondation des œufs [77]. Cela semble être plutôt inefficace par rapport à chaque partenaire libérant tous les œufs en un seul combat. Cependant, un tel schéma de libération serait vulnérable aux tricheurs : comme les œufs sont plus coûteux à produire, l'individu qui libère ses œufs en premier serait confronté au risque que le partenaire féconde les œufs puis parte pour trouver un nouveau partenaire qui a encore des œufs. Libérer tous les œufs en un seul combat correspondrait à un jeu de dilemme séquentiel du prisonnier à un coup, où la défection est le seul résultat stable. L'évolution d'une stratégie de morcellement, conjuguée à l'attente en fin d'après-midi, permet de surmonter le problème de la défection. Les parcelles sont si petites que la meilleure réponse à la réception d'une parcelle pour la fécondation est de donner une parcelle, à laquelle la meilleure réponse est de fournir la prochaine parcelle, jusqu'à ce que tous les œufs soient fécondés. En effet, les bénéfices de rester sont plus importants que les bénéfices de partir : partir implique des frais de recherche et le risque de ne pas trouver un autre partenaire dans le peu de temps avant le coucher du soleil [74]. Ainsi, l'évolution d'une stratégie de morcellement a transformé la matrice de gain pour chaque décision d'un jeu de dilemme du prisonnier à un jeu de pseudo-réciprocité mutuellement positif [74] : pour les deux partenaires, il est égoïste de rester et d'investir à chaque instant. de décision.

5. Pourquoi la plupart des cas d'aide sont susceptibles d'impliquer des niveaux intermédiaires de conflit

(a) Passage des avantages de sous-produits aléatoires à la coordination à l'aide conditionnelle dans un jeu asymétrique

Comme discuté précédemment, le mutualisme de sous-produit et la pseudo-réciprocité positive sont basés sur la notion que l'aide est exempte de conflit, ce qui fournit des points de départ idéaux pour l'évolution de l'aide, comme cela est souvent avancé pour les mutualismes [26,78]. Cependant, nous soutenons que cette structure de jeu n'est souvent pas stable. Là où les bénéfices des sous-produits se produisent, il y aurait inévitablement une sélection sur des taux d'association accrus qui entraînent des coûts de coordination ainsi qu'une sélection sur le choix du partenaire (cf. [79, 80]). Nous illustrons ces points par un exemple de chasse collaborative entre mérous et espèces partenaires, comme les murènes. Bien que les avantages soient entièrement dus aux sous-produits d'un comportement égoïste, l'ampleur de ces avantages est susceptible de varier d'un individu à l'autre. Empiriquement, il a été décrit que la volonté de participer à la chasse coopérative est variable chez les deux partenaires [13]. De plus, il semble y avoir une variation individuelle dans la capacité de coordonner les mouvements, la persévérance et la fréquence avec laquelle les proies sont poussées vers le partenaire. Une telle variation peut être due à des effets ontogénétiques, avec des preuves que les individus changent radicalement de comportement entre les années suivantes (R.B. 2002 et 2003, données non publiées). De plus, il semble probable que les partenaires de tailles différentes aient des préférences de proies différentes et des effets différentiels sur les comportements d'évasion des proies. En conséquence, les individus ont le choix entre des partenaires plus ou moins adaptés (rentables) et des expériences de laboratoire ont démontré que les mérous choisissent facilement de meilleurs collaborateurs [14], ce qui a été démontré d'abord chez les chimpanzés [81].

Le point clé ici est que ces associations de chasse interspécifiques forment un marché biologique avec des individus ayant le choix entre différents partenaires, appartenant parfois à des espèces différentes, par ex. les mérous peuvent choisir parmi les murènes, les napoléons et les pieuvres [14]. Dès qu'il y a échange de biens ou de services, les forces du marché de l'offre et de la demande devraient commencer à fonctionner [79,80]. En particulier, les mérous devraient s'associer de préférence avec des espèces ou des individus partenaires qui offrent les meilleurs avantages de sous-produit et les partenaires devraient préférer les mérous qui leur offrent à leur tour les meilleurs avantages de sous-produit. Comme les associations de chasse sont mutuellement bénéfiques, s'impliquer dans un plus grand nombre d'entre elles signifie un succès de recherche de nourriture accru, ce qui devrait se traduire par une meilleure condition physique. Par conséquent, les individus sont sous sélection pour choisir de bons partenaires et être choisis fréquemment. La concurrence au sein d'une classe de commerçants pour l'accès aux partenaires devrait conduire à une surenchère [79]. Dans l'exemple de la chasse coopérative, il existe des preuves d'observation d'une surenchère au stade du recrutement des partenaires. Premièrement, il semble clair que les mérous recherchent préférentiellement les murènes plutôt que les napoléons pour initier une chasse commune afin de rechercher des proies convenables [13] : les mérous s'associent au-dessus du hasard aux murènes mais pas aux napoléons. La préférence se décompose dans les zones où il y a peu de partenaires disponibles (AL Vail, A Manica, R Bshary 2010, données non publiées). En revanche, dans les zones où les partenaires sont plus abondants que sur le site d'étude initial [13], les mérous modifient leur comportement sur un aspect important : ils initient rarement la chasse en commun mais rejoignent plutôt les murènes qui avaient déjà commencé à se déplacer à travers le récif (AL Vail, A Manica, R Bshary 2010, données non publiées). Ainsi, les frais de coordination pour démarrer une association de chasse sont payés de manière flexible par différentes espèces partenaires en fonction de la disponibilité des partenaires. On peut soutenir que la plupart des mutualismes dérivés sont susceptibles d'impliquer de tels coûts de coordination. Par exemple, les associations d'espèces mixtes chez les primates génèrent des avantages sous-produits en raison de la réduction du risque de prédation, mais la coordination nécessite un écart par rapport aux itinéraires d'alimentation optimaux. La présence de ce compromis explique pourquoi les associations ne se produisent pas 100 % du temps [82].

Le conflit est bien illustré avec le jeu de la bataille des sexes dans lequel deux joueurs veulent être ensemble mais diffèrent dans leurs préférences spatiales, ce qui crée un conflit sur qui paie le prix d'être ensemble. La théorie biologique du marché peut faire des prédictions sur la classe de commerçants qui gagne la bataille et celle qui la perd [80]. En l'absence de marchés, des différences de besoins peuvent entraîner des « leaders » et des « suiveurs » ([83,84] voir [85] pour un scénario évolutif pour les mutualismes) et il est également possible que les individus paient alternativement le coût de la coordination. Notez que cela conduirait à un modèle d'aide en alternance sans impliquer une matrice de paiement itérée du dilemme du prisonnier.

Dans l'exemple du groupeur, il n'existe actuellement que des preuves de quarts de travail dans lesquels un partenaire paie les coûts de coordination. Cependant, il est facile d'imaginer que le marché biologique sélectionnerait de nouvelles stratégies qui vont au-delà de la fourniture d'avantages de sous-produits. Par exemple, alors que les individus qui réussissent ont immédiatement arrêté la collaboration dans tous les cas observés de chasses réussies, un individu qui poursuivrait la collaboration dans de telles conditions pourrait bien bénéficier de tels investissements si cela augmente les chances que les partenaires acceptent plus facilement les invitations de cet individu et/ ou choisissez cet individu avec une probabilité accrue.

En somme, nous proposons que toute interaction qui commence comme des bénéfices dérivés ou comme une pseudo-réciprocité positive a le potentiel d'évoluer vers un système qui implique des investissements spécifiques dans le seul but d'être choisi comme partenaire, dès que le système implique un marché biologique. Dans de telles circonstances, des investissements stables peuvent être réalisés par la menace de changement de partenaire, une forme de pseudo-réciprocité négative [4] : les individus investissent parce qu'il serait autrement dans l'intérêt du partenaire d'arrêter l'interaction et de passer à un individu différent. En conclusion, toute forme d'avantage de sous-produit peut conduire à un choix de partenaire chaque fois que les partenaires diffèrent dans l'ampleur des avantages de sous-produit qu'ils fournissent. Cela conduit à son tour à la concurrence par la surenchère et l'évolution des investissements, qui sont surveillés et assurés par la menace de changement de partenaire.

La figure 2 résume les étapes importantes des rencontres fortuites à un jeu asymétrique sur un marché biologique. Le montant de l'investissement supplémentaire sera fonction de l'abondance relative des deux classes de partenaires [86]. Si les choix conditionnels de la classe de choix ont un coût mineur (noté ?? dans la figure 2), la sélection dépendant de la fréquence négative conduit à la coexistence d'individus soumissionnaires (« coopérateurs ») et d'individus non-enchérisseurs (« défecteurs ») et le changement de partenaire comme mécanisme de contrôle de partenaire utilisé par les membres de la classe de choix. Ce scénario correspond dans divers aspects importants aux arguments avancés récemment par André [38], qui a soutenu que la présence initiale d'aide peut faciliter l'évolution des stratégies conditionnelles, car un tel scénario résout le problème du bootstrapping.

Figure 2. Changements de pay-offs en conséquence de la sélection conduisant à des changements de stratégies individuelles. Les gains dans chaque matrice sont classés les uns par rapport aux autres et ne sont pas comparables entre les matrices de gains. La première matrice de gains représente un jeu avant l'évolution, où les joueurs se rencontrent par hasard et augmentent leurs gains en conséquence des avantages des sous-produits. En raison de la sélection résultante sur des associations accrues, des coûts de coordination surgissent qui pourraient être partagés ou payés par un partenaire. Les options de choix de partenaires asymétriques conduiront les membres de la classe choisie à essayer de surenchérir les uns les autres en évoluant des investissements supplémentaires au seul bénéfice des partenaires afin d'être choisis. Si les choix conditionnels de la classe de choix ont un coût mineur ??, une sélection dépendante de la fréquence négative conduit à la coexistence d'individus soumissionnaires (« coopérateurs ») et d'individus non-enchérisseurs (« défecteurs »). Comme les membres de la classe choisie doivent payer les coûts de coordination dans tous les cas, ils gagnent invariablement moins que les membres de la classe choisie.

(b) Passage de niveaux de conflit mutuels maximaux à des niveaux de conflit mutuels intermédiaires

Une hypothèse du jeu de dilemme du prisonnier itéré standard est que les partenaires d'interaction actuels ont un passé et un avenir indépendants une fois le jeu terminé. En conséquence, la forme physique d'un individu est indépendante de la forme physique de son partenaire, en dehors du lien qui se crée à travers les conséquences payantes de leurs décisions lors des interactions. Cependant, ces hypothèses ne sont souvent pas satisfaites dans la nature, en particulier chez les animaux qui sont les plus susceptibles d'avoir des interactions itératives : les animaux qui vivent dans des groupes sociaux stables caractérisés par la parenté, des relations à long terme et des liens sociaux. Dans de telles conditions, l'aptitude des animaux sociaux peut être fortement déterminée par les interdépendances. L'interdépendance la plus connue et la plus étudiée est basée sur la parenté génétique et l'altruisme biologique qui en résulte (sélection de parenté, [1,2]). Fait intéressant, cependant, les liens sociaux à long terme entre des individus génétiquement non apparentés ou même le simple fait d'être membre du même groupe sont susceptibles d'avoir des effets similaires [87-89]. Comme Roberts [89] l'a proposé, la logique de «r’ dans la règle de Hamilton peut en principe être appliqué à toute forme d'interdépendance et noté le coefficient ‘s' pour la mise. Notons cependant que le fonctionnement est tout autre : la valeur de r est fixé pour les individus apparentés, tandis qu'un coefficient d'interdépendance entre individus génétiquement non apparentés peut changer avec le temps et affecte directement les valeurs de b et c. A titre d'exemple d'interdépendance entre individus non apparentés, dans une espèce de fourmi esclavagiste, plusieurs reines non apparentées s'associent et produisent rapidement un nombre suffisant d'ouvrières capables de défendre le nid commun. Pour les reines individuelles, il n'y a pas de tentation de tricher car tout défaut de contribution entraînera automatiquement l'échec de toutes les reines [90]. Une fois qu'il existe suffisamment d'ouvrières, l'interdépendance entre les reines tombe en dessous d'un seuil critique et les reines se battent à mort jusqu'à ce qu'il ne reste qu'un seul vainqueur [90]. Le principe d'interdépendance s'applique plus généralement aux animaux sociaux car toute aide qui génère des bénéfices d'interactions répétées sur une longue période est susceptible de provoquer une interdépendance entre partenaires. Plus l'interdépendance est élevée, plus les situations sociales surgissent dans lesquelles il s'agit d'une stratégie égoïste de soutenir les partenaires lorsqu'ils en ont besoin. Les partenaires à long terme deviennent des atouts sociaux qu'il faut chérir et dont la perte est coûteuse : l'aide est soumise à une sélection positive tant que les avantages pour le bénéficiaire multipliés par le degré d'interdépendance l'emportent sur le coût de l'aide [89]. Rappelez-vous que cette règle ne prédit pas que les individus aident toujours, mais que l'aide est subordonnée à l'acte produisant des avantages nets indépendamment de tout investissement réciproque. On ne s'attend donc pas nécessairement à la stricte contingence postulée par le modèle des investissements mutuellement conditionnels.

Alors, quels cas d'entraide entre individus non apparentés peuvent impliquer des niveaux importants d'interdépendance ? Nous proposons qu'en règle générale, l'interdépendance est corrélée à la stabilité de la disponibilité des partenaires. Les relations stables sont plus susceptibles de se produire dans des groupes stables. Par exemple, chez les espèces d'oiseaux biparentales présentant une monogamie à vie, la mort du partenaire entraîne une diminution de la forme physique de l'individu survivant [91,92]. Des effets similaires semblent également être présents chez les primates [93]. Chez de nombreux primates, les individus d'un sexe (généralement des femelles) restent dans leur groupe natal toute leur vie [94]. Les preuves s'accumulent que dans de telles circonstances, un réseau social de base stable a un effet positif sur la forme physique individuelle [95,96].

L'interdépendance n'est en aucun cas limitée aux espèces vivant en groupe. Les mutualismes sous forme de symbioses fournissent de nombreux bons exemples supplémentaires.Ici, l'interdépendance génétique est absente, mais l'interdépendance peut encore être forte si les partenaires vivent intimement ensemble sur des périodes prolongées, elle est maximale en cas de transmission verticale conjointe à la génération suivante. Les cas bien connus de telles symbioses incluent les bactéries intestinales, les lichens, les coraux et certains mutualismes de fourmis [3,6]. Pour de tels cas, il a été avancé que les intérêts sont plutôt alignés et que les conflits sont faibles [3,6,18].

(c) Interdépendance contre investissements mutuellement conditionnels basés sur un dilemme répété du prisonnier

Malgré les diverses revues critiques et le rôle bien établi de la dépendance mutuelle à l'aide, il existe une littérature considérable qui cherche à expliquer le comportement d'aide comme des formes d'investissements mutuellement conditionnels dans le cadre d'un dilemme du prisonnier itéré, souvent basé sur des données d'observation. Diverses études récentes très intéressantes sur l'aide alternée en ce qui concerne la vigilance chez les couples de poissons-lapins [97], la chasse coordonnée chez le poisson-lion [98] et la conduite pendant les vols migratoires chez les oies [99] donnent d'excellents exemples de coordination mais pas d'investissements mutuellement conditionnels résolvant un problème itératif. le dilemme du prisonnier, du moins pas jusqu'à ce qu'il soit démontré que les investissements sont contingents et que la matrice des gains du dilemme du prisonnier est l'hypothèse la plus parcimonieuse. Nous soutenons que ce dernier est la partie la plus difficile en raison de la fréquence des interdépendances génétiques et sociales. Nous illustrons cette préoccupation dans la figure 3, dans laquelle nous montrons comment les interdépendances peuvent transformer une matrice de gains qui ressemble au dilemme d'un prisonnier en d'autres jeux une fois que les effets d'interdépendance sont inclus (voir [22,100] pour les articles théoriques).

Figure 3. Exemples montrant comment les matrices de gains qui remplissent les critères du dilemme du prisonnier (T > R > P > S et 2R > T + S) se transforment en matrices de gains qualitativement différentes s'il existe une parenté génétique ou une interdépendance sociale entre les partenaires. Dans tous les cas, le coefficient de parenté de Hamilton r = le coefficient d'interdépendance s = 0,5. La première matrice de gains se transforme en un jeu de congères, la seconde en un jeu dans lequel l'investissement est dominant sur la défection, et la troisième en un jeu dont nous pensons qu'il n'a pas encore été nommé. Fondamentalement, toutes les matrices de gains résultantes ne présentent pas un « toujours défectueux » en tant que SSE, mais plutôt des niveaux de coopération intermédiaires ou complets.

Le plus connu parmi les jeux issus des interdépendances est le jeu de congère, également appelé jeu faucon-colombe (en insistant sur le caractère compétitif plutôt que coopératif d'une interaction [101]). Dans ce jeu, la meilleure option d'un individu dépend de ce que fait son partenaire. Si le partenaire coopère, la meilleure option est de faire défection. Si le partenaire fait défaut, la meilleure option est de coopérer. C'est parce que la défection mutuelle est la moins rentable pour les deux joueurs. En conséquence, le succès de la coopération et de la défection affiche une dépendance fréquentielle négative [102]. Une solution possible est de coopérer et de faire défaut avec des probabilités qui génèrent une dépendance fréquentielle stable [102]. Cependant, cela conduira à des cas dans lesquels les deux partenaires feront défaut et donc tous les deux perdront, et donc divers mécanismes peuvent conduire à l'émergence de coopérateurs et de transfuges [43,72]. Une solution encore meilleure serait que les deux partenaires coopèrent. Cependant, comment les partenaires pourraient parvenir à cette solution n'est pas évident, en tant qu'individu qui sait que le partenaire a toujours des défauts, devrait toujours coopérer pour maximiser son propre gain. Une aide mutuelle conditionnelle qui dépend du comportement du partenaire apporterait une solution. L'option de changer de partenaire sur un marché biologique pourrait offrir un mécanisme de contrôle alternatif pour atteindre des niveaux élevés d'entraide, car les coopérateurs pourraient laisser des transfuges. Comme le niveau de base de l'aide n'est pas nul comme dans la matrice de paiement du dilemme d'un prisonnier, mais b/c, les niveaux élevés d'aide qui en résulteraient seraient des investissements partiellement égoïstes et partiellement mutuellement conditionnels (figure 4).

Figure 4. À gauche : niveaux de coopération « par défaut » du SSE dans différents jeux : 100 % pour les bénéfices des sous-produits et la pseudo-réciprocité positive, b/c pour un jeu de congère et 0% pour un jeu de dilemme du prisonnier. Pour ces derniers jeux, des interactions itérées peuvent permettre l'évolution d'une coopération totale basée sur des investissements mutuellement conditionnels. Étant donné que les jeux de congères donnent par défaut des niveaux intermédiaires de coopération, le défi pour les chercheurs sera d'identifier les investissements supplémentaires partiellement réciproques en plus de ces niveaux intermédiaires.

6. Discussion générale

Notre objectif général a été de comprendre l'évolution de la coopération dyadique et du mutualisme. La littérature théorique est fortement biaisée vers le jeu du dilemme du prisonnier itéré, mais il y a peu de preuves de ce jeu dans les systèmes naturels. Une explication alternative actuellement populaire est la pseudo-réciprocité positive [17,18], une situation dans laquelle les partenaires en sont venus à s'appuyer l'un sur l'autre avec un intérêt dans le succès de l'autre, et donc tous les deux bénéficient de l'aide. Alors que la pseudo-réciprocité positive est donc plutôt sans conflit, nous avons avancé des arguments verbaux pour lesquels l'écologie et l'évolution peuvent souvent modifier l'espace de stratégie individuel de telle sorte que des jeux asymétriques émergent dans lesquels les conflits d'intérêts entre partenaires sont de niveau intermédiaire plutôt que minimal ou maximal. Inversement, nous avons soutenu que pour les jeux de conflit maximal, c'est-à-dire sous la forme de dilemmes répétés du prisonnier, l'écologie et l'évolution peuvent souvent conduire à un espace de stratégie individuel tel que l'interdépendance conduit à des jeux avec des niveaux de conflit intermédiaires, comme illustré par le jeu de congères.

Le message à retenir est qu'un certain niveau de conflit est inévitablement répandu tant dans la coopération que dans le mutualisme. D'un autre côté, le conflit maximal basé sur la matrice de paiement du dilemme du prisonnier est très probablement rare. Même les exemples de primates présentés précédemment qui ont fourni des preuves convaincantes d'investissements mutuellement conditionnels entre les membres du groupe non liés [35,36] pourraient encore être construits sur un faible niveau d'aide inconditionnelle en raison de l'interdépendance (augmentation de groupe, [87]). La tentation de faire totalement défaut est plus susceptible d'être trouvée dans certains mutualismes caractérisés par des interactions courtes où la fitness d'un phénotype comportemental d'un individu est à peine affectée par la survie du partenaire. Cependant, nous ne connaissons pas de cas fondés sur la tentation mutuelle de faire défection comme le suppose le jeu du dilemme du prisonnier itéré. Au lieu de cela, les mutualismes représentent souvent des jeux avec des options stratégiques asymétriques. Mutualismes de nettoyage marin impliquant des labres plus propres du genre Labroides fournir un cas d'espèce. Ces nettoyeurs ont une préférence inhérente pour le mucus des clients par rapport à leurs ectoparasites, de sorte que se nourrir de ces derniers peut être interprété comme un investissement [103]. Plus important encore, les nettoyeurs qui suivent leurs préférences inhérentes (c'est-à-dire tricher en se nourrissant de mucus) peuvent légèrement réduire la survie des clients mais ne subiront autrement pas de répercussions supplémentaires, principalement parce qu'ils interagissent avec de nombreux clients différents [104] et vivent généralement moins longtemps qu'eux. (données disponibles sur fishbase.org). En revanche, la grande majorité des espèces clientes n'ont aucun moyen de faire défaut à un nettoyeur, c'est-à-dire d'adopter un comportement qui augmente leur propre profit aux dépens d'un nettoyeur coopérant. Peut-être parce que le conflit n'implique pas d'interdépendances, le système a fourni des preuves expérimentales d'une variété de mécanismes de contrôle des partenaires, y compris la punition, le changement de partenaire et le prestige social [69,105]. Les options de tricherie asymétrique sont très abondantes dans les mutualismes, avec des preuves expérimentales qu'une aide contingente peut se produire même chez les plantes et les insectes [106–108]. Pour la coopération au sein de l'espèce, les preuves du paiement pour rester dans les systèmes d'élevage en coopération [109] fournissent une classe d'exemples d'aide à des actes tels que les soins du couvain ou la défense territoriale, bien que Hamilton & Taborsky [110] aient constaté que si la menace d'expulsion seule applique l'aide, les subordonnés ne surcompenseront pas les coûts qu'ils imposent aux dominants.

En conclusion, nous voyons une grande possibilité pour les théoriciens et les empiristes d'envisager des jeux avec des niveaux intermédiaires de conflit, et d'explorer comment la sélection sur les changements dans les espaces stratégiques individuels conduit à des changements dans la structure du jeu et les matrices de gains. L'aide conditionnelle mutuelle ou alternée ne fournit pas en elle-même la preuve d'un dilemme répété du prisonnier, car les mêmes schémas peuvent apparaître dans un jeu de congères répété ou un jeu de bataille des sexes répété. De plus, comme nous l'avons suggéré à plusieurs reprises dans cet article, les conditions du marché dans chaque système d'étude doivent être comprises et intégrées. Alors que les marchés libres favorisent à la fois les conflits et la solution facile du changement de partenaire, des marchés plus restreints réduisent les conflits mais n'offrent potentiellement aucune solution au niveau de conflit restant.


1. Introduction

Le comportement coopératif n'est pas propre à l'espèce humaine. Il s'agit d'un phénomène répandu entre individus d'espèces identiques, voire différentes. On parle ici de coopération dans son sens le plus large : des comportements qui apportent un bénéfice à un autre individu (bénéficiaire) ou qui sont bénéfiques à la fois à l'acteur et au bénéficiaire. Même des organismes très simples comme les virus, les bactéries et les amibes sociales coopèrent entre eux. Les amibes solitaires, par exemple, forment une "slug" multicellulaire différenciée lorsqu'elles meurent de faim, qui est capable de traverser les barrières du sol que les amibes solitaires ne peuvent pas traverser (Brown 2001 Kuzdzal-Fick et al. 2007 Brockhurst et al. 2008). Des niveaux très élevés de coopération sont une marque de commerce de plusieurs espèces, y compris les humains et les sociétés d'insectes dans ces dernières, le degré élevé de coopération peut s'expliquer par des avantages indirects de fitness dus à une forte parenté entre les membres de la colonie (Hamilton 1964). La caractéristique la plus frappante des sociétés humaines est probablement leur grande taille combinée à un comportement coopératif étendu entre des individus non apparentés. Un comportement coopératif se retrouve même entre de parfaits inconnus qui ne sont pas susceptibles de se revoir à l'avenir. Les sociétés humaines modernes dépendent fortement de niveaux élevés de coopération entre les individus, quelque chose que nous vivons tous les jours. Par exemple, les humains s'engagent dans des interactions coopératives mutuellement bénéfiques pour atteindre des objectifs aussi simples que déplacer des obstacles ou aussi compliqués que construire des ponts ou des maisons ou jouer des symphonies. De plus, les humains aident les autres, entraînant des coûts dans de nombreuses situations différentes au quotidien. Ils peuvent aider un ami à porter des cartons, tenir la porte ouverte à un collègue, aider une personne aveugle à traverser la rue ou à donner du sang, pour ne citer que quelques exemples.

De la théorie du fitness inclusif, nous savons que tous ces comportements doivent conduire en moyenne à une augmentation du fitness direct et/ou indirect de l'acteur (veuillez noter qu'il y a eu récemment un vif débat sur l'équivalence mathématique du fitness inclusif et du multiniveau/ sélection de groupe voir Wilson & Wilson 2007). L'importance des avantages indirects dans le maintien de la coopération a été largement démontrée chez les animaux et les humains (par exemple, Dugatkin 1997 Solomon & French 1997), alors que les preuves d'une coopération intraspécifique entre des individus non apparentés en dehors des humains sont moins courantes (Clutton-Brock 2009). La coopération entre individus non apparentés peut évoluer si l'acteur et le récepteur obtiennent des bénéfices directs immédiats de l'interaction, ou si les individus, qui investissent pour aider les autres, obtiennent un bénéfice futur supérieur à l'investissement initial, par exemple via la réciprocité (Trivers 1971). Chez l'homme, de nombreux mécanismes de contrôle différents, tels que la récompense, la punition, l'ostracisme, la construction d'une réputation, etc., contribuent à maintenir et à stabiliser la coopération, garantissant que les partenaires se comportent de manière coopérative et que les tricheurs restent sous contrôle. Bien que certains de ces mécanismes soient partagés avec d'autres espèces animales, pour d'autres, il existe peu ou pas de preuves chez les animaux non humains. Il semble que les humains ont développé des stratégies et des mécanismes psychologiques qui leur permettent de coopérer et de contrôler les free-riders avec une grande flexibilité, conduisant à des niveaux élevés de coopération entre des individus non apparentés, et même de parfaits inconnus, dans un large éventail de situations.

Il existe une grande variété de concepts qui peuvent expliquer la coopération dans la nature (voir Connor 2010 Leimar & Hammerstein 2010). Dans ce qui suit, nous passons en revue différentes formes de comportement coopératif dans le but explicite de discuter des différences entre les humains et les non-humains en ce qui concerne les stratégies employées pour maintenir la coopération et contrôler les resquilleurs. Nous nous concentrons sur les stratégies et les mécanismes qui conduisent à une augmentation des bénéfices directs de fitness des acteurs, car cela permet au comportement coopératif d'évoluer et de se stabiliser entre des individus non apparentés. Nous discutons également de certains des mécanismes immédiats sous-jacents au comportement coopératif et les comparons à ceux de nos plus proches parents primates, car les différences à cet égard semblent également expliquer les plus grandes capacités des humains à coopérer et à faire respecter la coopération.

Le problème du free-riding diffère entre les situations dans lesquelles il y a un délai entre l'aide donnée et reçue et les situations dans lesquelles il existe un potentiel de bénéfices mutuels immédiats (par exemple, les individus doivent travailler ensemble pour atteindre un objectif commun qui serait autrement inaccessible ou plus difficile obtenir), le premier étant plus vulnérable à la défection que le second. Nous distinguons les formes de comportement coopératif en fonction de leur influence sur les gains immédiats de l'acteur et du bénéficiaire. Si l'acteur a des coûts immédiats et que seul le bénéficiaire obtient des bénéfices immédiats, nous appelons cet investissement. Si le comportement a des effets positifs immédiats à la fois pour l'acteur et le destinataire, nous appelons cela un comportement égoïste mutuellement bénéfique ou une coopération mutuelle (Bshary & Bergmueller 2008). Nous discutons des dilemmes sociaux ou des problèmes d'action collective (PAC) comme un cas particulier de coopération mutuelle. Cependant, il convient de noter que les dilemmes sociaux s'appliquent aux deux types de comportement coopératif : (i) un comportement d'investissement qui crée des avantages publics et (ii) un comportement égoïste et mutuellement bénéfique dans les groupes.


Méthodes

Sujets et logement

Cette recherche a été menée en mars-avril 2018, à la station de recherche de Lizard Island, en Australie. Un total de 40 poissons ont participé aux expériences, 20 juvéniles et 20 napoléons adultes, se distinguant par leur motif de couleur distinct : les juvéniles sont pour la plupart bleus avec une bande noire, tandis que le bleu devient plus blanc chez les adultes. Il n'y avait pas de chevauchement entre les classes d'âge en ce qui concerne la longueur du corps (nettoyeurs juvéniles : moyenne = 4,45 ± 0,64 SD cm, nettoyeurs adultes : moyenne = 7,725 ± 0,56 SD cm). Les nettoyeurs ont été capturés dans les récifs entourant l'île Lizard au moins 24 jours avant le début des expériences et logés dans le laboratoire dans des aquariums séparés avec un débit constant d'eau de mer courante. Chaque poisson a reçu un tube en polychlorure de vinyle pour s'abriter. Avant le début des expériences, les nettoyeurs étaient nourris quotidiennement avec de la purée de crevettes qui était étalée sur des plaques de plexiglas de différentes couleurs et tailles. Les poissons ont été remis dans leur habitat d'origine à la fin des expériences.

Trois expériences ont été menées consécutivement, dans deux cohortes, chacune constituant 9 à 10 paires de jeunes et d'adultes nettoyeurs (N = 20 paires de nettoyeurs dans l'expérience 1, et N = 19 dans les expériences suivantes en raison du décès d'un mineur de la première cohorte). Avant le début des expériences, chaque paire de nettoyeurs était placée dans un aquarium en verre, séparé en deux compartiments par une cloison transparente. Une barrière opaque supplémentaire a été utilisée pour empêcher le contact visuel entre les nettoyeurs au cours des différentes étapes des expériences.

Montage expérimental

Dans les expériences 1 et 2, des plaques de plexiglas ont été utilisées comme substituts pour les clients, le mucus a été remplacé par de la purée de crevettes et les ectoparasites par des flocons. Les deux types d'aliments ont été utilisés pour créer des aliments discrets qui ont été placés sur les assiettes. Les articles en flocons étaient fabriqués en mélangeant de la purée de crevettes avec de la pâte de flocons de poisson du commerce. Les leviers attachés à chaque plaque ont permis à l'expérimentateur de manipuler les plaques pour qu'elles se comportent de manière prédéfinie qui imitent les réponses de vrais poissons clients. Les plaques n'ont jamais répondu lorsqu'un nettoyeur a mangé un élément en flocons non préféré, ce qui correspond à se nourrir en coopération d'ectoparasites non préférés 28 . En revanche, les expérimentateurs ont fait réagir les assiettes à une crevette préférée à manger plus propre, car la consommation de nourriture préférée (mucus) constitue une tricherie dans la nature 28 . Dans certains cas, la réponse a été de retirer rapidement l'assiette, l'équivalent d'un client en fuite et dans d'autres cas, l'expérimentateur a chassé le nettoyeur avec l'assiette, l'équivalent d'un client punissant 31 .

Dans chaque expérience, tous les poissons qui ne recevraient pas de nourriture pendant les sessions (c. Les sessions. Les nettoyeurs dans les deux compartiments de l'aquarium ont été visuellement isolés l'un de l'autre pendant cette alimentation.

Expérience 1 : apprendre socialement à se nourrir contre préférence

Dans la première expérience, nous avons testé si les juvéniles de poissons nettoyeurs peuvent apprendre socialement à manger contre leur préférence suite à l'observation des conséquences négatives associées à la « tricherie », la consommation de la nourriture préférée. Dans cette expérience, les poissons ont été présentés avec des assiettes (taille 10 × 15 cm) offrant trois flocons et trois crevettes. Pour faciliter la reconnaissance des articles, les articles de crevettes ont été placés à l'intérieur de cercles noirs tandis que les articles de flocons ont été placés dans des triangles noirs. Les emplacements de ces marquages, et leurs aliments respectifs, ont été commutés au hasard entre les sessions dans toutes les phases expérimentales (en utilisant dix versions différentes de la plaque, chacune impliquant une orientation différente des marquages).

Avant le début de l'expérience, nous avons mené une formation pré-expérimentale séparée pour les nettoyeurs des deux classes d'âge. Les barrières opaques ont été placées dans les aquariums tout au long de cette formation, interdisant le contact visuel entre les nettoyeurs. Dans cette phase pré-expérimentale, les démonstrateurs nettoyeurs ont été formés à se nourrir contre préférence pour obtenir plus de nourriture (voir aussi 31 ). Ils ont participé à 6 sessions, chacune impliquant la présentation d'une plaque en plexiglas contenant 2 crevettes et 12 flocons. Dans chaque essai, la consommation d'une crevette a entraîné le retrait immédiat de l'assiette pendant 60 s, après quoi l'assiette serait réintroduite dans l'aquarium jusqu'à ce que la prochaine crevette soit consommée. La consommation de la deuxième crevette a ensuite entraîné le retrait de l'assiette de l'aquarium jusqu'au prochain essai.En revanche, les nettoyeurs juvéniles étaient habitués à se nourrir d'assiettes contenant les deux types d'aliments qui ne répondaient pas à la consommation de crevettes. Ils ont été exposés à de nombreuses présentations d'assiettes contenant sept flocons et sept crevettes (initialement, différentes concentrations de flocons ont été utilisées, afin de trouver une concentration que les jeunes nettoyeurs n'aiment pas) et étaient donc bien familiarisés avec les deux types d'aliments.

A la fin de la phase d'acclimatation, les préférences des juvéniles envers la crevette ont été mesurées et utilisées pour créer pour chaque poisson un score de préférence initial. Ceci a été réalisé en testant les poissons dans une série de trois tests de préférence au cours desquels on leur a à nouveau présenté des assiettes contenant 7:7 de flocons et de crevettes. Dans chacun des tests, nous avons quantifié la quantité d'articles en flocons consommés dans les sept premiers choix (le point auquel la moitié de l'assiette est épuisée). Nous avons ensuite combiné les résultats des trois tests pour calculer pour chaque poisson un score de préférence : la proportion de crevettes consommées lors des phases initiales des tests. Étant donné que la préférence alimentaire initiale des jeunes nettoyeurs devrait affecter considérablement leur ajustement de l'alimentation dans la phase de test de l'expérience (moins ils aiment les flocons, moins ils sont susceptibles de s'en nourrir dans les tests), nous voulions nous assurer que le deux groupes de traitement ne diffèrent pas dans leur préférence pour la crevette. Pour ce faire, les préférences des nettoyeurs dans les tests de préférence initiaux ont été prises en compte dans leur affectation aux deux traitements. Les nettoyeurs au sein de chaque cohorte ont été classés en fonction de leur score de préférence initial, et ces rangs ont ensuite été utilisés pour répartir les poissons en deux traitements : d'abord, nous avons apparié les deux poissons avec le rang le plus élevé, et attribué au hasard chacun d'eux à un groupe de traitement (l'attribution a été déterminée par tirage au sort). Nous sommes ensuite passés au poisson avec les rangs les plus élevés du lot restant et avons répété cette procédure jusqu'à ce que tous les poissons aient été attribués. Enfin, nous avons vérifié que les juvéniles des deux traitements ne différaient pas dans leur préférence initiale pour la crevette ni dans leur taille corporelle (Wilcoxon rank sum 2-tailed test, N = 20 : préférence initiale, W = 48, P = 0,909 taille corporelle, W = 52.5, P = 0.879).

La concentration en flocons utilisée dans l'expérience était différente pour les sujets juvéniles et les démonstrateurs adultes. Dans le cas des juvéniles, la concentration des flocons était

60 % dans la première cohorte et

40% dans la seconde. Ces différences de cohorte proviennent du fait que dans la première cohorte, certains juvéniles ont à peine consommé des flocons lors de la phase de test. Comme nous craignions que cela empêche les différences de traitement d'être prononcées (si les juvéniles refusent de se nourrir de flocons, une absence de variation de leur réponse peut masquer tout effet d'observation), dans la deuxième cohorte, nous avons réduit la concentration de flocons à 40 %. En raison de cette différence inhérente entre les cohortes, nous avons inclus la « sapidité des flocons » (se référant à la différence entre les deux cohortes) comme facteur fixe dans l'analyse statistique de cette expérience. La concentration en flocons des adultes était plus faible (

20% d'écailles), en raison des premiers tests révélant que les juvéniles sont beaucoup plus tolérants envers les écailles que les adultes. L'utilisation de seulement 20 % de flocons pour les manifestants adultes a assuré qu'ils se nourriraient régulièrement d'articles en flocons avant de manger une crevette pendant les démonstrations, permettant ainsi potentiellement aux jeunes d'apprendre par l'observation les conséquences de la consommation d'articles en flocons par rapport aux crevettes.

L'expérience a été divisée en deux phases : une phase de démonstration et une phase de test. Au cours de la phase de démonstration, les jeunes nettoyeurs ont eu l'occasion d'assister à 14 démonstrations de présentations d'assiettes (voir Fig. 1a). Les plaques ont été marquées d'une bande blanche supplémentaire sur leur côté gauche, pour les distinguer des plaques utilisées précédemment, dans la phase de formation pré-expérimentale. Chaque assiette contenait trois flocons et trois crevettes, dont l'emplacement variait au hasard entre les essais. Dans le groupe de traitement (N = 10), la consommation d'un article de crevettes par le démonstrateur a entraîné le retrait immédiat de l'assiette de l'aquarium. Dans le groupe témoin (N = 10), une barrière transparente supplémentaire interdisait à l'adulte d'interagir avec la plaque (Fig. 1b). La durée de présentation de la plaque (le temps que les plaques sont restées dans l'aquarium) a été comparée entre les groupes de traitement et de contrôle : chaque individu de contrôle a été apparié à un individu du traitement d'observateur, et à chaque tour d'essai, la plaque de contrôle a été retirée en même temps. le temps que la plaque expérimentale avait été retirée en réponse au démonstrateur mangeant une crevette dans l'essai apparié.

A la fin de la phase de démonstration, nous avons effectué 15 essais tests (5 le jour de la démonstration et 10 le jour suivant), dans lesquels les juvéniles ont été présentés avec les mêmes plaques, et les plaques ont suivi la même règle de réponse qui a été montré lors des manifestations. Dans chacun de ces tests, nous avons mesuré la quantité d'articles en flocons consommés par les nettoyeurs avant la consommation de crevettes (la consommation d'un aliment était indiquée par la fixation de la bouche des nettoyeurs sur l'assiette à l'emplacement de l'article). Cette conception a permis aux juvéniles à la fois d'acquérir des informations en observant les adultes et d'acquérir une expérience personnelle en interagissant avec les plaques pendant les tests. Cela est parallèle aux conditions naturelles, où l'utilisation par les mineurs des informations sociales implique probablement l'obtention d'un retour d'information direct. Cela correspond en outre à la notion selon laquelle l'apprentissage social est un biais de l'apprentissage individuel par des stimuli sociaux plutôt qu'un processus complètement distinct (voir également les références 14,57,58,59,60,61,62). Notez, cependant, qu'en soi, l'apprentissage individuel ne serait pas en mesure de rendre compte des différences entre les traitements d'observateur et de contrôle. Au contraire, un effet important de l'apprentissage individuel devrait diminuer les différences potentielles entre ces traitements, car il permet aux individus des groupes de contrôle de combler les lacunes de connaissances créées par le manque d'exposition à l'information sociale. Ainsi, tout effet significatif de l'observation sociale sur les performances juvéniles serait prononcé malgré le potentiel d'apprentissage individuel, et non à cause de celui-ci.

À la fin de l'expérience, nous avons calculé pour chaque poisson un score de consommation par rapport à la préférence. Pour ce faire, nous avons d'abord calculé le score d'alimentation prévu du nettoyeur : le nombre d'éléments en flocons qu'il est censé cibler avant la consommation de crevettes, sur des assiettes contenant trois éléments en flocons et trois éléments de crevettes. Nous avons utilisé une dérivation d'une formule développée par Gingins et Bshary 63 dans le même but :

La formule combine les préférences alimentaires initiales du poisson et les probabilités de manger des éléments préférés et moins préférés dans un ensemble de choix séquentiels. Le score de préférence alimentaire mesuré avant le début de l'expérience (proportion de crevettes consommées dans les tests - voir détails ci-dessus) est noté par X. La probabilité de manger un flocon est notée 1 − X. Cette probabilité change à chaque fois qu'un élément en flocons est consommé, car sa consommation augmente la proportion de crevettes dans les éléments restants. La formule prend en compte ces changements de probabilités et génère pour chaque poisson un score d'alimentation prédit : le nombre de flocons qu'il est censé manger avant la consommation de crevettes en une seule session de test. Ce score a ensuite été soustrait du nombre moyen d'articles en flocons que les poissons ont réellement consommés dans les tests (mesurés - prédits), générant ainsi un score d'alimentation par rapport à la préférence. Lorsque le score d'alimentation par rapport aux préférences est supérieur à 0, cela signifie que le poisson a mangé plus de flocons que prévu, tandis que lorsque le score d'alimentation par rapport aux préférences est inférieur à 0, les poissons ont été inférieurs à la valeur attendue.

Expérience 2 : apprentissage social de la réactivité du partenaire

Dans l'expérience 2, les jeunes nettoyeurs (N = 19) ont participé à deux phases expérimentales consécutives : une phase d'apprentissage individuel et une phase d'apprentissage social, au cours desquelles ils ont été confrontés à plusieurs reprises à la nécessité de choisir entre des assiettes différentes par leur réactivité à la consommation de crevettes préférées des nettoyeurs. Les deux phases étaient composées de plusieurs traitements : deux dans la phase d'apprentissage individuel et quatre dans la phase d'apprentissage social (voir plus de détails dans la description de chaque phase expérimentale ci-dessous). Chacun des poissons a participé à tous les traitements (une conception au sein du sujet), et l'ordre de traitement a été contrebalancé entre les nettoyeurs au sein de chaque phase. Dans l'ensemble, au cours de cette expérience, les jeunes nettoyeurs ont rencontré un total de douze plaques (taille 7 × 9 cm) de couleurs et de motifs différents (voir Fig. 3 supplémentaire). Quatre aliments, deux crevettes et deux flocons, ont été placés sur des points également distants au milieu de chaque assiette. La concentration en flocons était de 40 % pour les jeunes nettoyeurs et de 20 % pour les démonstrations d'adultes. Les emplacements des aliments ont été contrebalancés, de sorte que les individus ont été exposés à une variété de combinaisons d'emplacements d'aliments tout au long des essais. Un traitement a été effectué chaque jour expérimental, et les rôles assignés aux plaques ont été contrebalancés entre les traitements au sein de chaque phase.

La première phase de l'expérience a testé l'apprentissage individuel concernant les réponses attendues des plaques (IL, jours 1-2). Dans cette phase, les nettoyeurs juvéniles ont participé à deux traitements, 'IL fuyant' et 'IL punissant', dans lesquels ils pouvaient interagir avec les plaques directement pendant la phase d'entraînement tout en étant visuellement isolés des adultes dans les compartiments voisins (Fig. 1c ). L'ordre de traitement était contrebalancé entre les individus. Dans chaque traitement, les nettoyeurs se sont vus présenter des assiettes appartenant à deux types distincts : une assiette qui permet au nettoyeur de manger ce qu'il veut et autant qu'il veut (« tolérant à la tricherie »), en sortant doucement de l'aquarium lorsque le nettoyeur a fini de se nourrir, et une assiette qui réagit négativement si et quand le nettoyeur mange une crevette préférée (« sensible à la tricherie »). Les réponses des plaques variaient d'un traitement à l'autre : dans le traitement « fuyant », les plaques réactives quitteraient l'aquarium brusquement après la consommation de crevettes, tandis que dans le traitement « punition », les plaques poursuivaient le nettoyeur dans l'aquarium pendant

3 s. Chaque traitement comprenait 20 sessions de formation impliquant 10 présentations uniques de chaque type de plaque. L'ordre de présentation a été déterminé par une loterie, avec la contrainte que la même plaque ne serait pas présentée dans plus de trois essais consécutifs.

A la fin de la formation, les juvéniles ont expérimenté une série de dix épreuves d'essai dans lesquelles ils ont été autorisés à choisir entre les deux plaques. Les règles de réaction des plaques dans ces tests correspondaient aux règles qu'elles ont suivies pendant l'entraînement, et dans chaque essai de test, la plaque non choisie a été retirée de l'aquarium. Les positions des plaques (côté gauche ou droit dans l'aquarium) ont été contrebalancées entre les tests. Le premier jour des tests, les nettoyeurs étaient relativement moins actifs vers la fin de la journée, et le nombre de tests effectués a donc été réduit à huit. Comme l'ordre des traitements était contrebalancé entre les individus, cette différence dans le nombre de tests entre le jour 1 et le jour 2 n'aurait pas pu conduire à des biais systématiques produisant des résultats significatifs. Les résultats de cette phase sont présentés dans la note complémentaire 1.

La deuxième phase de l'expérience était une phase d'apprentissage social (SL, jours 3-6), au cours de laquelle les jeunes nettoyeurs ont participé à quatre traitements impliquant différentes combinaisons d'observation sociale et de type de réponse de plaque (une matrice 2 × 2) : observer des démonstrateurs adultes interagir ou ne pas interagir avec les plaques et punir ou fuir les plaques réactives. L'ordre de traitement était contrebalancé entre les individus. Dans chaque traitement, les mineurs ont eu la possibilité d'assister à 20 démonstrations, 10 de chaque type de plaque (« tolérant » ou « réactif »), dans lesquelles la plaque désignée a été placée dans le compartiment du démonstrateur. Des nettoyeurs observateurs pouvaient alors observer l'interaction réelle du démonstrateur avec la plaque (Fig. 1a). Les individus témoins n'ont pas pu assister à une interaction réelle car les adultes ont été empêchés de se nourrir sur la plaque par une barrière transparente (Fig. 1b). Cependant, chaque individu témoin a été apparié à un individu d'un groupe de traitement respectif. L'ordre dans lequel les assiettes ont été présentées, le temps qu'elles ont passé dans l'aquarium et leurs règles de départ (partir doucement, s'enfuir brusquement ou « punir » en simulant le modèle de mouvement punitif utilisé dans le traitement de l'observateur, mais hors de portée du démonstrateur, dans la zone dans laquelle la plaque est confinée) étaient tous appariés à ceux utilisés dans les démonstrations de l'observateur apparié. Cela nous a permis de vérifier que toute différence de préférences entre les traitements de contrôle et d'observation ne sera pas due à des différences de durée d'exposition aux deux plaques, ou simplement à leurs schémas de mouvement. En raison du nombre impair de nettoyeurs, un individu a été apparié à lui-même : pour cet individu, chaque traitement d'observation a été effectué avant le contrôle pertinent, et l'ordre de présentation des plaques et le temps d'exposition utilisés pendant les traitements de contrôle ont été appariés à ceux présentés dans les traitements de l'observateur.

A la fin de la phase de démonstration, une barrière opaque a été placée dans l'aquarium, isolant visuellement les deux compartiments. Les nettoyeurs juvéniles ont ensuite été testés dans une série de dix essais d'essai dans lesquels ils ont été autorisés à choisir entre les deux plaques. De la même manière que pour la phase d'apprentissage individuel, les règles de réaction des plaques dans ces tests correspondaient aux règles qu'elles suivaient pendant l'entraînement, et dans chaque essai de test, la plaque non choisie était retirée de l'aquarium. Les positions des plaques (côté gauche ou droit dans l'aquarium) ont été contrebalancées entre les tests. Cette procédure de test a permis aux juvéniles d'acquérir une expérience personnelle dans leurs interactions avec les plaques pendant la phase de test. Cependant, comme expliqué en détail dans la description de l'expérience 1, l'expérience personnelle en elle-même ne serait pas en mesure d'expliquer les différences entre les traitements d'observateur et de contrôle.

Expérience 3 : observer les préférences arbitraires des manifestants

Dans l'expérience 3, les jeunes nettoyeurs ont été autorisés à observer des démonstrations dans lesquelles l'adulte choisirait entre deux types de plaques. La préférence des juvéniles pour l'une ou l'autre des plaques a ensuite été examinée dans une série de tests de choix. Les deux assiettes utilisées dans cette expérience étaient des assiettes monochromes (rouge et verte, taille 5 × 8 cm) avec des aliments placés sur des points dessinés sur leur dos. Cela garantissait que les nettoyeurs ne seraient pas en mesure de voir la nourriture elle-même avant de faire un choix, les forçant ainsi à baser leurs choix sur les indices de couleur plutôt que de simplement s'approcher facilement de la nourriture visible. Placer la nourriture au dos des assiettes nous a permis en outre de pré-former les démonstrateurs avant le début des expériences, tout en utilisant différents régimes de récompense. Les positions des plaques (côté gauche ou droit dans l'aquarium) ont été contrebalancées dans chacune des phases expérimentales.

Au cours de la formation pré-expérimentale, la barrière entre les compartiments du démonstrateur et de l'observateur était opaque, empêchant les jeunes nettoyeurs d'observer les interactions des adultes avec les plaques. Les jeunes nettoyeurs ont été pré-formés pour trouver de la nourriture au dos des assiettes en plexiglas en nageant derrière l'assiette. Les nettoyeurs adultes ont participé à au moins 24 sessions de formation (certains d'entre eux ont reçu plus de formation, en fonction de leurs réalisations, voir plus loin), impliquant un choix entre les deux types de plaques. A chaque séance, les deux plaques étaient placées dans l'aquarium, et suivant le choix de l'adulte, la plaque non choisie était immédiatement retirée. Les adultes ont été répartis en deux groupes de traitement : dans le traitement « démonstrateur préférant », les démonstrateurs ont été entraînés à préférer significativement l'une des assiettes (type assiette contrebalancée entre nettoyeurs) : dans ce traitement, l'assiette désignée contenait deux articles de crevettes et était donc toujours gratifiant, alors que l'autre assiette était vide de nourriture. Dans le traitement démonstrateur « non-préférant », le but de la formation était d'amener les démonstrateurs à s'approcher des plaques de manière aléatoire. Les adultes ont ainsi été entraînés avec des assiettes tout aussi enrichissantes, contenant toutes deux un élément de crevettes.

Dans certains cas, nous avons fourni aux adultes des séances de pré-formation supplémentaires. Dans le traitement « non-préférant », cela s'est produit lorsque les manifestants ont montré une forte préférence pour l'une des plaques (choisissent à plusieurs reprises le même type de plaque dans trois essais séquentiels). Ces manifestants recevraient alors des essais dans lesquels l'assiette préférée n'offrait aucune nourriture pour réduire la préférence. Dans les cas où les démonstrateurs présentaient néanmoins des difficultés à basculer entre les plaques, l'expérimentateur permettrait au nettoyeur d'explorer les deux plaques, plutôt que de retirer immédiatement la plaque non choisie (et enrichissante). Dans le traitement « préférant », des essais supplémentaires ont été ajoutés si les démonstrateurs présentaient des préférences faibles à la fin de la pré-formation (préférence non significative dans les 24 séances, selon un test binomial). Cela a été mené afin de maximiser les chances qu'ils montrent effectivement des préférences claires dans l'expérience elle-même.

Comme dans les expériences précédentes, l'expérience a été divisée en deux phases : l'observation sociale et le test. Dans la phase d'observation sociale, les juvéniles ont eu l'occasion d'assister à de nombreuses démonstrations de présentations d'assiettes (14 dans la première cohorte et 20 dans la deuxième cohorte). La nourriture était placée au dos des assiettes (et n'était donc pas visible pour les nettoyeurs), et sa répartition était similaire à celle de la période de formation initiale des adultes : 2 contre 0 articles dans le traitement démonstrateur préférant (N = 10), et 1 vs 1 dans le traitement non préférentiel (N = 9). Au début de chaque essai, le démonstrateur était confiné du côté adjacent à l'observateur, et les deux plaques étaient placées dans l'aquarium. La barrière confinant le manifestant a ensuite été retirée, lui permettant de nager vers les plaques. Suite à un choix d'une des plaques, la plaque non choisie a été escamotée. La plaque restante n'a été retirée de l'aquarium qu'une fois l'interaction terminée et le nettoyeur s'en est éloigné. Cela pourrait prendre un certain temps, car les nettoyeurs fournissaient souvent aux plaques une stimulation tactile, un comportement de « massage » qui fait partie de leur service aux clients du récif 64 . Notez que les choix des démonstrateurs dans cette phase, indiquent que notre formation initiale a atteint son objectif, et a généré une variation dans les préférences démontrées ainsi que des différences claires dans les démonstrations des deux groupes de traitement (somme des rangs de Wilcoxon : m = 19, W = 8.5, P = 0,003. Comparez les X-valeurs de l'axe des points gris et blancs sur la figure 4b).

A l'issue de la phase de démonstration, la barrière opaque séparant les deux compartiments a été mise en place, et les jeunes nettoyeurs ont été soumis à une série de dix tests de choix simultanés entre les deux mêmes plaques. Dans ces tests, une crevette était située à l'arrière de chaque assiette, rendant les assiettes de valeur égale. Comme lors des démonstrations, la plaque non choisie a été retirée de l'aquarium avant que les juvéniles puissent s'en nourrir.

Analyses statistiques

Les analyses statistiques ont été réalisées dans le logiciel statistique R version 3.5.1 65 . Les résultats des différentes expériences ont été analysés à l'aide de modèles linéaires, de modèles linéaires généralisés et de modèles mixtes linéaires généralisés, le cas échéant. Les prédicteurs continus ont tous été standardisés à l'aide de la fonction scale() du package de base en langage R. Signalé P les valeurs ont été extraites à l'aide de la fonction Anova() du package R car. Les résultats récapitulatifs de tous les modèles ajustés sont disponibles dans le tableau supplémentaire 1.

Dans l'expérience 1, nous nous sommes intéressés à savoir si les nettoyeurs juvéniles ajustaient la mesure dans laquelle ils mangeaient en fonction de leurs préférences après l'observation. Nous avons testé l'ajustement de l'alimentation des juvéniles en ajustant un modèle linéaire (modèle A, tableau supplémentaire 1) dans lequel leur score calculé d'alimentation par rapport à leurs préférences servait de variable de réponse. Le groupe de traitement (observateurs contre contrôle) et l'appétence des flocons (l'expérience a été menée dans deux cohortes, différant par l'appétence des éléments en flocons) ont été ajoutés comme prédicteurs fixes. La syntaxe de la formule de ce modèle était la suivante : manger contre score de préférence

groupe de traitement + appétence des flocons. Nous avons vérifié les diagnostics du modèle, la normalité des résidus et l'homogénéité des variances visuellement, en utilisant des diagrammes de résidus et des qqplots, et statistiquement, en utilisant les tests de Shapiro-Wilk et Levene.

De plus, nous nous sommes également intéressés à savoir si les choix alimentaires des adultes dans la phase de démonstration affectaient l'ajustement de l'alimentation des juvéniles dans le traitement d'observateur (les individus témoins n'ont pas observé les adultes consommer de la nourriture et n'ont donc pas été inclus dans cette analyse). À cette fin, nous avons adapté un modèle linéaire (modèle B, tableau supplémentaire 1) dans lequel le score de consommation par rapport aux préférences des jeunes a servi de variable de réponse. La consommation moyenne de flocons des démonstrateurs pendant l'observation et l'appétence des flocons ont servi de prédicteurs. La syntaxe de la formule de ce modèle était la suivante : manger contre score de préférence

consommation de flocons du démonstrateur + appétence des flocons. Les tests des hypothèses des modèles étaient similaires à ceux décrits ci-dessus pour le modèle A.

Dans l'expérience 2, nous avons testé séparément les phases d'apprentissage individuel et d'apprentissage social (N = 19 dans chaque phase), en ajustant deux modèles mixtes de liner généralisés (GLMM avec une distribution binomiale, fonction glmer() du package lme4 dans R lunguage 66 ). Dans le modèle d'apprentissage individuel, la variable de réponse était les choix binaires des nettoyeurs entre les plaques réactives et tolérantes dans la phase de test, le type de réponse de la plaque a été ajusté en tant que prédicteur fixe et l'identité du nettoyeur en tant que facteur aléatoire (voir la note supplémentaire 1). La syntaxe de la formule de ce modèle était la suivante : choix du nettoyeur

type de réponse de la plaque + (identité plus propre en tant que facteur aléatoire). Dans le modèle d'apprentissage social (modèle C, tableau supplémentaire 1), les choix binaires des nettoyeurs entre les plaques réactives et tolérantes étaient à nouveau la variable de réponse. L'observation sociale, le type de réponse et l'interaction entre eux ont été ajustés en tant que prédicteurs fixes, et l'identité plus propre a été ajustée en tant que facteur aléatoire. La syntaxe de la formule de ce modèle était le choix du nettoyeur

observation sociale * type de réponse à la plaque + (identité plus propre en tant que facteur aléatoire). Pour les deux modèles, nous avons vérifié les diagnostics des modèles à l'aide de diagrammes de résidus et la normalité des résidus pour les facteurs aléatoires à l'aide de qqplots et de tests de Shapiro-Wilk. Le R au carré pour les modèles mixtes a été obtenu à l'aide de la fonction r.squareGLMM(), du package MuMin R. De plus, nous avons mesuré les performances des poissons dans chaque traitement, en testant si leurs préférences s'écartaient de celles attendues par choix aléatoire (c'est-à-dire si la proportion de choix de plaques tolérantes dans chaque traitement différait de 0,5). Cela a été fait en utilisant des tests d'hypothèses linéaires générales (GLHT) pour les estimations des modèles mixtes, et P les valeurs ont été ajustées à l'aide de la méthode de Holm.

Dans l'expérience 3, nous avons testé si les préférences du groupe de traitement et/ou des démonstrateurs affectaient les préférences de plaques ultérieures des nettoyeurs juvéniles observateurs. Nous avons ajusté un modèle linéaire généralisé (GLM) avec une distribution quasi binomiale, une distribution qui contrôlait la surdispersion des résidus (en utilisant un paramètre d'échelle supplémentaire). Dans ce modèle, les choix des observateurs des plaques préférées et moins préférées des démonstrateurs dans les tests étaient la variable de réponse, tandis que les préférences des démonstrateurs (proportion des choix de la plaque la plus préférée de chaque démonstrateur pendant la phase de démonstration) et le groupe de traitement étaient les prédicteurs. . La syntaxe de la formule de ce modèle était la suivante : choix par le nettoyeur de plaques préférées par rapport aux plaques moins préférées du démonstrateur

groupe de traitement + préférence du démonstrateur. Nous avons vérifié les diagnostics des modèles (homogénéité de la variance, normalité résiduelle et violations potentielles de la linéarité) à l'aide de graphiques résiduels.

Note éthique

Cette étude a été réalisée conformément à la directive du comité d'éthique animale, Queensland, Australie (numéro d'approbation : CA 2018/01/1156).

Résumé du rapport

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports de recherche sur la nature lié à cet article.


Voir la vidéo: ANIMAUX DE COMPAGNIE QUE VOUS NE DEVEZ JAMAIS RELÂCHER DANS LA NATURE. Eureka (Décembre 2022).