Une étude à paraître est présentée comme « confirmant » que « les variations génétiques sont responsables de près de la moitié des variations de QI ». Ce n’est pourtant pas du tout ce qu’on peut en déduire.
Un acteur éminent du journalisme scientifique français soulignait récemment, à raison, le triste état dans lequel se trouve sa profession en France [1]. Il continue quant à lui de tenter d’intéresser ses concitoyens à l’actualité des sciences, courageusement et avec le professionnalisme que sa longue expérience lui a permis d’acquérir, sur un « blog invité » du Monde.fr. Quel dommage qu’il ait dérapé sur une question aussi sensible que celle des facteurs génétiques impliqués dans la variabilité des performances cognitives ! D’autant que son post a généré un buzz non négligeable [2].
Ce post [3] commence plutôt mal : l’utilisation de la terminologie « gènes de l’intelligence » dans le titre laisse supposer que ceux-ci existent, même si l’étude citée remet en question leur nombre et leur localisation. Elle laisse aussi supposer que cette étude adresse l’ « intelligence » alors qu’elle n’adresse que le facteur g, un concept statistique qui a ses limites [4]. Ensuite ça s’arrange : il fournit un lien vers l’article source, expose le contexte de l’étude, sa méthodologie, les caractéristiques clés des échantillons utilisés, ainsi que le principal résultat de l’étude.
Celui-ci, qui donne son titre à l’article source [5], est que les chercheurs ont échoué à répliquer, sur trois échantillons indépendants de grande taille ainsi que sur l’ensemble constitué des trois échantillons réunis, les associations précédemment mises en avant dans la littérature scientifique entre 12 variations génétiques et des mesures du facteur g. Compte tenu de l’importance des réplications, que le journaliste souligne à juste titre au début de son post, il aurait été utile d’indiquer que plusieurs études avaient déjà échoué à répliquer des associations de ce type, ce que les auteurs de l’article mentionnent, mais passons. Voici le passage du post qui est vraiment problématique (souligné en gras par moi) :
« Il ne faut pas en conclure pour autant que rien, dans les capacités cognitives, ne se transmet de manière génétique. En compilant et analysant des centaines de milliers de données, les auteurs de cette étude confirment que les variations génétiques sont responsables de près de la moitié des variations de QI entre individus […]. »
Tout d’abord, le facteur g que les chercheurs ont utilisé ici est très éloigné de la notion de QI [6], et cette partie de leur étude n’a porté que sur 2 440 hommes suédois, nés entre 1936 et 1958 et âgés de 18 ans environ au moment du test, un échantillon qui ne saurait représenter « les individus » en général.
Par ailleurs, comme les auteurs de l’article l’indiquent eux-mêmes, leurs résultats ne sont que compatibles avec l’hypothèse de l’existence de très nombreux variants génétiques dont les effets cumulés seraient responsables de près de la moitié de la variabilité du facteur g [7]. Ils ont en effet appliqué une méthode qui ne permet en aucun cas d’affirmer que la variabilité génétique est « responsable » de quoi que ce soit, et qui permet encore moins de le « confirmer », les études existantes qui vont dans le même sens ayant une portée limitée pour les mêmes raisons que celle-là.
Cette méthode récemment mise au point consiste, comme les études familiales et de jumeaux qui étaient jusqu’à récemment les seules à fournir des estimations d’héritabilité génétique, à calculer une corrélation entre proximité génétique et proximité phénotypique [8]. Cette nouvelle étude souffre du même travers fondamental que les études familiales et de jumeaux : elle ne prend pas en compte les corrélations entre facteurs génétiques et facteurs environnementaux, et c’est notamment pour cela que les estimations d’héritabilité génétique tirées de ces dernières restent controversées [9]. Ce point mérite qu’on s’y attarde, et j’y reviendrai dans de prochaines chroniques. Dans l’immédiat, je vous encourage vivement à lire quelques commentaires inspirés de ceux qui ont été postés le 13/12/2011, au sujet de cette étude, sur le blog que semble particulièrement apprécier notre journaliste scientifique [10].
Pour conclure, disons qu’on peut à juste titre vanter la richesse des blogs scientifiques anglo-saxons (cf in [1]), encore faut-il les utiliser pour leur véritable valeur ajoutée, à savoir le regard critique qu’ils posent parfois sur les publications scientifiques, et non comme système d’alerte permettant de publier un papier avant tout le monde [11].
Odile Fillod
_______________
Notes
[1] Cf http://passeurdesciences.blog.lemonde.fr/2011/11/25/prologue/, de Pierre BARTHELEMY.
[2] Le 15/02/2012 à 15h12, ce post avait été partagé 1216 fois directement depuis le blog, via l’un des modes de partage qui y sont disponibles (Facebook, Tweeter, etc). Compte tenu de la puissance de ces réseaux sociaux et sachant que ces statistiques ne tiennent pas compte des autres voies de mise en circulation de l’information, cela signifie qu’il a été lu par des milliers de personnes.
[3] Pierre BARTHELEMY, 15/12/2011, « Les gènes de l’intelligence remis en question », en ligne sur http://passeurdesciences.blog.lemonde.fr/2011/12/15/les-genes-intelligence-remis-en-question/ (accédé le 15/02/2012).
[4] Le facteur g, censé mesurer l’ « intelligence générale », est déduit de l’analyse statistique des scores obtenus à une batterie de tests. Il donne une vision à la fois biaisée et très réductrice tant de l’ « intelligence » que du QI. L’histoire et les défauts de ce concept ont été très bien exposés dans Stephen JAY GOULD, 1983, La mal-mesure de l’homme, Editions Ramsay/Le livre de poche.
[5] Christopher F. CHABRIS et al, 2011, Most reported genetic associations with general intelligence are probably false positives, Psychological Science (in press), en ligne sur http://www.wjh.harvard.edu/~cfc/Chabris2012a-FalsePositivesGenesIQ.pdf (accédé le 15/02/2012).
[6] Les tests utilisés pour calculer le facteur g dans cette partie de l’étude étaient ceux qu’avaient passés les hommes de l’échantillon lors de leur conscription, entre 1954 et 1976 environ. Leur contenu était très particulier, car ils avaient pour objectif d’adresser les compétences nécessaires pour suivre une formation militaire, à savoir : compréhension d’instructions simples, discrimination de concepts, compréhension technique (dont capacités spatiales), multiplication, et mécanique (résolution de problèmes simples) pour les individus les ayant passés avant 1959 ; à partir de 1959, le test de multiplication avait été supprimé, et celui de mécanique remplacé par un autre censé adresser les mêmes capacités en évitant un biais induit par la forme du précédent (cf http://gupea.ub.gu.se/bitstream/2077/9600/3/gupea_2077_9600_3.pdf, auquel les auteurs renvoient pour la description des tests utilisés). Les auteurs ont retenu comme facteur g le score obtenu sur le premier facteur issu de l’analyse en composantes principales des résultats à ces tests.
[7] Extrait de l’article ([5]) : « These and our other results, together with the failure of whole-genome association studies of g to date, are consistent with general intelligence being a highly polygenic trait on which common genetic variants individually have only small effects. ».
[8] La méthode utilisée ici consiste en gros à calculer, pour chaque paire d’individus d’un échantillon donné, leur degré de similarité génétique (ici sur environ 630 000 SNP) et leur degré de similarité dans le phénotype considéré (ici le facteur g), puis de calculer la corrélation entre les deux. De celle-ci est déduite une estimation du pourcentage de variance dite « expliquée » par les variations génétiques prises en compte. Extrait de l’article ([5]) : « […] we used SNP-based relatedness calculations to replicate estimates that about half of the variance in g is accounted for by common genetic variation among individuals. […] Davies et al. (2011) used data from five different genome-wide association studies (GWAS) and failed to identify any individual markers robustly associated with crystalized or fluid intelligence. They then applied a recently developed method (Yang et al., 2010; Visscher et al., 2010) for testing the cumulative effects of all the genotyped SNPs. In essence, this method calculates the overall genetic similarity between each pair of individuals in a sample and then correlates this genetic similarity with phenotypic similarity across all pairs. Following Yang et al. (2010), we dropped one twin per pair, and then estimated all pairwise genetic relationships in the resulting sample. We then dropped individuals whose relatedness exceeded .025, just as in Davies et al. (2011). Davies et al. reported that the ~550,000 SNPs in their data could jointly explain 40% of the variation in crystalized g (N = 3,254) and 51% of the variation in fluid g (N =3,181). We applied the same procedure to the STR sample from Study 3 and estimated that the ~630,000 SNPs in our data jointly account for 47% of the variance in g (p < .02), confirming the Davies et al. (2011) findings in an independent sample. »
[9] L’article de Davies et al cité dans l’article et dans le post dont il est question ici le reconnaît : « Data from twin and family studies are consistent with a high heritability of intelligence, but this inference has been controversial. […] Intelligence is highly familial, yet the extent and nature of the genetic contribution to intelligence differences has been controversial. Twin and adoption studies suggest that additive genetic effects contribute over half of the population variance in intelligence in adulthood. However, […], it has been suggested that the apparent high heritability for intelligence is the result of a correlation (confounding) between genetic and environmental factors and that breaking up this correlation would result in the trait being much less heritable. ». A ce point de leur exposé, les auteurs n’apportent aucun contre-argument à l’appui de la validité des conclusions habituellement tirées des études familiales et de jumeaux, se contentant d’enchaîner sur la description de leur étude. Malgré le titre tonitruant de leur article, ils y concluent prudemment que leurs résultats « show for the first time that a substantial proportion (~40–50%) of variation in human intelligence is associated with common SNPs […]. […] This suggests that human intelligence and perhaps other complex traits are highly polygenic […].». (Davies et al, 2011, Genome-wide association studies establish that human intelligence is highly heritable and polygenic, Molecular Psychiatry, Vol.16(10), p. 996-1005).
[10] Cf http://neuroskeptic.blogspot.com/2011/12/heres-paper-soon-to-appear-in.html. Pierre Barthelemy cite explicitement ce blog dans un autre post, daté du 22/12/2012. Trois commentaires ont particulièrement attiré mon attention, à partir desquels je développe ici trois remarques :
– la méthode de calcul utilisée implique que moins l’environnement est variable dans l’échantillon considéré, plus le pourcentage de variabilité « expliquée » par la variabilité génétique est grand ; ici on ne peut pas dire que les auteurs se soient assurés que les membres de leur échantillon venaient d’environnements très divers, puisque pour leur calcul ils ont utilisé uniquement leur troisième sous-échantillon (ils n’expliquent d’ailleurs pas pourquoi), à savoir 2 441 hommes suédois nés entre 1936 et 1958, issus d’un registre de jumeaux et testés à l’occasion de leur service militaire ;
– une part de la variation du facteur g « expliquée » par les variations génétiques pourrait venir de gènes qui affectent l’adaptation à la société en général (ex : être un homme de petite taille, avoir la peau noire dans un pays à majorité blanche,…), ce qui peut avoir un impact sur les performances aux tests de QI, à terme affectées négativement par l’inadaptation sociale (l’inadaptation scolaire par exemple). Ainsi, il y a bien dans ce cas un lien de cause à effet entre gènes et QI, mais qui n’a rien à voir avec l’idée que certains allèles de ces gènes prédisposent à avoir un QI plus ou moins élevé ;
– il existe une corrélation entre la proximité génétique et la proximité environnementale, et de ce fait, le lien entre performances aux tests de QI et patrimoine génétique peut en fait traduire une influence de l’environnement, même si (comme les chercheurs l’ont fait ici pour contrer cet argument) on exclut les paires d’individus de la même famille. Exemple : les allèles des gènes qui donnent les yeux bridés sont nécessairement plus similaires entre personnes d’origine asiatique qu’entre asiatiques et européens, et si l’on s’amusait à faire une étude génétique du même type sur la capacité à manger avec des baguettes, on trouverait sans doute une forte corrélation avec la variabilité de ces gènes. Cette corrélation ne serait pourtant en rien imputable à un effet de ces gènes sur les capacités sensorimotrices impliquées dans le maniement des baguettes ! Prenons un autre exemple : les habitants des banlieues pauvres dans lesquelles sont concentrées en France les populations d’origine maghrébine ou africaine sont susceptibles de souffrir d’un environnement peu favorable à l’obtention de scores élevés à certains tests de QI, et la fréquence de certains allèles (ne serait-ce que ceux qui sont liés à la couleur de la peau) dans ces populations est nécessairement différente de celle qu’on trouverait dans des quartiers où les enfants disposent d’environnements généralement plus favorables. Si une étude du même type que celle faite ici était réalisée sur ces populations, il n’est pas improbable qu’elle mettrait en évidence une corrélation entre gènes et QI qui pourrait cependant être entièrement due aux différences d’environnement.
[11] L’article n’est pas encore (pré-)publié en ligne par la revue scientifique en question et n’a pas non plus fait l’objet d’un communiqué de presse (par la revue ou par une institution de rattachement des chercheurs), éléments déclenchant en principe leur annonce dans la presse de vulgarisation. Il en revanche été relayé et discuté sur des blogs scientifiques dès le 11/12/2011.