MyHeritage, aujourd’hui 3e laboratoire de généalogie génétique après AncestryDNA et 23andMe, a l’ambition de rapidement devenir leader sur ce marché. Pour atteindre cet objectif, le laboratoire vient d’annoncer l’amélioration de ses résultats d’origines ethniques. Un niveau supplémentaire s’ajoute désormais aux 42 zones géographiques, permettant d’affiner les résultats sur plus de 2 100 populations s’étant installées dans le monde. Mais est-ce fiable ou pas ? Réponse.
De la pub, rien que de la pub ?
Dernier arrivé sur le marché des laboratoires de généalogie génétique, MyHeritage nous a habitué aux publicités mensongères. Et que dire des inquiétantes dérives sur les données personnelles ayant mené l’association de défense des consommateurs française Que choisir à saisir la Commission Nationale Informatique et Liberté en France. Alors, quand MyHeritage a annoncé avoir désormais le panel ethnique le plus précis avec quelques 2 114 groupes génétiques, mieux que les 1 500 régions ethniques du leader AncestryDNA, il fallait vérifier dans le détail ces assertions.
Les origines ethniques constituent l’approche généralement la plus demandée, et source de nombre d’incompréhension. Il faut donc rappeler que seul le rapprochement des origines ethniques avec ses ancêtres permet de confirmer, ou pas, la viabilité des informations. A ce sujet, il convient de relire l’article sur Les tests ADN ethniques sont ils fiables ?
Zones géographiques et groupes génétiques
Nombre d’utilisateurs se sont plaints des piètres résultats en termes d’origines ethniques de MyHeritage, découpant le monde en 42 zones géographiques d’origines ethniques, une peccadille au vu de la diversité humaine sur terre. Une zone géographique peut englober jusqu’à 15 pays différents, et autant de diversité de populations, soit un résultat bien décevant pour nombre d’utilisateurs.
La promesse d’affiner par cinquante ces 42 zones géographiques en affichant 2 114 groupes génétiques laissait donc assez rêveur.
Les équipes de MyHeritage ont travaillé à améliorer ces résultats grâce à 1,4 millions de profils génétiques inscrits sur le site. Ils ont combiné un mixte d’identification de marqueurs génétiques et d’analyse des informations contenues dans les arbres généalogiques.
Un groupe génétique peut être constitué de plusieurs populations différentes, notamment lorsqu’il s’agit de populations s’étant installées relativement récemment du point de vue génétique sur de nouveaux territoires comme les Etats-Unis.
La population américaine est constituée d’amérindiens, autochtones natifs du continent et bien identifiables génétiquement, et de populations européennes. Les parcours chronologique de migration desdites populations européennes ont été identifiés grâce aux arbres généalogiques. Les dates et lieux de naissance ont permis de retracer leur cheminement.
La répartition de ces groupes génétiques a été détaillé dans ce visuel publié par MyHeritage sur leur blog.
Il n’existe pas de liste détaillée des 2114 groupes génétiques. Pour obtenir le détail d’une zone géographique, il vous faudra cliquer sur la mention Groupes génétiques située en dessous du nom de la zone géographique pour en découvrir le détail.
L’examen de cette simple liste nous donne déjà des informations importantes.
Etude de la liste des groupes génétiques de MyHeritage

MyHeritage a publié la liste détaillée des 2114 groupes génétiques affichés dans les résultats des origines ethniques
Une simple observation attentive de la liste affichée par MyHeritage nous donne déjà des informations précieuses, certaines régions du monde étant sur-représentées par rapport à d’autres.
Ainsi, si vous êtes d’origine britannique, irlandaise, écossaise ou galloise, vous bénéficierez de 410 groupes génétiques soit près de 20 % des groupes génétiques du monde entier pour vous seuls !
Rien d’étonnant à cela, ce niveau de précision est disponible de longue date chez l’américain AncestryDNA, le leader des tests ADN avec ses 18 millions de testés, ou le britannique LivingDNA. Cette zone géographique, pionnière en matière de tests ADN d’origines ethniques, a bénéficié de nombres de publications scientifiques détaillées, reprises par les laboratoires.
Le 2e ensemble le plus représenté correspond à l’Italie. En cumulant le groupe Italien et Grec / Italiens du Sud, nous parvenons à un total de 204 groupes génétiques.
A titre de comparaison, le continent africain comportant plus de 2000 ethnies différentes, est identifié par moins de 200 groupes génétiques, dont 147 uniquement pour le Nigéria. Doutant que MyHeritage ait pu s’appuyer sur des arbres généalogiques dans ces pays où la tradition orale prédomine, il reste à supposer qu’une étude génétique spécifique sur ce pays a servi de support. Ces études sont publiées par les scientifiques dans des bases de données publiques accessibles gratuitement à tous.
La disproportion entre résultats ethniques du continent européen avec les autres continents se manifeste chez MyHeritage, alors que les laboratoires américains AncestryDNA et 23andMe y attachent une grande importance. La raison ? Les afro américains constituent leurs premiers clients à la recherche de résultats ethniques précis. Pour répondre à cette demande, ces laboratoires ont réalisé des enquêtes ethniques directement en Afrique, en y envoyant des kits gratuits afin de recueillir l’ADN des populations encore vivants sur place.
MyHeritage a vocation à devenir le leader des tests ADN à des fins généalogiques, notamment en Europe. Mais qu’en est-il en réalité ?
Les groupes génétiques de l’Europe de l’Ouest et du Nord
Alors que les autres laboratoires affichent le détail de toutes les zones géographiques proposées comme AncestryDNA, il est plus difficile de trouver cette liste sur MyHeritage. Certaines zones, notamment la France, demeurent largement sous-représentées dans la précision des résultats. MyHeritage se vantant d’être leader en Europe, devrait donc nous apporter une précision 50 fois plus importante que les autres laboratoires sur l’Europe de l’Ouest.
Le laboratoire nous annonce 297 groupes génétiques distincts sur l’Europe de l’Ouest et du Nord, dont la zone géographique s’étend notamment de la France, Allemagne, Autriche, Suisse, nord de l’Italie, République tchèque etPays-Bas.
Ce qui va nous intéresser plus particulièrement va s’afficher dans la colonne de droite avec enfin le détail des populations. Et dès les premières lignes, la désillusion l’emporte. Dans la liste des populations européennes, MyHeritage affiche les acadiens, ces colons français installés aux Etats-Unis et au Canada.
Les canadiens et américains constituent la source principale d’informations pratiquant la généalogie génétique depuis près de 20 ans. Ils sont aussi les plus nombreux à s’être fait testés. Cependant, pour nous, européens de souche, dont les racines plongent principalement dans l’ancien continent, nous sommes surtout intéressés par le détail de nos origines sur ce continent ?
Les Acadiens auraient donc dus être rattachés aux Etats-Unis et au Canada ! Mais les inclure dans les résultats de l’Europe de l’Ouest permet de bien « gonfler » le nombre de résultats ! Ce même reproche s’applique aux autres laboratoires de généalogie génétique.
Les résultats d’origines ethniques portent le plus à confusion de par leur mélange de nationalités, zones géographiques et populations variées.
Les affichages suivants semblent aussi peu significatifs. Les groupes génétiques s’étendent pour l’Autrice sur une zone englobant Tyrol, Italie et France ! Où est la précision attendue ?
En observant le détail d’une zone géographique précise comme le groupe 8215, on découvre que ce groupe correspond aux français, quelques allemands en France et en Allemagne de l’Ouest ainsi que leurs descendants aux Etats-Unis. Et cette identification a été rendue possible grâce à 32 kits ADN et 15 arbres généalogiques !
Et oui, vous avez bien lu, ils ont identifié un groupe génétique marquant avec 32 profils génétiques seulement. Est-ce représentatif ? Est-ce fiable ? Le moins que l’on puisse dire, c’est qu’en déterminant une zone géographique aussi grande, MyHeritage prend peu de risques de se tromper. En l’occurence, cela n’apporte pas d’information nouvelle pour les utilisateurs !

Dans la multiplication des groupes génétiques, MyHeritage a créé un second groupe génétique France et Allemagne tout aussi imprécis que le premier groupe
En fouillant dans le détail des groupes génétiques censés être plus précis, on peut même trouver des pépites comme le groupe génétique référencé 6995 s’étendant de l’Allemagne au Kazakhstan, et leurs descendants au Canada, bien sûr.

MyHeritage a créé des groupes génétiques n’ayant aucun intérêt, si ce n’est de comptabiliser des groupes génétiques supplémentaires pour augmenter leurs statistiques.
Quel intérêt ou information supplémentaire pour les utilisateurs de MyHeritage ?
Et cependant, parfois, enfin un groupe génétique apportant une information détaillée et précieuse. Mais cette précision géographique bienvenue se retrouve noyée au milieu des groupes génétiques étendus sur plusieurs pays et populations. L’utilisateur de MyHeritage espérait ce niveau de précision, notamment sur la France, grande oubliée de tous les laboratoires de généalogie génétique.
Même si le groupe 6817 englobe deux régions françaises (nous sommes bien loin de la précision obtenue pour les britanniques ou irlandais), cela représente une amélioration notable et bienvenue. Malheureusement, le nombre de tests ADN et arbres généalogiques utilisés semble bien insuffisants.
D’où cette mention sous le groupe génétique de fiabilité « élevée » ou « moyenne » pour le résultat affiché !

Parmi les multiples groupes génétiques étendus sur plusieurs pays, enfin, parfois, des groupes génétiques plus précis sur des zones géographiques plus restreintes et précises de la France.
Une première conclusion sur la précision de ces groupes génétiques
Entre l’effet d’annonce de la plus grande précision ethnique avec 2 114 groupes génétiques, à la réalité analysée desdits groupes génétiques, la déception s’avère de mise. MyHeritage a voulu faire du chiffre, quitte à mélanger des résultats de qualité et intérêt très disparates.
Aucune analyse critique de ces groupes génétiques n’a été effectuée, tant du point de vue ethnique qu’historique, permettant de donner du sens aux informations retranscrites.
Quelques groupes génétiques pertinents émergent parfois. Cependant, seule l’analyse individuelle des généalogistes génétiques permettra de confirmer ou pas la justesse de ces résultats.
En effet, les équipes de MyHeritage se sont appuyées sur les résultats ADN recoupés avec les arbres généalogiques mis en ligne. Et ceux-ci regorgent parfois d’erreurs, recopiées d’arbre en arbre. L’exemple en sera décortiqué dans mon exemple détaillé dans un prochain article.
Et vous ! Que pensez-vous de cette amélioration ?