
We are searching data for your request:
Upon completion, a link will appear to access the found materials.
J'ai lu pour essayer de comprendre comment le coefficient de parenté (ou coefficient d'ascendance) est calculé. https://brainder.org/2015/06/13/genetic-resemblance-between-relatives/ c'est la meilleure explication que j'ai pu trouver jusqu'à présent. Cependant, je n'ai pas été en mesure de trouver une explication qui fasse une distinction claire entre les gènes et les allèles.
Dans ma lecture initiale de ce qui précède, j'ai pris en compte ce fait et j'ai supposé que souvent, lorsque l'auteur a écrit gène, il / elle voulait dire allèle (une hypothèse que je pense maintenant incorrecte), et donc que l'identité par descendance d'un seul allèle entre individus serait suffire à satisfaire la parenté dans le cadre de la définition du coefficient de parenté. Cela m'a amené à la confusion en lisant le coefficient de parenté tel que défini mathématiquement à partir des coefficients d'identité condensés :
D1 + 1/2(D3+D5+D7) + 1/4(D8)
Assurément, pensai-je, le coefficient de parenté devrait simplement être la somme des probabilités de toutes les façons possibles dont les deux individus peuvent partager le même allèle. Et donc il n'y a aucune raison de multiplier la somme de D3, D5 et D7 par 1/2 et D8 par 1/4.
Enfin à ma question; Le coefficient de parenté est défini comme la probabilité que deux individus soient identiques par descendance à un seul gène choisi au hasard. En se souvenant de cela, c'est la raison pour laquelle il est calculé de cette manière car pour que le gène entre les individus soit totalement identique dans le cas de D3, D5 et D7, un allèle identique supplémentaire est requis d'un parent (un événement avec une probabilité de 1/2), et dans le cas de D8, des allèles identiques supplémentaires sont requis des deux parents (un événement avec une probabilité de 1/4) ?
Je serais très reconnaissant si quelqu'un pouvait m'expliquer pourquoi il est calculé de cette manière.
Estimation FST et parenté pour des structures de population arbitraires
Affiliations Duke Center for Statistical Genetics and Genomics, Duke University, Durham, Caroline du Nord, États-Unis d'Amérique, Département de biostatistique et de bioinformatique, Duke University, Durham, Caroline du Nord, États-Unis d'Amérique
Rôles Conceptualisation, Analyse formelle, Acquisition de financement, Enquête, Méthodologie, Rédaction – ébauche originale, Rédaction – révision et édition
Affiliation Lewis-Sigler Institute for Integrative Genomics, Université de Princeton, Princeton, New Jersey, États-Unis d'Amérique
Inférence relationnelle à partir des données génétiques sur les parents ou la progéniture : une étude comparative
L'inférence de relations dans une population présente un intérêt pour de nombreux domaines de recherche, de l'anthropologie à la génétique. Il est possible de déduire directement la relation entre les deux individus d'un couple à partir de leurs données génétiques ou de la déduire indirectement à partir des données génétiques d'un de leurs descendants. Pour cette raison, on peut se demander s'il est plus avantageux d'échantillonner des couples ou des célibataires pour étudier les relations de couples dans une population. En effet, l'échantillonnage de deux individus est plus informatif que l'échantillonnage d'un seul car nous examinons quatre haplotypes au lieu de deux, mais cela double également le coût de l'étude et constitue un schéma d'échantillonnage plus complexe.
Pour répondre à cette question, nous avons effectué des simulations de 1000 trios de 10 relations différentes en utilisant de vrais haplotypes humains pour avoir des données génétiques réalistes à l'échelle du génome. Ensuite, nous avons comparé les coefficients de partage du génome et l'inférence de relation obtenue à partir d'une paire d'individus ou d'un de leurs descendants en utilisant à la fois des approches à point unique et à points multiples.
Nous avons observé que pour les relations plus proches que le 1er cousin, les paires d'individus étaient plus informatives que l'un de leurs descendants pour l'inférence de relation, et les coefficients de parenté obtenus à partir de méthodes à point unique donnaient des estimations de partage du génome plus précises ou équivalentes. Pour les relations plus éloignées, la progéniture était plus informative pour l'inférence de relations, et les coefficients de consanguinité obtenus à partir de méthodes multipoints ont donné des estimations plus précises du partage du génome.
En conclusion, l'inférence relationnelle sur un couple parental ou sur l'un de leurs descendants apporte des informations complémentaires. Lorsque cela est possible, les trios d'échantillonnage doivent être encouragés car ils pourraient permettre de couvrir un plus large éventail de relations potentielles.
Formules de comptage de chemins pour les coefficients de parenté généralisés et les coefficients d'identité condensés.
Avec l'expansion rapide du domaine de la génétique médicale et du conseil génétique, les informations généalogiques deviennent de plus en plus abondantes. En janvier 2009, le département américain de la Santé et des Services sociaux a publié une version mise à jour et améliorée de l'outil Web d'historique de santé familiale du Surgeon General [1]. Cet outil Web permet aux utilisateurs d'enregistrer facilement les antécédents médicaux de leur famille. Les grands pedigrees humains étendus sont très instructifs pour l'analyse de liaison. Des pedigrees comprenant des milliers de membres sur 10 à 20 générations sont disponibles à partir de populations génétiquement isolées [2, 3]. En génétique humaine, un pedigree est défini comme « un diagramme simplifié de la généalogie d'une famille qui montre les relations des membres de la famille les uns avec les autres et comment un trait, une anomalie ou une maladie spécifique a été hérité » [4]. Les pedigrees sont utilisés pour retracer l'hérédité d'une maladie spécifique, calculer les ratios de risque génétique, identifier les individus à risque et faciliter le conseil génétique. Pour calculer les ratios de risque génétique ou identifier les individus à risque, nous devons évaluer le degré de parenté de deux individus. En fait, toutes les mesures de parenté sont basées sur le concept d'identité par filiation (IBD). Deux allèles sont identiques par descendance si l'un est une copie ancestrale de l'autre ou s'ils sont tous deux des copies du même allèle ancestral. Le concept IBD est principalement dû à Cotterman [5] et Malecot [6] et a été appliqué avec succès à de nombreux problèmes de génétique des populations.
La mesure la plus simple de la relation entre deux individus est leur coefficient de parenté. Le coefficient de parenté entre deux individus i et j est la probabilité qu'un allèle choisi au hasard parmi i et un allèle choisi au hasard dans le même locus autosomique de j soient identiques par filiation. Pour mieux discriminer entre les différents types de paires de parents, des coefficients d'identité ont été introduits par Gillois [7] et Harris [8] et promulgués par Jacquard [9]. Considérant les quatre allèles de deux individus à un locus autosomique fixe, il y a 15 états d'identité possibles. Sans tenir compte de la distinction entre les allèles d'origine maternelle et paternelle, nous obtenons 9 états d'identité condensés. Les probabilités associées à chaque état d'identité condensé sont appelées coefficients d'identité condensés, qui sont utiles dans un large éventail de domaines. Cela comprend le calcul des rapports de risque pour la maladie qualitative, l'analyse des traits quantitatifs et le conseil génétique en médecine.
Un algorithme récursif de calcul de coefficients d'identité condensés proposé par Karigl [10] est connu depuis un certain temps. Cette méthode nécessite que l'on calcule un ensemble de coefficients de parenté généralisés, à partir desquels on obtient des coefficients d'identité condensés via une transformation linéaire. Une limitation est que cette approche récursive n'est pas évolutive lorsqu'elle est appliquée à de très grands pedigrees. Il a été précédemment montré que les coefficients de parenté pour deux individus 11-13] et les coefficients de parenté généralisés pour trois individus [14, 15] peuvent être calculés efficacement en utilisant des formules de comptage de chemins ainsi que des schémas de codage de chemins adaptés aux graphes généalogiques.
Motivés par l'efficacité des formules de comptage de chemins pour calculer le coefficient de parenté pour deux individus et le coefficient de parenté généralisé pour trois individus, nous introduisons d'abord un cadre pour développer des formules de comptage de chemins pour calculer les coefficients de parenté généralisés concernant trois individus, quatre individus, et deux paires d'individus. Ensuite, nous présentons des formules de comptage de chemins pour tous les coefficients de parenté généralisés qui ont des formules récursives proposées par Karigl [10] et sont suffisantes pour calculer des coefficients d'identité condensés. En résumé, notre objectif ultime est d'utiliser des formules de comptage de chemins pour le calcul généralisé des coefficients de parenté afin que l'efficacité et l'évolutivité du calcul des coefficients d'identité condensés puissent être améliorées.
Les principaux apports de notre travail sont les suivants :
(i) un cadre pour développer des formules de comptage de chemins pour les coefficients de parenté généralisés
(ii) un ensemble de formules de comptage de chemins pour tous les coefficients de parenté généralisés ayant des formules récursives [10]
(iii) des résultats expérimentaux démontrant des gains de performances significatifs pour le calcul des coefficients d'identité condensés basés sur nos formules de comptage de chemin proposées par rapport à l'utilisation de formules récursives [10].
Cette section décrit les coefficients de parenté et les coefficients de parenté généralisés, les coefficients d'identité et les coefficients d'identité condensés plus en détail. Les termes conceptuels des formules de dénombrement des chemins pour trois et quatre individus sont présentés à la section 2.3. De plus, une vue d'ensemble de la dérivation de la formule de comptage de chemins est présentée.
2.1. Coefficients de parenté et coefficients de parenté généralisés. Le coefficient de parenté entre deux individus a et h est la probabilité qu'un allèle choisi au hasard au même locus de chacun soit identique par filiation (IBD). Il existe deux approches pour calculer le coefficient de parenté [[PHI].sub.ab] : l'approche récursive [10] et l'approche de comptage de chemin [16]. Les formules récursives [10] pour [[PHI].sub.ab] et [[PHI].sub.ab] sont
[[PHI].sub.ab] = 1/2([[PHI].sub.fb] + [[PHI].sub.mb]) si a n'est pas un ancêtre de b, [[PHI].sub. aa] = 1/2 (1 + [[PHI].sub.fm]) = 2 1/2 (1 + [F.sub.a]), (1)
où f et m désignent respectivement le père et la mère de a, et [F.sub.a] est le coefficient de consanguinité de a.
La formule de comptage de chemin de Wright [16] pour [[PHI].sub.ab] est
[EXPRESSION MATHÉMATIQUE NON REPRODUCTIBLE EN ASCII], (2)
où A est un ancêtre commun de a et b, PP est un ensemble de paires de chemins non chevauchants [??][P.sub.Aa], [P.sub.Aa][??] de A à a et b, r est la longueur du chemin [P.sub.Aa], s est la longueur du chemin [P.sub.Ab], et [F.sub.A] est le coefficient de consanguinité de A. Le chemin- paire [??][P.sub.Aa], [P.sub.Ab][??] ne se chevauchent pas si et seulement si les deux chemins ne partagent aucun individu commun, sauf A.
Les formules récursives proposées par Karigl [10] pour les coefficients de parenté généralisés concernant trois individus, quatre individus et deux paires d'individus sont répertoriées comme suit en (3), (4) et (5) :
[[PHI].sub.abc] = 1/2 + ([[PHI].sub.fbc] + [[PHI].sub.mbc]) si a n'est pas un ancêtre de b ou c,
[[PHI].sub.aab] = 1/2 ([[PHI].sub.ab] + [[PHI].sub.fmb])
si a n'est pas un ancêtre de b,
[[PHI].sub.aaa] = 1/4 (1 + 3[[PHI].sub.fm]) = 1/4 (1 + 3[F.sub.a]) > [[PHI].sub .abcd] = 1/2 ([[PHI].sub.fbcd] + [[PHI].sub.mbcd]) (3)
si a n'est pas un ancêtre de b ou c ou d,
[[PHI].sub.aabc] = 1/2 ([[PHI].sub.abc] + [[PHI].sub.fmbc])
si a n'est pas un ancêtre de b ou c,
[[PHI].sub.aaab] = 1/4 ([[PHI].sub.ab] + 3[[PHI].sub.fmb])
si a n'est pas un ancêtre de b,
[[PHI].sub.aaaa] = 1/8 (1 + 7[[PHI].sub.fm]) = 1/8 (1 + 7[F.sub.a]), (4)
[[PHI].sub.ab,cd] = 1/2 ([[PHI].sub.fb,cd] + [[PHI].sub.mb,cd])
si a n'est pas un ancêtre de b ou c ou d,
[[PHI].sub.aa,bc] = 1/2 ([[PHI].sub.bc] + [[PHI].sub.fm,bc])
si a n'est pas un ancêtre de b ou c,
[[PHI].sub.aa,ac] = 1/2 ([[PHI].sub.abc] + [[PHI].sub.fb,mc] + [[PHI].sub.mb,fc])
si a n'est pas un ancêtre de b ou c,
[[PHI].sub.aa,ab] = 2 ([[PHI].sub.ab] + [[PHI].sub.fmb])
si a n'est pas un ancêtre de b,
[[PHI].sub.aa,aa] = 4 (l + [[PHI].sub.fm]) = 1/4 (1 + 3[F.sub.a]). (5)
[[PHI].sub.abc] est la probabilité que des allèles choisis au hasard au même locus de chacun des trois individus (c'est-à-dire a, b et c) soient identiques par descendance (IBD). De même, [[PHI].sub.abcd] est la probabilité que des allèles choisis au hasard au même locus de chacun des quatre individus (c'est-à-dire a, b, c et d) soient IBD. [[PHI].sub.ab,cd] est la probabilité qu'un allèle aléatoire de a soit IBD avec un allèle aléatoire de b et qu'un allèle aléatoire de c soit IBD avec un allèle aléatoire de d au même locus. Notez que [[PHI].sub.abc] = 0 s'il n'y a pas d'ancêtre commun à a, b et c. [[PHI].sub.abcd] = 0 s'il n'y a pas d'ancêtre commun de a, b, c et d, et [[PHI].sub.ab,cd] = 0 en l'absence d'ancêtre commun soit pour a et b ou pour c et d.
2.2. Coefficients d'identité et coefficients d'identité condensés. Étant donné deux individus a et b avec des allèles d'origine maternelle et paternelle à un locus autosomique fixe, il y a 15 états d'identité possibles, et les probabilités associées à chaque état d'identité sont appelées coefficients d'identité. Ignorant la distinction entre les allèles d'origine maternelle et paternelle, nous classons les 15 états possibles en 9 états d'identité condensés, comme le montre la figure 1. Les états vont de l'état 1, dans lequel les quatre allèles sont IBD, à l'état 9, dans lequel aucun des quatre allèles sont IBD. Les probabilités associées à chaque état d'identité condensé sont appelées coefficients d'identité condensés, notés <[DELTA].sub.i] | 1 [inférieur ou égal à] i [inférieur ou égal à] 9>. Les coefficients d'identité condensés peuvent être calculés sur la base de coefficients de parenté généralisés en utilisant la transformation linéaire illustrée comme suit en (6) :
[EXPRESSION MATHÉMATIQUE NON REPRODUCTIBLE EN ASCII]. (6)
Dans notre travail, nous nous concentrons sur la dérivation des formules de comptage de chemins pour les coefficients de parenté généralisés, y compris [[PHI].sub.abc], [[PHI].sub.abcd] et [[PHI].sub.ab, CD].
2.3. Termes définis pour les formules de comptage de chemins pour trois et quatre personnes
(1) Ancêtre triple commun. Étant donné trois individus a, b et c, si A est un ancêtre commun des trois individus, alors nous appelons A un ancêtre triple-commun de a, b et c.
(2) Ancêtre Quad-Common. Étant donné quatre individus a, b, c et d, si A est un ancêtre commun des quatre individus, alors nous appelons A un ancêtre quad-commun de a, b, c et d.
(3) P(A, a). Il désigne l'ensemble de tous les chemins possibles de A à a, où les chemins ne peuvent traverser que des arêtes dans la direction du parent à l'enfant de telle sorte que P(A, a) [pas égal à] NULL si et seulement si A est un ancêtre de une. [P.sub.Aa] désigne un chemin particulier de A à a, où [P.sub.Aa] e P(A, a).
(4) Paire de chemins. Il se compose de deux chemins, notés [??][P.sub.Aa], [P.sub.Ab][??], où [P.sub.Aa] [membre de] P(A, a) et [P.sub.Ab] [membre de] P(A, b).
(5) Paire de chemins sans chevauchement. Étant donné une paire de chemins [??][P.sub.Aa], [P.sub.Ab][??], il n'y a pas chevauchement si et seulement si les deux chemins ne partagent aucun individu commun, sauf A.
(6) Chemin-Triple. Il se compose de trois chemins, notés [??][P.sub.Aa], [P.sub.Ab] [P.sub.Ab][??], où [P.sub.Aa] [membre de ] P(A, a), [P.sub.Ab] [membre de] P(A, b) et [P.sub.Ac] [membre de] P(A, c).
(7) Chemin-Quad. Il se compose de quatre chemins, notés [??][P.sub.Ab], [P.sub.Ab], [P.sub.Ac][??], [P.sub.Aa]>, où [P.sub.Aa] [membre de] P(A, a), [P.sub.Ab] [membre de] P(A, b), [P.sub.Ac] [membre de] P(A , c) et [P.sub.Ac] [membre de] P(A, d).
(8) BLC ([P.sub.Aa], [P.sub.Ab]). Il désigne tous les individus communs partagés entre [P.sub.Aa] et [P.sub.Ab], sauf A.
(9) TrLC ([P.sub.Aa], [P.sub.Ab], [P.sub.Ac]). Il désigne tous les individus communs partagés entre [P.sub.Aa], [P.sub.Ab] et [P.sub.Ac], à l'exception de A.
(10) Quad_C([P.sub.Aa], [P.sub.Ab], [P.sub.Ac], [P.sub.Ad]). Il désigne tous les individus communs partagés entre [P.sub.Aa], [P.sub.Ab], [P.sub.Ac] et [P.sub.Ad], à l'exception de A.
(11) Croisement et 2-Chevauchement Individuel. Si se BLC([P.sub.Aa], [P.sub.Ab]), on appelle sa crossover individu par rapport à [P.sub.Aa] et [P.sub.Ab] si les deux chemins passent par différents parents de l'art. D'un autre côté, si [P.sub.Aa] et [P.sub.Ab] passent par le même parent de s, alors nous appelons sa 2-chevauchement individu par rapport à [P.sub.Aa] et [P .sub.Ab].
(12) 3-Chevauchement individuel. Si s [membre de] Tri_C([P.sub.Aa], [P.sub.Ab], [P.sub.Ac]) et les trois chemins [P.sub.Aa], [P.sub.Ab ], et [P.sub.Ac] passent par le même parent de s, alors nous appelons sa 3-chevauchement individu par rapport à [P.sub.Aa], [P.sub.Ab] et [P.sub .Ac].
(13) 2-Chemin de chevauchement. Si s est un individu à double chevauchement par rapport à [P.sub.Aa] et [P.sub.Ab], alors [P.sub.Aa] et [P.sub.Ab] passent par le même parent de s, noté p, et le bord de p à s est appelé bord de chevauchement. Tous les bords de chevauchement consécutifs constituent un chemin et ce chemin est appelé un chemin à 2 chevauchements. Si le chemin à 2 chevauchements s'étend jusqu'à l'ancêtre A, nous l'appelons un chemin à 2 chevauchements racine.
(14) Chemin à 3 chevauchements. Il se compose de tous les individus à 3 chevauchements dans un ordre consécutif. Si le chemin à 3 chevauchements s'étend jusqu'à la racine A, nous l'appelons un chemin à 3 chevauchements à la racine.
Exemple 1. Considérez les paires de chemins de A à a et h sur la figure 2, où A est un ancêtre commun de a et h. Pour pathpai[R.sub.1], BLC([P.sub.Aa], [P.sub.Ab]) = Exemple 2.Il y a quatre chemin-quads répertoriés dans la figure 3, de A à quatre individus a, h, c et d, où A est un ancêtre quad-commun des quatre individus. Pour le chemin-quad2, compte tenu des chemins [P.sub.Aa] et [P.sub.Ab], le chemin A [flèche droite] t [flèche droite] f [flèche droite] s est un chemin racine 2-chevauchement
Ensuite, nous résumons tous les termes conceptuels utilisés dans les formules de comptage de chemins pour deux individus, trois individus et quatre individus dans le tableau 1 qui révèle un aperçu de notre cadre pour généraliser la formule de Wright à trois et quatre individus d'un point de vue terminologique. 2.4. Un aperçu de la dérivation de formules de comptage de chemins. Selon la formule de comptage de chemin de Wright [16] (voir (2)) pour deux individus a et h, l'approche de comptage de chemin nécessite d'identifier les ancêtres communs de a et h et de calculer la contribution de chaque ancêtre commun à [[PHI]. sous.ab]. Plus précisément, pour chaque ancêtre commun, noté A, nous obtenons toutes les paires de chemins de A à a et h et identifions les paires de chemins acceptables. Pour [[PHI].sub.ab], une paire de chemins acceptable [??][P.sub.Aa], [P.sub.Ab][??] est une paire de chemins sans chevauchement où les deux chemins partagent aucun individu commun, sauf A. Dans la figure 2, path-pai[R.sub.2] est une paire de chemins acceptable, tandis que pathpai[R.sub.1], path-pai[R.sub.3], et path-pair4 ne sont pas des paires de chemins acceptables. La contribution de chaque ancêtre commun A à [[PHI].sub.ab] est calculée sur la base du coefficient de consanguinité de A, modifié par la longueur de chaque paire de chemins acceptable. Pour calculer [[PHI].sub.abc], l'approche de comptage de chemins nécessite d'identifier tous les ancêtres triplement communs de a, b et c et de résumer toutes les contributions des ancêtres triples communs à [[PHI].sub.abc ]. Pour chaque ancêtre triple commun, noté A, nous identifions d'abord tous les triples chemins dont chacun se compose de trois chemins de A à a, b et c, respectivement. Quelques exemples de trajets triples sont présentés dans la figure 2. Pour [[PHI].sub.ab], seules les paires de chemins qui ne se chevauchent pas sont acceptables. Un triple chemin [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] se compose de trois paires de chemins [??][P.sub. Aa], [P.sub.Ab][??] [??][P.sub.Aa], [P.sub.Ac][??] et [??][P.sub.Ab], [P.sub.Ac][??]. Pour [[PHI].sub.abc], un chemin triple peut être acceptable même si des individus à 2 chevauchements ou des individus croisés existent entre une paire de chemins. Le principal défi que nous devons relever est de trouver les conditions nécessaires et suffisantes pour des trajets triples acceptables. Visant à résoudre le problème de l'identification des chemins triples acceptables, nous utilisons d'abord une méthode systématique pour générer tous les cas possibles pour une paire de chemins en considérant différents types d'individus communs partagés entre les deux chemins. Ensuite, nous introduisons des blocs de construction qui sont des graphes connectés avec des conditions sur chaque arête du graphe qui encapsulent un ensemble de cas acceptables de paires de chemins. Dans chaque bloc de construction, nous représentons les chemins comme des nœuds et les interactions (c'est-à-dire des individus communs partagés entre deux chemins) comme des bords. Il y a au moins deux chemins dans un bloc de construction. Pour chaque bloc de construction, nous obtenons tous les cas acceptables pour les paires de chemins concernées. Étant donné un chemin triple, il peut être décomposé en un ou plusieurs blocs de construction. Considérant une paire de chemins partagée entre deux blocs de construction, nous utilisons l'opérateur de jointure naturelle de l'algèbre relationnelle pour faire correspondre les cas acceptables pour la paire de chemins partagée entre deux blocs de construction. En d'autres termes, en considérant les cas acceptables pour les blocs de construction comme entrées, nous utilisons l'opérateur de jointure naturelle pour construire tous les cas acceptables pour un chemin triple. Les cas acceptables pour un chemin triple sont identifiés et ensuite utilisés pour dériver la formule de comptage de chemin pour [[PHI].sub.abc]. Ensuite, nous résumons toutes les principales procédures utilisées pour dériver la formule de comptage de chemin pour [[PHI].sub.abc] dans un organigramme illustré à la figure 4. Les principales procédures sont également applicables pour dériver les formules de comptage de chemin pour [[ PHI].sub.abcd] et [[PHI].sub.ab,cd]. 3.1. Formules de comptage de chemins pour trois individus. Nous introduisons d'abord une méthode systématique pour générer tous les cas possibles pour une paire de chemins. Ensuite, nous discutons des éléments constitutifs des triplets de chemin et identifions tous les cas acceptables qui sont utilisés pour dériver la formule de comptage de chemin pour [[PHI].sub.abc]. 3.1.1. Cas pour une paire de chemins. Étant donné une paire de chemins [??][P.sub.Aa], [P.sub.Ab][??] avec BL_C([P.sub.Aa], [P.sub.Ab]) [pas égal à] NULL, où A est un ancêtre commun de a et b et Bi_C([P.sub.Aa], [P.sub.Ab]) se compose de tous les individus communs partagés entre [P.sub.Aa] et [P .sub.Ab], à l'exception de A, nous introduisons trois modèles (c'est-à-dire, crossover, 2-overlap et root 2-overlap) pour générer tous les cas possibles pour [??][P.sub.Aa], [P.sub .Un B][??]. (1) X([P.sub.Aa], [P.sub.Ab]) : [P.sub.Aa] et [P.sub.Ab] partagent un ou plusieurs individus croisés. (2) T([P.sub.Aa], [P.sub.Ab]) : [P.sub.Aa] et [P.sub.Ab] sont la racine 2-chevauchement de A, et la racine 2- le chemin de chevauchement peut avoir un ou plusieurs individus à double chevauchement. (3) Y([P.sub.Aa], [P.sub.Ab]) : [P.sub.Aa] et [P.sub.Ab] se chevauchent mais pas à partir de A, et le chemin de 2 chevauchements peut avoir un ou plusieurs individus qui se chevauchent. Sur la base des trois modèles, X([P.sub.Aa], [P.sub.Ab]) et Y([P.sub.Aa], [P.sub.Ab]), nous utilisons des expressions régulières pour générer tous les cas possibles pour la paire de chemins [??][P.sub.Aa], [P.sub.Ab][??]. Pour plus de commodité, nous supprimons [??][P.sub.Aa], [P.sub.Ab][??] et utilisons X, T et Y au lieu des motifs X([P.sub.Aa], [ P.sub.Ab]), T([P.sub.Aa], [P.sub.Ab]) et Y([P.sub.Aa], PM), lorsqu'il n'y a pas de confusion. Lorsque BLC([P.sub.Aa], [P.sub.Ab]) [différent de] NULL, les huit cas indiqués en (7) couvrent tous les cas possibles pour [??][P.sub.Aa] , [P.sub.Ab][??]. La complétude des huit cas montrés en (7) pour [??][P.sub.Aa], [P.sub.Ab][??] peut être prouvée par induction sur le nombre total de T, X et Y apparaissant dans [??][P.sub.Aa], [P.sub.Ab][??]. En utilisant le pedigree de la figure 2, les cas 1 à 3 et le cas 6 sont illustrés en (8), (9), (10) et (11) : [EXPRESSION MATHÉMATIQUE NON REPRODUCTIBLE EN ASCII], (7) [EXPRESSION MATHÉMATIQUE NON REPRODUCTIBLE EN ASCII], (8) où [EXPRESSION MATHÉMATIQUE NON REPRODUCTIBLE EN ASCII], (9) où s est un individu à 2 chevauchements et le chemin de chevauchement est un chemin racine à 2 chevauchements t est un individu de croisement : [EXPRESSION MATHÉMATIQUE NON REPRODUCTIBLE EN ASCII], (10) où t est un individu croisé : [EXPRESSION MATHÉMATIQUE NON REPRODUCTIBLE EN ASCII], (11) où e est un individu croisé t est un individu à 2 chevauchements et le chemin de chevauchement est un chemin à 2 chevauchements. 3.1.2. Représentation graphique au niveau des paires de chemins d'un triple chemin. Étant donné un triple chemin [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??], nous représentons chaque chemin comme un nœud. Le chemin triple peut être décomposé en trois paires de chemins (c'est-à-dire, [??][P.sub.Aa], [P.sub.Ab][??], [??][P.sub.Aa] , [P.sub.Ac][??], et [??][P.sub.Ab], [P.sub.Ac] [??]). Pour chaque paire de chemins, si les deux chemins partagent au moins un individu commun (c. Par conséquent, nous obtenons quatre scénarios différents [S.sub.0]-[S.sub.3], illustrés à la figure 5. Dans la figure 5, le scénario S0 n'a pas de bords, cela signifie donc que [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] se compose de trois chemins. Dans la figure 2, path-triplel est un exemple de [S.sub.0]. Ensuite, nous introduisons un lemme qui peut aider à identifier les options pour les arêtes dans les scénarios [S.sub.1] - [S.sub.3]. Lemme 3. Étant donné un triple chemin [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??], considérons les trois paires de chemins [??] [P.sub.Aa], [P.sub.Ab] [??], s'il y a une arête à 2 chevauchements qui est représentée par Y dans la représentation d'expression régulière de l'une des trois paires de chemins, puis le chemin -triple [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] n'a aucune contribution à [[PHI].sub.abc]. Preuve. Dans [17], Nadot et Vaysseix ont proposé, d'un point de vue génétique et biologique, que [[PHI].sub.abc] peut être évalué en énumérant tous les chemins d'héritage éligibles au niveau de l'allèle à partir d'un triple ancêtre commun A à les trois individus a, b et c. Pour le pedigree de la figure 6, considérons le chemin-triple [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] répertorié comme suit. [P.sub.Aa] : A [flèche droite] a [P.sub.Ab] : A [flèche droite] [p.sub.3] [flèche droite] [P.sub.6] [flèche droite] [ p.sub.7] [flèche droite] b [P.sub.Ac] : A [flèche droite] [p.sub.4] [flèche droite] [p.sub.6] [flèche droite] [p.sub ,7] [flèche droite] C. Pour [??][P.sub.Ab], [P.sub.Ac][??], [p.sub.6] est un individu croisé, [p.sub.7] est un individu chevauchant, et [p.sub.6] [flèche droite] [p.sub.7] est une arête à 2 chevauchements représentée par Y dans une représentation d'expression régulière (voir la définition de Y dans la section 3.1.1). Pour l'individu [p.sub.6], désignons les deux allèles à un locus autosomique fixe comme [g.sub.1] et [g.sub.2]. Au niveau des allèles, un seul allèle peut être transmis de [p.sub.6] à [p.sub.7]. Puisque [p.sub.3] et [p.sub.4] sont les parents de [p.sub.6], [g.sub.1] est transmis d'un parent, et [g.sub.2] est transmis par l'autre parent. Il est impossible de transmettre à la fois [g.sub.1] et [g.sub.2] de [p.sub.6] à [p.sub.7]. En d'autres termes, il n'y a pas de chemins d'héritage correspondants pour le chemin-triple [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] avec un 2- bord de chevauchement entre [??][P.sub.Ab], [P.sub.Ac][??] (c.-à-d. Cas 6 : XY). Par conséquent, ce type de chemin triple n'a aucune contribution à [[PHI].sub.abc]. La figure 6(b) montre un exemple de chemins d'héritage éligibles correspondant à un graphe d'ascendance. Chaque individu est représenté par deux nœuds alléliques. Les chemins d'héritage éligibles de la figure 6(b) sont constitués de bords rouges uniquement. Seuls les cas 1, les cas 2 et 3 n'ont pas Y dans la représentation d'expression régulière d'une paire de chemins (voir (7)) compte tenu des scénarios [S.sub.1]-[S.sub.3] montrés dans Figure 5, une arête peut avoir trois options 3.1.3. Construire des cas pour un chemin-triple. Pour les scénarios [S.sub.1]-[S.sub.3] dans la figure 5, nous définissons deux blocs de construction <[B.sub.1], [B.sub.2]>avec quelques règles dans la figure 7 pour générer des cas acceptables. Pour B3, le bord peut avoir trois options Ensuite, nous nous concentrons sur la génération de tous les cas acceptables pour les scénarios [S.sub.1]-[S.sub.3] de la Figure 5, où seul [S.sub.3] contient plus d'un bloc de construction. Afin de tirer parti de la dépendance entre les blocs de construction, nous décomposons [S.sub.3] en [S.sub.3] = <[u.sub.1] = [B.sub.2], [u.sub. 2] = [B.sub.2], [u.sub.3] = [B.sub.2]>, illustré à la Figure 8. Pour chaque [u.sub.i], nous avons un ensemble de chemins acceptables -triples, notés [R.sub.i]. Compte tenu de la dépendance entre <[R.sub.1], [R.sub.2], [R.sub.3]>, nous utilisons l'opérateur de jointure naturelle, noté m, opérant sur <[R.sub.1 ], [R.sub.2], [R.sub.3]>pour générer tous les cas acceptables pour [S.sub.3]. En conséquence, nous obtenons [T.sub.3] = [R.sub.1] [??] [R.sub.2] [??] [R.sub.3], où [T.sub. 3] désigne les cas acceptables du chemin-triple [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] dans le scénario [S.sub. 3]. Pour chaque scénario de la figure 5, nous générons tous les cas acceptables pour [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac] [??]. Le scénario S0 n'a pas de bords, et il montre que [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] se compose de trois chemins indépendants, tandis que, pour les autres scénarios [S.sub.k] (k = 1, 2, 3), les k arêtes peuvent avoir deux options : (1) toutes les arêtes k appartiennent au croisement ou (2) une arête appartient à la racine 2-chevauchement les (k-1) arêtes restantes appartiennent au croisement. En résumé, les chemins triples acceptables peuvent avoir au plus un chemin racine à 2 chevauchements, un nombre quelconque d'individus de croisement, mais zéro chemin à 2 chevauchements. 3.1.4. Opérateur de fractionnement. Considérant l'existence d'un chemin racine 2-overlap et d'un croisement dans des chemins triples acceptables, nous proposons un opérateur de division pour transformer un chemin-triple avec des individus croisés en un chemin-triple non croisé sans changer la contribution de ce chemin-triple en [[PHI ].sub.abc]. L'objectif principal de l'utilisation de l'opérateur de fractionnement est de simplifier le processus de dérivation de la formule de comptage des chemins. Nous utilisons d'abord un exemple de la figure 9 pour illustrer le fonctionnement de l'opérateur de fractionnement. Dans la figure 9, il y a un individu croisé entre [P.sub.Aa] et PM dans le chemin triple [??][P.sub.Ab], [P.sub.Ab], [P.sub.Ac ]) dans [G.sub.k+1]] L'opérateur de découpage procède comme suit : (1) diviser le nœud s en deux nœuds, [s.sub.1] et [s.sub.2] (2) transformer les bords s [flèche droite] a et s [flèche droite] b' en [s.sub.1] [flèche droite] a' et [s.sub.2] [flèche droite] b', respectivement (3) ajouter deux nouvelles arêtes, [s.sub.2] [flèche droite] a' et [s.sub.1] [flèche droite] b'. Lemme 4. Étant donné un graphe généalogique [G.sub.k+1] ayant (k + 1) individus croisés concernant [??][P.sub.Ac], [P.sub.Ab], [P.sub. Ac][??] illustré à la figure 9, désignons par s l'individu de croisement le plus bas, où aucun descendant de s ne peut être un individu de croisement parmi les trois chemins [P.sub.Aa], [P.sub.Ab] et [P.sub.Ac]. Après avoir utilisé l'opérateur de division pour l'individu de croisement le plus bas dans [G.sub.k] + 1, le nombre d'individus de croisement dans [G.sub.k+1] est diminué de 1. Preuve. L'opérateur de fractionnement n'affecte que les arêtes de s à a' et b'. Si un nouveau nœud de croisement apparaît, le seul nœud possible est a ou b. Supposons que b devienne un individu croisé, cela signifie que b est capable d'atteindre a et b à partir de deux chemins distincts. Cela contredit le fait que s est l'individu de croisement le plus bas entre [P.sub.Aa] et [P.sub.Aa]. Ensuite, nous introduisons un graphe canonique qui résulte de l'application de l'opérateur de fractionnement pour tous les individus croisés. Le graphe canonique a zéro croisement individuel. Définition 5 (Graphique canonique). Étant donné un graphe d'ascendance G ayant un ou plusieurs individus croisés concernant [[PHI].sub.abc], S'il existe un graphe G qui n'a pas d'individus croisés concernant [[PHI].sub.abc] tel que (i) tout chemin-triple acceptable dans G a un chemin-triple acceptable dans G qui a la même contribution à [[PHI].sub.abc] que celui de G pour [[PHI].sub.abc] (ii) tout chemin-triple acceptable dans G' a un chemin-triple acceptable dans G qui et a la même contribution à [[PHI].sub.abc] que celui dans G' pour [[PHI].sub.abc ]. Nous appelons G' un graphe canonique de G concernant [[PHI].sub.abc]. Lemme 6. Pour un graphe généalogique G ayant un ou plusieurs individus croisés concernant [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??], il existe un graphe canonique G pour G. Preuve (esquisse). La preuve est par induction sur le nombre d'individus croisés. Hypothèse d'induction : supposons que si G a k croisements ou moins, il existe un graphe canonique G' pour G. Dans l'étape d'induction, soit [G.sub.k+1] un graphe avec k + 1 croisements, soit s le croisement le plus bas entre les chemins [P.sub.Aa] et [P.sub.Ab] dans [G. sous.k+1]. Nous appliquons l'opérateur de découpage sur s dans Gk+1 et obtenons [G.sub.k] ayant k croisements par le lemme 4. 3.1.5. Formule de comptage de chemin pour [[PHI].sub.abc]. Maintenant, nous présentons la formule de comptage de chemins pour [[PHI].sub.abc] : [EXPRESSION MATHÉMATIQUE NON REPRODUCTIBLE EN ASCII], (12) où [[PHI].sub.aa] - (1/2)(1 + [F.sub.A]), [[PHI].sub.AAA] - (1/4)(1 + 3[F. sub.A]), [F.sub.A] : le coefficient de consanguinité de A, A : un ancêtre triple commun de a, h et c, Type 1 : ([P.sub.Aa], [P. sub.Ab], [P.sub.Ac]) a zéro racine 2-chevauchement, Type 2 : [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac] [??] a un seul chemin racine 2 PAs se terminant à l'individu s [EXPRESSION MATHÉMATIQUE NON REPRODUCTIBLE EN ASCII], (13) et [EXPRESSION MATHÉMATIQUE NON REPRODUCTIBLE EN ASCII] la longueur du chemin [P.sub.Aa] (également applicable pour [P.sub.Aa], [P.sub.Ac] et [P.sub.As]) . Pour être complet, la formule de comptage de chemin pour [[PHI].sub.aab] est donnée dans l'annexe A et la preuve de l'exactitude de la formule de comptage de chemin est donnée dans l'annexe B. 3.2. Formules de comptage de chemins pour quatre individus 3.2.1. Représentation graphique au niveau des paires de chemins de [??][[PHI].sub.Aa], [P.sub.Ab], [P.sub.Ac], [P.sub.Ad][??]. Étant donné un chemin-quad [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac], [P.sub.Ad][??] et Quad_C([P. sub.Aa], [P.sub.Ab], [P.sub.Ac], [P.sub.Ad]) - 0, le path-quad peut avoir 11 scénarios [S.sub.0]-[S 10] représenté sur la figure 10 où les quatre chemins sont considérés de manière symétrique. Dans la figure 11, nous introduisons trois blocs de construction <[B.sub.1], [B.sub.2], [B.sub.3]>. Pour [B.sub.1] et [B.sub.2], les règles présentées dans la Figure 7 sont également applicables pour la Figure 11. Pour [B.sub.3], nous ne considérons que le chevauchement des racines, car les individus croisés peuvent être éliminé en utilisant l'opérateur de fractionnement présenté à la section 3.1.4. Notez que pour [B.sub.3] si Tr_C([P.sub.Aa], [P.sub.Ab], [P.sub.Ac]) - 0 alors c'est équivalent au scénario [S.sub. .3] dans la figure 8 Par conséquent, nous n'avons besoin de considérer [B.sub.3] que lorsque Tr_C([P.sub.Aa], Pap, [P.sub.Ac]) - 0. 3.2.2. Construction de cas basés sur des blocs de construction pour [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac], [P.sub.Ad][??]. Pour un scénario [S.sub.] (0 [inférieur ou égal à] i [inférieur ou égal à] 10) de la figure 11, nous décomposons d'abord [S.sub.i] en un ou plusieurs blocs de construction.Pour un scénario [S.sub.i] [membre de] <[S.sub.1], [S.sub.3]>, il n'a qu'un seul bloc de construction, et tous les cas acceptables peuvent être obtenus directement. Pour [S.sub.2] - <[u.sub.1] = [B.sub.1], [u.sub.2] - [B.sub.1]>, il n'est pas nécessaire de considérer le conflit entre les bords dans [u.sub.1] et [u.sub.2] parce que [u.sub.1] et [u.sub.2] sont déconnectés. Soit [R.sub.i] dénoter tous les cas acceptables des paires de chemins dans [u.sub.i], et laissez [T.sub.i] dénoter tous les cas acceptables pour [S.sub.i]. Par conséquent, nous obtenons [T.sub.2] - [R.sub.1] x [R.sub.2] où x désigne l'opérateur produit cartésien de l'algèbre relationnelle. Pour [S.sub.6] = <[u.sub.1] = [B.sub.3]>, on obtient [T.sub.6] = [R.sub.1]. Pour [S.sub.i] [membre de] <[S.sub.i] | 4 [inférieur ou égal à] i [inférieur ou égal à] 10 et i [différent de] 6>, nous définissons le plus grand sous-graphe de [S.sub.i] sur la base duquel nous construisons [T.sub. je]. Définition 7 (plus grand sous-graphe). Étant donné un scénario [S.sub.i] (4 [inférieur ou égal à] i [inférieur ou égal à] 10 et i [différent de] 6), le plus grand sous-graphe de [S.sub.i], désigné par [S.sub.j] est défini comme suit : (1) [S.sub.j] est un sous-graphe approprié de [S.sub.i] (2) si [S.sub.i] contient [B.sub.3], alors [S.sub.j] doit également contenir B3 (3) aucun [S.sub.k] n'existe que [S.sub.j] soit un sous-graphe approprié de [S.sub.k] tandis que [S.sub.k] est également un sous-graphe approprié de [S. sub.i]. Pour chaque scénario [S.sub.i] (4 [inférieur ou égal à] i [inférieur ou égal à] 10 et i = 6), nous listons le plus grand sous-graphe de [S.sub.i], noté [S.sub.j] dans le tableau 2. Pour un scénario [S.sub.i] (4 [inférieur ou égal à] i [inférieur ou égal à] 10 et i = 6), soit Diff([S.sub.i] [S.sub. j]) désignent l'ensemble des blocs de construction dans [S.sub.i] mais pas dans [S.sub.j], où [S.sub.j] est le plus grand sous-graphe de [S.sub.i]. Soit [valeur absolue de [E.sub.i]] et [valeur absolue de [E.sub.j]] dénoter le nombre d'arêtes dans [S.sub.i] et [S.sub.j], respectivement. Selon le tableau 2, nous pouvons conclure que [valeur absolue de [E.sub.i]] et [valeur absolue de [E.sub.j]] = 1. Afin de tirer parti de la dépendance entre les blocs de construction, nous considérons seulement [B.sub.2] dans Diff([S.sub.i][S.sub.j]). Par exemple, Diff([S.sub.5][S.sub.3]) = <[B.sub.2]>. Soit [T.sub.3] tous les cas acceptables pour [S.sub.3]. Et laissez [R.sub.1] désigner l'ensemble des cas acceptables pour Diff([S.sub.5] [S.sub.3]). Ensuite, nous pouvons utiliser [S.sub.3] et Diff([S.sub.5] [S.sub.3]) pour construire tous les cas acceptables pour [S.sub.5]. Ensuite, nous appliquons cette idée pour construire tous les cas acceptables pour chaque [S.sub.i] dans le tableau 2. Étant donné un chemin-quad [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac], [P.sub.Ad] [??], un cas acceptable a le propriétés suivantes : (1) s'il y a un chemin racine 3-chevauchement, il peut y avoir au plus un chemin racine 2-chevauchement (2) sinon, il peut y avoir au plus deux chemins racine 2-chevauchement. 3.2.3. Formule de comptage de chemin pour [[PHI].sub.abcd]. Maintenant, nous présentons la formule de comptage de chemins pour [[PHI].sub.abcd] comme suit : [EXPRESSION MATHÉMATIQUE NON REPRODUCTIBLE EN ASCII], (14) où [[PHI].sub.AA] = (1/2)(1 + [F.sub.A]), [[PHI].sub.AAA] = (1/4)(1 + 3[F. sub.A]), [[PHI].sub.AAA] = (1/8)(1 + 7[F.sub.A]), [F.sub.A]. le coefficient de consanguinité de A, A : un ancêtre quad-commun de a, b, c et d, Type 1 : racine zéro 2-chevauchement et zéro racine 3-chevauchement chemin, Type 2 : une seule racine 2-chevauchement chemin PAs se terminant à s [EXPRESSION MATHÉMATIQUE NON REPRODUCTIBLE EN ASCII], (15) et [EXPRESSION MATHÉMATIQUE NON REPRODUCTIBLE EN ASCII] la longueur du chemin [P.sub.Aa] (également applicable pour [P.sub.Ab], [P.sub.Ac], [P.sub.Ad]'etc ). Par souci d'exhaustivité, les formules de comptage de chemins pour [[PHI].sub.aabc] et [[PHI].sub.aaab] sont présentées à l'annexe A. L'exactitude de la formule de comptage de chemins pour quatre individus est prouvée à l'annexe C . 3.3. Formules de comptage de chemins pour deux paires d'individus 3.3.1. Terminologie et définitions (1) 2-Pair-Path-Paire. Il se compose de deux paires de paires de chemins notées [??]([P.sub.Sa], [P.sub.Sb]), ([P.sub.Tc], [P.sub.Td]) [??], où [P.sub.Sa] [membre de] P(S, a), [P.sub.Sb] [membre de] P(S, b), [P.sub.Tc] [ membre de] P(T, c), [P.sub.Td] [membre de] P(T, d), S est un ancêtre commun de a et b, et T est un ancêtre commun de c et d. Si A = S = T, alors A est un ancêtre quad-commun de a, b, c et d., et A [flèche droite] s [flèche droite] e [flèche droite] t est un chemin racine 2-chevauchement par rapport à [P.sub.Aa] et [P.sub.Ab]. Pour path-pair4, Bi_C([P.sub.Aa], [P.sub.Ab]) = sont des individus à 2 chevauchements et le chemin de chevauchement est un chemin racine à 2 chevauchements :