Héritabilité 201: Types d’héritabilité et comment nous l’estimons

dans Héritabilité 101, nous avons défini l’héritabilité comme « la proportion de variation d’un trait expliquée par des variants génétiques héréditaires. »En pratique, nous nous appuierons souvent sur des variations de cette définition, en partie à cause des différences entre ce concept idéalisé d’héritabilité et la réalité de ce que nous pouvons réellement estimer scientifiquement., Dans cet article, nous décrirons différentes « saveurs » de l’héritabilité, et les façons dont elles peuvent être estimées, dans le but final d’expliquer quelle forme d’héritabilité nous rapportons à partir des données de la biobanque britannique.

la version rapide:

notre analyse de la biobanque britannique estime \(h^2_g\), ou l’héritabilité SNP., Ce n’est que la proportion de variation du trait qui peut être expliquée par les effets additifs de variantes génétiques courantes appelées SNP (un changement de base unique dans une séquence D’ADN), donc c’est presque toujours moins que l’héritabilité totale \((H^2)\) qui pourrait être expliquée par tous les facteurs génétiques.

nous estimons \(h^2_g\) en utilisant une méthode appelée LD score regression (LDSR); si le choix de la méthode compte pour vous, vous apprécierez probablement le post plus technique ici.,

mesurer la variation

avant de parler des différentes saveurs de l’héritabilité, il est utile de définir ce que nous entendons par « variation” lorsque nous disons des choses comme « la proportion de variation dans un trait expliqué par” quelque chose.

ici, quand nous disons « variation”, nous faisons référence au concept mathématique de « variance”. La Variance est une mesure courante pour mesurer la différence d’un trait entre les personnes d’un groupe. Formellement, c’est la différence au carré moyenne entre une personne sélectionnée au hasard et la personne « moyenne”., Par exemple, chez tous les hommes et les femmes de la biobanque britannique, la variance de la hauteur en pouces est de 13,3 (86,0 pour la hauteur en centimètres), ce qui correspond à un écart type de 3,7 pouces (9,3 cm). L’écart type est simplement la racine carrée de la variance.

les statisticiens aiment parler de variance (par opposition à des mesures plus intuitives comme la plage ou l’écart absolu moyen par rapport à la moyenne) car il a de belles propriétés mathématiques., Plus particulièrement, si vous avez un résultat qui est la somme des effets provenant de sources indépendantes (comme, par exemple, les gènes et l’environnement), la variance des effets de chaque source s’additionne à la variance du résultat. Pouvoir diviser la variance totale d’un trait en différents morceaux qui s’additionnent de cette façon est très utile lorsque nous voulons commencer à parler de la « proportion de variance expliquée par la génétique”, comme nous le verrons ci-dessous.

enfin, parler de variance signifie implicitement que nous parlons d’un groupe ou d’une population d’individus., Vous ne pouvez pas avoir une différence moyenne entre les personnes avec une seule personne. Comme nous le soulignons dans Héritabilité 101, cela signifie que chaque fois que nous parlons d’héritabilité, nous parlons de variation dans une population d’individus, pas de génétique déterminant une certaine proportion d’un trait chez un individu donné.

« l’explication” de la variance

Il est également important de clarifier l’autre moitié de la phrase « la proportion de la variation d’un trait expliqué par”, à savoir ce que nous entendons par « expliqué”., Dans ce cas, la variance qui est « expliquée” par la génétique est une variance qui pourrait être prédite sur la base de données génétiques si nous avions des informations parfaites sur les effets de toutes les variantes génétiques (ce que, pour être clair, nous n’avons pas réellement).

si vous avez déjà entendu l’expression « corrélation n’est pas causalité”, c’est la question à laquelle nous faisons référence ici et pourquoi nous ne disons pas simplement la proportion de variance causée par les effets génétiques., Nous sommes plus proches de la causalité car il est assez sûr de supposer que les traits héritables ne sont pas à l’origine des variantes génétiques, puisque notre génétique est fixée à la conception (à l’exception des mutations acquises telles que celles observées dans le cancer). Il est cependant possible que les variants génétiques soient corrélés à des facteurs environnementaux qui ont un impact causal direct sur le trait. Cela ne signifie pas que la génétique n’est pas importante et informative pour ce trait, mais cela signifie que nous devons faire attention à décrire les effets comme causaux, même en génétique., Donc, par précaution contre toute déclaration prématurée sur la causalité, nous nous concentrons plutôt sur la variance” expliquée ».

Large sens de l’héritabilité

Nous faire trois observations importantes à propos de cette définition. Tout d’abord, il est entièrement flexible sur la façon dont les effets génétiques spécifiques contribuent à \(^^2_g\)., Le sens large \(H ^ 2\) ne se soucie pas de savoir si \(𝜎^2_g\) provient d’une seule variante mendélienne dans un seul gène, ou des petits effets additifs de variantes dans 100 gènes différents, ou des interactions complexes entre chaque variante du génome entier. Nous verrons ci-dessous qu’il s’agit d’une distinction importante entre le sens large \(H^2\) et certains des autres types d’héritabilité.

h h^2 = \frac{\Sigma^2_g}{\Sigma^2_g + \Sigma^2_e} but mais cette hypothèse n’est pas requise., En écrivant simplement le dénominateur comme \(𝜎^2_p\), nous permettons la possibilité que les facteurs génétiques et environnementaux soient corrélés ou interagissent d’une manière ou d’une autre. Ceci est important car il souligne que l’effet de l’environnement sur le trait n’est pas simplement le « reste” après la prise en compte de tous les effets génétiques, mais qu’ils peuvent se chevaucher et interagir de manière complexe.

héritabilité au sens étroit

en pratique, la flexibilité du sens large \(H^2\) rend très difficile l’estimation sans faire de fortes hypothèses., Permettre les effets de toutes les interactions possibles de toutes les variantes génétiques possibles signifie avoir un espace fonctionnellement infini d’effets possibles. Une façon utile de simplifier cela est de considérer la variance totale expliquée par la génétique comme une combinaison d’effets additifs, d’effets dominants/récessifs et d’effets d’interaction entre différentes variantes. $ $\Sigma^2_g = \Sigma^2_a + \ Sigma^2_d + \ Sigma^2_i

historiquement, la plupart des discussions scientifiques sur l’héritabilité des différents traits se sont concentrées sur \(H^2\)., L’une des caractéristiques intéressantes de \(h^2\) est qu’il implique une relation simple entre la façon dont deux personnes sont génétiquement liées et à quel point le trait sera similaire pour ces deux personnes. Nous pouvons utiliser cette relation pour estimer \(h^2\) dans les études sur les jumeaux et les familles.

dans le cas le plus simple, on peut comparer les jumeaux monozygotes (souvent appelés jumeaux « identiques” ou MZ) aux jumeaux dizygotes (« fraternels” ou DZ). Les jumeaux MZ ont partagé tout leur ADN , tandis que les jumeaux DZ partagent la moitié de leur ADN en moyenne., Les jumeaux partagent également en grande partie le même environnement, qu’ils soient MZ ou DZ . Donc, pour estimer \(h^2\), nous pouvons observer comment un trait est corrélé entre des paires de jumeaux MZ et comment le trait est corrélé entre des jumeaux DZ et voir si ces corrélations sont différentes. Si les paires de jumeaux MZ, avec leur similitude génétique plus élevée, sont plus fortement corrélées que les paires de jumeaux DZ, cela suggère que la génétique explique une partie de la variance du trait .

il y a eu des décennies de recherche scientifique sur l’héritabilité des traits humains en utilisant cette approche générale., Utilement, un effort récent de Danielle Posthuma et ses collègues ont regroupé une grande partie de ce travail en une seule page Web où vous pouvez parcourir les estimations basées sur des jumeaux de \(h^2\) pour une grande variété de traits.

SNP-héritabilité

les saveurs d’héritabilité ci-dessus ont fait référence à des « effets génétiques” conceptuellement sans nécessiter de prise en compte de variantes génétiques spécifiques et de leur association avec le trait., Maintenant que les progrès de la génétique ont permis de collecter des données sur ces variantes spécifiques, il est possible d’évaluer dans quelle mesure chacune de ces variantes observées contribue à l’héritabilité.

en particulier, nous pouvons considérer un type de variant génétique appelé polymorphisme nucléotidique unique (SNP), qui est un changement d’une seule paire de bases d’ADN à un endroit spécifique du génome. Par exemple, certaines personnes peuvent avoir un A à cet endroit, tandis que D’autres ont un G., Il y a des millions de ces emplacements dans le génome qui varient généralement entre différentes personnes, et une grande partie de la recherche actuelle en génétique humaine est axée sur la compréhension des effets de ces variantes .

il convient de souligner deux caractéristiques clés de \(h^2_g\). Tout d’abord, vous remarquerez peut-être que nous avons défini \(h^2_g\) basé sur un ensemble de SNPs « S”. En pratique, cet ensemble de SNP va dépendre (a) des données SNP qui ont été observées et (b) de la méthode utilisée pour estimer \(h^2_g\)., Cela rend difficile la comparaison des valeurs de \(h ^ 2_g\) entre différentes méthodes et différentes études , bien que dans la plupart des cas, il soit prudent de supposer au moins qu’il se réfère à des SNP courants. Deuxièmement, la variance expliquée par les SNP peut ou non refléter les effets de ces SNP particuliers par opposition aux effets d’autres variants génétiques avec lesquels les SNP sont corrélés., Ceci n’est qu’une extension de notre discussion précédente ci-dessus sur la signification de la variance « expliquée”, mais mérite d’être réitérée car il serait facile de mal interpréter L’héritabilité SNP comme excluant complètement les effets causaux d’autres types de variation génétique.

plusieurs méthodes différentes ont été développées pour estimer \(h^2_g\) à partir de SNP observés. En pratique, nous ne connaissons pas le vrai \(𝛽_j\), nous devons donc utiliser d’autres astuces., La première approche, connue sous le nom de GREML (genomic relatedness matrix REstricted Maximum Likelihood; couramment mis en œuvre dans GCTA), utilise SNPs pour estimer la similitude génétique entre individus aléatoires et comparer cela à leur similitude de traits. Ceci est conceptuellement similaire à l’estimation basée sur les jumeaux décrite ci-dessus, mais utilise la similitude génétique de faible niveau observée dans les données SNP d’individus qui ne sont pas directement liés. Vous pouvez lire les détails statistiques ici avec un examen plus récent ici.,

une deuxième approche est appelée régression de score de déséquilibre de liaison (LD), implémentée dans ldsc. C’est la méthode que nous appliquons à L’ensemble de données de la biobanque britannique. La régression du score LD dépend de l’observation clé selon laquelle certains SNP sont corrélés avec (c.-à-d. dans LD avec) d’autres variants génétiques, observant ainsi que le SNP à son tour « balise” les informations sur les effets d’autres variants. L’idée de base est alors que s’il y a beaucoup, beaucoup de petits effets génétiques répartis dans le génome (c.-à-d., le trait est « polygénique »), alors la force de la relation entre chaque SNP individuel et le trait devrait être (en moyenne) proportionnelle à la variation génétique totale que SNP marque. Des détails statistiques sur la méthode de régression du score LD peuvent être trouvés ici.

la Variance expliquée par SNP connu effets

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *