erfelijkheid 201: Types of erfelijkheid and how we estimate it

in erfelijkheid 101 definieerden we erfelijkheid als ” the proportion of variation in a trait explained by inherited genetic variants.”In de praktijk vertrouwen we vaak op variaties van deze definitie, deels vanwege de verschillen tussen dit geïdealiseerde concept van erfelijkheid en de realiteit van wat we wetenschappelijk kunnen inschatten., In dit bericht zullen we een aantal verschillende “smaken” van erfelijkheid schetsen, en de manieren waarop ze kunnen worden geschat, met als einddoel uit te leggen welke vorm van erfelijkheid we rapporteren uit de gegevens van de Britse Biobank.

de snelle versie:

onze Britse Biobankanalyse schat \(h^2_g\), of SNP-erfelijkheid., Dit is slechts het deel van de variatie in de eigenschap dat kan worden verklaard door additieve effecten van algemeen voorkomende genetische varianten genaamd SNPs (een enkele basisverandering in een DNA-sequentie), dus het is bijna altijd minder dan de totale erfelijkheid \((h^2)\) die kan worden verklaard door alle genetische factoren.

we schatten \(h^2_g\) met behulp van een methode genaamd LD score regressie (LDSR); als de keuze van de methode belangrijk is voor u dan zult u waarschijnlijk waarderen de meer technische post hier.,

het meten van variatie

voordat we praten over de verschillende smaken van erfelijkheid, is het nuttig om te definiëren wat we bedoelen met” variatie “als we dingen zeggen als de” de verhouding van variatie in een eigenschap verklaard door ” iets.

hier, wanneer we” variatie “zeggen, verwijzen we naar het wiskundige concept van”variantie”. Variantie is een gemeenschappelijke maatstaf voor het meten van hoeveel een eigenschap verschilt tussen mensen in een groep. Formeel is het het gemiddelde kwadraat verschil tussen een willekeurig gekozen persoon en de” gemiddelde ” persoon., Bij alle mannen en vrouwen in de Britse Biobank is de variantie van de hoogte in inches bijvoorbeeld 13,3 (86,0 voor de hoogte in centimeters), wat overeenkomt met een standaarddeviatie van 9,3 cm (3,7 inch). De standaarddeviatie is gewoon de vierkantswortel van de variantie.

statistici praten graag over variantie (in tegenstelling tot meer intuïtieve maten zoals het bereik of de gemiddelde absolute afwijking van het gemiddelde) omdat het mooie wiskundige eigenschappen heeft., Het meest in het bijzonder, als je een resultaat hebt dat de som is van de effecten van onafhankelijke bronnen (zoals, Laten we zeggen, genen en omgeving) de variantie van de effecten van elke bron optellen tot de variantie van de uitkomst. In staat zijn om de totale variantie van een eigenschap op te splitsen in verschillende stukken die op deze manier optellen is erg handig wanneer we willen beginnen met praten over de “verhouding van variantie verklaard door genetica”, zoals we hieronder zullen zien.

ten slotte betekent praten over variantie impliciet dat we het hebben over een groep of populatie van individuen., Je kunt geen gemiddeld verschil hebben tussen mensen met maar één persoon. Zoals we benadrukken in erfelijkheid 101, betekent dit dat wanneer we praten over erfelijkheid we praten over variatie in sommige populatie van individuen, niet over genetica bepalen van een deel van een eigenschap in een bepaald individu.

” Explaining”variance

Het is ook de moeite waard om de andere helft van de zin” the proportion of variation in a trait explained by “te verduidelijken, namelijk wat we bedoelen met”explained”., In dit geval is variantie die wordt “verklaard” door genetica variantie die kan worden voorspeld op basis van genetische gegevens als we perfecte informatie hadden over de effecten van alle genetische varianten (die we, om duidelijk te zijn, eigenlijk niet hebben).

Als je ooit de zinsnede” correlatie is geen oorzaak”hebt gehoord, dan is dat de kwestie waar we het hier over hebben en waarom we niet simpelweg zeggen de proportie van variantie veroorzaakt door genetische effecten., We zijn dichter bij causatie omdat het vrij veilig is om aan te nemen dat de erfelijke eigenschappen niet de genetische varianten veroorzaken, omdat onze genetica gefixeerd is bij de conceptie (met uitzondering van verworven mutaties zoals die gezien worden bij kanker). Het is echter mogelijk dat genetische varianten worden gecorreleerd met omgevingsfactoren die een directe causale invloed hebben op de eigenschap. Dat betekent niet dat de genetica niet belangrijk en informatief zijn voor die eigenschap, maar het betekent wel dat we voorzichtig moeten zijn met het beschrijven van effecten als Causaal, zelfs in de genetica., Dus als voorzorgsmaatregel tegen het maken van voortijdige uitspraken over causaliteit richten we ons in plaats daarvan op” verklaarde ” variantie.

erfelijkheid in brede zin

we maken drie belangrijke opmerkingen over deze definitie. Ten eerste is het volledig flexibel over hoe specifieke genetische effecten bijdragen aan \(^^2_g\)., De brede zin \(h^2\) maakt het niet uit of \(^^2_g\) afkomstig is van een enkele Mendeliaanse variant in slechts één gen, of de kleine additieve effecten van varianten in 100 verschillende genen, of complexe interacties tussen elke variant in het hele genoom. We zullen hieronder zien dat dit een belangrijk onderscheid is tussen breed-zin \(h^2\) en enkele van de andere vormen van erfelijkheid.

$$h^2 = \frac{\sigma^2_G}{\sigma^2_G + \sigma^2_E}$$ maar die aanname is niet vereist., Door simpelweg de noemer te schrijven als \(^^2_p\) laten we de mogelijkheid toe dat genetische en omgevingsfactoren gecorreleerd zijn of op een bepaalde manier interageren. Dit is belangrijk omdat het benadrukt dat het effect van milieu op de eigenschap is niet gewoon de “rest” na de boekhouding van alle genetische effecten, in plaats daarvan kunnen zij overlappen en op complexe manieren op elkaar inwerken.

Narrow-sense erfelijkheid

in de praktijk maakt de flexibiliteit van breed-sense \(h^2\) het zeer moeilijk te schatten zonder sterke veronderstellingen te maken., Het toestaan van effecten van alle mogelijke interacties van alle mogelijke genetische varianten betekent het hebben van een functioneel oneindige ruimte van mogelijke effecten. Een nuttige manier om dit te vereenvoudigen is om te denken aan de totale variantie verklaard door genetica als een combinatie van additieve effecten, dominant/recessieve Effecten, en interactie-effecten tussen verschillende varianten. $$ \ sigma^2_G = \ sigma^2_A + \ sigma^2_D + \ sigma^2_I$ $

historisch gezien is de meeste wetenschappelijke discussie over de erfelijkheid van verschillende eigenschappen gericht op \(h^2\)., Een van de leuke eigenschappen van \(h^2\) is dat het een eenvoudige relatie impliceert tussen hoe genetisch verwant twee mensen zijn en hoe vergelijkbaar de eigenschap zal zijn voor die twee mensen. We kunnen deze relatie gebruiken om \(h^2\) in tweelingstudies en familiestudies te schatten.

in het eenvoudigste geval kunnen we monozygotische tweelingen (vaak” identieke”of MZ-tweelingen genoemd) vergelijken met dizygotische tweelingen (“twee-eiige” of DZ-tweelingen). MZ-tweelingen deelden al hun DNA , terwijl DZ-tweelingen gemiddeld de helft van hun DNA delen., Tweelingen delen ook grotendeels dezelfde omgeving, ongeacht of ze MZ of DZ zijn . Dus om \(h^2\) te schatten kunnen we zien hoe gecorreleerd een eigenschap is tussen paren van MZ tweelingen en hoe gecorreleerd de eigenschap is tussen DZ tweelingen en zien of die correlaties verschillend zijn. Als de MZ tweelingparen, met hun hogere genetische gelijkenis, sterker gecorreleerd zijn dan de DZ tweelingparen, suggereert dat genetica een deel van de variantie in de eigenschap verklaart .

er is tientallen jaren wetenschappelijk onderzoek gedaan naar de erfelijkheid van menselijke eigenschappen met behulp van deze algemene benadering., Behulpzaam, een recente inspanning van Danielle Posthuma en collega ‘ s samengevoegd veel van dit werk in een enkele webpagina waar u kunt bladeren twin-based schattingen van \(h^2\) voor een breed scala aan eigenschappen.

SNP-erfelijkheid

de bovenstaande smaken van erfelijkheid verwijzen conceptueel naar” genetische effecten ” zonder dat specifieke genetische varianten en hun associatie met de eigenschap in aanmerking hoeven te worden genomen., Nu de vooruitgang in de genetica het mogelijk heeft gemaakt om daadwerkelijk gegevens te verzamelen over deze specifieke varianten, is er de mogelijkheid om te evalueren hoeveel elk van deze waargenomen varianten bijdragen aan erfelijkheid.

in het bijzonder kunnen we één type genetische variant noemen, een single nucleotide polymorphism (SNP), een verandering van een enkel basenpaar DNA op een specifieke locatie in het genoom. Sommige mensen hebben bijvoorbeeld een A op die locatie, terwijl andere mensen een G. hebben., Er zijn miljoenen van deze plaatsen in het genoom die algemeen tussen verschillende mensen variëren, en veel van het huidige onderzoek in menselijke genetica is gericht op het begrijpen van de gevolgen van deze varianten .

Het is de moeite waard om twee belangrijke kenmerken van \(h^2_g\) te benadrukken. Ten eerste zou je kunnen merken dat we \(h^2_g\) hebben gedefinieerd op basis van een aantal SNPs “S”. In de praktijk zal deze reeks SNP ‘ s afhangen van (A) de waargenomen SNP-gegevens en (b) de methode die wordt gebruikt voor het schatten van \(h^2_g\)., Dit maakt het lastig om waarden van \(h^2_g\) te vergelijken tussen verschillende methoden en verschillende studies , hoewel het in de meeste gevallen veilig is om tenminste aan te nemen dat het verwijst naar algemeen voorkomende SNPs. Ten tweede kan de variantie die door SNP ’s wordt verklaard, al dan niet de effecten van die specifieke SNP’ s weerspiegelen in tegenstelling tot de effecten van andere genetische varianten waarmee de SNP ‘ s zijn gecorreleerd., Dit is slechts een uitbreiding van onze vorige discussie hierboven over de Betekenis van variantie “uitgelegd”, maar de moeite waard om te herhalen, omdat het gemakkelijk zou zijn om SNP-erfelijkheid verkeerd te interpreteren als volledig uitsluiten van de causale effecten van andere soorten genetische variatie.

er zijn een aantal verschillende methoden ontwikkeld voor het schatten van \(h^2_g\) uit waargenomen SNP ‘ s. In de praktijk kennen we de ware \(𝛽_j\) niet dus moeten we andere trucs gebruiken., De eerste benadering, bekend als GREML (Genomic relatedness matrix REstricted Maximum Likelihood; algemeen geïmplementeerd in GCTA), gebruikt SNPs om de genetische gelijkenis tussen willekeurige individuen te schatten en te vergelijken met hun eigenschap gelijkenis. Dit is conceptueel vergelijkbaar met de tweelinggebaseerde schatting hierboven beschreven, maar maakt gebruik van de waargenomen low-level genetische gelijkenis in SNP gegevens van individuen die niet direct gerelateerd zijn. U kunt lezen over de statistische details hier met een meer recente review hier.,

een tweede benadering wordt linkage disequilibrium (LD) score regressie genoemd, geïmplementeerd in ldsc. Dit is de methode die we toepassen op de UK Biobank data set. LD score regressie hangt af van de belangrijkste observatie dat sommige SNP ‘ s zijn gecorreleerd met (dwz in LD met) andere genetische varianten, dus observeren dat SNP op zijn beurt “tags” informatie over de effecten van andere varianten. Het basisidee is dan dat als er veel en veel kleine genetische effecten verspreid over het genoom (d.w.z., de eigenschap is “polygeen”), dan moet de sterkte van de relatie tussen elke individuele SNP en de eigenschap (gemiddeld) proportioneel zijn aan hoeveel totale genetische variatie die SNP tags. Statistische details over de LD score regressiemethode zijn hier te vinden.

variantie verklaard door bekende SNP-effecten

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *