Dědivosti 201: Typy dědivosti a jak odhadujeme, že to

V Dědivosti 101 jsme definovali dědivosti jako „podíl změny vlastnost, vysvětlil dědičné genetické varianty.“V praxi se často spoléháme na variace této definice, částečně kvůli rozdílům mezi tímto idealizovaným pojetím dědičnosti a skutečností toho, co můžeme vědecky odhadnout., V tomto příspěvku se budeme nastínit některé různé „příchutě“ dědivosti, a způsoby, které lze odhadnout, s cílem vysvětlit, jakou formu dědivosti jsme hlášení od data UK Biobanky.

rychlé verze:

Naše velké BRITÁNII Biobanky analýzy je odhad \(h^2_g\), nebo SNP-dědičnost., To je jen podíl variability ve rys, který lze vysvětlit aditivním účinkům běžně se vyskytující genetické varianty názvem Snp (single base změna v sekvenci DNA), tak to je skoro vždy menší než celkové dědivosti \((H^2)\), která by mohla být vysvětlena tím, že všechny genetické faktory.

odhadujeme \(h^2_g\) pomocí metody zvané LD score regression (LDSR); pokud vám záleží na volbě metody, pravděpodobně oceníte více technického příspěvku zde.,

Měření odchylky

předtím, Než mluvit o různých chutí dědivosti, je užitečné definovat, co máme na mysli tím, že „variace“, když jsme se říkat věci jako „podíl změny vlastnost, vysvětlil tím, že“ něco.

zde, když říkáme „variace“, máme na mysli matematický koncept“rozptylu“. Rozptyl je běžná metrika pro měření toho, jak moc se vlastnost liší mezi lidmi ve skupině. Formálně je to průměrný čtvercový rozdíl mezi náhodně vybranou osobou a“ průměrnou “ osobou., Například, ve všech mužů a žen v BRITÁNII Biobanky rozptyl výšky v palcích je 13.3 (86.0 pro výšku v centimetrech), odpovídající standardní odchylka 3,7 palce (9,3 cm). Směrodatná odchylka je jednoduše druhá odmocnina rozptylu.

Statistici rádi mluví o rozptylu (na rozdíl od více intuitivní opatření, jako rozsah nebo střední absolutní odchylka od průměru), protože má hezké matematické vlastnosti., Zejména, pokud máte výsledek, který je součtem účinků z nezávislých zdrojů (jako, řekněme, geny a prostředí) rozptyl efektů z každého zdroje se podílejí na rozptylu výsledku. Být schopen rozdělit celkový rozptyl znaku do různých částí, které se sčítají tento způsob je velmi užitečné, když chceme začít mluvit o „podíl rozptylu je vysvětleno tím, že genetika“, jak uvidíme níže.

konečně, mluvit o rozptylu implicitně znamená, že mluvíme o skupině nebo populaci jednotlivců., Nemůžete mít průměrný rozdíl mezi lidmi s pouze jednou osobou. Jak zdůrazňujeme v Dědivosti 101, to znamená, že pokud budeme mluvit o dědivosti mluvíme o změnu v některé populaci jednotlivců, ne o genetice stanovení některých podíl rys, v každém daného jedince.

„Vysvětlující“ rozptyl

je také třeba vyjasnit, druhá polovina věty „podíl variace rys vysvětlil“, a to, co máme na mysli tím, že „vysvětlil“., V tomto případě je rozptyl, který je“ vysvětlen “ genetikou, rozptyl, který by mohl být předpovězen na základě genetických dat, pokud bychom měli dokonalé informace o účincích všech genetických variant (které, Aby bylo jasné, ve skutečnosti nemáme).

Pokud jste někdy slyšeli frázi „korelace není kauzalita“, to je problém, my“re na mysli a proč nejsme prostě říkám, že podíl rozptylu způsobeného genetické účinky., Jsme blíže k příčinné souvislosti, protože je to poměrně bezpečné předpokládat, že dědičné vlastnosti nejsou příčinou genetické varianty, protože naše genetika je stanovena při početí (s výjimkou získané mutace jako např. ty, které viděl v rakovinu). Je však možné, že genetické varianty budou korelovány s faktory prostředí, které mají přímý kauzální dopad na rys. To neznamená, že genetika není pro tuto vlastnost důležitá a informativní, ale znamená to, že musíme být opatrní při popisu účinků jako kauzální, dokonce i v genetice., Takže jako preventivní opatření proti předčasným prohlášením o kauzalitě se místo toho zaměřujeme na „vysvětlenou“ rozptyl.

broad-sense heritability

děláme tři důležitá pozorování o této definici. Za prvé, je to zcela flexibilní o tom, jak specifické genetické účinky přispívají k \(𝜎^2_g\)., Broad-sense \(H^2\) je jedno, zda \(𝜎^2_G\) pochází z jediného Mendelovy varianta jen v jednom genu, nebo malý aditivní účinky z variant na 100 různých genů, nebo složité interakce mezi každou variantu v celém genomu. Níže uvidíme, že se jedná o důležitý rozdíl mezi širokým smyslem \(H^2\) a některými dalšími typy dědičnosti.

$$H^2 = \frac{\sigma^2_G}{\sigma^2_G + \sigma^2_E}$$ ale tento předpoklad není nutné., Tím, že prostě psát jmenovatel jako \(𝜎^2_P\) dovolíme pro možnost, že genetické a environmentální faktory jsou korelovány nebo komunikovat v nějakým způsobem. To je důležité, protože zdůrazňuje, že vliv prostředí na rys není jen „zbytek“ po zohlednění všech genetických účinků, místo toho se mohou překrývat a interagovat složitými způsoby.

Narrow-sense dědivosti

V praxi, flexibilitu, broad-sense \(H^2\) je velmi těžké odhadnout, aniž by silné předpoklady., Umožnění účinků všech možných interakcí všech možných genetických variant znamená mít funkčně nekonečný prostor možných efektů. Jedním z užitečných způsobů, jak to zjednodušit, je myslet na celkovou odchylku vysvětlenou genetikou jako kombinaci aditivních účinků, dominantních / recesivních účinků a interakčních účinků mezi různými variantami. $$\sigma^2_G = \sigma^2_A + \sigma^2_D + \sigma^2_I$$

Historicky, většina vědecké diskuse o dědivosti různých vlastností se zaměřuje na \(h^2\)., Jeden z pěkných vlastností \(h^2\) je, že to znamená jednoduchý vztah mezi tím, jak geneticky související jsou dva lidé a, jak podobné vlastnost bude pro ty dva lidi. Tento vztah můžeme použít k odhadu \(h^2\) v dvojčatech a rodinných studiích.

V nejjednodušším případě můžeme porovnat monozygotní dvojčata (často označovaný jako „totožné“ nebo MZ dvojčata) dizygotická („bratrské“ nebo DZ) dvojčat. Dvojčata MZ sdílela veškerou svou DNA, zatímco dvojčata DZ sdílejí v průměru polovinu své DNA., Dvojčata také do značné míry sdílejí stejné prostředí bez ohledu na to, zda jsou MZ nebo DZ . Takže pro odhad \(h^2\), můžeme pozorovat, jak souvisí rys je mezi párů MZ dvojčat a jak souvisí rys je mezi DZ dvojčaty a uvidíme, jestli se ty korelace jsou různé. Pokud jsou páry dvojčat MZ s jejich vyšší genetickou podobností silněji korelovány než dvojče DZ, to naznačuje, že genetika vysvětluje některé rozdíly ve znaku .

existuje desetiletí vědeckého výzkumu dědičnosti lidských vlastností pomocí tohoto obecného přístupu., Ochotně, nedávné úsilí o Danielle Posthuma a jeho kolegové dali dohromady hodně z této práce do jediné webové stránky, kde můžete procházet twin-podle odhadů \(h^2\) pro širokou řadu rysů.

SNP-dědičnost

nad chutí dědivosti mít uvedené „genetické účinky“ koncepčně bez nutnosti jakékoliv úvahy o specifických genetických variant a jejich asociace s rys., Nyní, když pokroky v genetice umožnily skutečně shromažďovat údaje o těchto konkrétních variantách, existuje možnost vyhodnotit, kolik každá z těchto pozorovaných variant přispívá k dědičnosti.

konkrétně můžeme považovat za jeden typ genetické varianta tzv. jednonukleotidový polymorfismus (SNP), což je změna o jeden pár bází DNA na konkrétní místo v genomu. Například, někteří lidé mohou mít A na tomto místě, zatímco jiní lidé mají g., Existují miliony těchto místech v genomu, které se běžně liší mezi různými lidmi, a velká část současného výzkumu v oblasti lidské genetiky je zaměřen na pochopení vlivů těchto variant .

je třeba zdůraznit dvě klíčové vlastnosti \(h^2_g\). Nejprve si můžete všimnout, že jsme definovali \(h^2_g\) na základě nějaké sady SNPs „s“. V praxi bude tato sada SNP záviset na (a) zjištěných datech SNP a(b) metodě použité pro odhad \(h^2_g\)., Díky tomu je obtížné porovnávat hodnoty \(h^2_g\) mezi různými metodami a různými studiemi , i když ve většině případů je bezpečné alespoň předpokládat, že se jedná o běžně se vyskytující SNP. Za druhé, rozptyl vysvětlil tím, že Snp se může nebo nemusí odrážet dopad těchto určité Modifikace oproti účinky jiných genetických variant na Snp jsou korelovány s., Tohle je jen rozšíření naší předchozí diskusi výše o smyslu rozptylu „vysvětlil“, ale stojí za to zopakovat, protože to by bylo snadné překroutit SNP-dědivosti jako plně vyloučit kauzální účinky jiných typů genetické variability.

Existuje několik různých metod, které byly vyvinuty pro odhad \(h^2_g\) ze zjištěných Snp. V praxi neznáme pravou \(𝛽_j\), takže musíme použít jiné triky., První přístup, známý jako GREML (Genomické matice příbuznosti Omezen Maximální věrohodnosti; běžně realizovány v GCTA), používá Modifikace pro odhad genetické podobnosti mezi náhodných jedinců a porovnat, že na jejich vlastnost, podobnost. To je koncepčně podobný twin-podle odhadu popsaných výše, ale používá pozorovat nízkou úroveň genetické podobnosti v SNP dat od jedinců, kteří nejsou přímo souvisejí. O statistických detailech si můžete přečíst zde s novějším přehledem zde.,

druhý přístup se nazývá vazba nerovnováha (LD) skóre regrese, realizován v ldsc. Toto je metoda, kterou aplikujeme na britskou datovou sadu Biobank. LD skóre regresní závisí na klíčové pozorování, že některé Modifikace jsou spojeny s (tj. v LD s) další genetické varianty, tak připomněl, že SNP v pořadí „kategorie“ informace o účincích dalších variant. Základní myšlenkou pak je, že pokud existuje spousta a spousta malých genetických účinků rozložených v genomu (tj., vlastnost je „polygenní“), pak síla vztahu mezi každým jednotlivým SNP a znakem by měla být (v průměru) úměrná tomu, kolik celkové genetické variace, kterou SNP označuje. Statistické údaje o metodě regrese skóre LD naleznete zde.

rozptyl vysvětlený známými účinky SNP

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *