Heritability 201: az örökölhetőség típusai és hogyan becsüljük meg

A Heritability 101-ben az öröklött genetikai változatokkal magyarázható tulajdonság variációjának arányát határoztuk meg.”A gyakorlatban gyakran támaszkodunk ennek a meghatározásnak a változataira, részben azért, mert különbségek vannak az idealizált öröklési koncepció és a valóság között, amit tudományosan meg tudunk becsülni., Ebben a bejegyzésben felvázoljuk az örökölhetőség különböző “ízeit”, valamint azokat a módokat, amelyeket meg lehet becsülni, azzal a céllal, hogy elmagyarázzuk, milyen típusú örökölhetőséget jelentünk az Egyesült Királyság Biobank adataiból.

a gyors verzió:

UK Biobank elemzésünk becslése \(h^2_g\), vagy SNP-örökölhetőség., Ez csak a tulajdonság variációjának aránya, amely a gyakran előforduló genetikai változatok SNP-k (egyetlen bázisváltozás a DNS-szekvenciában) additív hatásaival magyarázható, tehát szinte mindig kevesebb, mint a teljes örökölhetőség \((H^2)\), amelyet minden genetikai tényező magyarázhat.

becslésünk \(h^2_g\) az LD score regression (LDSR) nevű módszerrel; ha a módszer kiválasztása számít Önnek, akkor valószínűleg értékelni fogja a technikai hozzászólást itt.,

mérési variáció

mielőtt az örökölhetőség különböző ízeiről beszélnénk, hasznos meghatározni, hogy mit értünk a “variáció” alatt, amikor olyan dolgokat mondunk, mint a “valami által magyarázható tulajdonság variációjának aránya”.

itt, amikor” variációt “mondunk, a”variancia” matematikai fogalmára utalunk. A variancia egy közös mutató annak mérésére, hogy egy vonás mennyiben különbözik a csoportban lévő emberek között. Formálisan ez az átlagos négyzet különbség egy véletlenszerűen kiválasztott személy és az” átlagos ” személy között., Például az összes férfi és nő az Egyesült Királyságban Biobank a szórás a magasság hüvelykben 13,3 (86,0 a magasság centiméterben), amely megfelel a szórás 3,7 hüvelyk (9,3 cm). A szórás egyszerűen a variancia négyzetgyöke.

a statisztikusok szeretnek varianciáról beszélni (szemben az intuitívabb intézkedésekkel, mint például a tartomány vagy az átlagtól való átlagos abszolút eltérés), mert szép matematikai tulajdonságokkal rendelkezik., Leginkább, ha van egy eredmény, hogy az összeg a hatások független forrásokból (mint például a gének és a környezet) a variancia a hatások minden forrás összeadódik a variancia az eredmény. Nagyon hasznos, ha egy tulajdonság teljes varianciáját különféle darabokra bontjuk, amelyek így összeadódnak, amikor a “genetika által kifejtett variancia arányáról” akarunk beszélni, amint azt alább látni fogjuk.

végül a varianciáról való beszélgetés implicit módon azt jelenti, hogy egyének csoportjáról vagy populációjáról beszélünk., Nem lehet átlagos különbség az emberek között, csak egy személy. Amint azt a 101-es Örökölhetőségben hangsúlyozzuk, ez azt jelenti, hogy amikor az örökölhetőségről beszélünk, az egyének egyes populációinak variációjáról beszélünk, nem pedig a genetikáról, amely meghatározza a tulajdonság bizonyos arányát egy adott egyénben.

” Explaining”variancia

érdemes tisztázni a” variáció aránya egy tulajdonságban “kifejezés másik felét is, nevezetesen azt, amit a”magyarázat” alatt értünk., Ebben az esetben a genetika által “magyarázott” variancia olyan variancia, amelyet genetikai adatok alapján lehet megjósolni, ha tökéletes információnk lenne az összes genetikai változat hatásairól (ami egyértelmű, hogy valójában nincs). ha valaha is hallottad a” korreláció nem okozati összefüggés”kifejezést, erre a kérdésre utalunk itt, és miért nem egyszerűen a genetikai hatások által okozott variancia arányát mondjuk., Közelebb vagyunk az okozati összefüggéshez, mivel meglehetősen biztonságos azt feltételezni, hogy az öröklődő tulajdonságok nem okozzák a genetikai variánsokat, mivel genetikánk a fogantatáskor rögzül (kivéve a megszerzett mutációkat, például a rákban látottakat). Lehetséges azonban, hogy a genetikai változatok korreláljanak olyan környezeti tényezőkkel, amelyek közvetlen okozati hatással vannak a tulajdonságra. Ez nem jelenti azt, hogy a genetika nem fontos és informatív az adott tulajdonság számára, de ez azt jelenti, hogy óvatosnak kell lennünk a hatások ok-okozati leírásában, még a genetikában is., Tehát elővigyázatosságból, hogy ne tegyünk korai kijelentéseket az ok-okozati összefüggésről, inkább a “magyarázott” szórásra összpontosítunk.

széles értelemben vett örökölhetőség

három fontos megfigyelést teszünk erről a meghatározásról. Először is teljesen rugalmas, hogy a specifikus genetikai hatások hogyan járulnak hozzá \(𝜎^2_g\)., A tág értelemben vett \(H^2\) nem érdekli, hogy \(𝜎^2_g\) csak egy gén egyetlen Mendeliai változatából származik-e, vagy a 100 különböző gén variánsainak kis additív hatásai, vagy a teljes genom minden változata közötti komplex kölcsönhatások. Az alábbiakban látni fogjuk, hogy ez egy fontos különbség a tág értelemben vett \(H^2\) és néhány más típusú örökölhetőség között.

$$h^2 = \frac{\sigma^2_g}{\sigma^2_g + \sigma^2_e}$$ de ez a feltételezés nem szükséges., A nevező \(^^2_p\) egyszerű írásával lehetővé tesszük annak lehetőségét, hogy a genetikai és környezeti tényezők korreláljanak vagy valamilyen módon kölcsönhatásba lépjenek. Ez azért fontos, mert kiemeli, hogy a környezetnek a tulajdonságra gyakorolt hatása nem egyszerűen a” maradék ” az összes genetikai hatás elszámolása után, hanem összetett módon átfedhetik egymást.

szűklátókörű örökölhetőség

a gyakorlatban a tágabb értelemben vett \(H^2\) rugalmasság nagyon nehéz megbecsülni anélkül, hogy erős feltételezéseket tennénk., Az összes lehetséges genetikai változat minden lehetséges kölcsönhatásának lehetővé tétele azt jelenti, hogy a lehetséges hatások funkcionálisan végtelen térrel rendelkeznek. Ennek egyszerűsítésének egyik hasznos módja a genetika által magyarázott teljes variancia, mint az additív hatások, a domináns/recesszív hatások, valamint a különböző változatok közötti kölcsönhatási hatások kombinációja. $ $ \ sigma^2_g = \ sigma^2_a + \sigma^2_d + \sigma^2_i$

történelmileg a különböző tulajdonságok örökölhetőségének legtöbb tudományos vitája a\(H^2\) – ra összpontosított., A \(h^2\) egyik szép tulajdonsága, hogy egyszerű kapcsolatot jelent a genetikailag rokon két ember között, és hogy milyen hasonló lesz a vonás a két ember számára. Ezt a kapcsolatot felhasználhatjuk a \(h^2\) becslésére iker-és családi tanulmányokban.

a legegyszerűbb esetben összehasonlíthatjuk a monozigotikus ikreket (gyakran “azonos” vagy MZ ikrek) a dizygotic (“testvér” vagy DZ) ikrekkel. Az MZ ikrek megosztották az összes DNS-t, míg a DZ ikrek átlagosan a DNS felét osztják meg., Ikrek is nagyrészt ugyanazt a környezetet, függetlenül attól, hogy azok MZ vagy DZ . Tehát a \(h^2\) becsléséhez megfigyelhetjük, hogy egy tulajdonság mennyire korrelál az MZ ikrek párjai között, és mennyire korrelál a tulajdonság a DZ ikrek között, és megnézzük, hogy ezek a korrelációk eltérőek-e. Ha az MZ ikrek párjai magasabb genetikai hasonlóságukkal erősebben korrelálnak, mint a DZ iker párok, ez azt sugallja, hogy a genetika magyarázza a tulajdonság varianciájának egy részét . több évtizedes tudományos kutatás folyt az emberi tulajdonságok örökölhetőségéről ezen általános megközelítés alkalmazásával., Danielle Posthuma és kollégái nemrégiben tett erőfeszítései ennek a munkának a nagy részét egyetlen weboldalra egyesítették, ahol a \(H^2\) két alapú becsléseit böngészheti a tulajdonságok széles skálájához.

SNP-heritability

az öröklődés fenti ízei fogalmilag” genetikai hatásokra ” hivatkoztak anélkül, hogy figyelembe vették volna a specifikus genetikai variánsokat és a tulajdonsághoz való kapcsolódást., Most, hogy a genetika fejlődése lehetővé tette az adatok tényleges gyűjtését ezekről a konkrét változatokról, lehetőség van annak értékelésére, hogy ezek a megfigyelt változatok mennyire járulnak hozzá az örökölhetőséghez. különösen figyelembe vehetjük az egyetlen nukleotid polimorfizmusnak (SNP) nevezett genetikai variáns egyik típusát, amely a DNS egyetlen bázispárjának változása a genom meghatározott helyén. Például, néhány embernek lehet egy A-je ezen a helyen, míg másoknak G-je van., Ezen helyek milliói vannak a genomban, amelyek általában különböző emberek között változnak, és az emberi genetika jelenlegi kutatásainak nagy része ezen változatok hatásainak megértésére összpontosít .

érdemes kiemelni a \(H^2_g\) két legfontosabb jellemzőjét. Először is, lehet, hogy észre, hogy már meghatározott \(h^2_g\) alapján néhány sor SNP”S”. A gyakorlatban ez az SNP-készlet függ (a) A megfigyelt SNP-adatoktól és (b) a \(H^2_g\) becsléséhez használt módszertől., Ez megnehezíti a \(h^2_g\) értékek összehasonlítását a különböző módszerek és a különböző tanulmányok között , bár a legtöbb esetben biztonságos legalább feltételezni, hogy az általánosan előforduló SNP-kre utal. Másodszor, az SNP-k által kifejtett variancia tükrözheti vagy nem tükrözi az adott SNP-k hatásait, szemben az SNP-k más genetikai variánsainak hatásaival., Ez csak egy kiterjesztése a korábbi vita felett a jelentése variancia “magyarázható”, de érdemes megismételni, mivel könnyű lenne félreértelmezni SNP-örökölhetőség teljes mértékben kizárva az okozati hatások más típusú genetikai variáció.

van néhány különböző módszer, amelyet a megfigyelt SNP-k \(h^2_g\) becslésére fejlesztettek ki. A gyakorlatban nem ismerjük az igaz \(𝛽_j\) értéket, ezért más trükköket kell használnunk., Az első megközelítés, az úgynevezett GREML (Genomic relatedness matrix korlátozott maximális valószínűsége; általánosan alkalmazott GCTA), használja SNP megbecsülni a genetikai hasonlóság a véletlen egyének és hasonlítsa össze, hogy a tulajdonság hasonlóság. Ez fogalmi szempontból hasonló a fent leírt iker-alapú becsléshez, de a megfigyelt alacsony szintű genetikai hasonlóságot használja az SNP adatokban olyan személyektől, akik nem közvetlenül kapcsolódnak egymáshoz. A statisztikai részletekről itt olvashat, egy újabb áttekintéssel itt.,

a második megközelítés az úgynevezett linkage disequilibrium (LD) pontszám regresszió, végre ldsc. Ez az a módszer, amelyet az Egyesült Királyság Biobank adatkészletére alkalmazunk. Az LD pontszám regresszió attól a kulcsfontosságú megfigyeléstől függ, hogy egyes SNP-k korrelálnak (azaz LD-ben) más genetikai változatokkal, így megfigyelve, hogy az SNP viszont “címkék” információkat tartalmaz más változatok hatásairól. Az alapötlet tehát az, hogy ha sok – sok apró genetikai hatás terjed a genomban (azaz, a tulajdonság “poligén”), akkor az egyes SNP és a tulajdonság közötti kapcsolat erősségének (átlagosan) arányosnak kell lennie azzal, hogy mennyi teljes genetikai variáció van az SNP címkékkel. Az LD score regressziós módszer statisztikai adatai itt találhatók.

variancia magyarázata ismert SNP hatások

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük