Heritabilitate 201: Tipuri de heritabilitate și cum estimăm că

În Heritabilitate 101 am definit-o heritabilitate ca „proporția de variație într-o trăsătură explică prin moștenit de variante genetice.”În practică ne vom baza adesea pe variații ale acestei definiții, în parte din cauza diferențelor dintre acest concept idealizat de heritabilitate și realitatea a ceea ce putem estima științific., În acest post vom schița câteva „arome” diferite de heritabilitate și modalitățile prin care acestea pot fi estimate, cu scopul final de a explica ce formă de heritabilitate raportăm din datele Biobank din Marea Britanie.

versiunea rapida:

Noastre din marea BRITANIE Bio analizei este estimarea \(h^2_g\), sau SNP-heritabilitate., Aceasta este doar proporția de variație a trăsăturii care poate fi explicată prin efectele aditive ale variantelor genetice care apar frecvent numite SNPs (o singură schimbare de bază într-o secvență ADN), deci este aproape întotdeauna mai mică decât heritabilitatea totală \((h^2)\) care ar putea fi explicată de toți factorii genetici.

suntem estimarea \(h^2_g\), folosind o metoda numita LD scorul de regresie (LDSR); dacă alegerea metodei contează pentru tine, atunci te va aprecia, probabil, cel mai tehnic post aici.,

de Măsurare variația

Înainte de a vorbi despre diferite arome de heritabilitate, este util să definim ce înțelegem prin „variație” atunci când spunem lucruri de genul „proporția de variație într-o trăsătură explică prin” ceva.

aici, când spunem” variație”, ne referim la conceptul matematic de”varianță”. Varianța este o metrică comună pentru măsurarea cât de mult diferă o trăsătură între oamenii dintr-un grup. Formal, este diferența medie pătrată între o persoană selectată aleatoriu și persoana „medie”., De exemplu, pentru toți bărbații și femeile din Marea Britanie Biobank varianța înălțimii în inci este de 13,3 (86,0 pentru înălțimea în centimetri), corespunzând unei deviații standard de 3,7 inci (9,3 cm). Abaterea standard este pur și simplu rădăcina pătrată a varianței.

Statisticieni place să vorbesc despre varianța (spre deosebire de mai intuitiv măsuri, cum ar fi gama sau abaterea medie absolută de la medie), deoarece are frumos proprietăți matematice., Mai ales, dacă aveți un rezultat care este suma efectelor din surse independente (cum ar fi, să zicem, gene și mediu), varianța efectelor din fiecare sursă se adaugă la varianța rezultatului. A fi capabil să descompunem variația totală a unei trăsături în diferite piese care se adaugă în acest fel este foarte util atunci când vrem să începem să vorbim despre „proporția varianței explicată de genetică”, așa cum vom vedea mai jos.

în cele din urmă, a vorbi despre varianță înseamnă implicit că vorbim despre un grup sau o populație de indivizi., Nu poți avea o diferență medie între oameni cu o singură persoană. Așa cum subliniem în heritabilitatea 101, aceasta înseamnă că ori de câte ori vorbim despre heritabilitate vorbim despre variația unei anumite populații de indivizi, nu despre genetică care determină o anumită proporție a unei trăsături la un anumit individ.

„Explică” variația

este, de asemenea, merită să clarifice cealaltă jumătate de expresia „în proporție de variație într-o trăsătură explică prin”, și anume ce înseamnă pentru noi „, a explicat”., În acest caz, varianța care este „explicată” de genetică este varianța care ar putea fi prezisă pe baza datelor genetice dacă am avea informații perfecte despre efectele tuturor variantelor genetice (care, pentru a fi clar, nu avem de fapt).

dacă ați auzit vreodată expresia „corelația nu este cauzalitate”, aceasta este problema la care ne referim aici și de ce nu spunem pur și simplu proporția de variație cauzată de efectele genetice., Suntem mai aproape de cauzalitate, deoarece este destul de sigur să presupunem că trăsăturile ereditare nu cauzează variantele genetice, deoarece genetica noastră este fixată la concepție (cu excepția mutațiilor dobândite, cum ar fi cele observate în cancer). Cu toate acestea, este posibil ca variantele genetice să fie corelate cu factorii de mediu care au un impact cauzal direct asupra trăsăturii. Asta nu înseamnă că genetica nu este importantă și informativă pentru acea trăsătură, dar înseamnă că trebuie să fim atenți la descrierea efectelor ca cauzale, chiar și în genetică., Deci, ca măsură de precauție împotriva oricăror declarații premature despre cauzalitate, ne concentrăm în schimb pe varianța „explicată”.

Larg sens heritabilitate

facem trei observații importante despre această definiție. În primul rând, este în întregime flexibil cu privire la modul în care efectele genetice specifice contribuie la \(𝜎^2_g\)., Larg sens \(Sec^2\) nu-i pasă dacă \(𝜎^2_G\) vine de la un singur Mendeliană varianta în doar o singură genă, sau mici efecte aditive de variante în 100 de gene diferite, sau interacțiuni complexe între fiecare variantă în întregul genom. Vom vedea mai jos că aceasta este o distincție importantă între sensul larg \(h^2\) și unele dintre celelalte tipuri de heritabilitate.

$$H^2 = \frac{\sigma^2_G}{\sigma^2_G + \sigma^2_E}$$ dar această presupunere nu este necesară., Prin simpla scriere a numitorului ca \(𝜎^2_p\) permitem posibilitatea ca factorii genetici și de mediu să fie corelați sau să interacționeze într-un fel. Acest lucru este important, deoarece subliniază faptul că efectul mediului asupra trăsăturii nu este pur și simplu „restul” după contabilizarea tuturor efectelor genetice, în schimb se pot suprapune și interacționa în moduri complexe.

Îngust sens heritabilitate

În practică, flexibilitatea larg sens \(Sec^2\), este foarte greu de estimat, fără a face ipoteze puternice., Permiterea efectelor tuturor interacțiunilor posibile ale tuturor variantelor genetice posibile înseamnă a avea un spațiu funcțional infinit de efecte posibile. O modalitate utilă de a simplifica acest lucru este să ne gândim la variația totală explicată de genetică ca o combinație de efecte aditive, efecte dominante/recesive și efecte de interacțiune între diferite variante. $$\sigma^2_G = \sigma^2_A + \sigma^2_D + \sigma^2_I$$

din punct de vedere Istoric, cele mai multe discuții științifice de heritabilitate de diferite trăsături de-a concentrat pe \(sec^2\)., Una dintre caracteristicile frumoase ale \(h^2\) este că implică o relație simplă între modul în care sunt legate genetic două persoane și cât de asemănătoare va fi trăsătura pentru acele două persoane. Putem folosi această relație pentru a estima \(h^2\) în studiile gemene și familiale.

În cel mai simplu caz, putem compara gemenii monozigoți (adesea numite „identic” sau gemenii MZ) să dizigotică („frățești” sau DZ) gemeni. Gemenii MZ și-au împărtășit tot ADN-ul , în timp ce gemenii DZ împărtășesc jumătate din ADN-ul lor în medie., Gemenii au, de asemenea, în mare parte același mediu, indiferent dacă sunt MZ sau DZ . Deci, pentru a estima \(h^2\) putem observa cât de corelată este o trăsătură între perechile de gemeni MZ și cât de corelată este trăsătura între gemenii DZ și a vedea dacă aceste corelații sunt diferite. Dacă perechile de gemeni MZ, cu similitudinea lor genetică mai mare, sunt mai puternic corelate decât perechile gemene DZ, asta sugerează că genetica explică o parte din varianța trăsăturii .

au existat decenii de cercetare științifică privind heritabilitatea trăsăturilor umane folosind această abordare generală., Util, un recent efort de Danielle Posthuma și colegii reunite de mult de acest lucru într-o singură pagină web unde puteți naviga twin bazate pe estimări ale \(sec^2\) pentru o mare varietate de trăsături.

SNP-heritabilitate

Cele de mai sus arome de heritabilitate-am referit la „efecte genetice” din punct de vedere conceptual, fără a necesita nici o considerație de anumite variante genetice și asocierea lor cu trăsătură., Acum, că progresele în genetică au făcut posibilă colectarea de date despre aceste variante specifice, există posibilitatea de a evalua cât de mult contribuie fiecare dintre aceste variante observate la heritabilitate.

în special, putem lua în considerare un tip de variantă genetică numită un singur polimorfism nucleotidic (SNP), care este o schimbare a unei singure perechi de baze de ADN la o anumită locație din genom. De exemplu, unii oameni pot avea un A la acea locație, în timp ce alte persoane au un G., Există milioane din aceste locații în genom care variază în mod obișnuit între diferite persoane și o mare parte din cercetarea actuală în genetica umană este axată pe înțelegerea efectelor acestor variante .

merită evidențiate două caracteristici cheie ale \(h^2_g\). În primul rând, este posibil să observați că am definit \(h^2_g\) pe baza unui set de SNP-uri „S”. În practică, acest set de SNP va depinde de (a) datele SNP care au fost observate și (b) metoda utilizată pentru estimarea \(h^2_g\)., Acest lucru face dificil de a compara valorile de \(h^2_g\) între diferite metode și studii diferite , deși în cele mai multe cazuri este în siguranță pentru cel puțin presupun că se referă la frecvent apar Snp. În al doilea rând, variația explicată de SNP poate reflecta sau nu efectele acestor SNP-uri particulare, spre deosebire de efectele altor variante genetice cu care SNP-urile sunt corelate., Aceasta este doar o extensie a discuției noastre anterioare de mai sus despre semnificația varianței „explicată”, dar merită reiterată, deoarece ar fi ușor să interpretăm greșit SNP-heritabilitatea ca excluzând pe deplin efectele cauzale ale altor tipuri de variații genetice.

Există o serie de metode care au fost dezvoltate pentru estimarea \(h^2_g\) de observat Snp. În practică nu știm adevăratul \(𝛽_j\), așa că trebuie să folosim alte trucuri., Prima abordare, cunoscut sub numele de GREML (Genomice înrudire matrice REstricted Maximum Likelihood; de obicei puse în aplicare în GCTA), foloseste SNPs pentru a estima similitudini genetice între persoanele fizice aleatorii și că, pentru a compara lor trăsătură de similitudine. Aceasta este similară conceptual cu estimarea bazată pe gemeni descrisă mai sus, dar utilizează similitudinea genetică observată la nivel scăzut în datele SNP de la persoane care nu sunt direct legate. Puteți citi despre detaliile statistice aici cu o revizuire mai recentă aici.,

O a doua abordare este numit dezechilibru de linkage (LD) scor de regresie, puse în aplicare în ldsc. Aceasta este metoda pe care o aplicăm setului de date Biobank din Marea Britanie. Regresia scorului LD depinde de observația cheie că unele SNP sunt corelate cu (adică în LD cu) alte variante genetice, observând astfel că SNP la rândul său „etichetează” informații despre efectele altor variante. Ideea de bază atunci este că, dacă există o mulțime și o mulțime de mici efecte genetice răspândite în genom (adică., trăsătura este „poligenică”), atunci puterea relației dintre fiecare SNP individual și trăsătură ar trebui să fie (în medie) proporțională cu cantitatea de variație genetică totală pe care o etichetează SNP. Detalii statistice privind metoda de regresie a scorului LD pot fi găsite aici.

varianța explicată prin efectele SNP cunoscute

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *