遺伝率201:遺伝率の種類とその推定方法

遺伝率101では、遺伝率を”遺伝的遺伝的変異体によって説明される形質の変動の割合”と定義しました。”実際には、この理想化された遺伝性の概念と実際に科学的に推定できるものの現実との違いのために、この定義のバリエーションに依存することが, この記事では、英国バイオバンクのデータから報告している遺伝性の形態を説明する最終目標とともに、遺伝性のいくつかの異なる”フレーバー”とそれら

クイックバージョン:

私たちの英国バイオバンク分析は\(h^2_g\)、またはSNP遺伝率を推定しています。, これは、Snp(DNA配列の単一塩基変化)と呼ばれる一般的に発生する遺伝的変異体の相加的効果によって説明できる形質の変動の割合に過ぎないため、ほとんどの場合、すべての遺伝的要因によって説明できる全遺伝性\((H^2)\)よりも小さい。

LD score regression(LDSR)というメソッドを使用して\(h^2_g\)を推定しています。,

バリエーションの測定

遺伝のさまざまなフレーバーについて話す前に、”形質におけるバリエーションの割合”のようなものを言うときに、”バリエーション”とは何を意味するのかを定義すると便利です。

ここでは、”変動”と言うとき、”分散”の数学的概念を指しています。 分散は、グループ内の人々の間で特性がどれくらい異なるかを測定するための一般的な指標です。 正式には、ランダムに選択された人と”平均的な”人との間の平均二乗差です。, たとえば、英国バイオバンクのすべての男性と女性において、インチ単位の高さの分散は13.3(センチメートル単位の高さの場合は86.0)であり、3.7インチ(9.3cm)の標準偏差に対応しています。 標準偏差は、単に分散の平方根です。

統計学者は、分散について話すのが好きです(範囲や平均からの平均絶対偏差などのより直感的な尺度とは対照的に)。, 最も顕著なのは、独立した情報源(遺伝子や環境など)からの効果の合計である結果がある場合、各源からの効果の分散は結果の分散に加算されます。 以下に示すように、形質の総分散をこのように追加するさまざまな部分に分割できることは、”遺伝学によって説明される分散の割合”について話し始

最後に、分散について暗黙のうちに話すことは、個人のグループまたは人口について話していることを意味します。, あなたは一人だけを持つ人々の間に平均的な違いを持つことはできません。 遺伝率101で強調しているように、これは、遺伝率について話すたびに、特定の個人の形質のある割合を決定する遺伝学についてではなく、個人のある集団のばらつきについて話していることを意味します。

“説明する”分散

“説明された特性における変動の割合”というフレーズの残りの半分、つまり”説明された”という意味を明確にすることも価値があります。, この場合、遺伝学によって”説明される”分散は、すべての遺伝的変異体の影響に関する完全な情報があれば、遺伝的データに基づいて予測できる分散で

“相関は因果関係ではない”というフレーズを聞いたことがあるなら、それは私たちがここで言及している問題であり、なぜ遺伝的影響によって引き起こされる分散の割合を単に言っていないのかという問題です。, 遺伝的形質が遺伝的変異を引き起こしていないと仮定することはかなり安全であるため、私たちの遺伝学は受胎時に固定されているため(癌に見られるような後天的突然変異を除く)、因果関係に近い。 しかしながら、遺伝的変異体は、形質に直接的な因果関係を有する環境要因と相関する可能性がある。 それは遺伝学がその形質にとって重要で有益ではないことを意味するものではありませんが、遺伝学においてさえ、効果を因果関係として記述することに注意する必要があることを意味します。, したがって、因果関係についての時期尚早の陳述に対する予防策として、代わりに”説明された”分散に焦点を当てます。

広義の遺伝率

この定義について三つの重要な観察を行います。 まず、特定の遺伝的効果が\(θ^2_G\)にどのように寄与するかについては完全に柔軟です。, 広義の\(h^2\)は、\(λ^2_G\)が一つの遺伝子の単一のメンデル変異体から来ているのか、100の異なる遺伝子の変異体からの小さな加算効果、または全ゲノム内のすべての変異間の複雑な相互作用かどうかを気にしません。 これは広義の\(H^2\)と他のいくつかのタイプの遺伝率との間の重要な区別であることを以下に示します。

$H^2=\frac{\シグマ^2_G}{\シグマ^2_G+\シグマ^2_E}$しかし、その仮定は必要ありません。, 分母を\(σ^2_P\)と書くだけで、遺伝的要因と環境的要因が何らかの形で相関したり相互作用したりする可能性があります。 これは、形質に対する環境の影響は、すべての遺伝的影響を考慮した後の単なる”残り”ではなく、複雑な方法で重複して相互作用する可能性があることを強調しているため、重要です。

狭義の遺伝率

実際には、広義の\(H^2\)の柔軟性は、強い仮定をしないで推定することを非常に困難にします。, すべての可能な遺伝的変異体のすべての可能な相互作用の効果を可能にすることは、可能な効果の機能的に無限の空間を有することを意味する。 これを単純化する一つの有用な方法は、遺伝学によって説明される全分散を、加法効果、優性/劣性効果、および異なる変異体間の相互作用効果の組み合わせとして考えることである。 $\シグマ^2_G=\シグマ^2_A+\シグマ^2_D+\シグマ^2_I$

歴史的に、異なる形質の遺伝性のほとんどの科学的議論は\(h^2\)に焦点を当てています。, \(H^2\)の良い特徴の一つは、それがどのように遺伝的に関連する二人の間の単純な関係を意味し、その特性がその二人のためにどのように似てい この関係を使用して、双子および家族研究で\(h^2\)を推定できます。

最も単純なケースでは、一卵性双生児(しばしば”同一”またはMZ双子と呼ばれる)と二卵性双生児(”兄弟”またはDZ)双子を比較することができます。 MZ双子はすべてのDNAを共有していましたが、DZ双子は平均してDNAの半分を共有しています。, 双子はまた、mzまたはDZであるかどうかにかかわらず、ほとんど同じ環境を共有します。 したがって、\(h^2\)を推定するために、形質がMZ双生児のペア間でどのように相関しているか、そして形質がDZ双生児の間でどのように相関している 遺伝的類似性が高いMZ双子のペアがDZ双子のペアよりも強く相関している場合、それは遺伝学が形質の分散のいくつかを説明することを示唆し

この一般的なアプローチを使用して、人間の形質の遺伝性に関する科学的研究の数十年がありました。, 有益なことに、Danielle Posthumaらによる最近の努力は、この作業の多くを単一のwebページにまとめ、さまざまな形質について\(h^2\)の双子ベースの推定値を閲覧できるようにしました。

SNP-heritability

上記の遺伝性味は、特定の遺伝的変異体およびそれらの形質との関連を考慮することなく、概念的に”遺伝的効果”を指している。, 遺伝学の進歩により、これらの特定の変異体に関するデータを実際に収集することが可能になったので、これらの観察された変異体のそれぞれが遺伝

特に、ゲノム内の特定の場所でのDNAの単一塩基対の変化である一塩基多型(SNP)と呼ばれる遺伝的変異体の一種を考えることができます。 たとえば、その場所にAがある人もいれば、他の人にGがある人もいます。, ゲノムには何百万ものこれらの場所があり、一般的には異なる人々の間で異なりますが、ヒト遺伝学における現在の研究の多くは、これらの変異体の

これは、\(h^2_g\)の二つの重要な機能を強調する価値があります。 まず、あるSnp”S”の集合に基づいて\(h^2_g\)を定義したことに気付くかもしれません。 実際には、このSnpのセットは、(a)観測されたSNPデータおよび(b)\(h^2_g\)を推定するために使用される方法に依存することになる。, これにより、異なる方法と異なる研究間で\(h^2_g\)の値を比較するのは難しくなりますが、ほとんどの場合、少なくとも一般的に発生するSnpを指すと 第二に、Snpによって説明される分散は、Snpが相関している他の遺伝的変異体の効果とは対照的に、それらの特定のSnpの効果を反映し得るか、または反映, これは、”説明された”分散の意味についての上記の私たちの以前の議論の延長に過ぎませんが、SNP遺伝率を他のタイプの遺伝的変異の因果関係を完全に除くものと誤解することは容易であるため、繰り返し述べる価値があります。

観測されたSnpから\(h^2_g\)を推定するために開発されたいくつかの異なる方法があります。 本当にありがとうございました\(⊙_⊙\)rl_, GREML(Genomic relatedness matrix REstricted Maximum Likelihood;gctaで一般的に実装されている)として知られている最初のアプローチは、Snpを使用して、ランダムな個体間の遺伝的類似性を推定し、それをその特性類似性と比較する。 これは、概念的には、上記の双子ベースの推定に類似しているが、直接関連していない個体からのSNPデータにおいて観察された低レベルの遺伝的類似性を あなたはここでより最近のレビューでここに統計の詳細について読むことが,

第二のアプローチは、ldscで実装された連鎖不平衡(LD)スコア回帰と呼ばれています。 これは、英国バイオバンクのデータセットに適用している方法です。 LDスコア回帰は、いくつかのSnpが他の遺伝的変異体と相関している(すなわち、LDでは他の遺伝的変異体と相関している)という重要な観察に依存し、SNPが他の変異体の効果に関する情報を”タグ付け”することを観察する。 基本的な考え方は、ゲノム全体にたくさんの小さな遺伝的効果が広がっている場合(すなわち, そして、各個々のSNPと形質との間の関係の強さは、SNPがタグ付けする総遺伝的変異の量に(平均して)比例するべきである。 LDスコア回帰法に関する統計的詳細は、ここにあります。

既知のSNP効果によって説明される分散

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です