ヒトゲノムにおけるハプロタイプブロックとタグ一塩基多型の定義

Abstract

最近の研究では、ゲノムがハプロタイプのブロックに編成されていることが示唆されており、ゲノム全体の一塩基多型(Snp)のハプロタイプマップの作成がすでに進められています。 ハプロタイプブロックはアルゴリズム的に定義されており、現在までにいくつかのアルゴリズムが提案されている。 しかし、実際のデータでの相対的なパフォーマンスや、対立遺伝子の頻度とパラメータの選択がハプロタイプブロックとそれらをタグ付けするマーカーの検出に及ぼす影響についてはほとんど知られていません。 ここでは、二つの主要なアルゴリズム、リンケージ不平衡(LD)ベースの方法とダイナミックプログラミングアルゴリズム(DPA)、遺伝子content有量と組換え速度が異な この二つの方法は著しく異なる結果をもたらした。 DPAは、LD法よりも少ないと大きなハプロタイプブロックだけでなく、タグSnpの小さなセットを識別しました。 両方法では,結果は対立遺伝子の頻度に強く依存した。 マイナー対立遺伝子の頻度を減少させることは、ハプロタイプブロックおよびタグSnpの数の最大3.7倍の増加につながった。 HaploytpeブロックとタグSnpの定義もパラメータの変更に敏感でしたが、パラメータ調整だけでは結果を調整することはできませんでした。 これらの結果は,ハプロタイプブロックとタグSnpを検出するための二つの主要な方法が同じデータで異なる結果を生成することができ,これらの結果はマーカー対立遺伝子の頻度とパラメータの選択に敏感であることを示している。 ハプロタイプマップの開発における方法、マーカー対立遺伝子の頻度、およびパラメータの選択を導くためには、より多くの情報が必要である。

はじめに

全ゲノム連鎖不平衡(LD)マッピングは、複雑な形質の感受性遺伝子を検出するための強力なツールとして提案されている(1)。 最近の研究では、ヒトゲノムはハプロタイプのブロックに編成されていることが示唆されている(2,3)。 このゲノムアーキテクチャは、ハプロタイプパターンを十分に説明または”タグ”するSnpにタイプされる一塩基多型(Snp)の数を制限することにより、ゲノム全体のLDマ

ハプロタイプブロックとタグSnp(2,5–11)を識別するために、さまざまなアルゴリズムが提案されています。 しかし、実際のデータにおけるこれらの様々な方法の相対的な性能についてはほとんど知られていない。 いくつかのアルゴリズムの違いは何ですか? すべてのメソッドは同じ結論に達しますか、つまり、同じまたは少なくとも類似のhaplytpeブロックとタグSnpを識別しますか? 方法間の不一致をどのように解決するのですか? 最近、Schwartz e t a l. (12)異なるアルゴリズムによって割り当てられたブロック境界の重複を評価した。 彼らは、小さなサンプルでより顕著であった”異なるから導出されたブロック境界間の一般的に悪い一致”アルゴリズムを発見しました。 別の研究では、マーカー間隔が進化モデリング解析におけるハプロタイプブロックの予測された長さに影響を与えることを示した(13)。 また、ハプロタイプブロックのサイズはアルゴリズム依存であることが示されている(14)。 それでも、同じデータセット内の異なるアルゴリズムの性能を正式に研究する研究はなく、パラメータ設定または対立遺伝子頻度の影響を評価した研究

ここでは、ハプロタイプブロックを定義するための二つの主要な方法、GABRIELらによって提案されたLDベースの方法の正式な比較を提示します。 (5)およびZhang et al.によって開発された動的計画アルゴリズム(DPA)。 (10). これらの変数は、関連マッピングに重要であるため、以前の研究とは異なり、我々は、各方法によって同定されたhaloytpeブロックとタグSnpの数を比較しました。 我々は、任意に選択されたマイナー対立遺伝子頻度(q)しきい値に我々の分析を制限するのではなく、結果に対立遺伝子頻度の影響を解明するために、qのさまざ 最後に,パラメータの変更がブロック分割に及ぼす影響を調べた。 18q21.32-33(180kb)、33SNPs50人(CEPH創設者)で遺伝子型;22q13.31-32(811kb)、55SNPs91人(Wellcome Trust Sanger Instituteから得られたデータ)で遺伝子型;22q13.33(Ceph founders)で遺伝子型;22q13.31-32(811kb)で遺伝子型;91人(Wellcome Trust Sanger Instituteから得られたデータ)で遺伝子型;22q13.33(Ceph founders)で遺伝子型;22q13.33(Ceph founders)で遺伝子型;22q13.31-32(811kb)で遺伝子型;22q13.33(Ceph founders)で遺伝子型;22q13.33(Ceph founders)で遺伝子型;993kb)、同じ91個体で54snpで遺伝子型を決定した。 二つの方法は異なる結果を生じることが分かった。 DPA法は、LD法よりも少ない、より大きなハプロタイプブロックだけでなく、少ないタグSnpを一貫して同定した。 どちらの方法でも,ハプロタイプブロックとタグSnpの同定はマーカー対立遺伝子の頻度に非常に敏感であった。 両方の方法はパラメータ選択に敏感であったが、LD法はDPA法よりもこの点で敏感ではなかった。 パラメータ調整だけでは,方法間の一致は実質的に改善されなかった。 これらの結果は,ハプロタイプマップとタグSnpを検出するための二つの主要な方法が同じデータで異なる結果を生成することができ,これらの結果はマーカー対立遺伝子の頻度とパラメータの選択に敏感であることを示している。

結果

三つの領域のそれぞれについてLDの異なるパターン(補足資料、図。 1)

ペアワイズLDのパターンは、研究された三つの領域間で変化した。 22q13.33では、22q13.31-32の隣接領域(平均D’=0.35)よりも高く、より拡張されたレベルのLD(平均D’=0.35)が見られます。これは、組換えの既知の違いに一致する。 LDのこの差は、より高いqしきい値とサブセットを比較するときにも保持されます。 18q22上の領域は、LDの拡張と強いレベルを示した(平均D’=0.58)。 補足データ図1は、さまざまなqしきい値について、調査した三つの領域の全体的なLD分布を示しています。

DPAは、LD法よりも少ないハプロタイプブロックとタグSnpを識別します(図。 1)

両方のアルゴリズムによるハプロタイプブロックの分割とタグSnpの同定の結果を図1に示します。 正確なブロック分割とハプロタイプブロックの物理的な長さを含む詳細な結果は、補足資料、2-7に示されています。 詳細なブロック分割の結果から、用語「ブロック」を少なくとも2つのSnpを含むゲノム伸張に限定しないことがわかる:ブロックはまた、単一のSNPによ

すべての領域およびすべてのレベルのqについて、DPAはLD法よりも一貫して少数のハプロタイプブロックおよびタグSnpを同定した。 例えば、染色体18q21.32-33では、q≥0である。01、DPAは11Snpによってタグ付けされた六つのハプロタイプブロックを検出し、LD法は19ブロックおよび15タグSnpを同定した。 したがって、DPAによって呼び出されるハプロタイプブロックは、LD法によって呼び出されるものよりも大きい。 例えば、染色体18q21.32–33では、q≥0.01で、DPAはLD法のための0.8-26.4kbの範囲と比較して、4.9と77.6kbの長さのブロックを同定した。

ブロック分割は、マーカー対立遺伝子の頻度に大きく依存する(図。 1)

両方の方法について、ブロック分割およびタグSnpの識別は、適用されるq閾値に依存した。 元のデータセットから稀なSnpを徐々に省略することによってqを増加させると、同定されたハプロタイプブロックおよびタグSnpの数が減少した。 ハプロタイプブロックは、q≤0.01からq≤0.41の範囲にわたって着実に減少した。 タグSnpの数は、q=0. 1および補足資料、2-7)。

ハプロタイプブロックおよびタグSnpの同定は、主要なパラメータに敏感である(補足資料1-7、図。 2)

キーパラメータの変動は、両方の方法の結果に影響を与えました。 全ての3つの染色体領域について、dpaによって同定されたtag Snpの数は、α(=β)のレベルの増加とともに増加した(図2A〜Cおよび補足材料、2〜4)。 同定されたハプロタイプブロックの数もαのレベルに依存したが、単調な関係を識別することはできなかった(補足資料、2-4)。 LD法は信頼限界のしきい値の変化に対して非常に無感覚であることが分かった。 18q上の領域については、低下した閾値と上昇した閾値の両方について同じ結果が得られた。 染色体22上の二つの領域については、ハプロタイプブロックとタグSnpの数は、それぞれ、デフォルト、上昇、および低下したしきい値の間で少し変化し 我々がテストしたパラメータの構成は、二つの方法の間の結果の違いを調整することはできませんでした。

ディスカッション

ハプロタイプブロックのアルゴリズム検出は、系統的かつ効率的な方法でジェノタイピングの努力を合理化するためのツールである(15)。 ハプロタイプブロック分割アルゴリズムは、ゲノム全体の関連マッピングのために持っていると考えられていることの重要性を考えると、我々はこれまで十分に対処されていないいくつかの実用的なが、重要な質問に対処したかったです。 ハプロタイプブロックとタグSnpの同定に関して、異なるアルゴリズムはどのように比較されますか? マーカー対立遺伝子の頻度の選択は、ブロックの分割にどのような影響を与えますか? パラメータ設定の変更に対する結果の機密性はどの程度ですか? LDと遺伝子含量のパターンが異なるヒトゲノムの三つの領域におけるハプロタイプブロック分割のための二つの主要な方法を比較した。 すべての三つの領域について、我々は、DPAは一貫してLD法よりも少ないハプロタイプブロックとタグSnpを同定したことを観察した。 さらに,ブロックとタグSnpの同定はマイナー対立遺伝子の頻度に批判的に依存した。 どちらの方法もパラメータ選択に完全に鈍感ではなかったが,パラメータ調整だけでは結果を調整することはできなかった。

主要なハプロタイプにタグを付けるマーカーの減少セットを利用することにより、ゲノム全体の関連研究を体系的に行うことができることが提案されている(16)。 この提案は、ゲノムが明らかにハプロタイプ(2,3)のブロックに編成されているという観察から続く。 これらのブロックをアルゴリズム的に識別するための多数の方法が提案されている(2,5–11)。 それでも、多くの不確実性が持続する(17)。

我々が研究した二つの主要なブロック分割アルゴリズムは、ハプロタイプブロックとタグSnpの同定において非常に異なった挙動を示した。 これは単に校正の問題ではありません。 これらの結果は,パラメータを調整することによってこれらの大きな違いを修正できないことを示した。 さらに,その差は一つの染色体領域に限定されただけでなく,全体的な組換え速度と遺伝子含量が異なる三つの領域のそれぞれに明らかであった。

私たちの小さな研究領域のタグSnpの数の絶対的な違いは大きくないように見えるかもしれません。 しかし、ゲノム全体のレベルでは、それらは、遺伝子型化されるタグSnpの数においてより実質的な差異に達する可能性がある。

タグSnpの同定は、領域または全ゲノムを十分にカバーするために必要な遺伝子型決定の努力についてのアイデアを与えることを意味し、ハプロタイプブロックの同定は、ゲノムのどれだけサンプリングされているかを与えることができる。 両方とも、全ゲノム関連マッピングまたは関心領域の焦点を当てたファインマッピングを目指すときにも同様に重要です。 したがって、理想的には、ブロック分割アルゴリズムがこれらの重要な特徴に同意することを望むでしょう。 我々の比較から、異なる方法とマーカー対立遺伝子の頻度が非常に異なる結果を与えることがわかります。

メソッド間のこれらの違いはどのように説明できますか? ハプロタイプブロックを組換えホットスポットによって中断された多様性の低いゲノム領域とうまく描写されたゲノム領域と考えると、異なるブロッキングアルゴリズムが同様の数のブロックとタグSnpを検出すべきであると信じるように導かれる。 しかし、実際の状況はより複雑であるように見えます。 組換えの局所的な違いは、ゲノム(2,5,18)のハプロタイプブロック構造の背後にある主要な力であると仮定されている。 この仮説は、精子(19,20)の組換え頻度の推定に続いて、高分解能LD研究によってサポートされていた:強いLDのストレッチ内のLD内訳の領域は、組換えホッ しかし,このようなホットスポットがブロック構造を説明するために必要であるという概念は最近挑戦されている。 Phillipsらによる研究。 (13)は、ハプロタイプブロックは、自然選択、集団ボトルネック、集団混和、マーカー間隔の選択および対立遺伝子頻度など、組換え以外の要因によって生じ得ることを示唆している。 シミュレーション研究では、Zhang et al. (21)ハプロタイプブロックは、組換えホットスポットまたは最近の人口のボトルネックの非存在下でも観察されたことを示した。 さらに,遺伝的ドリフトはブロックのようなパターンを生成することも示した。 したがって、著者らは、複数の民族グループで研究が行われるまで、ハプロタイプマップの世界的な適用性に対して警告した。 StumpfとGoldstein(22)も同様の結論に達しました。 基礎となる進化過程に関するこれらの不確実性に照らして、Schwartz et al. (12)メソッド間の違いは、ブロック概念の不完全な性質の直接的な結果とみなされる可能性があると結論づけます。

本研究の主な焦点は、分割アルゴリズムの結果に対するマイナー対立遺伝子頻度(q)の影響を評価することでした。 文献から、我々はゲノム全体のハプロタイプマップ(2,5,9)に必要なタグSnpの数の推定値に大きな不一致があることがわかります。 これらすべての推定値が異なるアルゴリズムによって導出されるという事実とは別に、1つの問題は非常に見落とされています: それぞれのサンプルで表されるqの範囲を示す。 Dalyら。 (2)q>0.05で使用されたSnp、Patil et al. (9)q>0.1を有するSnpのみを含み、Gabriel et al. (5)q>0.2のさらに高いしきい値を適用しました。

私たちの知る限りでは、ブロック分割アルゴリズムに対するqの影響は正式には対処されていません。 我々のデータから、識別されるブロックおよびタグSnpの数は、qに対するしきい値に強く依存することがわかる:しきい値が低いほど、タグSnpの数が高 まれな原因となる多型は”一つまたはいくつかの共通のハプロタイプバックボーンに見られる傾向がある”ため、ハプロタイプマップの生成は”10または20%以下のマイナーな対立遺伝子頻度を有するSnpまたはハプロタイプを無視する”ことができると主張されている(23)。 私たちのデータに基づいて、私たちはそのようなアプローチは危険かもしれないと信じています。 一般的なハプロタイプブロックは、あまり一般的でない変異体を自動的に包含しない場合があります。 例えば、ハプロタイプブロック内のLDは、ブロック内でさえLDが物理的距離で減衰することがあるので、完全ではないことがある(2 4)。 完全なLDのシナリオの下でさえ、高周波タグSnpは、特により小さなサンプルサイズ(25,26)で、必ずしもまれな変異体をキャプチャしないかもしれません。

DPAのタグSnpの同定は、ハプロタイプブロックの描写と密接に関連していることを指摘したいと思います。 これは、タグSnpが属するハプロタイプブロックに基づいてタグSnpを定義することの必要な結果である。 LD法の場合、これはそうではありません。 実際には、Gabriel et al. (5)タグSnpの定義のためのアルゴリズムを提供しませんでしたが、排他的にハプロタイプブロックに焦点を当てました。 方法間の比較を可能にするために、我々は、LD法によって識別されたブロック内のハプロタイプをタグ付けするSnpを決定するために、DPAからのタグSNP定義 しかしながら、タグSnpの同定は、haplytpeブロックの事前の同定に必ずしも依存しない。 明確に定義された物理的に小さな観察単位、例えば遺伝子の場合、タグSnpは、Johnson e t a l.,Nature3 2 5:4 2−4 3(1 9 9 6)によって実証されるように、ハプロタイプブロックの事前決定 (6). しかし、このようなアルゴリズムは、すべてのハプロタイプが一意であるため、非常に長い領域に直接適用することはできません。 最近、Meng et al. (27)スライディングウィンドウベースのアルゴリズムを用いて、ハプロタイプブロックから独立してタグSnpを定義するアプローチを導入した。 関連研究のための異なるアルゴリズムを用いて同定されたタグSnpの有用性を比較するためにはさらなる研究が必要である。

ハプロタイプマップの生成を高周波Snpに制限することは問題であると考えています。 そのようなアプローチはより少なく、より大きいブロックおよびより低いgenotyping努力をもたらすかもしれません。 しかし、これは、ゲノム構造を適切に特徴づけない人工的にまばらなマップを犠牲にして来るかもしれない(13,17)。

私たちの研究は、ブロック分割の結果に対する方法、パラメータおよび対立遺伝子頻度の影響を評価することを目的としています。 比較のために2つの方法しか選択しなかったことを考えると、私たちの結論は制限され、他のアルゴリズムに譲渡できない可能性があります。 しかし、現存する方法のほとんどは互いに関連している。 そこで、私たちは、重要な原則が異なり、共通のアプローチの範囲にまたがる傾向がある二つの方法を検討することにしました。 さらに、異なるゲノム背景(すなわち、組換え速度、遺伝子含有量)上の方法の性能をテストするために三つの染色体領域を選択しました。

我々のデータは、ハプロタイプブロックの計算同定は、アルゴリズム依存性と対立遺伝子の頻度に敏感なままであることを示しています。 現時点では、誰もアルゴリズムが決定的と考えることはできません。 これらのアルゴリズムは、異なる目的に基づいて開発されました。 DPAの主な目的は、関連研究のためのタグSnpを使用してジェノタイピングの努力を最小限に抑えることです; ハプロタイプブロックは、この目的を達成するためのツールとして使用されました。 一方、Gabrielらの目的は、Gabrielらの目的は、Gabrielらの (5)ハプロタイプブロックを使用して高LD領域を識別することであった;タグSnpはブロック分割のために使用されませんでした。 調査の目的に応じて、異なるブロック分割アルゴリズムを適用する必要があります。 この点で、一般的なハプロタイプとタグSNPマップの作成は、普遍性の野心に追いつくために、いくつかのアルゴリズムを並行して使用する必要があ 現在の段階では、どのアルゴリズムも”すべての目的”のハプロタイプブロックまたはタグSnpを提供するとは言えません。 このような特徴の解釈は、使用される特定のアルゴリズムおよび所与の研究の目的の範囲内でなければならない。 ‘All-purpose’ハプロタイプブロックマップおよびタグSNPセットは存在しない可能性があります。 「ゲノムにおける組換えと不平衡のパターンについての我々の理解はまだ限られている」、「離散ブロックの概念はおそらく連鎖不平衡の複雑さを説明するには硬すぎるだろう」(28)ということを考えると、今後の研究では、LDのグローバルなゲノム組織を記述するアプローチ(すなわち、ハプロタイプのブロックを識別するマップ)に焦点を当てるべきか、むしろハプロタイプブロックの概念とは独立してタグSnpを識別するアルゴリズムを開発する必要がある。

材料と方法

染色体領域とサンプル研究

染色体18q21.32-33、22q13.31-32、および22q13.33の三つの染色体領域から得られたデータを用いて分析を行い、それぞれが完全に配列決定され、Snpで特徴付けられた。

18番染色体上の領域は、180kbのコンティグで構成され、33のSnpで5kb以下の中央密度で特徴付けられた完成配列である(使用されたSnpのリストについては、補足資料1を参照)。 ジェノタイピングは、ユタ州とフランスのセフの血統コレクションから50の無関係な創始者の個人で行われました(www.cephb.fr;遺伝子型決定手順については、以下を参照してください)。 Golden Path UCSC Genome browserの2002年11月のビルド(http://genome.ucsc.edu/cgi-bin/hgGateway)によると、この領域の平均組換え率は1.3〜1.9cM/Mbと推定され、遺伝子含量は低い(ゲノムブラウザの「既知」および「RefSeq」トラッ

22番染色体上の二つの領域については、ウェルカムトラストサンガー研究所から公に入手可能なデータを取得しました(www.sanger.ac.uk/HGP/Chr22/). データは、英国から91人の個人で構成され、サンプルの特性および遺伝子型決定手順は、他の場所(29)に記載されています。 染色体22q13.31–32上の領域は、≥10kbの中央密度で55Snp(rs1009783-rs132231)で特徴付けられる811kbで構成されています。 平均組換え率は2.5と2.8cM/Mbの間にあり、遺伝子含量は研究された三つの領域の中で最も低い(ゲノムブラウザの”既知”および”RefSeq”トラックによると、Mbあたり1.2遺伝子)。 領域22q13.33は993kbで構成され、54KbのSnp(rs139777–TSC0100622)が≥9kbの中央密度で特徴づけられる。 この領域は、分析された3つの領域の中で最も高い遺伝子含量を示しています(ゲノムブラウザの「既知」および「RefSeq」トラックによると、Mbあたり34.2遺伝子)。 平均再結合率は非常に低い。

ジェノタイピング(18q21.32-33)

ジェノタイピングは、蛍光偏光検出(FP-TDI)(30)とテンプレート指向色素ターミネーター取り込みを使用して行われました。 詳細なプロトコルは他の場所で提示されています(31)。

Minor allele頻度(q)の閾値を使用

当社では、クライアント様の利益のた性能を評価するためには、ブロック分割アルゴリズムを種々の閾値のq. このようにしました七つのサブセットの解析から明らかなように、本発明のオリジナルデータを設定し、以下のq値により段階的に除Snp q値の閾値:q≥0.01(つまり、オリジナルサンプルを含むすべてのSnp)、q≥0.04q≥0.1q≥0.19、q≥0.25q≥34q≥0.41.

SNP間LDの計算

標準化されたLD係数D'(32)で表されるように、三つの領域についてのペア単位のSNP間LDの計算は、金のldmaxオプションを使用して計算されまwww.sph.umich.edu/csg/abecasis/GOLD/)(33) これは、期待最大化(EM)アルゴリズムによって推定されたハプロタイプ頻度を使用し、位相のないデータ(34,35)で良好に機能することが示されている。

ブロック分割

ハプロタイプブロックを定義するための二つの主要な方法、動的計画法アルゴリズム(DPA)(10)とD’(5)に基づく方法、以降LD法と呼ばれる。 この方法は、元の論文で詳細に説明され、以下に簡単に要約されています。

DPA

ハプロタイプは、分割結紮EMアルゴリズム(36)を介して推論される。 続いて、得られたハプロタイプをブロックに分割するためにDPAが適用される。 一般的なハプロタイプは、ブロック内で複数回表現されるハプロタイプとして定義されます。 最終ブロック分割では、連続するSnpのサブセットは、共通のハプロタイプがそのブロック内のすべての推定ハプロタイプの少なくともαパーセント(「 DPAは、ブロック内のハプロタイプの少なくともβパーセントを区別するSnp(すなわち、タグSnp)の数を最小化することを目的とする。 LD法との主な比較のために、DPA(10)の元の研究に沿って、α=β=0.80を設定しました。 パラメータ設定の影響をさらに評価するために、我々はまた、他のαおよびβ値(0.7、0.75、0.85、0.9および0.95)

LD法

D’Snpのすべてのペアの値を計算し、分散を推定した(37)。 我々は、ブートストラップベースの分散推定値を正規近似に置き換えた、前述のLD法(5)の修正バージョンを使用しました。 シミュレーションは、この修正された方法は、はるかに少ない計算時間(38)とブートストラップ法と同様の信頼区間を与えたことを示した。 Snpのペアは、D’の片側上部95%信頼限界が0.98より大きく、下限が0.7より大きい場合、”強い”LDであると考えられました。 上限が0.9未満のペアについては、”低”LDが想定されていました。 次いで、ハプロタイプブロックを、SNP対の5%未満が低レベルのLDを示した領域として定義した。

LD法にはタグSnpを定義するアルゴリズムが含まれていないため、DPAと同じ基準を使用しました(上記参照)。

パラメータ設定の影響を評価するために、より厳しい基準(D’>0.99および下限>0.75の上限として定義される’strong’LD)と、より厳しい基準(上限>0.96および下限>0.65) 詳細なブロック定義基準については、補足資料1を参照してください。

補足資料

補足資料はHMGオンラインで入手できます。

謝辞

エドワードF国立精神衛生研究所からの助成金によってサポートされています。 Mallinckrodt Jr財団、シカゴ脳研究所、および統合失調症およびうつ病に関する研究のための全国同盟(Young Studenters Awards to T.G.S.and Y.S.C.)。 KzおよびFsは、National Institutes o f Health(NIH P5 0H G0 0 2 7 9 0)からの助成金によって支持された。 私達はWellcome Trust Sangerの協会からの染色体22の遺伝子型の取得のGonçalo Abecasisからの助けを感謝して認めます。

図1. 対立遺伝子の頻度の影響。 図は、小対立遺伝子(q)頻度のために選択された閾値と、それぞれ同定されたハプロタイプブロック(A)およびタグSnp(B)の数との間の関係を示す。 LD法とDPAの両方について結果を示した。

図1. 対立遺伝子の頻度の影響。 図は、小対立遺伝子(q)頻度のために選択された閾値と、それぞれ同定されたハプロタイプブロック(A)およびタグSnp(B)の数との間の関係を示す。 LD法とDPAの両方について結果を示した。

図2. パラメータの変更の影響。 選択されたパラメータと、LD法の同定されたタグSnpの数と、マイナー対立遺伝子(q)頻度の選択された閾値におけるDPAとの間の関係。 (A–C)DPA、パラメータα(=β)は0.7と0.95の間で変化した。 (D–F)LD法では、D’の信頼限界が低下し、上昇し、解析はβレベル0.8で行われた。

図2. パラメータの変更の影響。 選択されたパラメータと、LD法の同定されたタグSnpの数と、マイナー対立遺伝子(q)頻度の選択された閾値におけるDPAとの間の関係。 (A–C)DPA、パラメータα(=β)は0.7と0.95の間で変化した。 (D–F)LD法では、D’の信頼限界が低下し、上昇し、解析はβレベル0.8で行われた。

1

Risch,N.(

2000

) 複雑な疾患における遺伝子の探索:全身性エリテマトーデスからの教訓。

投資

,

105

,

1503

-1506.

2

Daly,M.J.,Rioux,J.D.,Schaffner,S.F.,Hudson,T.J.and Lander,E.S.(

2001

) ヒトゲノムにおける高分解能ハプロタイプ構造。

ジュネット

,

29

,

229

–232.

3

Taillon-Miller,P.,Bauer-Sardina,I.,Saccone,N.L.,Putzel,J.,Laitinen,T.,Cao,A.,Kere,J.,Pilia,G.,Rice,J.P.and Kwok,P.Y. (

2000

) ヒトXq25およびXq28における広範かつ最小限の連鎖不均衡の並置領域。

ジュネット

,

25

,

324

–328.

4

張、K.、Calabrese、P.、Nordborg、M.およびSun、F.(

2002

) ハプロタイプブロック構造とその関連研究への応用:パワーと研究デザイン。

J.ハム ジュネット

,

71

,

1386

–1394.

5

Gabriel,S.B.,Schaffner,S.F.,Nguyen,H.,Moore,J.M.,Roy,J.,Blumenstiel,B.,Higgins,J.,DeFelice,M.,Lochner,A.,Faggart,M.et al. (

2002

) ヒトゲノムにおけるハプロタイプブロックの構造。

サイエンス

,

296

,

2225

-2229.

6

Johnson,G.C.,Esposito,L.,Barratt,B.J.,Smith,A.N.,Heward,J.,Di Genova,G.,Ueda,H.,Cordell,H.J.,Eaves,I.A.,Dudbridge,F.et al. (

2001

) 共通の病気の遺伝子の同一証明のためのハプロタイプの付くこと。

ジュネット

,

29

,

233

–237.

7

Koivisto,M.,Perola,M.,Varilo,T.,Hennah,W.,Ekelund,J.,Lukk,M.,Peltonen,L.,Ukkonen,E.and Mannila,H.(

2003

) ハプロタイプブロックを見つけ、ハプロタイプブロック境界の強度を推定するためのMDLメソッド。

Pacific Symposium on Biocomputing

,pp.

502

–513.

8

とができるようにすることを目的としています。 (

2003

) 最小記述長ブロックファインダは、ハプロタイプブロックを識別し、ブロック境界の強さを比較する方法である。

J.ハム ジュネット

,

73

,

86

–94.

9

Patil,N.,Berno,A.J.,Hinds,D.A.,Barrett,W.A.,Doshi,J.M.,Hacker,C.R.,Kautzer,C.R.,Lee,D.H.,Marjoribanks,C.,McDonough,D.P.et al. (

2001

) 限られたハプロタイプ多様性のブロックは、ヒト染色体21の高解像度スキャンによって明らかにした。

サイエンス

,

294

,

1719

-1723.

10

Zhang,K.,Deng,M.,Chen,T.,Waterman,M.S.およびSun,F.(

2002

) ハプロタイプブロック分割のための動的計画アルゴリズム。

ナトル-アカデミー所属。 サイ… アメリカ

,

99

,

7335

-7339.

11

Zhang,K.およびJin,L.(

2003

) HaploBlockFinder:ハプロタイプブロック解析。

バイオインフォマティクス

,

19

,

1300

-1301.

12

シュワルツ,R.,Halldorsson,B.V.,Bafna,V.,Clark,A.G.and Istrail,S.(

2003

) ハプロタイプブロック構造の推論のロバスト性。

バイオル

,

10

,

13

–19.

13

Phillips,M.S.,Lawrence,R.,Sachidanandam,R.,Morris,A.P.,Balding,D.J.,Donaldson,M.A.,Studebaker,J.F.,Ankener,W.M.,Alfisi,S.V.,Kuo,F.S.et al. (

2003

) ハプロタイプブロックの染色体全体の分布と組換えホットスポットの役割。

ジュネット

,

33

,

382

–387.

14

張、W.、Collins、A.、Maniatis、N.、Tapper、W.およびMorton、N.E.(

2002

) リンケージ不平衡(LD)マップのプロパティ。

ナトル-アカデミー所属。 サイ… アメリカ

,

99

,

17004

-17007.

15

Zhang,K.,Sun,F.,Waterman,M.S.およびChen,T. (

2003

) 限られたリソースとヒト染色体21ハプロタイプデータへの応用を持つハプロタイプブロックパーティション。

J.ハム ジュネット

,

73

,

63

–73.

16

コリンズ、F.S.および緑、E.D.(

2003

) ゲノミクス研究の未来のためのビジョン。

自然

,

422

,

835

-847.

17

カールソン、C.S.、Eberle、M.A.、Rieder、M.J.、Smith、J.D.、Kruglyak、L.およびNickerson、D.A. (

2003

) ヒトにおける全ゲノム関連研究には、追加のSnpおよび連鎖不平衡解析が必要である。

ジュネット

,

33

,

518

–521.

18

ゴールドスタイン、D.B.(

2001

) リンケージ不均衡の島。

ジュネット

,

29

,

109

–111.

19

Jeffreys,A.J.,Kauppi,L.And Neumann,R. (

2001

) 激しく主要な組織適合遺伝子複合体のクラスII領域における減数分裂組換えを句読点。

ジュネット

,

29

,

217

–222.

20

Jeffreys,A.J.,Ritchie,A.And Neumann,R.(

2000

) ヒトTAP2組換えホットスポットにおけるハプロタイプ多様性と減数分裂クロスオーバーの高分解能解析。

モル ジュネット

,

9

,

725

–733.

21

張,K.,Akey,J.M.,Wang,N. とができます。(

2003

) ランダムに分布したクロスオーバーは、連鎖不平衡のブロックのようなパターンを生成することができる:遺伝的ドリフトの行為。

ジュネット

,

113

,

51

-59.

22

とができます。(

2003

) 人口統計学、再結合ホットスポット強度、および連鎖不平衡のブロック構造。

バイオル

,

13

,

1

–8.

23

ジャドソンR. とができるようになることを期待しています。(

2002

) ゲノム全体のハプロタイプマップにはいくつのSnpが必要ですか?

ファーマコゲノミクス

,

3

,

379

-391.

24

とができるようにすることを目的としています。(

2003

) 集団間のヒトゲノムの連鎖不平衡パターン。

モル ジュネット

,

12

,

771

–776.

25

Risch,N.およびMerikangas,K. (

1996

) 複雑な人間の病気の遺伝学的研究の未来。

サイエンス

,

273

,

1516

-1517.

26

マッギニス,R.,Shifman,S.And Darvasi,A.(

2002

) TDTの力そして効率および連合スキャンのための場合制御の設計。

ジュネット

,

32

,

135

–144.

27

Meng,Z.,Zaykin,D.V.,Xu,C.F.,Wagner,M.and Ehm,M.G. (

2003

) 連鎖不平衡とハプロタイプを用いた関連解析のための遺伝子マーカーの選択。

J.ハム ジュネット

,

73

,

115

–130.

28

Cardon,L.R.And Abecasis,G.R.(

2003

) ハプロタイプブロックを使用して人間の複雑な形質遺伝子座をマッピングする。

,

19

,

135

–140.

29

Dawson,E.,Abecasis,G.R.,Bumpstead,S.,Chen,Y.,Hunt,S.,Beare,D.M.,Pabial,J.,Dibling,T. ら,tinsley,E.,Kirby,S.et a l. (

2002

) ヒト染色体22の第一世代連鎖不平衡マップ。

自然

,

418

,

544

-548.

30

とができるようになりました。(

1999

) 同質な核酸の分析の蛍光性の分極。

,

9

,

492

-498.

31

とができるようにすることを目的としています。 (

2002

) 有用性と一塩基多型のジェノタイピングのための蛍光偏光検出とテンプレート指向の色素ターミネーターの取り込みの精度。

バイオテクノロジー

,

32

,

1072

-1076.

32

レヴォンチン(

1964

) 選択とリンケージの相互作用。 I.一般的な考慮事項;ヘテロティックモデル。

,

49

,

49

-67.

33

Abecasis,G.R.and Cookson,W.O. (

2000

) ゴールド-リンケージ不平衡のグラフィカルな概要。

バイオインフォマティクス

,

16

,

182

-183.

34

Dempster,A.P.,Laird,N.M.and Rubin,D.B.(

1977

) EMアルゴリズムを介した不完全なデータからの最尤。

Soc. サー B

,

39

,

1

-38.

35

Excoffier,L.およびSlatkin,M. (

1995

) Maximum-likelihood estimation of molecular haplotype frequencies in a diploid population.

Mol. Biol. Evol.

,

12

,

921

–927.

36

Qin, Z.S., Niu, T. and Liu, J.S. (

2002

) Partition–ligation expectation-maximization algorithm for haplotype inference with single-nucleotide polymorphisms.

Am. J. Hum. Genet

,

71

,

1242

–1247.

37

Zapata, C., Alvarez, G. and Carollo, C. (

1997

) ゲーム的不平衡D’の標準化された尺度のおおよその分散。

J.ハム ジュネット

,

61

,

771

–774.

38

Kim,S.K.,Zhang,K.およびSun,F.(

2004

) 連鎖不平衡尺度D’の信頼区間を計算するためのさまざまな戦略の比較。

バイオコンピューティングに関する太平洋シンポジウム

(プレス)。

コメントを残す

メールアドレスが公開されることはありません。