エキソームシーケンシングとその意義
多数のヒト全ゲノム配列が決定され、個人間で相違する3百万個以上の一塩基多型(Single Nucleotide Polymorphism; SNP)が同定された。同定されたSNPは、エキソン内に存在するものは少なく、SNPの多くはイントロン部分や遺伝子間領域に存在する。これらSNPデータをもとにSNPタイピングアレイが開発され、GWAS(Genome-Wide Association Study)、すなわち疾患罹患性などの形質とSNPとの連関解析研究が行われてきた。1%以上の高頻度で観察されるSNPとは別に、個人に稀に見出される変異(Single Nucleotide Variation;SNV)も多数発見され、これらの成果をもとにした個別化医療や予防医療の実現に向けた取り組みが加速化している。
このような流れの中、次世代シーケンサーの発展に伴い、シーケンシングコストが急落したことから、個人のゲノム配列を決定することにより、エキソン部とmiRNAだけでなく、プロモーター領域などを含めた非翻訳領域(UTR)の中のSNVを同定することに高い関心が集まっている。その理由としては、GWASプロジェクトで同定された形質と連関するSNPの多くは原因変異でないので、真の原因SNVを見出すには、エキソンなど機能的に重要な領域の配列を調べる必要があることが挙げられる。さらに、SNPやSNVの情報をもとに、個人の形質を予測したり、検査したりするニーズが高まっているからである。このニーズを充足するためには、全ゲノムシーケンシングが理想的であるが、まだその価格は高く、普及するには時間がかかる。そこで、より安価なエキソームシーケンシングが注目を集めている。
|
従来のエキソームシーケンシングの方法と比較
現在使われているエキソームシーケンシング(Exome Sequencing)法は、ターゲットシーケンシング(Targeted Sequencing)法の一種で、ターゲット領域となるエキソン領域を含むDNAを濃縮する工程(Sequence Capture工程)、ならびに濃縮したエキソンDNA断片を次世代シーケンサーを用いて配列を決定する工程からなる。Sequenece Capture工程では、断片化した染色体DNAの両末端に次世代シーケンシング用のアダプターを付加し、さらに1本鎖にした後に、エキソン領域の配列を有するオリゴDNAまたはオリゴRNAとハイブリダイズさせることにより、エキソンDNA断片を濃縮する。 よく利用されているSequence Capture法としては、AgilentのSureSelect、NimbleGenのSeqCap EZ、およびIllumina TruSeq Exome (Enrichment Kit) が知られている。AgilentのSureSelectは、120 merのビオチン化オリゴRNAを用いてエキソンDNA断片をハイブリダイズさせた後、Streptoavidin-磁気ビーズを用いてエキソンDNA断片を濃縮する。 NimbleGenのSeqCap EZは、エキソンDNA断片の濃縮にオリゴDNAとのハイブリダイゼーション法を用いるが、AgilentのSureSelectと同様に、溶液状態でオリゴDNAとハイブリダイズさせる方法を用いることができるほか、マイクロアレイ上のオリゴDNAとハイブリダイズさせる方法も用いることができる。NimbleGenのSeqCap EZの特徴は、適切なハイブリダイゼーションが起こるように、オリゴDNAの長さを可変とし、かつ配列を必要に応じて重複させている点である。 IlluminaのTruSeq Exomeは、95 mer(固定長)のビオチン化オリゴRNAを用いてエキソンDNA断片をハイブリダイズさせた後、Streptoavidin-磁気ビーズを用いてエキソンDNA断片を濃縮する。 次世代シーケンシングの工程は、通常ターゲットとなるエキソーム領域の100倍量の配列を読む。通常のキットでは、50 Mbのターゲット領域があるので、約5 Gbの配列を得る必要がある。エキソームのターゲット領域としては、エキソン以外にmiRNA領域を含むことが標準となっており、これに加えてプロモーター領域を含むUTRを濃縮できるキットもある。単純には、より広い領域をカバーする方が良いと思われるが、ターゲット領域の総長を50 Mbから75 Mbにすると、シーケンシング価格が高くなるという欠点がある(Illumina HiSeqシーケンサーを用いた場合、1サンプルあたり3万円程度高くなると予想される)。 上記の3種類のSequence Capture法の比較であるが、AgilentのSureSelectとNimbleGenのSeqCap EZの2つが良く使われており、IlluminaのTruSeq Exomeは少し性能が劣る。AgilentのSureSelectの場合にはハイブリダイゼーション時間が24時間で終わるが、NimbleGenのSeqCap EZの場合には、ハイブリダイゼーション時間は3日間必要である。AgilentのSureSelectのエキソンの補足効率は、NimbleGenのSeqCapEZと比べて若干悪いが、実用上問題になるほどではない。実際、AgilentのSureSelectが最も利用されているキットと思われる。なお、上記3種類のいずれの方法も出発材料となるヒト染色体DNAの量は約1 μgを必要とする。 |
Ion AmpliSeq Exome Kit
上述のSequence Capture法によるエキソン領域の濃縮に対して、Life Technologiesが開発・発売した“Ion AmpliSeq Exome Kit”の場合には、Multiplex(多重化)PCR法を用いるDNA増幅により、各エキソン領域のDNAを濃縮する。具体的には、エキソンの両側(イントロン領域内)のプライマー対でエキソンを増幅するが、合計294,000対のプライマーセットを調製し、12個のプライマープールに分けて(12本のチューブに分けて)、エキソン領域を増幅している。増幅領域の選択については、33 MbのCCDS (Consensus Coding Sequences) に加えて、エキソンのFlanking regionも含む合計約58 Mbの領域を増幅するためのプライマー設計を行っている。出発材料となるゲノムDNA量は50~100 ngと、オリゴDNA/RNAを用いて捕捉する方法の1/20~1/10の量で済む。ゲノムDNAを出発材料としてシーケンシングサンプルの調製までの時間は6時間(以内)と驚くほど短い。 通常100倍の冗長度(×100)で配列決定を行うので、約10 Gbの配列出力を行えるPI チップの場合には、1チップあたり2サンプルのエキソームシーケンシングを行える。シーケンシングによって得られるエキソンカバー率は、×10で94%以上であるとLife Technologiesの資料に記載されている。 これまでに、Ion AmpliSeqキットのシリーズで、がん関連遺伝子のターゲットシーケンシングで、Multiplex PCR法で一度に400遺伝子以上を増幅できることは実証されていたが、今回発表されたエキソン増幅では、1反応で約25,000対のプライマーで対象領域を増幅できることになるので、驚くべき性能であると言えよう。 |
今後の展望
ナノポアシーケンサーの開発が進み、Sample-to-Answer型シーケンサーのように、得られたDNAをそのままシーケンシングすることにより、短時間でゲノムシーケンシングを実施できる可能性が出てきた。また、1000ドルゲノムシーケンシングも間もなく達成できる見込みであることから、エキソームシーケンシングから全ゲノムシーケンシングへの移行も期待されている。 ゲノムシーケンシングを医療やビジネスの現場で利用する場合、安く、早く、しかも精度よく目的領域をシーケンシングできることが望まれる。全ゲノムシーケンシングを行った場合、エキソームシーケンシングに比べると、同じ冗長度の配列を得るためには、50倍の量の配列を決定する必要がある。現在、ヒト全ゲノムシーケンシングでは、コストの理由などから、×30のシーケンシングが標準であるが、×30で均一にSNP・SNVを同定できるかについては疑問がある。早く結果を得るという観点からは、今回発売されたIon AmpliSeq Exome Kitを用いると、SNP・SNV同定を含めて2日間で解析が終了するので、早く結果を得るという目標も達成している。Ion AmpliSeq Exome Kitを用いたときの精度については今後明らかになるはずであるが、現在用いられている上述のSequence Captureキットと同じレベルの結果が得られることが期待される。 以上、エキソームシーケンシング法も進化しているので、将来もスタンダードなゲノムシーケンシング法として利用されていくであろう |