2011年12月13日火曜日

Ion PGMとIllumina MiSeqシーケンサーのPaired-EndとMate-Pair Sequencing

 Illumina MiSeqシーケンサー(MiSeq)の日本での出荷も始まり、いよいよIon Torrent PGM シーケンサー(PGM)との競争もデッドヒートしそうである。Illuminaのウェブサイトでは、MiSeqの方がPGMよりはるかに配列決定精度(Quality Value; QV)が優れているというデータを発表している。QVについてIlluminaはPredicted QVを使って比較しているが、PGMの場合、このQVが低く出るという特徴を持っている。PGMの精度が急速に向上している点、またEmpirical (経験的)QVでの比較を考慮すると、両者の配列決定精度については実用上は大差ないと思われる。GOクラブでは、両者の比較を過去に行っているが、Ion Torrentの318 Chipが登場する頃には、両者のパフォーマンスは同等となると予想される。
さて、今回のGOクラブでは、Ion Torrent PGMシーケンサーで、Paired-End SequencingMate-Pair Sequencingが可能になったことが発表されたので、MiSeqの方法と比較しながら紹介したい。


Paired-End Sequencing

 Paired-End Sequencingは、個々の短いDNA断片を両末端から読む方法である。両側からのリードが重複していれば、配列決定精度を向上させることができる。一方、DNA断片の長さが大きく、両側からのリードが重複しない場合には、後述するMate-Pair Sequencingに近い結果が得られる。
Illuminaシーケンサーではかなり前からPair-End Sequencingが可能であり、Illuminaのウェブサイトにその方法が公開されている。その方法を簡単に説明すると、DNA断片の両末端に異なるプライマーを連結してから、Bridge Amplificationを行うことにより、それぞれのプライマーから配列を読むことができるという原理である。
一方、PGM用のPaired-End Sequencing法も最近ウェブサイトに公開された。右図に示すように、
(ステップ1) 順(forward)方向の配列を読む。
(ステップ2) Ion ChipをPGMから取り外して、逆(reverse)方向の配列を読むために、順方向のDNA合成を完全に伸ばした後に、オリジナルのDNA鎖にニックを入れるとともに分解し、逆方向のプライマーを露出させる。
(ステップ3) このChipを同じPGMに入れてシーケンシング反応を行うことにより、反対鎖の配列を読むことができる。

Mate-Pair Sequencing

Mate-Pair Sequencingは、長いDNA断片の両末端をライブラリー構築によって接近させた後、それら両末端の配列を決定する方法である。一定距離だけ離れた場所の2つの配列を解明できることから、de novo sequencingや欠失・挿入などの大きなDNA構造の変化の解析に役立つ。

Illuminaシーケンサーのmate-pair sequencing法の概要は右図に示すとおりである。



一方、PGMのmate-pair sequencing法は454 FLXシーケンサーの方法と類似しており、長いDNA断片をcircularizeしたときに、リンカーDNAを挟んでその断片の両末端を連結するので、一回のリードで片端の配列、リンカーの配列、そしてもう一端の配列が同時に読める仕組みになっている。

PGMとMiSeqのPaired-End とMate-Pair Sequencingの比較

 PGMシーケンサーのPaired-End sequencingの性能を示すデータが一部しか公開されていないので、両者の性能を比較することは現時点では困難である。ただし、PGMのリード長が400~500 bpとなったことから、PGMの方が応用の範囲の点で有利と思われる。
PGMシーケンサーのMate-Pair Sequencingについては、10 kbライブラリーの例で優れた性能が開示されたことから、PGMシーケンサーの方が圧倒的に有利と思われる。特に、IlluminaのMate-Pair Sequencing法の場合、混入していくビオチンでラベルされていないDNA断片の配列を決定したときに、両末端の境目を記すリンカー配列がないことから、キメラリードとなってしまうことが大きな問題である。この問題は、de novo assemblyや構造変化の解析に大きな影響を及ぼすことになる。PGMシーケンサーのMate-Pair Sequencingは優れていると予想される。ただし、現時点では、これまで実績があり、かつ400 bp以上のリード長が得られる454 FLXシーケンサーのMate-Pair sequencingが最も優れていると言える