2012年2月21日火曜日

Oxford Nanoporeのナノポアシーケンサー、衝撃的デビュー!

 2月9日付のGOクラブで、「次世代シーケンサーの未来」としてナノポアシーケンサーに対する多数の予言と期待を述べたが、それらをすべて満たすOxford Nanopore Technologies(以下、Oxford Nanoporeと略す)のナノポアシーケンサーが、わずか11日後に発表された。驚くべき衝撃である。GOクラブでもOxford NanoporeのGridIONシーケンサーについて紹介したことがあるが、そのGridIONシーケンサーの性能は驚くべきものであった。さらに衝撃的なデビューは、MinIONと呼ぶシーケンサーである。今回のGOクラブでは、Oxford Nanoporeが今年後半に発売するこれら2種類のシーケンサーを紹介する。


シーケンシング原理とシーケンシング方法

(1) シーケンシング原理
 Oxford NanoporeのStrand Sequencingの原理は以前にも概要を説明したが、今年発売予定のシーケンサーで使われる原理は次の通りである。
以前は、脂質2重膜にタンパク質ナノポアを埋め込んだチップでシーケンシングする予定であったが、市販版はポリマー膜にタンパク質ナノポアを埋め込んだチップとなった。DNAがナノポアを通過するときのイオン電流の変化を検出することにより塩基を同定する。DNAがナノポアを通過する速度が速すぎるというナノポアシーケンシングの欠点は、酵素を利用してDNAの通過速度を制御することにより解決されているようであるが、その詳細は発表されていない。
(2) サンプル調製
 PCRなどによりDNA増幅やリンカー結合などのライブラリー調製作業も不要である。DNAが溶液状態であれば使えるだけでなく、血液中のDNAや環境中の水溶液中のDNAサンプルなどのある程度汚いサンプルでもそのまま配列決定可能である。また、DNAの末端構造によらずシーケンシングでき、DNAサンプルは2本鎖のままでよい。
(3) シーケンシング
 1個のポアあたり1秒間に20~400塩基解読できる。最大リード長は約100 kbで、エラー率は市販時には約1%となる予定である。これまで発売されたシーケンサーはリードが進むにつれて配列決定エラー率が上がるが、Oxford Nanoporeのナノポアシーケンシングでは、リード全体にわたってエラー率は変わらない。シーケンシングエラーの多くはdeletion errorである。メチル化シトシンとヒドロキシメチル化シトシンも読めるので、エピゲノム解析も直接行える。
(4) データ解析
 塩基配列はリアルタイムで出力され、ユーザは得られた塩基配列を同時に2次解析を行うことができる。したがって、ユーザが2次解析を行いながら、目的とする結果が得られるまでシーケンシングを続行できるという利点がある。

発売されるGridIONシーケンサーとMinIONシーケンサー

 大規模シーケンシングが行える“GridIONシーケンサー”とそのミニチュア版であるポータブル使い捨てシーケンサーである“MinIONシーケンサー”の2機種が発売される。特に、後者のMinIONシーケンサーは、これまでのシーケンサーの概念を覆す画期的なデバイスである。MinIONシーケンサーは、大型のUSBメモリー程度のデバイスであり、このデバイスをパソコンのUSBポートに差し込んだ後、サンプルをロードするだけで配列決定を行える。シーケンサーというより、デバイスという表現が正しいだろう。このデバイス以外に、データ解析用専用ソフトウェアをインストールすれば、大型シーケンサーを購入しなくても、どこでも簡単に配列決定を行える。

項目\シーケンサー
GridIONシーケンサー
MinIONシーケンサー
機器の概要クラスターコンピュータと同様に、1個のチップを持つシーケンシングデバイス(ノードと呼ぶ)を最大20ノード並列で動かせる。GridIONシーケンサのミニ版で、ポータブル使い捨てデバイス。パソコンのUSBポートに差し込んで利用する。
ナノポア数/チップ2000個(市販時)、>8000個(2013年)500個
リード長50 kb(現在)、100 kb(市販時)同左
エラー率4%(現在)、1%(市販時)同左
塩基配列出力量
数十Gb/日/ノード(市販時)
3 Tb/日/20ノード(2013年)
50 Gb/15分/20ノード(2013年)
数百Mb/時間
シーケンシング時間
数分~日
数分~6時間
シーケンシング・
カートリッジの寿命
数日約6時間
シーケンシング・コスト$25~$40/Gb(市販時)
$20~$30/Gb(2013年)
$1,500(ヒト全ゲノム解読)
約$1,000/Gb
シーケンサー価格$30,000/ノード$500~$900


ナノポアシーケンサーが他のシーケンサーに及ぼす影響

 上述のように、Oxford Nanoporeのナノポアシーケンサーは様々な点でこれまでの次世代シーケンサーを凌駕しているが、強いて欠点を挙げるならば、下記の4点であろう。
(欠点1) エラー率が1%と比較的高い。(欠点2) 配列エラー率と関係あるが、deep sequencing を行うことにより、頻度の低い変異を検出することが苦手かもしれない。(欠点3) 1チップのポア数が8,000個程度なので、億単位のリード数の配列を解読することは容易でないかもしれない。(欠点4) ヒト全ゲノム解析のコストが安いとはいえ、$1,500と予想されている。ここで、Oxford Nanoporeシーケンサーが持つこれら潜在的欠点を考慮して、Oxford Nanoporeシーケンサーが他のシーケンサーの存亡に及ぼす影響をGOクラブの分類に従って考察してみる。

(1) PacBio RSシーケンサーなどの第3世代シーケンサー
 ロングリードで1分子シーケンサーである第3世代シーケンサーは、ナノポアシーケンサーと類似した性能を有するが、ほとんどすべての点で、Oxford Nanoporeのナノポアシーケンサーより劣っていると思える。第3世代シーケンサーが生き残れる可能性は低くなったと思われる。

(2) Illumina HiSeq/GAシーケンサーなどの第2世代シーケンサー
 Oxford Nanoporeのナノポアシーケンサーが持つ潜在的欠点のうち、欠点(1)~(3)については、Illumina HiSeq/GAシーケンサーは若干優れているといえる。しかしながら、Oxford Nanoporeのナノポアシーケンサーのエラー率が1%であり、しかもエラーの多くがdeletion errorであり、ランダムに発生するであろうことを考慮すると、冗長度を大きくして配列決定すれば、それほどエラーについて気にする必要がないと予想される。欠点(2)であるdeep sequencingもそれほど問題にならないかもしれない。現段階で、1チップあたりのナノポア数が8,000個と少ないが、解読するDNAの長さを短くすれば、1個のポアあたりの配列決定数は増加するはずなので、欠点(3)も大きな欠点でなくなると思われる。蛍光イメージング型の第2世代シーケンサーは、データプロセシングへの負荷が重く、シーケンシング時間が長くなることが欠点であり、シーケンシングコストも高止まりするであろう。これらの考察から、ナノポアシーケンサーの登場は、第2世代シーケンサーの存亡に対して厳しい影響を与えると予測する。
 なお、GnuBIOの第2世代シーケンサーは、シーケンシングコストが安く、シーケンシング時間も短く、かつ配列決定精度が良い(1リードあたり99.97%)ので、ナノポアシーケンサーと共存する可能性を秘めていると思う。

(3) Ion Torrent シーケンサー(GOクラブでは第4世代に分類)
 Ion Torrent シーケンサーは、蛍光イメージングで生データ処理をせずに、半導体チップ内でデータを処理する点、第2世代シーケンサーよりも原理的に進歩している。CMOSチップの製造コストは最終的に1個あたり数百円にすることも可能であり、またセンサーの集積密度を向上させることも可能であるので、Ion Torrent シーケンサーは多くの点でナノポアシーケンサーより劣っているものの、シーケンシング・コスト、迅速性ならびに別原理のシーケンシング法という点で生き残れる可能性があろう。

(4) 総括
 ナノポアシーケンサーの登場は、人間の移動手段で言えば、内燃機関が発明され、自動車が登場した事例にも似ている。第1世代シーケンサーが「徒歩」であれば、第2世代シーケンサーの一部とIon Torrent シーケンサーのようなシーケンサーは「自転車」に相当し、将来も共存できる可能性がある。これまで登場したDNAシーケンサーはいずれもエラーが発生するので、精度高い結果を得るには、できる限り2種類以上の原理のシーケンサーによって配列を決定することが望ましい。さらに、Illuminaシーケンサーは広く利用され、実績があるので、しばらくの間、ナノポアシーケンサーと共存して利用されると予想する。しかしながら、GOクラブの次世代シーケンサーの分類でもリストアップしているが、多数のタイプのナノポアシーケンサーが開発されているので、将来は、サンガーシーケンサーとナノポアシーケンサーが広く使われる時代となると予測する。Illuminaも、LifeTechもナノポアシーケンサーの開発・発売を加速化するに違いない。