2012年5月9日水曜日

Nature Biotech誌の論文をもとにナノポアシーケンシングの欠点を考察する

 Oxford Nanopore Technologies (Oxford Nanopore) が、今年2月17日にナノポアシーケンサーを今年中に発売することを発表したが、そのシーケンシング技術を科学的に裏付けるデータや論文を発表していない。一方、AkesonらのグループGundlachらのグループがそれぞれタンパク質ナノポアを用いてシーケンシングが行えることを実証した論文をNature Biotechnology誌4月号に発表した。今回のGOクラブでは、これら論文のエッセンスを紹介するとともに、論文のデータからナノポアシーケンシング技術の欠点について考察してみたいと思う。

Nature Biotech誌の論文に発表された成果

 AkesonらのグループGundlachらのグループが開発した技術の原理をそれぞれ下図AとBに示す。両者の主な違いは、前者はα-Hemolysinを、そして後者は(変異を導入した)Mycobacterium smegmatis porin A (MspA)をタンパク質ポアとして用いている点である。
ナノポアシーケンシングでは、DNAのナノポア移動速度が速すぎて塩基配列を読み取れないという大きな問題があったが、Akesonらのグループは、phi29 DNAポリメラーゼ(DNAP)をDNAを移動させるモーターとして用いることにより、その移動速度を約10000万の1に減少できることを見出し、この問題を解決した。
長さ100塩基未満の被験1本鎖DNA(ssDNA;下図の青)にPrimer(水色)をアニールすると、phi29 DNAP(ピンク)が結合できるが、DNAタンパク質ポア(灰色)に入る前に、phi29 DNAPによるDNA合成またはDNA切除(分解)が起こってしまう。そこで、Akesonらのグループは、Blocking Oligomer(赤)をアニールさせることにより、DNA合成/削除を阻止する方法を開発した。Blocking Oligomerの5'側は被験1本鎖DNAと相補性を有するが、3'側の7残基は塩基を持っていないので被験1本鎖DNAと対合しない。
脂質2重膜Lipid Bilayer;下図の黄緑)の上下(trans側が+、cis側が-)に電圧をかけると、マイナス電荷を有するDNAタンパク質ポアを通り、下方に向かって移動する(Voltage-driven Unzipping)。2本鎖DNAが解きほぐれ、Blocking Oligomerが完全に離れると、Primerの3'末端が露出するが、dNTPとMg+イオンが存在するとDNA合成が始まるために、被験1本鎖DNAは上方に吊り上げられ(ratchet)、逆方向に移動する(Replication-driven Ratcheting)。


脂質2重膜の上下の槽はKCl水溶液で満たされているが、電圧をかけるとイオン電流が流れる。タンパク質ポアのくびれ(ポアの内径が小さい部分)を1本鎖DNAがふさぐと、電流値が小さくなる。また、くびれの部分をふさぐ連続塩基の種類によって、この電流値が異なることが明らかになった。しかも、1塩基ずつ移動するごとに、その電流値が変化するので、塩基配列が解読できる可能性が示された。
Voltage-driven UnzippingでDNAが下方に移動したときに観察される電流値変化は、上方移動時(Replication-driven Ratcheting)の電流値変化と対称的な波形を持つことがわかり、DNAの配列をポア中で2度解読できる。ただし、Replication-driven RatchetingのDNA移動速度(約40塩基/秒)は、Voltage-driven Unzippingの速度(約2.5塩基/秒)よりも速い。DNA合成が終わると、phi29 DNAPDNAポアから離れて、別のphi29 DNAPDNAの複合体がタンパク質ポアに会合してDNA解読が起こる。このようにして、同一のポアにより約130分子/時の割合で約500分子のDNAの解読が起こることがわかった。
α-Hemolysinの場合、塩基移動に伴う電流変化は観察されるものの、タンパク質ポアのくびれの長さが長く、数多くの塩基がポアをふさぐために、配列解像度が悪いようである。一方、MspAの場合には、ポアのくびれの長さが短いために、1塩基ステップごとに良好な電流値の変化が観察され、さらにポアのくびれをふさぐ連続4塩基(上図の橙色)が特徴的な電流値を示すことが明らかにされた。なお、両方の方法とも、観測された電流変化を既知の塩基配列と対応付けることに成功したが、電流値の変化は複雑で、新規塩基配列を決定できることは示されていない。
主な配列決定エラーは、両方のポアともに欠失と挿入である。α-Hemolysinではエラー率は10~24.5%と推定された。移動速度が速いためにデータを取得できなかったという単純な原因以外に、「phi29 DNAPがDNA合成時に後退・前進を起こす現象」と「長いホモポリマーの場合、塩基の個数を正確に同定できないこと」によりエラーが発生した。

Oxford Nanoporeのシーケンシング技術との比較

 Oxford Nanoporeは、利用しているタンパク質ポアとDNAポリメラーゼの種類を明らかにしていないが、上記技術と類似した技術を開発し、市販できるシーケンサーの完成まで辿り着いた。Oxford Nanoporeの技術は、下記の点で上記技術と異なる。

(1) 末端に1本鎖部分(オーバーハング)を持つ2本鎖DNAであれば、いかなるDNAでも配列決定を行える。またPrimerもBlocking Oligomerも必要ない。
(2) Voltage-driven Unzippingにより、cisからtransへの方向のみにDNAを移動して配列を読み取る。
(3) リード長は長く、50~100 kbでも一続きの配列として解読できる。
(4) 連続する塩基に特徴的な電流値をもとに配列を同定しているようであるが、塩基解読アルゴリズムを開発できたために、新規配列決定を実現した。

ナノポアシーケンシング技術の欠点に関する考察

 上述のように、タンパク質ナノポアを用いてイオン電流値の変化を1塩基ステップごとに観察する方法により塩基配列を解読できることが証明された。Gundlachらのグループが示したように、4塩基(または3塩基)から成る連続塩基に特徴的である電流値をもとに塩基配列をCall(コール)することになるが、同一塩基を3~4回重複して解読するので、配列決定精度を上げることができるであろう。しかしながら、長いホモポリマーは同じ電流値を示すことがわかっているので、ホモポリマーの長さを決定できる手掛かりは、その電流値が続く時間だけである。
上述のMspAポアでは連続4塩基が電流値を決定する。上図BにおいてDNAが下方に移動した場合、CCCT ⇒ CCCC(上図Bでは橙色) ⇒ ACCC と、1塩基ずつ移動することにより電流値が変化する。したがって、4塩基のホモポリマーは解読できるが、5塩基以上のホモポリマーの場合、Roche-454シーケンサーやIon Torrent シーケンサーのように、ホモポリマーが長くなるほど精度が落ちることが予想される。
Geniaのナノポアシーケンシング技術では1塩基/秒という遅い速度で塩基配列を読めるので、長いホモポリマーの配列決定精度が向上する可能性もある。Stratos Genomicsは被験DNAを長鎖の代理ポリマーに変換してから塩基配列を解読するので、ホモポリマーの配列決定精度が高くなるかもしれない。また、QuantaporeとNobleGenのナノポアシーケシング技術はともに蛍光を検出して塩基配列を決定するが、塩基と塩基の間の変わり目を検出できれば、ホモポリマー問題は解決できるかもしれない。