2010年12月13日月曜日

第3世代シーケンサー開発企業Pacific Biosciences社の最近の動向



 第3世代シーケンサー、すなわち1分子リアルタイムシーケンサーを開発しているPacific Biosciences(以下、PacBioと略す)が、今年(2010年)10月28日にNasdaq Global Select Marketに株式公開を行った後、初めての四半期報告を行った。また、Early Access Customersに対するPacBio RSシーケンサーのβ版機器の納入も進み、この機器のスペックなどもわかってきたので、今回はPacBioの最近の動向をまとめる。


PacBioの第3世代シーケンシング技術の概要

 PacBioのStephen Turner博士は何回か来日しているので、PacBioの第3世代シーケンシング技術の内容については、多くの方がご存知のことと思うが、まず簡単にレビューすることにする。
 PacBioが開発したシーケンシング技術は、一言で言えば、DNAポリメラーゼが連続的にDNA合成を行うときに、各dNTPの取り込みをリアルタイムでモニタリングする方法である。
 まず、(通常dNTPの塩基に付加されている)蛍光色素がdNTPの三リン酸鎖に付加されている上、dNTPの取り込みとともにリン酸エステル結合が切断され、蛍光色素はDNAから離れる。この機構により、DNAポリメラーゼはスムーズにかつ連続的にDNA合成を行うことができる。
 シーケンシング反応は、“Zero-Mode Waveguide (ZMW)”と呼ぶ、直径数十nm、深さ100 nmの円筒状の穴の中で行われる。その穴の底面はガラス板になっているが、底面からレーザーが照射され、蛍光色素から発せられる蛍光を検出できるようになっている。さらに、ガラス板の表面にはDNAポリメラーゼが1分子だけ固定化されている。このDNAポリメラーゼに1分子の鋳型DNAが結合した後、dNTPが取り込まれ、DNA合成が進む。その際、DNAポリメラーゼ近傍の蛍光だけを検出することにより、塩基配列を読み取っている。その検出原理については、光の波長は穴の直径より小さいために、光は遠くにいけずに、わずか10(マイナス21乗)リットルの容量の範囲内にある光のみ検出できるという仕組みに基づいている。シーケンシング法の詳しい原理については、PacBioのホームページを参照してほしい。


ハイチで流行しているコレラ菌のゲノム解析を2日間で終了!

 PacBioは、「ハーバード大学との共同研究により、ハイチで流行しているコレラ菌のゲノム解析を11月10日~12日の2日間で終了し、その解析結果がNew England Journal of Medicineのオンライン版(12月9日)に掲載されたこと」を2010年12月9日付けでプレスリリースした。発表された論文によると、ハイチのコレラ菌のゲノム配列決定を行い、ラテンアメリカで流行している菌や南アジア地域で流行している菌との比較ゲノム解析を行ったところ、ハイチのコレラ菌は南アジア地域の菌から由来しているらしいことが判明した。なお、この結果は、ヒトが移動して、南アジア地域のコレラ菌をハイチに運んだことを示唆している。
 このように、今流行している感染症の詳しい解析が極めて短期間で論文に掲載されたことは、エポックメーキングなことと思える。また、本研究成果は、1分子リアルタイムシーケンサーの威力を端的に証明したとも言えよう。

シーケンシングの手順

 PacBio RSシーケンサーは来年上半期に発売される予定であるが、そのβ版機器はすでに10ユーザ以上に設置されている。この機器を用いたシーケンシングの手順について概説する。
(1) サンプルの準備
 近い将来RNAも直接シーケンシングの鋳型になるようであるが、ここではDNAを鋳型にするケースについて紹介する。ライブラリーの各分子のサイズが1 kb以下の場合には、必要なDNA量は非常に少なく、500 ngでよい。
(2) ライブラリーの作製
 ライブラリーの各DNA長は250 bp~6 kb(数十kbも可能)である。2本鎖DNAの片末端に「ヘアピン状の1本鎖DNAアダプター」を結合させ、もう一方の末端には、DNA合成開始に必要なプライマーをアニールし一部が2本鎖になった「ヘアピン状のDNAアダプター」を結合させることにより、ライブラリーを構築する。この両末端にヘアピン状のアダプターが付加された構造は“SMRTbell”と呼ばれる。
(3) ライブラリーのDNAポリメラーゼへの結合
 多数(現バージョンは75,000個)のZMWを持つ“SMRT Celll”と呼ぶウェルの中にライブラリーを入れて、ZMWの底に固定化されているDNAポリメラーゼと結合させる。
(4) シーケンシング反応と塩基配列出力
 DNAポリメラーゼにDNAライブラリーを結合させたSMRT CellをPacBio RSシーケンサーにセットした後は、シーケンシング反応は自動的に制御・実施される。塩基配列は、内臓クラスターコンピューターが生データをリアルタイムに処理することにより、出力される。現バージョンでは、DNAポリメラーゼのDNA合成速度は1~3塩基/秒らしい。SMRT Cellは1列に8個並んでおり、列の数は12列あるので、最大96個のSMRT Cellをセットできるらしい。
(5) シーケンシング時間
 ライブラリー作製から塩基配列出力までの工程は1日以内に終わり、急げば4時間程度で終了するようである。なお、シーケンシング反応自体は通常30分以内に終わる。
(6) シーケンシングモード
 Standard sequencing、Strobe(ストロボ) sequencing、Circular consensus sequencingの3種類が利用できる。Standard sequencingは通常の1方向のシーケンシング法である。Strobe sequencingはPacBio特有の方法で、dNTPに付与された蛍光色素から蛍光を励起するためのレーザー照射を間欠的に行う方法である。この方法を使うと、レーザーが照射されているときのみ塩基配列が得られ、照射されないときには単にDNAポリメラーゼによるDNA合成が進む。したがって、(同じライブラリーを用いて)Mate-Pair sequencingに類似したシーケンシングを実行できる。PacBioのライブラリーは環状構造を取っているので、同じ鋳型を何度も繰り返し読むことができるが、この配列決定モードはCircular consensus sequencingと呼ばれる。PacBioのシーケンシング法は、後述するように、1リードの配列決定精度は良くないが、その配列決定精度は、冗長度を上げてシーケンシングする方法以外に、このCircular consensus sequencingによっても向上させることができる。

PacBio RSシーケンサーの利点と欠点

 現在公表されているスペックを評価したときのPacBio RSシーケンサーの利点について列挙する。
(利点1) ライブラリー作製からDNA配列を得るまでの時間が短い(1日以内)。
(利点2) 1リード長は500 bp以上である(10 kb近く読める場合もある)。
(利点3) 1分子シーケンシングなので、PCRによる増幅バイアスやエラーが入らない。
(利点4) 通常1本鎖DNAをもとにシーケンシング反応を行うが、上述のSMRTbell法により、2本鎖DNAを鋳型としてDNA合成を行うので、2次構造形成に由来するシーケンシング・トラブルやエラーを回避できる可能性がある。

 以上のように、PacBio RSシーケンサーは多数の利点を有する一方、以下の欠点も有する。
(欠点1) 現段階では配列決定精度が悪い(β版機器を用いたEarly Access Customerによるシーケンシングの実績では、シングルリードの精度は80~85%である)。
(欠点2) 現段階では1回のラン(1 SMRT Cell)の配列決定量は小さい。β版機器では、「SMRT Cell内の75,000個のZMWのうち約30%しか正常なDNA合成反応が起こらない」および「1リード長は平均500~550 bpである」を考慮すると、1 SMRT Cellあたり12 Mbの決定量と推定される。
(欠点3) 出力される生データ量が膨大なので、データ処理の負荷は大きく、シーケンサー機器は大型になる。

PacBio RSシーケンサーの将来

 ジナリスでは、約2年前にPacBioの第3世代シーケンシング技術を知り、その技術の凄さに驚嘆したが、その後、数多くの新しいシーケンシング技術も登場し、PacBioの技術が特に抜きん出た技術とも思えなくなった。PacBioのβ版機器のスペックをもとに、ヒトの全ゲノム再配列決定に必要な100 Gbの配列を得ようとすると、約8,000個のSMRT Cellの反応を行う必要がある。今後「SMRT Cellの集積度の向上」、「正常なDNA合成反応が起こる率の向上」、「リード長の増大」および「シーケンシング反応の高速化」により、単位時間あたりのスループットが大きく向上すると思われるが、IlluminaシーケンサーやSOLiDシーケンサーに追いつくのは容易でない。また配列決定精度もどの程度向上するかわからないことを考えると、ヒト全ゲノムの再配列決定には向かない気がする。むしろPacBio RSシーケンサーには他のシーケンサーにない多数の利点があるので、多様な研究用途に使えるシーケンサーという位置付けになると思われる。
 Ion Torrent SystemsのPGMシーケンサーでは、CMOSチップ内でリアルタイムでデータプロセッシングを行っているので、外部コンピューターによる生データ処理の負荷は極端に少ない。PacBioも、上記の欠点3を克服するために、SMRT Cellと半導体技術を合体させてチップ内でデータプロセッシングを行うタイプのシーケンサーを開発していくと発表されている。このバージョン2機器の発表は2014年頃らしい。期待したい。