2015年3月12日木曜日

10X Genomics、衝撃的デビュー:ショートリード・シーケンサーをグレードアップ!

 今年2月25~28日に米国Florida州Marco Islandで開催された“Advances in Genome Biology and Technology Meeting(AGBT) 2015”では、新しい次世代シーケンサーの開発に関して、特筆すべき新技術の発表はなかった。一方で、「Illuminaシーケンサーなどによって得られるショートリードを合成的にロングリードに変える画期的技術」を開発したというベンチャー企業、“10X Genomics”の発表は大きなトピックスであった。同社は、この技術を商品化した機器の販売も行うとしている。今回のGOクラブでは、この10X Genomicsの新技術の話題を提供したい。


AGBT2015の話題に関して

  昨年までのAGBTでは、次世代シーケンシング(NGS)に関連した革新的な新技術が毎年発表されていた。今年も、GenapSys、Genia、Oxford Nanoporeなどから新しい発表があることを期待していたが、インパクトがある新型シーケンサー開発の発表はなかった。GOクラブでは、NGS技術が普及化時期に入ったため、特集シリーズの名称と記事の内容を「バイオデジタル革命の夜明け」と変更したが、今年のAGBTの発表を見ると、まさに同様の時代の変化を感じる。冒頭に述べたように、今年のトピックスは、10X Genomicsが開発した「ショートリードを合成的にロングリードに変える技術」の発表であり、非常に多くのニュースで取り上げられていることからも、革新性が高いと評価できる。

10X Genomicsが開発した技術と機器

 10X Genomicsが開発した技術と機器については、ウェブ・ニュースサイト“Bio-IT World”において、2月25日付1月14日付の2つの記事で紹介されているので、詳細についてはこれらの記事を参照されたい。以下に、10X Genomicsが開発した技術のポイントをまとめる。

 10X Genomicsが開発した技術は、機器、試薬キットおよびソフトウェアを含めた一連のプラットフォームに対し、“GemCode Platform”と名付けられた。これは、本技術で使用するバーコード付きアダプターを含んだゲルビーズを、gem(宝石)と呼んでいることに由来する。機器は、マイクロ流路システムを介して個々の長鎖DNA分子をそれぞれ単一のゲルビーズ(gem)に分配する機能を有する。また、ソフトウェアは、得られたショートリードがそれぞれどのgemに由来するかを判別するアルゴリズムを備えている。以下に、GemCode Platform(以下、GemCodeと略す)の内容と操作手順について述べる。
(1) まず、一般的な方法により調製した長鎖DNA分子(数十kb~数百kbの長さ)のサンプルを、機器内のGemCode Chipにロードする。必要なDNA量は1 ngと非常に少量であり、サンプル・ロードに要する時間はたった数分である。なお、GemCode Chipは一度に8種類のサンプルを処理できる

(2) 機器内のマイクロ流路システムを介して、長鎖DNA分子がオイルにより1本ずつ分離され、酵素類とともにそれぞれ個別のgemに分配される。個々のgemはそれぞれ異なる14 bpのバーコード付きのアダプターを含んでおり、用意されているバーコードの種類(gemの種類)は100,000以上である。

(3) 各gemに分配された1分子の長鎖DNAを利用して、バーコード付きアダプターが付加されたDNAフラグメントが作製される(gemの中でアダプター付きのフラグメントが作製されるメカニズムは一切開示されていないが、おそらくMALBAC法やMDA法などDNA増幅プロセスを経ていると思われる)。これにより、同一の長鎖DNA分子に由来するDNAフラグメントは、gem固有の同一のバーコード配列を有することになり、シーケンス後のショートリードを、バーコードを指標に由来するgem(長鎖DNA分子)ごとに分別することができる。

(4) バーコード付きアダプターが付加されたDNAフラグメントは、その後、通常のショートリード・シーケンシング用のライブラリー作製と同様の処理が施され、シーケンシング反応が行われる。現時点では、利用できるシーケンサーはIlluminaのシーケンサーのみであるが、将来的には他のシーケンサーでも使えるようにする方針であることが発表されている。シーケンシング後は、付属のソフトウェアにより、各ショートリード(配列)がどのgemに由来しているか判別され、同一の長鎖DNA分子を構成していたショートリードごとにグループ分けされるものと思われる。

(5) GemCodeを用いると合成的にロングリードが得られるので、原理的にはde novoシーケンシングを行ってロングリードを得ることが可能であるが、最初のバージョンのGemCodeではソフトウェアが対応していないためか、de novoシーケンシングを行うことはできない。現段階では、Illuminaシーケンサーからのリードを参照ゲノムにマッピングした後、付属のソフトウェアを利用して、それぞれの長鎖DNA分子由来の配列を同定することにより、Haplotypeレベルの長い配列(10 ~100 kb)を再現(=Phasing)することができる。なお、父方または母方のHaplotypeレベルの長い配列を得ることを“Haplotype phasing”と呼ぶ。合成的に得られた長鎖DNAの配列をSNP (Single Nucleotide Polymoriphism) を利用してPhasingを行うことにより、数Mb~10 Mbの超長鎖配列も得ることができる。

 GemCodeの機器は今年第2四半期に発売される予定であり、その販売予定価格は75,000ドルである。また、1サンプルを処理するための試薬代は約500ドルであることが発表されている。

GemCode技術の利点と優位性

  まず、GemCodeを使用した場合の塩基配列決定精度は、各シーケンサーのシーケンシング精度に依存する。Illuminaシーケンサーの精度は非常によいので、GemCodeを用いた場合の出力精度もよい。さらに、Haplotype phasingを行ったときの“Long Switch Error rate”は0.01~0.03%であり、精度は極めてよいと言える。
 GemCodeの用途は、上述の「Haplotype phasing」以外に、ショートリード・シーケンシングでは解析が困難である「大きな欠失・挿入部位の解析」と「転座・融合部位の解析」である。「融合部位の解析」については、10X Genomicsも自社のウェブサイトで実例を公開している。また、GemCode技術は原理的にde novoシーケンシングにも適用可能であるが、ソフトウェアの開発などが必要であり、初期のバージョンでは利用できない。
 競合技術としては、Illuminaが買収したMoleculoの技術が挙げられる。本技術は、Illuminaのキット“TruSeq Synthetic Long-Read DNA Library Prep Kit”として利用できるようになっているが、IlluminaのHiSeq 2000/2500でしか利用できない。一方で、GemCode機器で処理したDNAサンプルをシーケンシングできるのは、現段階ではIlluminaシーケンサーだけあるが、今後他のシーケンサーにも適合する製品(試薬キット)を出す予定であるので、汎用性という点でGemCodeに優位性がある。
 ショートリードをもとに合成されるリード長は、Moleculoの場合には平均8~10 kbであるが、GemCodeの場合には10~100 kbである。また、GemCodeでは必要となるDNA量は1 ngであるが、Moleculoの場合には500 ngのDNAを必要とする。さらに、GemCodeは機器も比較的安価であり、消耗品コストも比較的安価であるので、総合的に見ても、GemCodeは明らかにMoleculoより優位であろう。
   
 ロングリード・シーケンサーとしては、Pacific BiosciencesのRSシーケンサーが著名であるが、リード長、精度、機器の価格を含めたコストパフォーマンスを考慮すると、GemCodeに軍配が上がると思う。特に、近いうちにGemCodeでde novoシーケンシングが可能になることが想定されるので、ユーザサイドの意見としては、Pacific Biosciencesのシーケンサーについては価格や機能面で一層の改善を期待したい。

GemCode技術に対する考察

  巨人Illuminaのシーケンサーと競合せずに拡販を促せる点、ならびに他のシーケンサーにも適用できる点を考えると、GemCode機器は急速に普及するとともに、Illuminaシーケンサーの優位性をさらに高める可能性がある。
 第3世代シーケンサーとの対比に関しては、Haplotype phasingの精度で評価できる。第3世代シーケンサーの開発では、特に1分子シーケンシングが掲げられており、その目標はコストダウンだけでなく、長鎖配列を得ること、特にHaplotype phasingを行えることであった。後者の目標に関しては、配列決定精度を加味すると、Pacific Biosciencesのシーケンサーに限らず、ナノポアシーケンサーがこの目標で競合することは、かなりハードルが高くなったといえよう。
 1分子解析レベルでの大きな構造変化の検出では、BioNano Genomicsの技術も競合となるが、配列が得られる点と精度が圧倒的によいという点から、GemCode技術は比較できない位置付けの技術である。
以上の点を考察すると、10X GenomicsのGemCode技術と機器の登場は、「衝撃的」であるといえよう。