2014年12月5日金曜日

Helicosの次世代シーケンサーが復活:SeqLLがサービスを開始

 世界で最初にDNA/RNAの1分子シーケンシングを実用化したHelicos Biosciences Corporation (Helicos) は、NASDAQに上場を果たした後、2012年11月に破産により活動を終えた。しかし、最近SeqLL, LLC (SeqLL) がHelicosの資産を承継し、受託シーケンシングサービス事業を開始することをアナウンスした。今回のGOクラブでは、Helicosの次世代シーケンシング(NGS)技術とSeqLLの事業を紹介する。


HelicosのNGS技術-サンプル調製

 HelicosのNGS技術は、true single molecule sequencing (tSMS) とも呼ばれ、1分子のDNAまたはRNAの配列を直接決定できる。シーケンシング原理は、逐次DNA合成型で蛍光で検出する方式で、第2世代シーケンサーに分類されるが、1分子シーケンシングを実現していることから、第3世代シーケンサーの特徴を持っているといえる。
 次の3つのステップからなる方法を用いて簡便にサンプル調製を行うことができる。
(ステップ1)DNAの断片化(Shearing)
(ステップ2)ターミナル・トランスフェラーゼを用いたポリAの付加
(ステップ3)ターミナル・トランスフェラーゼとddTTPを用いたポリAの3’末端のブロッキング
 なお、ポリAを持つmRNAの場合には、上記のサンプル調製工程を経ずに、直接シーケンシングを行うことができる。

HelicosのNGS技術-シーケンシング反応

 HelicosのtSMS技術は、上記の方法で調製した1分子DNA/RNAをもとに、以下の手順でシーケンシング反応を行い、塩基配列を決定する。

(1)ガラス板の表面に膨大な数のオリゴdT(50)が固定化されたフローセルにポリAテールを持つ核酸を流し、55℃でハイブリダイズさせる。

(2)ポリAがハイブリダイズせずに、オリゴdTが露出している部分は、DNAポリメラーゼによりFill-in反応で埋める。

(3)DNAポリメラーゼによる1塩基の取り込み反応

 HelicosのNGSの特徴の1つが、“Virtual Terminator”と呼ばれる修飾NTPを使った逐次DNA合成である。Virtual Terminatorは、次の塩基の合成が可能なフリー3'-OH基を持つが、「次の塩基付加を阻害する化合物(阻害剤)」と「塩基を検出するための蛍光色素」がそれぞれリンカーを介して結合している。Virtual Terminatorが取り込まれると、蛍光色素も取り込まれるので、レーザー照射により取り込んだ塩基を検出できる。
 蛍光の検出後は、切断反応により阻害剤と蛍光色素を塩基から遊離させ、洗浄することにより取り除くことができる。そして、次の塩基付加反応を行うことができる。

シーケンサーのスペック

  Helicosは、tSMS技術を利用した1分子シーケンシング機器(HeliScope Genetic Analysis System)を2008年に発売した。1つのフローセルには25レーンあるので、25サンプルの配列を決定できる。1度に2つのフローセルを処理できるので、最大合計50サンプルの塩基配列をバーコード配列の付与なしに決定できる。以前の報告では、リード長は24~70塩基で、平均32塩基であった。通常のシーケンシングでは、120サイクルの反応を行うことから、リード長は30塩基である。1レーンあたり1200~2400万リードの配列が得られることから、1ランの配列出力量は18~30 Gbである。

 Virtual Terminator標品には、蛍光色素が結合していない分子も混入している。その分子が取り込まれてしまうと、蛍光が検出されないので、その塩基は欠失として記録されてしまう。このような理由から、生データレベルでの配列決定エラー率は5%程度と言われている。なお、Wikipediaに記載されている“エラー率0.5%”は置換変異の値と思われる。1分子レベルでのエラー率は高いものの、エラーはランダムに発生するので、冗長度を高くして読めば、コンセンサス配列の精度は良くなる。Pyrosequencingなどで観察される、ホモポリマーの塩基個数エラーの問題は発生しない。

Helicos (SeqLL) のNGS技術の利点と欠点

 上述のように、SeqLLはHelicosの資産を承継し、シーケンシングサービスを開始することになった。SeqLLの社名は、“Sequence the Lower Limit”から由来している。この社名が象徴しているように、Helicos (SeqLL) の技術の優位性は、ごく少量のサンプルから配列を決定できる点、しかもmRNAについては稀な分子種を検出できる点である。
 その他の利点としては、1分子シーケンシングを行えることである。他の方法ではPCRなどでDNAを増幅する必要があるため、バイアスがかかってしまう。HeliScopeシーケンサーでは、このバイアスがかからないことが大きな利点であるので、トランスクリプトーム解析には威力を発揮するであろう。特にポリA・RNAについては、サンプル調製なしにシーケンシングできる点も魅力的である。 
一方、欠点は、機器が大きく、高価である点である(価格は1億円以上であった)。また、リード長も短く、リード精度もよくない。これらの欠点がHeliScopeシーケンサーの普及を妨げたと思われる。

SeqLLのサービス内容

 以前、Helicosは、48,000ドルのコストで、4週間でヒト全ゲノムシーケンシング(冗長度は約30)を行えることを実証した。しかしながら、上述のような理由から、ヒトゲノムシーケンシングの用途で利用されることは少なかったようである。
 SeqLLは2013年3月に設立され、今年9月にGenomic Diagnostic Technologies主導でシリーズA・ファイナンスとして100万ドルを集め、事業を開始することを発表した。事業内容は、HeliScopeシーケンサーを用いた受託解析のみである。サービスメニューは、「mRNA-seq」、「ポリA・RNAの3'末端のシーケンシング」、そして「DNAの配列決定」である。
 mRNA-Seqは、mRNAをcDNAに変換した後に断片化し、ランダムに配列を決定する。1分子シーケンシングが行えるので、ダイナミックレンジが広いことが特徴である。リード長は以前より長く、33~100塩基と発表された。また、1レーンあたりのリード数は2000万~3000万であり、これも以前より改善されている。DNAの配列決定については、太古のサンプルからのシーケンシングやChIP-Seqが適しているとされている。