次世代シーケンサーで解決されていない課題
これまで次世代シーケンサーの進歩が革新的に起こったが、まだ解決されていない課題も残っている。まず、これら未解決の課題についてまとめてみたい。
(課題1)高精度ロングリード配列の実現と高等生物の高精度全ゲノム配列の決定
ショートリードシーケンサーの欠点は、多数のコンティグ配列(ショートリード配列のアセンブリーにより生成する配列)の位置関係、繰り返し配列の数、大きな構造変化(欠失、挿入、転座変異など)の正確な解析が困難である点である。この欠点を解決する方法の一つは、精度の高いロングリード配列が得られる技術の開発であり、複数の技術が実用化された。しかし、GemCodeを利用してもヒトの高精度全ゲノム解析の精度はまだ不十分であり、10X Genomicsの従来機"GemCode"でも全ゲノム解析用IlluminaシーケンサーHiSeq Xを用いたヒト全ゲノム解析に利用できないという問題が残っている。
(課題2)高精度ロングリードによるハプロイド単位のゲノムシーケンシング
課題1で高精度のロングリードの必要性について言及したが、さらにハプロイド単位のゲノム配列を得ることも課題となっている。課題1が解決できれば、多くの場合、本課題も同時に解決できることが期待されるが、これまで利用可能となったショートリードからのロングリードの合成技術やPacific Biosciencesのロングリードシーケンサーでは十分には解決されていない。
(課題3)ごく微量サンプルからのシーケンシング
次世代シーケンサーを用いて全ゲノムシーケンシングを行う場合、「トランスポゾン法」を使ったライブラリー作製を行うと、必要DNA量は50 ngなどと少なくなる。ヒトゲノムはハプロイド換算で3×109 bpである。1塩基対の平均分子量を660とすると、ヒトゲノムの重量は1分子換算では約3.3 pgとなる。ここで、仮にヒト全長をカバーするゲノム配列を得るために、ハプロイド換算で100分子のヒトゲノムDNAを出発材料としてライブラリー調製を行うとする。この場合、ヒトゲノムは2倍体であることを考慮し、出発材料は3.3 pg×100×2 = 0.66 ngとなる。したがって、「ごく微量サンプルからのシーケンシング」という課題については、1 ng程度のゲノムDNAから全ゲノム配列が得られるとよい。上市済みのGemCode機器における出発DNA量は1 ngではあるが、GemCodeを用いて1 ngのヒトゲノムDNAからライブラリーを作製し、Illuminaシーケンサーでシーケンシングを行った場合には、ヒト全ゲノム配列を決定することは困難である。
(課題4)多様な変異を高精度で検出・同定できるエクソームシーケンシング
従来のエクソームシーケンシングでは、置換変異や小さな欠失・挿入変異の同定精度は優れているが、大きな構造変化の同定精度は悪い。この問題を解決するには、ロングリードとエクソームシーケンシングの組み合わせが必要である。従来機GemCodeは長鎖DNAをもとにNGS用ライブラリーを作製できるが、比較的短いDNAを取り扱う既存のエクソームシーケンシング用キットとは相性が悪いという問題が残っている。
(課題5)サンプル調製からシーケンシングまでを自動的に実施できるポータブル小型次世代シーケンサー
次世代シーケンサーの利用法として、ベットサイドや屋外での利用または一般市民の利用も想定されるが、これらの利用には「サンプル調製からシーケンシングまでを自動的に実施できるポータブル小型次世代シーケンサー」の開発が必要である。現時点では、Oxford Nanopore TechnologiesのMinIONシステムがこの課題の解決を実現できるシーケンサーといえる。
|
ショートリード配列をロングリード配列に変換する従来技術との比較
上述したように、ショートリード・シーケンサーは、大きな欠失置換変異や転座・融合変異に関しては同定精度が落ちるという欠点がある。また、二倍体の片方のゲノム配列、すなわちハプロタイプの配列情報を明らかにすることは困難である。最近、これらのショートリード・シーケンサーの欠点を克服するために、ショートリード配列をロングリード配列に変換する技術が開発された。具体的には、Illumina社が買収したMoleculo社の技術、10X Genomics社の技術と機器、ならびにDovetail Genomicsの技術が挙げられるが、これらは上述の課題のうち課題2は解決できるが、そのほかの課題解決には不十分である。10X GenomeのGemCodeを利用した場合には1 ng DNAからヒト全ゲノム配列を決定できないが、後述するように、Chromiumでは1 ng DNAからヒト全ゲノム配列を決定できるようになり、課題2の解決に加えて課題3も解決できた。 |
新機種ChromiumはゲノムDNAシーケシングで何が進歩したのか
10X Genomics社が開発した技術とは、同じ長鎖DNA分子に由来する小DNA断片にバーコードを付加し、これらDNA断片の配列(ショートリード配列)をIlluminaシーケンサーなどを用いて得た後に、バーコード情報を利用して長鎖DNA分子のロングリード配列を合成する技術である。10X Genomicsは、従来機GemCodeのアップグレード機種として、今年(2016年)1月に新機種Chromiumの発売を発表した。以下に、CoreGenomicsブログの記事をもとに、GemCodeと比べてChromiumで改良された点をまとめる。
(1) GemCode利用と比べて、より長いDNAを用いてNGS用ライブラリーを作製できるようになったので、シーケンシングにより産生される配列がゲノムをより均一にカバーできるようになり、高精度でSingle Nucleotide Variation (SNV) や変異を同定するのに必要な配列量が減少した。
(2) GemCodeでは、1 ngのDNAを出発材料として10万個のビーズにDNAを分配していたが、Chromiumでは100万個のビーズにDNAを分配できるようになった。なお、1個のビーズあたりのDNA分子数は平均10個である。
(3) 各ビーズに分配された長鎖DNAをもとに作製したDNAライブラリーのサイズが約300 bpに調整されているために、Illuminaのヒト全ゲノム解析用シーケンサーであるHiSeq Xを用いたシーケンシングに適合できるようになった。
(4) DNAの由来を判別するためのバーコードが14 bpから16 bpになったために、利用できるバーコード数が75万種類から4百万種類に増えた。
以上のような改良がなされた結果、全ゲノムシーケンシング用キットであるChromium Genomeとエクソームシーケシング用キットであるChromium Exomeが発売されることになった。また、ソフトウェアの改良もなされているので、SNVや変異をより高精度に同定できるようになっている。合成的に得られたロングリード配列を用いてハプロタイプのフェージングを行うことにより生成する「一続きのゲノム配列」の長さも格段と改善され、約10 Mbとなった。
従来機GemCodeの価格は米国では75,000ドルであったが、Chromiumの価格は120,000ドルである。Chromiumの発売時期は今年5月が予定されている。なお、Illumina HiSeq XとChromiumを使って長鎖DNA配列を得てヒト全ゲノム配列を決定する場合には、約1,450ドルのコストになると発表されている。
|
10X Genomicsと他社との提携ラッシュ
(1) Illuminaとの提携
10X GenomicsのChromiumはIlluminaシーケンサーの弱点を補強することから、両社は双方の製品を一緒にマーケティングすることを、今年2月10日に発表した。
(2) QIAGENとの提携
QIAGENは、Illuminaよりもより広範囲にわたる協業を目的とした10X Genomicsとの提携を、今年2月9日に発表した。10X GenomicsのChromiumでは高分子量DNAを出発材料とするが、QIAGENは自社製品のQIAGEN's MagAttract HMW DNA kitをChromiumに適合させることを進める。また、QIAGENが持つバイオインフォマティクス技術やソフトウェアについて10X Genomicsのロングリード配列を利用した解析に適合させることも推進する。さらに、QIAGENが上市予定である次世代シーケンサーGeneReaderとの連携も進めることが発表された。
(3) Agilentとの提携
AgilentのSureSelectキットはエクソームシーケンシングではスタンダードな製品として利用されている。AgilentはSureSelectキットを10X GenomicsのChromiumに最適化することにより、より優れたエクソームシーケンシング用製品(仮称"premium" exome )を開発するため、10X Genomicsとの提携を今年2月11日に発表した。この提携により開発される"premium" exomeは上記課題4を十分に解決する製品となろう。
以上のように、10X Genomicsの技術と機器の登場により、ショートリード・シーケンサーが抱えていた上記課題の多くは、一気に解決へ向かうことになり、NGSの技術の完成度もかなり高いものになってきた。また、数多くの企業との提携が成立したことは、新機種Chromiumは魅力ある製品であることが認められたともいえる。
|