2011年10月12日水曜日

1細胞からのゲノムシーケンシング (パート1)

 最近、1細胞からのゲノムシーケンシングの研究が盛んになってきたので、GOクラブで2回に渡って、この話題について紹介しようと思う。
 J. Craig Vneter InstituteのRoger S. Laskenらが中心となって、Phi DNAポリメラーゼによるDNA増幅法であるMultiple Displacement Amplification (MDA) 法を用いて、1個の細菌から染色体DNAを増幅する技術が確立された。この技術を利用して、Harvard Univ.のGeorge M. Churchの研究グループが2006年に1個の細菌のゲノムシーケンシグング技術に関する研究を発表している。Laskenらも1細胞からのゲノムシーケンシングの論文を2007年に発表した。Laskenらは、その後も微生物の1細胞ゲノムシーケンシングの研究を精力的に進めているが、今年の9月18日付のONLINE版Nature Biotechnology誌で、1細胞ゲノム解析専用の新しいde novo assembly技術について発表した。今回のGOクラブでは、細菌の1細胞ゲノムシーケンシングについて紹介する


1細菌細胞の分離法

 土壌、水中、空気中などの環境から採取したサンプルから、1細菌細胞を分離するには、(1) 希釈法、(2) FACSによるソーティング、(3) 光ピンセットや機械的micromanipurationなどの方法、(4) microfluidicsによる方法のいずれかを用いることができる。これらの方法の中でも、多数の細胞を自動的に分離するのに向いている「FACSによるソーティング」は優れた方法と言える。特にFISH (fluorescence in situ hybridization) を組み合わせることにより、細胞を蛍光ラベルすることにより特定の種の細菌を集めることができる。一方、「micromanipuration」は形態を観察しながら分離できる点で魅力ある方法である。

次世代シーケンシング用DNAライブラリーの調製

 1細胞ゲノムシーケンシング用DNAサンプルの調製の基本的課題は、被験サンプルDNAとは異なる種のDNAの混入(コンタミネーション)である。1細胞分離段階のみならず、DNAライブラリー作製段階でも、微量のDNAがコンタミネーションしただけで、配列解析に大きな影響を与える。
また、現時点の1細胞ゲノムシーケンシングは、第2世代シーケンサーを用いているので、ゲノムDNAを増幅してシーケンシング用ライブラリーを調製する必要がある。DNA増幅はPCR法を使わずに、上述のMDA法を用いる。MDA法については下記の問題点を有するので、これら問題点の解決が、1細胞ゲノムシーケンシング技術開発の大きな課題であった。
(問題点1)DNA増幅に用いるプライマーがプライマーダイマーを形成する。
  ⇒(解決法)プライマーダイマーを形成しにくいランダムプライマーのセットを利用する。
(問題点2)1本鎖領域以外、分岐構造のDNAおよびキメラ構造のDNAが生成する。
  ⇒(解決法)S1ヌクレアーゼによる1本鎖部分の消化、DNAポリメラーゼによる修復、またはバイオインフォ技術で解決。
(問題点3)ゲノム中で不均一に増幅・複製が起こる。
  ⇒(解決法)冗長度を大きくしてゲノムシーケンシングを行う。Normalized libraryの作製またはバイオインフォ技術で解決。

次世代シーケンシング解析 & 新規ゲノム配列アセンブリー

 リード長が長いRoche-454シーケンサーを用いて配列決定が行われるケースが多い。Larsenらは、ショートリードシーケンサーであるIllumina GAIIxを用いて平均冗長度600で配列決定したデータをもとに優れたアセンブリーが得られることが最近報告した(下記参照)。なお、ナノポアシーケンサーが利用できるようになれば、増幅しないDNAを直接解析できる可能性がある。以下に、次世代シーケンサー解析の論文を3報紹介する。
(1) Churchらのグループの発表:Narure Biotech. 24, 680-686 (2006)
 この発表は、1細胞ゲノムシーケンシング&アンセンブリーを行った最初の事例である。Prochlorococcus 属細菌ゲノムからサンガーシーケンシングによって産出された配列をアセンブルし、約60%のゲノム配列を回収した。平均冗長度が3.5×~4.7×が低いこともあり、ゲノムカバー率(回収率)が低い。またキメラ配列の割合が多いことが問題点として浮かび上がった。
(2) Chisholmらのグループの発表:PLoS ONE 4(9), e6864 (2009)
 Prochlorococcus MED4の1細胞ゲノムシーケンシングを行った。上記問題点3は、Normalized libraryの作製を行うことにより解決し、454シーケンサーで平均冗長度約40で配列決定し、アセンブリーを行った後、コンティグ数1008、回収率(ゲノムカバー率)90%の結果を得ている。さらに、Illuminaシーケンサーのデータを合わせたハイブリッドアセンブリーで、平均冗長度約500で解析したところ、コンティグ数755、ゲノムカバー率95%の結果を得ている。ただし、10 kbに1個の頻度でキメラ配列が存在し、問題点2は十分解決されていない。
(3) Larsenらのグループの発表:Narure Biotech. doi: 10.1038/nbt.1966 (2011)
 1細胞ゲノムDNAをショートリードシーケンサー(Illumina GAIIx)により解析して得た配列データをアセンブルするための専用ツールを開発した。具体的には、ショートリード用アセンブラーVelvetを改良して(Velvet-SC)、上述の問題点2と3を解決した。さらに、配列決定エラーが多く残ったので、アセンブラーEULERのerror correction機能を取り入れて、エラー率を低減させた。
出来上がったツールEULER+Velvet-SCを用いることにより、E. coli Staphylococcus aureus の1細胞から、アセンブルされたゲノム配列を91%以上のゲノムカバー率(コンティグ数はそれぞれ481と355)で回収できた。複数の細胞からのシーケンシング結果を合わせると、ゲノムカバー率は95%に向上した。特筆すべき点は、エラー率が低く(3~6 bp/100 kb)、かつミスアセンブリー率がほとんどない(E. coli で0個、Staphylococcus aureus で1個)ことである。
ゲノム配列未知の培養困難な菌の1細胞全ゲノムシーケンシングの結果も発表されている。

メタゲノム研究への応用

 メタゲノム解析は、環境中から収集したサンプルからDNAをまとめて抽出した後、16S rDNAをPCRで増幅し、配列を決定する手法、または抽出したDNAを次世代シーケンサーにより網羅的な配列決定を行う手法が用いられる。後者の手法は微生物集団を分析・観察するには適しているが、多数の種類の微生物からのDNAをもとに膨大な数の短い配列が得られるので、ゲノムアセンブリー、すなわちそれぞれの微生物のゲノム配列を復元することは困難である。また、存在比率の大きい微生物群のゲノム配列は解明できるが、稀な微生物のゲノムを解析することはむずかしい。
 これに対して、1細胞ゲノムシーケンシングを行うと、培養困難な微生物でも完全な形でないにしてもゲノム配列を復元することができる。また存在比率が小さい稀な微生物でも、その細胞を採取することにより、ゲノム構造を解明することができる。