Improved genome sequencing using an engineered transposase

Tn5 mutant library construction

Tn5 mutants were generated by random mutagenesis using error prone PCR on entire wild type Tn5 transposase (NCBI accession code ‘3ECP_A’, Additional file 1)(That’s Tn5変異体は、野生型トランスポザーゼを使用したランダム・ミュータジェネシスにより作製した。 部位飽和は、タンパク質のモデル化されたDNA結合部位に対して行った。 変異させたTn5断片を大腸菌(Illumina Madison)での発現のために改良したpET11aベクターに挿入した。 このベクターはプラスミド安定性のためにカナマイシン耐性であり、精製を助けるためにTn5コード領域のN末端のT7プロモーター/lacオペロンの下流にStrep Tag II-sumo融合を有している。 線形回帰によって同定されたドライバー変異は、標準的な部位特異的変異誘発(Qiagen)によって結合された。

変異体タンパク質の発現と精製

変異体ライブラリーをプレーティングし、シングルコロニーを選択して50μg/mL kanを含む1Lルリアブロス(LB)培地に接種し、OD600=0.5に成長させてから、Tn5はLB培地で培養された。 その後、100μM Isopropyl β-D-1-thiogalactopyranoside(IPTG)の添加によりTn5変異トランスポザーゼの発現を誘導し、18℃で19時間インキュベーションを継続させた。

細胞を遠心分離により採取し、完全なプロテアーゼ阻害剤ミックス(Roche)を含むTNE1バッファ(100 mM Tris, pH 8.0, 1 M NaCl, 1 mM Ethylenediaminetetraacetic acid(EDTA), 1 mM Dithiothreitol(DTT))中に再懸濁した。 ガラスホモジナイザーで細胞ペレットをほぐした後、マイクロフルイダイザーに3回通し、溶解させた。 デオキシコール酸ナトリウムを溶解液に添加し(最終0.1%)、混合物を室温で15分間撹拌しながらインキュベートし、その後4℃で15分間撹拌した。 4℃で撹拌しながら、5%ポリエチレンイミン、pH7.5を加え(最終0.5%)、さらに1時間撹拌して核酸を沈殿させ、遠心分離(45000g、20分間、4℃)により除去した。 上清に飽和硫酸アンモニウムを1:1の割合で加え、4℃で1時間攪拌した後、遠心分離した(45,000 g、20分間、4℃)。 Tn5変異体タンパク質を含むペレットを10mLのTNE1に再懸濁し、遠心分離して微粒子を除去し、得られた上清をさらにTNE1で5倍に希釈し、AKTA Pure(GEヘルスケア)を用いてTNE1で平衡化したStrepTrap High Performance(HP)カラム(GEヘルスケア)に負荷した。

ロード後、StrepTrap HPカラムを10カラム容量(CV)の100 mM Tris, pH 8.0, 4 M NaCl, 1 mM EDTAで洗浄し、続いて10 CV 100 mM Tris, pH 7.5, 100 mM NaCl, 1 mM EDTAで洗浄した。 その後、100 mM Tris, pH 7.5, 100 mM NaCl, 1 mM EDTA, 5 mM Desthiobiotin (IBA-lifesciences) を用いた10 CVグラジエントでタンパク質を溶出させた。 OD280のピークを含む画分をプールし、100 mM Tris, pH 7.5, 100 mM NaCl, 0.2 mM EDTA (GE Healthcare) で平衡化した HiTrap Heparin HP カラムにアプライした。 結合後、カラムを15 CVの平衡化バッファで洗浄し、その後20 CVの塩濃度勾配(100 mM-1 M NaCl)で洗浄した。 0.5 M NaClで溶出した単一のピークがドデシル硫酸ナトリウムポリアクリルアミドゲル電気泳動(SDS-PAGE)により示され、66 kDaのStrep-Sumo-Tn5変異体を含んでいることが分かった。 溶出したピークは、Vivaspin 20遠心濃縮機で10 kDa MWCOで濃縮した後、100%グリセロールで1:1に希釈し、-20℃で保存した。 この発現・精製から、Tn5変異型トランスポザーゼの収量は、1L培養あたり約5mgであった。

トランスポゾームの組み立てと活性の正規化

19 bp Tn5 mosaic end (ME) transposon sequence (Illumina paired-end sequencingに適合する14および15 bp 5′ adaptor sequenceも含む) は、95 ℃で5分加熱し、2分ごとに5℃温度を下げて20℃まで下げ、一本鎖オリゴをアニールさせた。 アニーリングしたMEを精製Tn5トランスポザーゼと1.2:1のモル比(ME:トランスポザーゼ)で組み合わせ、37℃で1時間インキュベートした。得られたトランスポゾーム集合体は使用するまで-20℃で保存した。 すなわち、25 ngのB. cereusゲノムDNA(gDNA)に、様々な濃度の変異体またはコントロールとしてIllumina Nexteraキットの標準Tn5をタグ付けした。 得られた断片化DNAのサイズは、Agilentの高感度DNAバイオアナライザーチップで解析した。 そして、Tn5変異体の濃度を正規化し、100〜300bpの曲線下面積が20〜30%、301〜600bpが30〜40%、601〜7000bpが30〜40%、一方、100〜7000bpの曲線下面積の合計は≧90%と、同じDNA断片サイズ分布となった(追加ファイル2:図 S1)。

DNA library preparation, sequencing and data analysis

5μLの各Tn5変異体トランスポゾームの正規化濃度を用いて、大腸菌gDNA(バランスゲノム)、R. sphaeroides(GCリッチゲノム)、および B. cereus genomic DNA(AT rich genome)について標準Nextera DNA library prepare methodを用いて配列決定ライブラリーを調製した。 その後、ライブラリーはイルミナの標準プロトコールに従ってMiSeqでシーケンスされた。 Biasプロットは、すべてのリードについて、各ヌクレオチドが各サイクルにおいて観測された回数をカウントし、それをパーセントで報告することによって作成されました。 Bias plotは、トランスポザーゼの全体的なタグ付けの偏りを示しています。 各位置での偏りは、他の位置から独立している場合があることに注意してください。 Coverage plotは、異なるシーケンス深度で観測された塩基の割合を示しています。 samtoolsのmpileupオプション(http://www.htslib.org/)を用いて作成した。 正規化GC曲線とAT/GCドロップアウトはPicard Tools(http://broadinstitute.github.io/picard/)を用いて作成した。

Linear regression

挿入バイアスにおける個々の変異の重みを推定するために線形回帰モデルを使用した。 各線形回帰モデルは、リードの塩基位置における支配的なヌクレオチドの含有量に適用され、塩基位置ごとのモデルが得られた。 モデルのあてはめには、大腸菌のシーケンス結果を使用した。 そこで、1塩基目から15塩基目までのドミナントヌクレオチドとして、GTTTA***CTGCGを使用した。 Tn5はホモダイマーとして働くため、6位から9位で観測されるドミナントヌクレオチドは常に1位から4位と相補的な塩基である。 そこで、6,7,8位の塩基のモデルは無視し、9位の塩基を残すことにした。 9位は対称性により1位の挙動を再現するが、1位はシーケンスのアーチファクトの影響を受けるため、9位を用いることで1位の特徴をよりよく捉えることができる。

学習には10重クロスバリデーションを用い、重みは10重クロストレーニングで平均化された。 予測変数の入力行列は、各変異体の行と観測されたすべての変異の列で構成されている。 常に一緒に現れる変異は、行列に特異性をもたらした。 したがって、それらの変異に関連する列のうち、1列を除くすべてが削除された。

各ポジションについて、正または負の有意な重みを持つ突然変異が選ばれた。 異なる位置の変異を組み合わせて新しい変異体ライブラリーが作られた。 そのため、変異は類似した効果に基づいてグループ化されています。

Tn5/DNA binding stability assay

Standard Tn5はタグ付け後も標的DNAに結合していることが示された(未発表の結果)。 したがって、ポリメラーゼによるタグ付けされたDNAのギャップフィルやPCRによるさらなるDNAの増幅は、立体障害によって阻止される。 しかし、Tn5は温度が上がるとタグ付けされたDNAから解離し、ポリメラーゼによるDNAのギャップフィルとPCRを可能にする。 このように、ポリメラーゼによるPCR反応を可能にするために必要な温度は、様々なTn5変異体のTn5/DNA結合安定性を比較するために使用することができる。

変異体Tn5-059と標準Tn5を用い、TDバッファーを20mM Tris Acetate pH 7.5, 5mM magnesium acetateに変更した以外はNextera標準プロトコルに従って1mLの反応でセレウス菌gDNAにタグ付けを行った。 TDバッファーにはマグネシウムが含まれているので、挿入バイアスを変化させる変異と余分な複合効果を生じないはずである。 25μL反応のアリコートをPCRプレートに3重に分注し、55℃で5分間インキュベートした後、遠心分離(1000g、4℃で5分間)した。

PCRを含む第2工程のために、200μL PPC(PCRプライマーカクテル)、200μL i501、200μL i507および400μL NPM(標準Nextera DNAライブラリー作成キットに付属の試薬)を合わせてPCR混合物を作製した。 次に、このミックスの25μLをPCRプレート上の25μLタグメンテーション反応アリコートにそれぞれ加え、ピペットで混合した後、サーモサイクラーに戻した。 72℃から95℃の温度勾配をプレートの12列にわたって発生させ、1分間保持した後、プレートを72℃で5分間、続いて98℃で30秒間インキュベートした。このギャップフィル-変性工程の後、Nextera DNAライブラリ作成法で規定されているPCRを5サイクル行った。 その後、プレートを1000g、4℃で5分間遠心分離した。 その後、各タグメンテーション-PCR増幅反応をZymo Clean and Concentrator 96ウェルプレートを用いて精製し、25 μL 10 mM Tris, pH 8.0で溶出させた。 陰性対照試料は、Tn5トランスポアーゼを除去するためのZymo洗浄を含む標準タグメンテーションプロトコルに従って調製したが、PCR工程は含まなかった。 陽性コントロールの3連は、Tn5トランスポザーゼを除去するZymo洗浄とタグ付けされたDNAを増幅するPCR工程を含む標準タグ付けプロトコルにしたがって調製された。 すべての精製 DNA 産物を 10 mM Tris, pH 8.0 で 1:10 に希釈し、Picogreen とラムダ DNA 標準を用いて定量した。

その結果、標準 Tn5 は 74.2 ℃でタグ付け DNA から放出され、その後のギャップフィルおよび PCR 反応を可能にするが、Tn5-059 は 76.6 ℃でそれを行うことがわかった (Additional file 3: Figure S2)。 Tn5-059がより高い温度を必要とするのは、より安定なDNA結合複合体であることを示唆している

コメントを残す

メールアドレスが公開されることはありません。