サンガーシーケンスとキャピラリー電気泳動について、6回に分けて基礎的な内容をメインに紹介していきます。
DNAの塩基配列決定法が開発・発表されてから40年以上経過していますが、サンガーシーケンスはいまだに多くの研究分野で実施されています。このシリーズの1回目である本記事では、DNAシーケンスのゴールドスタンダートとして受け入れられてきたサンガーシーケンスの歴史と、その正確性について紹介します。
▼こんな方におすすめです!
・サンガーシーケンスの基礎をおさらいしたい方
・サンガーシーケンスをしているが、改めてその原理を人に聞きたい方
・サンガーシーケンスの過去の思い出に浸りたい方
サンガー法とRIを用いたDNAシーケンス
1977年、DNAの塩基配列決定法であるジデオキシ法がFred Sanger氏により発表されました。このジデオキシ法を開発した功績により、Sanger氏はノーベル化学賞を授与されました(別のDNAの塩基配列決定法であるマクサム-ギルバート法を開発したPaul Berg氏とWalter Gilbert氏との共同受賞)。
ジデオキシ法=「サンガー法」は、自然にあるDNA合成を模倣する生化学的な方法であるため、危険な化学物質を使用しません。そのため、その使いやすさから、サンガー法はDNAシーケンスの標準法となっていきました。
ヌクレオチド(デオキシヌクレオチド三リン酸:dNTP)と修飾ヌクレオチド(ジデオキシヌクレオチド三リン酸:ddNTP)の混合物を使用することにより、DNAポリメラーゼによるDNA合成の過程で、ランダムにddNTPが取り込まれます。DNA合成を継続するために必要な3′-ヒドロキシ基がddNTPには無いため(したがって「ジデオキシヌクレオチド」となる)、その分子が取り込まれた後の合成は停止します。そのため、反応後の反応液中には、異なるサイズの生成物が混合された状態で存在することになります。
1985年に開発されたPCR法は、サンガーシーケンシングプロセス(いわゆる「サイクルシーケンシング」)にすぐに利用されるようになりました。また、高ガンマ線を放出する32P末端標識プライマーよりもプロセスが比較的安全になるため、35S標識ddNTPが利用されるようになりました。
こちらより、サイクルシーケンシングの詳細な説明動画をご確認いただけます。
この手法が1970年代後半に初めて導入されたとき、放射性末端標識プライマーが使用され、各反応は、各ヌクレオチドに1つずつ、4つの個別のチューブで実施されていました(たとえば、「A」とラベルされたチューブには、4つすべてのdNTP(DNA鎖伸長の通常のヌクレオチド)とddATPが混在して反応)。
次に、各チューブごとの生成物を大きなアクリルアミドスラブ電気泳動ゲル上(例:30 cm x 50 cm)でサイズごとに分離します。その後、ゲルを乾燥させ、オートラジオグラフィーでX線フィルムに感光させた後、ラダー状のパターンから塩基配列を読み取ることができます。

Biotechniques. 1998 Nov;25(5):876-8, 880-2, 884. doi: 10.2144/98255rr02.
これらのプロセスはマニュアルで行われ、オートラジオグラムを読み取るための蛍光灯ボックス、定規、そして(当時はより便利な方法として)一度に1ベースずつコンピュータにG. G. A. A. T. T. C. C. A…のように、4文字を入力する補助機能がありました。シーケンシングの準備から塩基配列の読み取りまで約1.5日間かかったのですが、正確性を確認するために再度シーケンスをすることは珍しくありませんでした。
シーケンス技術の主要な変遷
20年以上前より、放射性物質で標識されたジデオキシヌクレオチドが蛍光標識のジデオキシヌクレオチドに置き換えられ、X線フィルムからX線フィルムカセットの暗室での操作に置き換わりました。さらに、自動検出システムが登場し、走査型レーザーと高度な光学系を備えた光電子増倍管を使用して蛍光色素を読み取り、DNA塩基配列データを直接自動出力できるようになりました。
しかし、増感紙・フィルムカセットを-80℃の冷凍庫に一晩置く必要があるX線フィルムカセットと、現像薬の維持も伴う暗室での面倒なフィルム操作が伴うため、より簡便な蛍光物質と光学系での検出への変遷が、1986年にApplied Biosystems™ 370A DNA Sequencerが登場したことにより起こり、さらなる大きな変遷は、1995年に登場したApplied Biosystems™ 310 genetic analyzerにより起こりました。
それまでApplied Biosystems™ 370A DNA Sequencerなどで使用されていた使用されていた電気泳動用ゲルのガラスプレートは、相当にクリーンな状態で扱われる必要がありました。アクリルアミドが重合する2枚のガラスの間隔は非常に狭く(例:0.4 mm)、一片のほこりが容易に気泡の原因になりました。加えて、フレッシュなアクリルアミド溶液を使用することが最適な結果には必要であるため、発がん性物質として疑われる粉末状のアクリルアミドを扱う必要が有りました。Applied Biosystems™ 310 Genetic Analyzerは、これらの問題を解決するキャピラリー型のシーケンサです。
シーケンス技術はゲノム解析を映す鏡
Applied Biosystems™310 Genetic Analyzerが登場した数年後には、96本のキャピラリーを持つApplied Biosystems™ 3700 DNA AnalyzerがHuman Genome Projectに使用されることになりました。この 3700 DNA Analyzerには、生化学・高分子化学・および機械工学/光工学の面での改良が施されました。Dr. Elaine Mardis氏(当時:Washington University Genome Sequencing Centerのco-director)は、3700 DNA Analyzerについてインタビューで次のように述べています:「このHuman Genome Projectは、どこを見ても、これらの機器がなければできなかったと思います。」
これらの数十年にわたる技術的進歩の結果、キャピラリー電気泳動によるサンガーシーケンシングは、シーケンス品質のゴールドスタンダードであるという正当な資格を持っています。シーケンシングに使用されるDNAポリメラーゼのタンパク質工学による改良(無機物質である蛍光色素で修飾されたジデオキシヌクレオチドは比較的大きな分子となり、これらを収めるための「ポケット」を作るために工学的な技術がかなり必要)、アクリルアミドなどのPOPポリマー構成成分の化学的な改良、新しい蛍光に関連した蛍光の微妙な変化を感知するための光学的改良、ベースコールとエラーモデリングのソフトウェア改良により、キャピラリー電気泳動によるサンガーシーケンスは、非常に高い精度で正確な結果を提供できるようになりました。
現在販売されているシステムの一つであるApplied Biosystems™ 3500シリーズGenetic Analyzerには、より簡単に使用できるようにさまざまなテクノロジーが組み込まれています。長寿命な固体レーザー、RFIDタグによる消耗品の使用状況とロット番号の追跡、包装済みのポリマーパウチ、データ収集ソフトウェアまで、すべてが使いやすいように設計されています。
サンガーシーケンスの正確性
時間の経過とともに大幅に進歩し、かつシステムが長年にわたって開発されてきたため、サンガーシーケンスのエラーモデルは一般的なモデルとして広く普及しています。これは、Phredと呼ばれるプログラムによって定量化され、Q=–10log10Pとして定義されます。Qは品質のスコア、Pはエラーの確率です。たとえば、エラーが10%の場合、Phredによる品質スコアは10であるため、精度は90%になります。Phredスコアが20の場合、エラーは1%、精度は99%となり、Phredスコアが30の場合、エラーは0.1%、精度は99.9%となります。
サンガーシーケンシングの全体的な精度はおおよそ99.95%、またはエラー0.05%と言われています。サンガーシーケンスは2つの側面(高い精度と読み取り長:800~1000 bp)により、シーケンスのゴールドスタンダードとして認められています。
まとめ
・RI標識プライマーに代わり蛍光標識ジデオキシヌクレオチドを、ガラス板に代わりキャピラリーを使用することで、サンガーシーケンスは、より安全に使いやすくなってきました。
・自動DNAシーケンサとして登場したキャピラリー電気泳動は、現在でもさまざまな面で技術的進歩を続けています。
・サンガーシーケンスは、その高い精度とロングリードにより、DNAシーケンスのゴールドスタンダードとして認められています。
次回のシリーズでは、その2:フラグメント解析をご説明します。
[無料公開中]サンガーシーケンスの基礎
シーケンスのワークフローやデータからのトラブルシュートについては、こちらのガイドにも詳しい記載がございます。ぜひご活用ください。
研究用にのみ使用できます。診断目的およびその手続き上での使用はできません。