キャピラリーシーケンサで、データがアナログ信号からデジタル信号に変換され、品質スコアとともに塩基が割り当てられるまでのプロセスをご紹介します。
光信号から塩基への変換
ブログ “いまさら聞けないサンガーシーケンスのこと ~その1:DNAシーケンスのゴールドスタンダードになるまで~” では、放射性物質と X 線フィルムを用いた検出から、蛍光物質と光学系での検出へのシーケンス技術の変遷について説明しました。今回は、蛍光物質と光学系での検出における、光信号から塩基へのデータ変換について説明します。
サイクルシーケンス反応では、伸長されたDNA断片の3´末端に蛍光標識ジデオキシヌクレオチドが取り込まれることで、蛍光標識されたDNA断片がつくられます(図1)。蛍光色素は4種用いられ、塩基ごとに異なる蛍光色素が標識されているため、シーケンス解析では、検出される蛍光波長の違いから、塩基の種類を特定することができます。

図1. サイクルシーケンス反応の概念図
キャピラリーシーケンサには、レーザー光源と電荷結合素子(CCD)が搭載されています。キャピラリー電気泳動では、前述の蛍光標識されたDNA断片がキャピラリーに取り込まれ、泳動されます。キャピラリーにレーザー光が照射されると、キャピラリー内部の蛍光色素が励起され、特定のスペクトルをもつ光が放出されます。放出された光は、シーケンサー内部のCCDで検出されます。
キャピラリーシーケンサで取得されるデータは、Applied Biosystems™ Data Collectionソフトウエアで収集されます。Data Collectionソフトウエアは、ユーザーが機器を操作するためのソフトウエアで、電圧、泳動時間、適用するフィルター、カメラスピードなどのパラメーターを調整することができます。電気泳動では、電圧と時間が、泳動速度とピーク分離能に影響する主要なパラメーターとなります。
CCDで検出される蛍光色素の蛍光スペクトルはブロードであり、色素間でスペクトルの裾が重なります(図2)。スペクトルが重なる比率は常に一定であり、数学的に差し引くことができます。Data Collectionソフトウエアは CCD から蛍光スペクトル情報を取得し、使用する蛍光色素の組み合わせに応じて、スペクトル間の重複情報を取り除きます。これにより、4つの蛍光色素が正しく認識されます。
ソフトウエアは、この蛍光強度データを”AB1”と呼ばれるファイルに出力します(生成されたファイルの拡張子が.ab1であるため、AB1ファイルと呼ばれます)。
シーケンス解析の場合、ソフトウエアはさらに使用した機器、ポリマー、蛍光色素に応じて、移動度の補正を行います。そして、各ピークに個々の塩基がコールされ、バックグラウンドシグナルノイズ (特定位置にみられる他の色素のシグナル)が解析されて、コールされた塩基に品質スコアが割り当てられます。

図2. 4種の蛍光色素の蛍光スペクトル概念図
塩基に割り当てられる品質スコア
キャピラリー電気泳動によるサンガーシーケンスのエラーモデルは、Phil Greenによって開発された、Phredと呼ばれるプログラムにより定量化されます。Phred品質スコアQは、エラー確率Pの関数として、Q = -10 log10(P) と定義されます。品質スコア20は、エラー確率が100 分の 1 、精度は99%であることを示します。品質スコア 30 は、エラー確率1000 分の 1、精度が99.9%であることを示します。

図3. 割り当てられた塩基と品質スコアQ(Quality Value: QV)の例
Sequencing Analysis Software 8 user guideより抜粋
特定の塩基や領域に低い品質スコアが割り当てられる理由はさまざまあります。例えば、GCリッチな領域は、ポリメラーゼがうまく読み進められず、ピークの圧縮が起こります。回文配列など二次構造を形成する配列も、これらの配列中に存在する塩基の品質スコアに影響を及ぼします。一方、低い品質スコア(高いエラー確率)で塩基がコールされた場合、「その塩基が不正確である」ことの信頼性は高いものとなります。
目的に応じたソフトウエア
取得された塩基配列は、Applied Biosystems™ Sequencing Analysisソフトウエアを使用して閲覧することができます。また、Applied Biosystems™ Variant Reporter™ ソフトウエアでは、塩基配列の表示、リファレンス配列との比較、変異の検出ができます。Applied Biosystems™ SeqScape™ ソフトウエアでは、さらに、複数のリファレンス配列ライブラリーとの比較なども可能です。
これらのソフトウエアは全て事前にセットアップでき、データを読み込み、いくつかのボタンをクリックするだけで、解析が実行され、レポートが生成されます。ソフトウエアの詳細については、こちらをご参照ください。
まとめ
今回は、キャピラリーシーケンサで蛍光が検出され、塩基の情報に変換されるまでのプロセスをご紹介しました。キャピラリー電気泳動によるシーケンス解析について、より詳しく知りたい方は、サンガーシーケンスの基本原則を学べる資料をダウンロードしていただけます。
また、ソフトウエアを用いたデータ解析のハンズオントレーニングもご用意しておりますので、ぜひご活用ください。
ハンズオントレーニングコース:キャピラリーシーケンサ(3)データ解析 ~変異解析編~
研究用にのみ使用できます。診断目的およびその手続き上での使用はできません。