皆さんのほとんどはDNAやRNAといった言葉をご存じだと思います。しかし、次世代シーケンシング(NGS)の世界には、WES、target-seq、RNA-Seq、BAM、FASTQなど、独自のキーワードがたくさんあります。そこで今回は、NGSのキーワードについて解説いたします。
▼こんな方におすすめです!
・次世代シーケンシング解析未経験の方
・次世代シーケンシング解析を始めたばかりの方
次世代シーケンシングについて検討を始めるときWES、WGS、target-seqのどのアプリケーションを始めるのかと聞かれることがあるかもしれません。WES(Whole Exome Sequencing)は全エクソームシーケンシング、WGS(Whole Genome Sequencing)は全ゲノムシーケンシング、target-seq(Targeted Sequencing)はターゲットシーケンシングのことです。さらにRNA-Seq(RNAシーケンシング)、ChIP(chromatin immunoprecipitation)-Seq(クロマチン免疫沈降法と次世代シーケンシングを組み合わせた技術)のような他のシーケンシング手法に関する用語もたくさんあります。
変異解析に関連する頭字語もあります。たとえば、誰かがあなたに「サンプルのSNP、SNV、Indel、CNVの近くのHPについて懸念していますか?」と尋ねるかもしれません。シーケンスを実行した後、その結果について「AQは?MRLはどうだった?」と聞かれたり、またはIon Torrent™ シーケンシングテクノロジーの場合、ISPがどのくらい得られたか尋ねられたりするかもしれません。
SNP(Single Nucleotide Polymorphism)は一塩基多型、SNV(Single Nucleotide Variants)は一塩基変異、Indel(Insertion/Deletion)は挿入・欠失変異、CNV(Copy Number Variation)はコピー数変異を意味します。HP(HomoPolymer)はAAAAやTTTTTなど、同一の塩基が並ぶ箇所のことです。AQ(Alignment Quality)は、サンプル配列が参照配列とどれだけうまく整列したかを評価する値です。MRL(Mean Read Length)は平均読み取り長です。NGSでは、何百万ものリード(次世代シーケンシングで得られる1本1本の配列)がうみだされ、リードの長さが異なるため、リードの平均の長さを計算します。
そして、Ion TorrentユーザーはISP(Ion Sphere Particles)にも関心があります。ISPはシーケンス反応の際にDNA断片を結合させる小さなビーズです。得られたISPが多いほど、シーケンス処理できる読み取りの数が多くなります。
これらの用語に混乱しそうな時は、身近にいるバイオインフォマティシャンにこれらをどう使用するのか聞いてみましょう。彼らと話をするとき、あなたはBAMかuBAMファイルを持っているかどうか、またはFASTQファイルを取得したかと聞かれるでしょう。次に彼らは、FASTAおよびVCFファイルが必要かどうかを知りたいと考えるでしょう。
BAMファイルは、リードを参照配列にアラインメント/マッピングを行った情報を含む、コンピュータが直接的に処理することができるバイナリ形式のファイルです。uBAMは、アラインメント/マッピングを行っていないリードの情報を含むバイナリファイルです。FASTAファイルは配列情報だけを含むファイルで、FASTQファイルはクオリティスコアを含む各リードのリストです。最後に、VCF(Variant Calling Format)ファイルは、変異とその場所の情報を含みます。
多くのソフトウェアではアラインメント/マッピングを行っていないリードのファイルとしてFASTQファイルを出力しますが、IonTorrentシーケンサーはuBAMファイルを出力します。これは、IonTorrentシーケンサー特有のフロースペース情報を含めることができるからです。フロースペース情報は変異を正確に検出するのに重要です。FASTQファイルをIonTorrentシーケンサーから出力するには、プラグインという機能を使用します。
まとめ
・次世代シーケンシングを用いた多様なアプリケーションに関するキーワード
・変異解析を例に、解析結果とその評価に関するキーワード
・ファイル形式に関するキーワード
をご紹介しました。
NGSデータ解析でお悩みの方、より詳しい解析をご要望の方は次世代シーケンス(NGS)データ解析支援サービスを検討してみてください。
https://www.thermofisher.com/jp/ja/home/products-and-services/services/technical-services/bioinformatics-services.html
次世代シーケンサ入門
Ion Torrent次世代シーケンサについて詳しく知りたい方は、こちらもご参照ください。
次世代シーケンス データ解析オンライン個別相談
IonTorrentユーザでデータ解析に関する具体的な課題をお持ちの方には、無料の個別相談の時間を開設しています。
研究用にのみ使用できます。診断用には使用いただけません。