FASTQファイルとは何ですか?また、WGS(全ゲノムシーケンス)分析でどのように使用されますか?
FASTQファイルは、あなたのDNAを100%解読するUltra 全ゲノムシーケンス(WGS)で使用されるシーケンシングマシンの生の出力ファイルです。このファイルには、すべての未処理の遺伝データ、つまり数百万の文字列(A、C、G、T)形式のDNAリードと、読み取りの信頼性を示す品質スコアが含まれています。
FASTQは、ゼロからのアライメントやバリアントの特定など、DNAの詳細な分析を行いたいバイオインフォマティクス研究者や研究者によって使用されます。また、新しい参照ゲノムが公開された場合などに備えて、将来の分析のために生データを保存したいユーザーにも役立ちます。
FASTQファイルの特徴:
- 完全性:情報をフィルタリングすることなく、シーケンサーによって生成されたすべての読み取りが含まれています。
- 偏りがない:科学的な制限や特定の参照ゲノムの影響を受けません。
制限事項:
- 人間が読める形式ではない:遺伝的特徴に関する情報を得るためにFASTQファイルを直接「読む」ことはできません。有用な情報を抽出するには処理が必要です。
- ストレージサイズ:サイズが大きいため、FASTQファイルにはかなりのハードディスク容量が必要です。
形式とダウンロード:
FASTQに加えて、VCF形式も提供しています。これらのファイルは、tellmeGenのユーザーアカウントから直接ダウンロードできます。
技術要件:
- オペレーティングシステム:LinuxまたはmacOS(コマンドラインのスキルが必要)。
- RAM:最低16GB(分析には32GB以上を推奨)。
- ストレージ:200GB以上。
この形式は、遺伝データのより詳細で具体的な分析を行いたい上級ユーザーに適しています。