VCFファイルとは何ですか?また、何のためにあるのですか?
VCF(Variant Call Format)ファイルは、FASTQ形式のデータを処理した結果です。このファイルは、あなたの生のDNAと「参照ゲノム」(標準的なヒトのモデル)を比較します。VCFファイルは、あなたのDNAが参照ゲノムと異なる場所、つまりあなたの遺伝子に見られるバリアント(SNP、挿入、欠失)をリストアップします。
VCFファイルは通常、.vcf.gz形式で圧縮されています。バイオインフォマティクスツールはこれらの圧縮ファイルを直接読み取るように設計されていますが、7zipやgzipなどのツールで解凍することも可能です。
誰に役立ちますか?
- 好奇心旺盛なユーザー:特定の遺伝子変異を探したい場合(例:MTHFD1遺伝子の14番染色体、位置64877827)。
- サードパーティによる分析:WGSデータを受け入れる他のサービスにデータをアップロードして、祖先や健康に関する情報を得たい場合、この形式が標準的に要求されます。
長所
- 実用性:このファイルには実際の遺伝データが含まれています。
- コンパクト:違いのみをリストアップするため、生のFASTQファイル(FASTQに関する質問へのリンク)よりもはるかに小さいです。
制限事項
- 処理済みデータ:このファイルは、tellmeGenが使用する現在の参照ゲノム(GRCh37)に依存しています。FASTQファイルとは異なり、参照モデルが変更されると、このファイルは古くなります。
ファイルの開き方と使い方
- 基本的な使い方:解凍後、テキストファイルとして開くことができます(WindowsではNotepad++、MacではTextMateを使用)。
- 高度な使い方:VCFビューアやIntegrative Genomics Viewer (IGV)を使用して、バリアントを視覚的に確認します。また、Galaxyなどのサードパーティツールを使用して、VCFファイルを操作することもできます。
システム要件
- オペレーティングシステム:Windows、Mac、またはLinux。
- RAM:標準8GB。
- ストレージ:1GB未満。