Qu’est-ce qu’un fichier VCF et à quoi sert-il ?
Le fichier VCF (Variant Call Format) est le résultat du traitement de vos données au format FASTQ. Ce fichier compare votre ADN brut avec un « génome de référence » (un modèle standard humain). Le fichier VCF liste les endroits où votre ADN diffère du génome de référence, c’est-à-dire les variantes (SNPs, insertions ou délétions) qui se trouvent dans votre génétique.
Les fichiers VCF sont généralement compressés au format .vcf.gz. Les outils de bioinformatique sont conçus pour lire ces fichiers compressés directement, bien qu’ils puissent également être décompressés avec des outils comme 7zip ou gzip.
Pour qui est-il utile ?
- Utilisateurs curieux : Si vous souhaitez rechercher une mutation génétique spécifique (par exemple, à la position du chromosome 14, 64877827 dans le gène MTHFD1).
- Analyse de tiers : Ce format est le standard requis si vous souhaitez télécharger vos données vers d’autres services qui acceptent des données de WGS pour obtenir des informations sur l’ancestralité ou la santé.
Points forts
- Exploitable : Ce fichier contient les données génétiques réelles.
- Compact : En ne listant que les différences, il est beaucoup plus petit que les fichiers FASTQ (lien vers la question sur FASTQ) bruts.
Limites
- Données traitées : Le fichier dépend du génome de référence actuel utilisé par tellmeGen (GRCh37). Si le modèle de référence change, ce fichier deviendra obsolète, contrairement au fichier FASTQ.
Comment ouvrir et utiliser le fichier
- Utilisation basique : Après l’avoir décompressé, il peut être ouvert comme un fichier texte (avec Notepad++ sous Windows, TextMate sous Mac).
- Utilisation avancée : Utilisez un visualiseur VCF ou l’Integrative Genomics Viewer (IGV) pour voir les variantes de manière visuelle. Vous pouvez également utiliser des outils tiers comme Galaxy pour effectuer des opérations avec votre fichier VCF.
Configuration requise
- Système d’exploitation : Windows, Mac ou Linux.
- RAM : 8 Go standard.
- Stockage : <1 Go.