Cos’è e a cosa serve un file VCF?
Il file VCF (Variant Call Format) è il risultato dell’elaborazione dei tuoi dati in formato FASTQ. Questo file confronta il tuo DNA grezzo con un “genoma di riferimento” (un modello umano standard). Il file VCF elenca i punti in cui il tuo DNA differisce dal genoma di riferimento, ovvero le varianti (SNP, inserzioni o delezioni) che si trovano nella tua genetica.
I file VCF sono solitamente compressi in formato .vcf.gz. Gli strumenti di bioinformatica sono progettati per leggere direttamente questi file compressi, anche se possono essere decompressi con strumenti come 7zip o gzip.
Per chi è utile?
- Utenti curiosi: Se desideri cercare una mutazione genetica specifica (ad esempio, nella posizione del cromosoma 14, 64877827 nel gene MTHFD1).
- Analisi di terze parti: Questo formato è lo standard richiesto se desideri caricare i tuoi dati su altri servizi che accettano dati WGS per ottenere informazioni su ancestralità o salute.
Punti di forza
- Azionabile: Questo file contiene i dati genetici reali.
- Compatto: Elencando solo le differenze, è molto più piccolo dei file FASTQ (link alla domanda su FASTQ) grezzi.
Limitazioni
- Dati elaborati: Il file dipende dall’attuale genoma di riferimento utilizzato da tellmeGen (GRCh37). Se il modello di riferimento cambia, questo file diventerà obsoleto, a differenza del file FASTQ.
Come aprire e utilizzare il file
- Uso di base: Dopo averlo decompresso, può essere aperto come un file di testo (con Notepad++ su Windows, TextMate su Mac).
- Uso avanzato: Utilizza un visualizzatore VCF o l’Integrative Genomics Viewer (IGV) per vedere le varianti visivamente. Puoi anche utilizzare strumenti di terze parti come Galaxy per eseguire operazioni con il tuo file VCF.
Requisiti di sistema
- Sistema operativo: Windows, Mac o Linux.
- RAM: 8GB standard.
- Archiviazione: <1GB.