Hva er en VCF-fil, og hva brukes den til?
VCF-filen (Variant Call Format) er et resultat av behandling av dataene dine i FASTQ- format. Denne filen sammenligner ditt rå DNA med et «referansegenom» (en standard menneskelig modell). VCF-filen viser stedene der DNA-et ditt er forskjellig fra referansegenomet; det vil si variantene (SNP-er, innsettinger eller delesjoner) som finnes i genetikken din.
VCF-filer komprimeres vanligvis i .vcf.gz -format. Bioinformatiske verktøy er utviklet for å lese disse komprimerte filene direkte, selv om de også kan dekomprimeres med verktøy som 7zip eller gzip .
Hvem er det nyttig for?
- Nysgjerrige brukere : Hvis du vil søke etter en spesifikk genetisk mutasjon (for eksempel i posisjon 64877827 på kromosom 14 i MTHFD1 -genet).
- Tredjepartsanalyse : Dette formatet er den nødvendige standarden hvis du ønsker å laste opp dataene dine til andre tjenester som godtar WGS-data for å innhente informasjon om avstamning eller helse.
Styrker
- Handlingsrettet : Denne filen inneholder de faktiske genetiske dataene .
- Kompakt : Ved å bare liste opp forskjellene, er den mye mindre enn de rå FASTQ -filene (lenke til spørsmålet om FASTQ).
Begrensninger
- Behandlede data : Filen er avhengig av det gjeldende referansegenomet som brukes av tellmeGen (GRCh37). Hvis referansemodellen endres, vil denne filen bli utdatert, i motsetning til FASTQ-filen.
Slik åpner og bruker du filen
- Grunnleggende bruk : Etter utpakking kan den åpnes som en tekstfil (med Notepad++ på Windows, TextMate på Mac).
- Avansert bruk : Bruk en VCF-visningsprogramvare eller Integrative Genomics Viewer (IGV) for å se varianter visuelt. Du kan også bruke tredjepartsverktøy som Galaxy til å utføre operasjoner på VCF-filen din.
Systemkrav
- Operativsystem : Windows, Mac eller Linux.
- RAM : 8 GB standard.
- Lagring : <1 GB.