Vad är en VCF-fil och vad används den till?
Filen VCF (Variant Call Format) är resultatet av bearbetningen av dina data i FASTQ-format. Denna fil jämför ditt råa DNA med ett ”referensgenom” (en standardmodell för människan). VCF-filen listar de platser där ditt DNA skiljer sig från referensgenomet, det vill säga de varianter (SNP:er, insertioner eller deletioner) som finns i din genetik.
VCF-filer är vanligtvis komprimerade i .vcf.gz-format. Bioinformatikverktyg är utformade för att läsa dessa komprimerade filer direkt, även om de också kan dekomprimeras med verktyg som 7zip eller gzip.
För vem är det användbart?
- Nyfikna användare: Om du vill söka efter en specifik genetisk mutation (till exempel på kromosom 14, position 64877827 i genen MTHFD1).
- Analys av tredje part: Detta format är den standard som krävs om du vill ladda upp dina data till andra tjänster som accepterar WGS-data för att få information om härkomst eller hälsa.
Styrkor
- Agerbart: Denna fil innehåller faktiska genetiska data.
- Kompakt: Genom att endast lista skillnaderna är den mycket mindre än de råa FASTQ-filerna (länk till frågan om FASTQ).
Begränsningar
- Bearbetade data: Filen är beroende av det aktuella referensgenomet som används av tellmeGen (GRCh37). Om referensmodellen ändras kommer denna fil att bli föråldrad, till skillnad från FASTQ-filen.
Hur man öppnar och använder filen
- Grundläggande användning: Efter dekomprimering kan den öppnas som en textfil (med Notepad++ i Windows, TextMate på Mac).
- Avancerad användning: Använd en VCF-visare eller Integrative Genomics Viewer (IGV) för att se varianterna visuellt. Du kan också använda tredjepartsverktyg som Galaxy för att utföra operationer med din VCF-fil.
Systemkrav
- Operativsystem: Windows, Mac eller Linux.
- RAM: 8 GB standard.
- Lagring: <1 GB.