Mikä on VCF-tiedosto ja mihin sitä käytetään?
VCF (Variant Call Format) -tiedosto on FASTQ-muotoisten tietojesi käsittelyn tulos. Tämä tiedosto vertaa raaka-DNA:tasi ”viitegenomiin” (ihmisen vakiomalli). VCF-tiedosto listaa kohdat, joissa DNA:si eroaa viitegenomista, eli genetiikassasi esiintyvät variantit (SNP:t, insertiot tai deleetiot).
VCF-tiedostot ovat yleensä pakattuja .vcf.gz-muotoon. Bioinformatiikkatyökalut on suunniteltu lukemaan näitä pakattuja tiedostoja suoraan, vaikka ne voidaan myös purkaa työkaluilla, kuten 7zip tai gzip.
Kenelle se on hyödyllinen?
- Uteliaat käyttäjät: Jos haluat etsiä tiettyä geneettistä mutaatiota (esimerkiksi kromosomin 14 kohdassa 64877827 MTHFD1-geenissä).
- Kolmannen osapuolen analyysi: Tämä muoto on vaadittu standardi, jos haluat ladata tietosi muihin palveluihin, jotka hyväksyvät WGS-tietoja saadaksesi tietoa alkuperästä tai terveydestä.
Vahvuudet
- Käyttökelpoinen: Tämä tiedosto sisältää todelliset geneettiset tiedot.
- Kompakti: Koska se listaa vain erot, se on paljon pienempi kuin raa’at FASTQ-tiedostot (linkki FASTQ-kysymykseen).
Rajoitukset
- Käsitellyt tiedot: Tiedosto riippuu tellmeGenin käyttämästä nykyisestä viitegenomista (GRCh37). Jos viitemalli muuttuu, tämä tiedosto vanhenee, toisin kuin FASTQ-tiedosto.
Miten tiedosto avataan ja käytetään
- Peruskäyttö: Purkamisen jälkeen se voidaan avata tekstitiedostona (Notepad++ Windowsissa, TextMate Macissa).
- Edistynyt käyttö: Käytä VCF-katseluohjelmaa tai Integrative Genomics Viewer (IGV) -ohjelmaa nähdäksesi variantit visuaalisesti. Voit myös käyttää kolmannen osapuolen työkaluja, kuten Galaxy, VCF-tiedoston käsittelyyn.
Järjestelmävaatimukset
- Käyttöjärjestelmä: Windows, Mac tai Linux.
- RAM: 8 Gt vakiona.
- Tallennustila: <1 Gt.