tellmegen logo

USEIN ESITYT KYSYMYKSET

SELVITÄ EPÄILYKSESI

Mikä on VCF-tiedosto ja mihin sitä käytetään?

VCF (Variant Call Format) -tiedosto on FASTQ-muotoisten tietojesi käsittelyn tulos. Tämä tiedosto vertaa raaka-DNA:tasi ”viitegenomiin” (ihmisen vakiomalli). VCF-tiedosto listaa kohdat, joissa DNA:si eroaa viitegenomista, eli genetiikassasi esiintyvät variantit (SNP:t, insertiot tai deleetiot).

VCF-tiedostot ovat yleensä pakattuja .vcf.gz-muotoon. Bioinformatiikkatyökalut on suunniteltu lukemaan näitä pakattuja tiedostoja suoraan, vaikka ne voidaan myös purkaa työkaluilla, kuten 7zip tai gzip.

Kenelle se on hyödyllinen?

  • Uteliaat käyttäjät: Jos haluat etsiä tiettyä geneettistä mutaatiota (esimerkiksi kromosomin 14 kohdassa 64877827 MTHFD1-geenissä).
  • Kolmannen osapuolen analyysi: Tämä muoto on vaadittu standardi, jos haluat ladata tietosi muihin palveluihin, jotka hyväksyvät WGS-tietoja saadaksesi tietoa alkuperästä tai terveydestä.

Vahvuudet

  • Käyttökelpoinen: Tämä tiedosto sisältää todelliset geneettiset tiedot.
  • Kompakti: Koska se listaa vain erot, se on paljon pienempi kuin raa’at FASTQ-tiedostot (linkki FASTQ-kysymykseen).

Rajoitukset

  • Käsitellyt tiedot: Tiedosto riippuu tellmeGenin käyttämästä nykyisestä viitegenomista (GRCh37). Jos viitemalli muuttuu, tämä tiedosto vanhenee, toisin kuin FASTQ-tiedosto.

Miten tiedosto avataan ja käytetään

  • Peruskäyttö: Purkamisen jälkeen se voidaan avata tekstitiedostona (Notepad++ Windowsissa, TextMate Macissa).
  • Edistynyt käyttö: Käytä VCF-katseluohjelmaa tai Integrative Genomics Viewer (IGV) -ohjelmaa nähdäksesi variantit visuaalisesti. Voit myös käyttää kolmannen osapuolen työkaluja, kuten Galaxy, VCF-tiedoston käsittelyyn.

Järjestelmävaatimukset

  • Käyttöjärjestelmä: Windows, Mac tai Linux.
  • RAM: 8 Gt vakiona.
  • Tallennustila: <1 Gt.