Mikä on FASTQ-tiedosto ja miten sitä käytetään WGS-analyysissä (Koko genomin sekvensointi)?
FASTQ-tiedosto on sekvensointilaitteen tuottama käsittelemätön tulostiedosto, jota käytetään Koko genomin Ultra-sekvensoinnissa (WGS), joka purkaa 100 % DNA:stasi. Tämä tiedosto sisältää kaikki käsittelemättömät geneettiset tiedot, eli DNA-luennat miljoonina kirjainketjuina (A, C, G, T), yhdessä lukemisen luotettavuutta osoittavien laatupisteiden kanssa.
Bioinformaatikot ja tutkijat käyttävät FASTQ:ta halutessaan tehdä yksityiskohtaisia analyysejä DNA:staan, kuten kohdistusta ja varianttien tunnistamista alusta alkaen. Se on hyödyllinen myös käyttäjille, jotka haluavat säilyttää raakatiedot tulevaa analyysiä varten, esimerkiksi jos uusia viitegenomeja julkaistaan.
FASTQ-tiedoston ominaisuudet:
- Täydellinen kattavuus: Sisältää jokaisen sekvensaattorin tuottaman luennan ilman tietojen suodattamista.
- Vääristymätön: Tieteelliset rajoitukset tai tietyt viitegenomit eivät vaikuta siihen.
Rajoitukset:
- Ei ihmisen luettavissa: Et voi ”lukea” FASTQ-tiedostoa suoraan saadaksesi tietoa geneettisistä ominaisuuksistasi. Se on käsiteltävä hyödyllisen tiedon saamiseksi.
- Tallennustilan koko: Suuren kokonsa vuoksi FASTQ-tiedostot vaativat huomattavasti tilaa kiintolevyllä.
Muodot ja lataus:
FASTQ:n lisäksi tarjoamme myös VCF-muodon. Voit ladata nämä tiedostot suoraan tellmeGen–käyttäjätililtäsi.
Tekniset vaatimukset:
- Käyttöjärjestelmä: Linux tai macOS (komentoriviosaamista vaaditaan).
- RAM-muisti: Vähintään 16 Gt (analyysiin suositellaan 32 Gt tai enemmän).
- Tallennustila: > 200 Gt.
Tämä muoto sopii edistyneille käyttäjille, jotka haluavat tehdä yksityiskohtaisemman ja tarkemman analyysin geneettisistä tiedoistaan.