Wat is een FASTQ-bestand en hoe wordt het gebruikt bij WGS-analyse (Whole Genome Sequencing)?
Het FASTQ-bestand is het ruwe uitvoerbestand van de sequencingmachine dat wordt gebruikt bij Ultra Whole Genome Sequencing (WGS), waarmee 100% van je DNA wordt gedecodeerd. Dit bestand bevat alle onverwerkte genetische gegevens, dat wil zeggen de DNA-lezingen in de vorm van miljoenen letterreeksen (A, C, G, T), samen met kwaliteitsscores die de betrouwbaarheid van de lezing aangeven.
Het FASTQ wordt gebruikt door bio-informatici en onderzoekers die gedetailleerde analyses van hun DNA willen uitvoeren, zoals uitlijning en variantidentificatie vanaf nul. Het is ook nuttig voor gebruikers die hun ruwe gegevens willen opslaan voor toekomstige analyse, bijvoorbeeld als er nieuwe referentiegenomen worden vrijgegeven.
Kenmerken van het FASTQ-bestand:
- Volledigheid: Bevat elke lezing die door de sequencer is geproduceerd, zonder enige informatie te filteren.
- Niet bevooroordeeld: Wordt niet beïnvloed door wetenschappelijke beperkingen of specifieke referentiegenomen.
Beperkingen:
- Niet leesbaar voor mensen: Je kunt een FASTQ-bestand niet direct “lezen” om informatie over je genetische kenmerken te verkrijgen. Het moet worden verwerkt om nuttige informatie te extraheren.
- Opslaggrootte: Vanwege hun grote omvang vereisen FASTQ-bestanden aanzienlijke ruimte op de harde schijf.
Formaten en downloaden:
Naast FASTQ bieden we ook het VCF-formaat aan. Je kunt deze bestanden direct downloaden vanuit je gebruikersaccount op tellmeGen.
Technische vereisten:
- Besturingssysteem: Linux of macOS (kennis van de opdrachtregel is vereist).
- RAM: Minimaal 16 GB (32 GB of meer aanbevolen voor analyse).
- Opslag: > 200 GB.
Dit formaat is geschikt voor geavanceerde gebruikers die een meer gedetailleerde en specifieke analyse van hun genetische gegevens willen uitvoeren.