Qu’est-ce qu’un fichier FASTQ et comment est-il utilisé dans l’analyse WGS (Séquençage du Génome Entier) ?
Le fichier FASTQ est le fichier de sortie brut de la machine de séquençage utilisé dans l’Ultra Séquençage du Génome Entier (WGS), qui décode 100 % de votre ADN. Ce fichier contient toutes les données génétiques non traitées, c’est-à-dire les lectures d’ADN sous forme de millions de chaînes de lettres (A, C, G, T), ainsi que les scores de qualité indiquant la fiabilité de la lecture.
Le FASTQ est utilisé par les bioinformaticiens et les chercheurs qui souhaitent effectuer des analyses détaillées de leur ADN, comme l’alignement et l’identification de variantes à partir de zéro. Il est également utile pour les utilisateurs qui souhaitent stocker leurs données brutes pour une analyse future, par exemple au cas où de nouveaux génomes de référence seraient publiés.
Caractéristiques du fichier FASTQ :
- Complétude totale : Contient chaque lecture produite par le séquenceur, sans filtrer aucune information.
- Non biaisé : Il n’est pas influencé par des limites scientifiques ou des génomes de référence spécifiques.
Limites :
- Non lisible par l’homme : Vous ne pouvez pas « lire » un fichier FASTQ directement pour obtenir des informations sur vos traits génétiques. Il doit être traité pour en extraire des informations utiles.
- Taille de stockage : En raison de leur grande taille, les fichiers FASTQ nécessitent un espace disque important.
Formats et téléchargement :
En plus du FASTQ, nous proposons également le format VCF. Vous pouvez télécharger ces fichiers directement depuis votre compte utilisateur sur tellmeGen.
Exigences techniques :
- Système d’exploitation : Linux ou macOS (compétence en ligne de commande requise).
- RAM : Minimum 16 Go (32 Go ou plus recommandés pour l’analyse).
- Stockage : > 200 Go.
Ce format convient aux utilisateurs avancés qui souhaitent effectuer une analyse plus détaillée et spécifique de leurs données génétiques.