Что такое файл FASTQ и как он используется при анализе WGS (Полногеномное секвенирование)?
Файл FASTQ — это необработанный выходной файл машины для секвенирования, используемый в Ультра полногеномном секвенировании (WGS), который расшифровывает 100% вашей ДНК. Этот файл содержит все необработанные генетические данные, то есть прочтения ДНК в виде миллионов цепочек букв (A, C, G, T), вместе с оценками качества, указывающими на надежность прочтения.
FASTQ используется биоинформатиками и исследователями, которые хотят провести детальный анализ своей ДНК, такой как выравнивание и идентификация вариантов с нуля. Он также полезен для пользователей, которые хотят сохранить свои необработанные данные для будущего анализа, например, в случае выпуска новых референсных геномов.
Характеристики файла FASTQ:
- Полная завершенность: Содержит каждое прочтение, произведенное секвенатором, без фильтрации какой-либо информации.
- Непредвзятость: Не подвержен влиянию научных ограничений или конкретных референсных геномов.
Ограничения:
- Не читается человеком: Вы не можете «прочитать» файл FASTQ напрямую, чтобы получить информацию о своих генетических особенностях. Его необходимо обработать для извлечения полезной информации.
- Объем памяти: Из-за своего большого размера файлы FASTQ требуют значительного места на жестком диске.
Форматы и загрузка:
Помимо FASTQ, мы также предлагаем формат VCF. Вы можете скачать эти файлы прямо из вашей учетной записи пользователя в tellmeGen.
Технические требования:
- Операционная система: Linux или macOS (требуется навык работы с командной строкой).
- ОЗУ: Минимум 16 ГБ (для анализа рекомендуется 32 ГБ или больше).
- Хранилище: > 200 ГБ.
Этот формат подходит для продвинутых пользователей, которые хотят провести более детальный и специфический анализ своих генетических данных.