Czym jest plik FASTQ i jak jest wykorzystywany w analizie WGS (Sekwencjonowanie całogenomowe)?
vPlik FASTQ to surowy plik wyjściowy z maszyny sekwencjonującej używany w Ultra Sekwencjonowaniu Całogenomowym (WGS), które dekoduje 100% Twojego DNA. Plik ten zawiera wszystkie nieprzetworzone dane genetyczne, czyli odczyty DNA w postaci milionów ciągów liter (A, C, G, T), wraz z wynikami jakości wskazującymi na wiarygodność odczytu.
Plik FASTQ jest używany przez bioinformatyków i badaczy, którzy chcą przeprowadzić szczegółowe analizy swojego DNA, takie jak dopasowanie i identyfikacja wariantów od podstaw. Jest również przydatny dla użytkowników, którzy chcą przechowywać swoje surowe dane do przyszłej analizy, na przykład w przypadku udostępnienia nowych genomów referencyjnych.
Cechy pliku FASTQ:
- Całkowita kompletność: Zawiera każdy odczyt wygenerowany przez sekwencera, bez filtrowania jakichkolwiek informacji.
- Bezstronność: Nie jest pod wpływem ograniczeń naukowych ani konkretnych genomów referencyjnych.
Ograniczenia:
- Nieczytelny dla ludzi: Nie możesz „przeczytać” pliku FASTQ bezpośrednio, aby uzyskać informacje o swoich cechach genetycznych. Musi zostać przetworzony w celu wyodrębnienia użytecznych informacji.
- Rozmiar pamięci: Ze względu na duży rozmiar, pliki FASTQ wymagają znacznej przestrzeni na dysku twardym.
Formaty i pobieranie:
Oprócz FASTQ oferujemy również format VCF. Możesz pobrać te pliki bezpośrednio ze swojego konta użytkownika na tellmeGen.
Wymagania techniczne:
- System operacyjny: Linux lub macOS (wymagana umiejętność obsługi wiersza poleceń).
- RAM: Minimum 16 GB (zalecane 32 GB lub więcej do analizy).
- Pamięć: > 200 GB.
Ten format jest odpowiedni dla zaawansowanych użytkowników, którzy chcą przeprowadzić bardziej szczegółową i specyficzną analizę swoich danych genetycznych.