¿Qué es y para qué sirve un archivo VCF?
El archivo VCF (Variant Call Format) es el resultado del procesamiento de tus datos en formato FASTQ. Este archivo compara tu ADN crudo con un «genoma de referencia» (un modelo estándar humano). El archivo VCF lista los lugares donde tu ADN difiere del genoma de referencia, es decir, las variantes (SNPs, inserciones o deleciones) que se encuentran en tu genética.
Los archivos VCF suelen estar comprimidos en formato .vcf.gz. Las herramientas de bioinformática están diseñadas para leer estos archivos comprimidos directamente, aunque también se pueden descomprimir con herramientas como 7zip o gzip.
¿Para quién es útil?
- Usuarios curiosos: Si deseas buscar una mutación genética específica (por ejemplo, en la posición del cromosoma 14, 64877827 en el gen MTHFD1).
- Análisis de terceros: Este formato es el estándar requerido si deseas subir tus datos a otros servicios que acepten datos de WGS para obtener información sobre ancestralidad o salud.
Fortalezas
- Accionable: Este archivo contiene los datos genéticos reales.
- Compacto: Al listar solo las diferencias, es mucho más pequeño que los archivos FASTQ (enlace a la pregunta sobre FASTQ) en bruto.
Limitaciones
- Datos procesados: El archivo depende del genoma de referencia actual utilizado por tellmeGen (GRCh37). Si el modelo de referencia cambia, este archivo quedará desactualizado, a diferencia del archivo FASTQ.
Cómo abrir y usar el archivo
- Uso básico: Tras descomprimirlo, puede abrirse como un archivo de texto (con Notepad++ en Windows, TextMate en Mac).
- Uso avanzado: Utiliza un visor VCF o el Integrative Genomics Viewer (IGV) para ver las variantes de manera visual. También puedes usar herramientas de terceros como Galaxy para realizar operaciones con tu archivo VCF.
Requisitos del sistema
- Sistema operativo: Windows, Mac o Linux.
- RAM: 8GB estándar.
- Almacenamiento: <1GB.