تحلیل دادههای NGS یا توالییابی نسل جدید، یکی از مهمترین مهارتهایی است که هر زیستشناس امروزی باید کسب کند. مطالعات مبتنی بر تکنیک NGS نهتنها امکان بررسی ژنوم و ترانسکریپتوم در مقیاس وسیع را فراهم میکند، بلکه پایهی بسیاری از مطالعات سرطان، ژنتیک انسانی، پزشکی شخصیسازیشده و بیوانفورماتیک مدرن بهحساب میآید.
در این مقاله، از صفر با مراحل تحلیل NGS آشنا میشوید و یاد میگیرید برای شروع چه ابزارهایی لازم دارید، چطور دادهها را تفسیر کنید و چطور مسیر یادگیری خود را پایه گذاری کنید.
توالییابی نسل جدید (NGS = Next Generation Sequencing) فناوریای است که به ما اجازه میدهد میلیونها قطعه DNA یا RNA را بهصورت موازی بخوانیم. این یعنی میتوانیم در مدت زمان کوتاه، حجم بزرگی از اطلاعات ژنتیکی یا ترانسکریپتومی را تحلیل کنیم.
شناسایی جهشهای ژنتیکی (در سرطان، بیماریهای ارثی و…)
بررسی بیان ژنها (RNA-seq)
مطالعه تنوع ژنتیکی در جمعیتها
تشخیص میکروارگانیسمها (Metagenomics)
هر پروژه NGS، مراحل مشخصی دارد که به ترتیب زیر انجام میشوند:
در این مرحله با ابزارهایی مثل FastQC کیفیت دادههای خام (FASTQ) بررسی میشود و سپس با Trimmomatic یا Cutadapt نویزها و آرتیفکتها حذف میشوند.
دادهها روی یک ژنوم مرجع مپ میشوند، مثلاً با استفاده از BWA یا HISAT2. نتیجه این مرحله فایل به فرمت BAM است که نشان میدهد هر توالی در کجای ژنوم قرار گرفته است.
بسته به نوع پروژه:
برای RNA-seq: استفاده از featureCounts، DESeq2 یا edgeR
برای فراخوانی واریانتها: استفاده از GATK، Samtools، bcftools
این ابزارها روی محیط لینوکس و به صورت Command Line Based و نیز به کمک پلتفرمهای رابط گرافیکی مثل Galaxy اجرا میشوند.
آشنایی با اصول NGS و فرمت فایلها (FASTQ، BAM، VCF)
یادگیری لینوکس مقدماتی
تحلیل پروژه با Galaxy (محیط گرافیکی آنلاین)
یادگیری اسکریپتنویسی با Bash یا Python
ورود به آنالیزهای پیشرفته (DESeq2، Mutect2 و …)
آیا برای شروع تحلیل NGS نیاز به برنامهنویسی هست؟
در مراحل اولیه خیر، اما اگر بخواهید حرفهایتر شوید، یادگیری لینوکس، Bash و R یا Python بسیار مفید خواهد بود.
دادههای NGS را از کجا تهیه کنیم؟
پروژههایی مثل TCGA، ENA، GEO منابع رایگان داده هستند که میتوانید برای تمرین یا تحقیق از آنها استفاده کنید.
اگر میخواهید NGS را بهصورت عملی یاد بگیرید و بتوانید تحلیل واقعی انجام دهید، دوره جامع ما در زیستا بیوتک را از دست ندهید.