زیستا بیوتک

سيستم بيولوژی برای مبتدی‌ها

از داده‌های خام تا یک کشف زیستی: مسیر یک پروژه ترنسکریپتومیکس

تحلیل داده‌های اُمیکس (به‌ویژه ترنسکریپتومیکس) امروزه به یکی از قدرتمندترین رویکردها برای کشف مکانیزم‌های مولکولی بیماری‌ها تبدیل شده است. اما سؤال کلیدی این است: یک پروژه ترنسکریپتومیکس دقیقاً چه مراحلی دارد و هر مرحله چه نقشی در رسیدن به پاسخ اصلی ایفا می‌کند؟

در این مقاله به زبان ساده اما علمی، به پشت‌پرده‌ی ابزارها و تکنیک‌هایی می‌پردازیم که در مطالعات سیستم بیولوژی(Systems Biology) استفاده می‌شوند و توضیح می‌دهیم چرا هر مرحله حیاتی است.

    1.  آشنایی با زبان R؛ زیربنای تحلیل‌های بیوانفورماتیک
  •  چرا مهم است؟ تقریباً همه‌ی پکیج‌های بیوانفورماتیک و آمار بر روی زبان R توسعه یافته‌اند. بدون یادگیری آن، ادامه این مسیر ممکن نیست.

مثال: تصور کنید حجم داده‌های RNA-seq شما ۵۰ گیگابایت است. شما نیاز دارید آن را فیلتر کنید، نرمال‌سازی کنید و گراف‌ رسم کنید. این کارها در R به کمک پکیج‌هایی مثل DESeq2 و edgeR ممکن می‌شود.

     2. دسترسی به داده‌های واقعی؛ TCGA و گنجینه داده‌های cancer
  • چرا مهم است؟ تولید داده‌های خام آزمایشگاهی همیشه گران قیمت و زمان‌بر است. اما پایگاه‌هایی مثل TCGA (The Cancer Genome Atlas) امکان دسترسی رایگان به داده‌های ژنومی و ترنسکریپتومی هزاران کیس cancer را فراهم می‌کنند.

مثال: شما می‌خواهید بدانید بیان ژن‌ها در سرطان کولورکتال چه تفاوتی با بافت سالم دارند. TCGA این داده‌ها را آماده کرده و فقط کافی است استخراج و تحلیل کنید.

   ۳. تحلیل داده‌های جهش (Mutation Analysis)
  •  چرا مهم است؟ بیان ژن‌ها فقط بخشی از تصویر بزرگ است. جهش‌های ژنی می‌توانند توضیح دهند چرا بعضی مسیرها فعال یا غیرفعال می‌شوند.

مثال: در سرطان ریه ممکن است بیان ژن KRAS تغییر کرده باشد. تحلیل جهش نشان می‌دهد دلیلش یک mutant hotspot است که عملکرد پروتئین را تغییر داده است.

   ۴. ترسیم نمودار و غنی‌سازی عملکردی (Functional Enrichment)
  •  چرا مهم است؟ وقتی صدها ژن تغییر بیان یافته دارید، نمی‌توانید آن‌ها را تک‌به‌تک تفسیر کنید. اینجاست که دیتابیس2هايي نظير GO و KEGG وارد می‌شوند تا به شما بگویند کدام مسیرها بیش از حد تحت تأثیر قرار گرفته‌اند و ارتباطات بيان ژن‌ها را به صورت مسیرهای سیگنالینگ مرتبط باهم نشان می‌دهند.

 مثال: در بیماری التهابی روده (IBD) می‌بینید ژن‌های زیادی تغییر کرده‌اند. غنی‌سازی عملکردی نشان می‌دهد بیشتر ژن‌های دارای تغییر بیان در مسیر TNF signaling حضور دارند . که از این طریق مکانیزم التهابی مرتبط با بیماری روده تحریک پذیر کشف می‌شود.

   ۵. تحلیل شبکه‌های ژنی: از Cytoscape تا WGCNA
  •  چرا مهم است؟ زیرا ژن‌ها به‌تنهایی عمل نمی‌کنند.بلکه آن‌ها شبکه‌ای پیچیده از تعاملات را تشکیل می‌دهند.
  •  ابزارها:
    –  STRING + Cytoscape برای تعاملات پروتئین-پروتئین
    –   WGCNA برای کشف ماژول‌های هم‌بیانی و تعاملات ژن‌ها

 مثال: با WGCNA می‌توانیم خوشه‌ای از ژن‌ها را پیدا کنیم که همگی با شدت بیماری همبسته‌اند؛ این خوشه معمولاً  کاندیداي تبديل شدن به يك بایومارکر بالقوه است.

   ۶. فراتر از mRNA: شبکه‌های ceRNA
  •  چرا مهم است؟ تعاملات پیچیده‌ای بین انواع مولكول‌هاي RNA از جمله mRNA، miRNA و lncRNA وجود دارد. این تعاملات می‌توانند بیان ژن‌ها را تنظیم کنند.

 CeRNA Network تعاملات انواع RNA را نشان می‌دهد و مشخص مي‌كند چگونه یک miRNA می‌تواند چندین مسیر سيگنالينگ و بيان ژن را هم‌زمان کنترل کند.

 مثال: در سرطان پستان، مطالعه‌ی lncRNAها نشان می‌دهد یک lncRNA خاص در تعامل با miRNA عمل کرده و مسیر رشد سلولی را فعال نگه می‌دارد.

جمع‌بندی نهایی

یک پروژه ترنسکریپتومیکس موفق تنها به تولید داده‌های خام محدود نمی‌شود.

از یادگیری R تا دسترسی به داده‌های TCGA، از تحلیل بیان ژن‌ها و بررسی جهش‌ها تا غنی‌سازی عملکردی، از تحلیل شبکه‌های ژنی تا ساخت ceRNA network، هر مرحله تکه‌ای از پازل را کامل می‌کند.

درک این مراحل نه فقط برای پژوهشگران علوم زیستی، بلکه برای پزشکان، محققان و حتی شرکت‌های دارویی که به دنبال کشف داروهای جدید هستند، حیاتی است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

4 × 4 =