8 نوامبر 2022 -توسط دانشکده پزشکی دانشگاه ایندیانا -اعتبار: دامنه عمومی Pixabay/CC0
تیمی از محققان در دانشکده پزشکی دانشگاه ایندیانا نرمافزار بیوانفورماتیک تخصصی طراحی کردهاند که برای شناسایی انواع ژنتیکی نادر در مطالعات توالییابی کل ژنوم طراحی شده است. زیلین لی، دکترا، استادیار آمار زیستی و علوم دادههای سلامت، اولین و نویسنده همکار انتشار اخیر در Nature Methods بود که آزمایش مجموعهای از متغیرها را با استفاده از چارچوب خط لوله اطلاعات حاشیهنویسی یا STAARpipeline شرح میدهد. .
لی میگوید: «اگرچه صدها میلیون گونه ژنتیکی نادر وجود دارد، اما مطالعه آنها چالش برانگیز بوده است، زیرا هیچ خط لوله مناسب، مقیاسپذیر و قوی برای تجزیه و تحلیل جامع واریتههای کمیاب وجود نداشت، که به ارزیابی مجموعههای گونهای به جای تک گونهها نیاز دارد».
خط لوله STAAR به محققان اجازه می دهد مجموعه ای از گونه های ژنتیکی نادر و غیر کدگذاری را ارزیابی کنند که به فعال کردن تحقیقات ژنتیکی کمک می کند. واریانتهای ژنتیکی غیرکدکننده بخشهایی از ژنوم هستند که آمینو اسیدها را کد نمیکنند، مولکولهایی که برای تشکیل پروتئینها ترکیب میشوند. بیش از 98 درصد از DNA یک فرد غیر کد کننده است.
لی گفت: «واریتههای نادری در 99 درصد از ژنوم انسان مشاهده میشوند و منبع اصلی از دست رفتن وراثتپذیری صفات و بیماریهای پیچیده هستند.
برای استفاده از STAARpipeline، محققان دادههای ژنوتیپ (کد ژنتیکی) و فنوتیپ (خصیصه پیچیده یا کد بیماری) را در برنامه وارد میکنند. این نرم افزار آن داده ها را تجزیه و تحلیل می کند و انواع کمیاب را شناسایی می کند و انواع را به هشت دسته عملکردی در تجزیه و تحلیل ژن محور و به پنجره های کشویی با اندازه ثابت و پنجره های دینامیک سازگار با داده های پیشنهادی جدید در تجزیه و تحلیل غیر ژن محور گروه بندی می کند. تجزیه و تحلیل ژن محور بر روی انواع موجود در ژن ها یا نزدیک آنها تمرکز می کند، در حالی که تجزیه و تحلیل غیر ژن محور بر روی انواع در ناحیه بین ژنی تمرکز می کند، که کشش DNA واقع بین ژن ها است. سپس این برنامه دارای حاشیه نویسی های عملکردی چندگانه برای هر مجموعه متغیر است تا قدرت تحلیل را بیشتر افزایش دهد و نتایج را برای کاربر خلاصه کند.
تیم تحقیقاتی قبلاً خط لوله STAAR را بر روی اندازههای بزرگ نمونه آزمایش کرده است، از جمله 40000 نمونه از برنامه پزشکی دقیق Trans-Omics موسسه ملی قلب، ریه و خون (NHLBI). در طی آن تجزیه و تحلیل، STAARpipeline 49 ارتباط مهم در تجزیه و تحلیل غیرکدکننده ژن محور پیدا کرد که 35 مورد از آنها بر اساس شش دسته جدید پیشنهادی غیرکدکننده یافت شد. علاوه بر این، تجزیه و تحلیل پنجره دینامیک اندازه تطبیقی داده ها، 43 ارتباط قابل توجه غیرهمپوشانی را در ژنوم غیرکدکننده شناسایی کرد که 19.4 درصد بیشتر از روش کلاسیک پنجره کشویی با اندازه ثابت است.
خط لوله STAAR، برنامه دیگری که لی و همکارانش بر پا کردند، یک آزمایش مجموعه گونه ژنتیکی برای یافتن ارتباطات و ارتباط با استفاده از اطلاعات حاشیه نویسی است.
لی گفت: «ما بر این باوریم که خط لوله STAAR را میتوان برای تجزیه و تحلیل صدها میلیون گونه از دادههای توالییابی کل ژنوم گسترش داد. از آنجایی که انواع نادری در 99 درصد از ژنوم انسان یافت شده است، این برنامه به یک شکاف مهم در تجزیه و تحلیل اطلاعاتی می پردازد.