بیوانفورماتیکزیست شناسی محاسباتی

طراحی دارو به کمک کامپیوتر (قسمت دوم)

قسمت دوم

در قسمت قبل از طراحی دارو به کمک کامپیوتر به دلایل استفاده از متدهای محاسباتی و مفاهیم رسپتور و لیگاند و لزوم استفاده از Clinical Trial ها پرداختیم. همچنین به نمودار زیر اشاره کردیم:

 

طراحی دارو به کمک کامپیوتر

در این قسمت و قسمت‌های بعدی، اجزای شکل فوق را بررسی می‌کنیم. با ما همراه باشید…

در ابتدا به معرفی انواع الگوریتم‌ها می‌پردازیم و بعد از آن داده های ورودی و خروجی را بررسی خواهیم کرد.

الگوریتم ها در طراحی دارو به کمک کامپیوتر

الگوریتم‌های طراحی دارو به طور کلاسیک به دو طبقه تقسیم می‌شوند : الگوریتمهای مبتنی بر لیگاند و الگوریتم های مبتنی بر رسپتور.  در الگوریتم‌های مبتنی بر لیگاند، ما با دانستن یک جفت برهمکنش موثر و صحیح پروتئین-لیگاند که به صورت تجربی به اثبات رسیده اند، داروهای جدیدی را پیشنهاد می‌دهیم. برای مثال اگر بدانیم متابولیت X با پروتئین  Y ، Interaction دارد، سعی می‌کنیم با جست و جو در دیتابیس هایی نظیر DrugBank۱و۲ ، مولکول‌های کوچک آلی را که ساختاری شبیه X دارند را به عنوان دارو معرفی کنیم. مثلا ساختاری شبیه همان مولکول X ارائه بدهیم که به جای یکی از هیدروژن های ناقطبی زنجیره کربنی آن، متیل، اتیل و… جانشین شده است . یا مثلا ساختار کلی X را حفظ کنیم و به جای کربوکسیلی آن، عامل استری قرار دهیم و…

موتور جست و جوی SIMCOMP دقیقا همین کار را انجام میدهد و یکی از همین الگوریتمها است. فرض کنید میدانیم که استامینوفن با یک پروتئین خاصی برهمکنش دارد و فعالیت آن را کاهش یا افزایش میدهد. SIMCOMP (3و۴) به ما پیشنهاد میدهد که مثلا ۴-Chloroacetanilide هم با توجه به این که ساختار مشابهی با استامینوفن دارد به احتمال خیلی زیاد با این پروتئین واکنش میدهد و ما میتوانیم این ماده را هم در مراحل اولیه تحقیقات به عنوان یک داروی کاندید لحاظ بکنیم.

نتیجه سرچ SIMCOMP با دادن فایل sdf استامینوفن به عنوان ورودی :

طراحی دارو به کمک کامپیوتر

الگوریتم های مبتنی بر رسپتور (Receptor/Protein/Target) همان الگوریتمهای Docking هستند که مبتنی بر محاسبات دینامیک مولکولی میباشند. قبلا در مقاله سایت‌های بیوانفورماتیکی برای زیست شناسان به معرفی CB-Dock (5و۶) پرداخته بودم که متکی بر نرم افزار Autodock vina (9و۱۰)، همراه با یک سری بهبود های الگوریتمی بود. این سری از متد ها عموما زمان بیشتری برای محاسبات می طلبند. به این نوع سرور های داکینگ ، سرور های Blind Docking گفته میشود. چرا؟؟؟ 🙂 

یک سری الگوریتم ها خصوصا الگوریتمهای جدید در literature در این تقسیم بندی قرار نمیگیرند. اگر بدانیم که Protein هدف ما حداقل یک لیگاند دارد که متصل شدن آن دو به صورت تجربی به اثبات رسیده، از الگوریتم های نوع اول یعنی مبتنی بر Ligand استفاده میکنیم و تلاش میکنیم با تغییر دادن جزئی در ساختار لیگاند طبیعی، ماده ای با خاصیت دارویی را کشف بکنیم.

هرگاه که ساختار سه بعدی پروتئین توسط روش‌هایی نظیر X-ray Crystallography و NMR به درستی تبیین شده باشد، میت‌وانیم این داده را به نرم افزارهای داکینگ بدهیم و در نهایت ببینیم که Chemical  ما ممکن است خاصیت دارویی داشته باشد یا نه.

 

طراحی دارو به کمک کامپیوتر

 

طراحی دارو به کمک کامپیوتر

منبع تصاویر: (۷)

اما در برخی اوقات ممکن است که نه ساختار سه بعدی پروتئین تبیین شده باشد و نه لیگاند های طبیعی پروتئین شناخته شده باشد (مثل برخی از Transcription Factor ها و همینطور گروه Orphan GPCR(۸) ها). در این حالت نرم افزار های جدید مبتنی بر هوش مصنوعی استفاده میکنیم که در تقسیم بندی بالا قرار نمیگیرند. این حوزه که در سال های اخیر پیشرفت شگرفی کرده ، با تکیه بر الگوریتمهای هوش مصنوعی که قبلا در ژورنال های رشته کامپیوتر، درستی آنها به اثبات رسیده است، در تلاش است تا فرایند طراحی دارو بر پایه کامپیوتر را متحول کند. نکته مهم این است که در شرایطی که نه ساختار سه بعدی و نه لیگاند را میدانیم، حداقل توالی آمینواسیدی پروتئین را میدانیم

یک راه این است که وقتی توالی آمینواسیدی را میدانیم ، آن را ابتدا به نرم افزارهایی نظیر (۱۲)AlphaFold بدهیم تا پس از پیش بینی کردن فولدینگ صحیح و بدست آوردن ساختار سه بعدی ،عملیات داکینگ را روی آن انجام بدهیم.

طراحی دارو به کمک کامپیوتر

منبع تصویر: (۱۱)

AlphaFold ، برای یک توالی ، ۵ ساختار سه بعدی احتمالی را به کاربر ارائه میدهد. در متدهای داکینگ مثل CB-Dock هم متداول است که حداقل ۵ جایگاه اتصال که دارای امتیاز بالاتری هستند را به کاربر پیشنهاد کنند. بنابراین برای بررسی برهمکنش یک پروتئین با یک لیگاند در این حالت حداقل ۲۵ نحوه اتصال (Pose) یا ۲۵ فایل PDB کمپلکس احتمالی را باید بررسی بکنید. برای همین در مقیاس بالا این روش جواب نمی‌دهد (حداقل در زمان حاضر!)

متد های دیگر هوش مصنوعی متکی بر SVM۸ ، Random Walk۱۳ ، KNN ، Matrix Factorization۱۴ در فرایند پیشبینی برهمکنش Chemical  و Target به کرات به کار رفته اند .۱۵

افرادی که در زمینه هوش مصنوعی تبحر دارند می‌دانند که efficiency این الگوریتم ها را با کمیت هایی نظیر AUC و AUPR یا در مواردی R۲ اندازه می‌گیرند. در این جا هم با این مفاهیم سر و کار خواهیم داشت. تا آنجا که من دیده ام معمولا ۱۰ fold Cross Validation بیشتر برای اندازه گیری بهره وری این متد ها به کار میروند.

الگوریتم‌های مبتنی بر Network مثل  KNN و Random Walk ، معمولا به این صورت است که داروی جدیدی را پیشنهاد نمی‌دهند بلکه Interaction جدید را پیشبینی می‌کنند. یعنی برای مثال می‌گویند که (مثلا!!) احتمالا دارویی که برای درمان سرطان سینه به کار میرود “ممکن است ” برای تومور های مغزی هم داروی موثری باشد. الگوریتم های مبتنی بر شبکه در بسیاری از موارد به سه نوع ماتریس از داده ها نیاز دارند.

ماتریس اول : ماتریس Similarity Score برای Chemical  ها

ماتریس دوم :  ماتریس Similarity Score برای Protein  ها

ماتریس سوم :  Adjacency Matrix برای اعمال اثر برهمکنش هایی که به صورت تجربی به اثبات رسیده اند.

در قسمت بعدی از طراحی دارو به کمک کامپیوتر ، گام به گام این داده ها را معرفی میکنیم… با ما همراه باشید.

منابع/رفرنس ها :

در جای جای این آموزش از یک سری مقالات و وبسایت ها بهره برده ایم که بدون کمک آنها ، بیان مطالب ما حداقل به این زیبایی ممکن نبود…

 

  1. https://go.drugbank.com
  2. Wishart DS, Knox C, Guo AC, Shrivastava S, Hassanali M, Stothard P, Chang Z, Woolsey J. Drugbank: a comprehensive resource for in silico drug discovery and exploration. Nucleic Acids Res. 2006 Jan 1;34 (Database issue):D668-72. 16381955.
  3. https://www.genome.jp/tools/simcomp
  4. Hattori, M., Tanaka, N., Kanehisa, M., & Goto, S. (2010). SIMCOMP/SUBCOMP: chemical structure search servers for network analyses. Nucleic acids research, 38(Web Server issue), W652–W656. https://doi.org/10.1093/nar/gkq367
  5. http://clab.labshare.cn/cb-dock/php
  6. Liu, Y., Grimm, M., Dai, Wt. et al. CB-Dock: a web server for cavity detection-guided protein–ligand blind docking. Acta Pharmacol Sin 41, 138–۱۴۴ (۲۰۲۰). https://doi.org/10.1038/s41401-019-0228-6
  7. https://www.creative-biostructure.com/comparison-of-crystallography-nmr-and-em_6.htm
  8. Bock, J. R., & Gough, D. A. (2005). Virtual screen for ligands of orphan G protein-coupled receptors. Journal of chemical information and modeling, ۴۵(۵), ۱۴۰۲–۱۴۱۴. https://doi.org/10.1021/ci050006d

  9. Trott, O., & Olson, A. J. (2010). AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. Journal of computational chemistry, 31(2), 455–۴۶۱. https://doi.org/10.1002/jcc.21334
  10. Eberhardt, J., Santos-Martins, D., Tillack, A.F., Forli, S. (2021). AutoDock Vina 1.2.0: New Docking Methods, Expanded Force Field, and Python Bindings. Journal of Chemical Information and Modeling.
  11. deepmind.com
  12. Jumper, J., Evans, R., Pritzel, A. et al. Highly accurate protein structure prediction with AlphaFold. Nature (2021). https://doi.org/10.1038/s41586-021-03819-2
  13. Seal, A., Ahn, YY. & Wild, D.J. Optimizing drug–target interaction prediction based on random walk on heterogeneous networks. J Cheminform 7, 40 (2015). https://doi.org/10.1186/s13321-015-0089-z

  14. Liu Y, Wu M, Miao C, Zhao P, Li XL (2016) Neighborhood Regularized Logistic Matrix Factorization for Drug-Target Interaction Prediction. PLOS Computational Biology 12(2): e1004760. https://doi.org/10.1371/journal.pcbi.1004760
  15. Maryam Bagherian, Elyas Sabeti, Kai Wang, Maureen A Sartor, Zaneta Nikolovska-Coleska, Kayvan Najarian, Machine learning approaches and databases for prediction of drug–target interaction: a survey paper, Briefings in Bioinformatics, Volume 22, Issue 1, January 2021, Pages 247–۲۶۹, https://doi.org/10.1093/bib/bbz157
برچسب‌ها
نمایش بیشتر

نوشته‌های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا
EnglishIran
بستن
بستن