اخبار علمی

پایگاه های داده بیوانفورماتیکی

معرفی پایگاه های داده بیوانفورماتیکی

در حال حاضر تجزیه و تحلیل داده های بیولوژیکی چالشی بزرگ پیش پای محققان زیست شناسی قرار داده است که سبب شده تعداد زیادی از ابزارهای نرم افزاری و بانک های اطلاعاتی را تولید کرده و به سرعت آن ها را پیشرفت و توسعه دهند. در این مقاله سایت ژن فن آوری اوژن به معرفی برخی سایت ها و نرم افزارهایی که معمولا برای آنالیز داده های بیوانفورماتیکی بکار میروند پرداخته خواهد شد.

این انستیتو بسیاری از نرم افزارها را برای تجزیه و تحلیل مجموعه های بزرگ از داده های مرتبط با ژنوم بطور رایگان توسعه و در دسترس قرار داده است.

  • بانک اطلاعاتی DNA ژاپن (DDBJ)

 بانک اطلاعاتی داده های توالی نوکلئوتیدی با ابزار جستجو و تجزیه و تحلیل می باشد.

  • انستیتوی بیوانفورماتیک اروپا (EBI)

بخشی از آزمایشگاه زیست شناسی مولکولی اروپا ، پایگاه داده ها و ابزارهایی را فراهم می کند که به کاربران امکان می دهد داده ها را پیدا کرده و به اشتراک بگذارند ، پرس و جوهای پیچیده ای را انجام دهند و نتایج را تجزیه و تحلیل کنند.  منابع شامل Ensembl ، UniProt و ArrayExpress هستند.

  • پورتال منابع بیوانفورماتیک (EXPASy)

 پورتالِ دیتابیس‌ها و ابزارهای نرم افزاری مربوط به ژنوم ، پروتئومیکس، رونویسی و… انستیتوی بیوانفورماتیک سوئیس (SIB) .

  •  مرکز ملی اطلاعات بیوتکنولوژی (NCBI)

بانکهای اطلاعاتی متنوعی را برای یافتن و تجزیه و تحلیل بیولوژی مولکولی ، بیوشیمیایی و داده های ژنتیکی از جمله GenBank ، ژن ، بانک اطلاعاتی نوکلئوتیدها و بانک اطلاعات پروتئین ها حفظ می کند.

 

برخی نرم افزارهای مورد استفاده و پرکاربرد در حوزه بیوانفورماتیک موارد زیر هستند:

  • Jmol: یک ابزار بیوانفورماتیکی جهت پی بردن به ساختار سه بعدی درشت مولکول ها از جمله DNAها، RNAها و پروتئین ها و اجزای آن‌هاست. این نرم‌افزار مبتنی بر وب است و بنابراین احتیاجی به نصب این نرم افزار روی دستگاه مورد استفاده نمی‌باشد. جهت به کارگیری این ابزار باید کد شناسایی مولکول مورد نظر وارد نرم افزار شود. کد چهار رقمی مولکول ها در پایگاه اطلاعاتی PDB موجود است. Jmol اطلاعات کامل مولکول ها  از جمله نوع و تعداد اتم ها، ساختار زنجیره ها و توالی های بکار رفته در مولکول، رزولوشن و غیره را به دست داده و پیوندهای مولکولی و فواصل و زاویه ها و اطلاعات مربوط به آنها را مشخص می کند. این نرم‌افزار مرتباً به روز رسانی شده و بنابراین اطلاعات جامع و به روزی را در بر می‌گیرد. همچنین می توان این نرم افزار را روی گوشی‌های هوشمند و آیپد ها به کار برد.
  • RNAstructure: نرم‌افزاری رایگان است که جهت تحقیقات بیوانفورماتیکی مورد استفاده قرار میگیرد . RNAstructure ساختار دوم DNA و RNA را نمایش می‌دهد و همچنین احتمال هیبریداسیون باز ها را محاسبه و میزان پایداری هر یک از این پیوندها را مشخص می کند. همچنین این ابزار، تمایل اتصال مولکول های زیستی به RNA موردنظر را نیز محاسبه می‌کند. نرم افزار مذکور  قابلیت نصب  و اجرا بر روی سیستم های مختلف را دارا می باشد.
  • Hex: یک نرم افزار  بیوانفورماتیکی رایگان و اختصاصی جهت داکینگ مولکولی(پروتئین_پروتئین)  است. این نرم افزار رایگان بوده و روی انواع سیستم عامل ها قابل اجراست.  با استفاده از این نرم‌افزار می‌توان انژی کل برهمکنش را محاسبه کرده و همچنین با توجه به شباهت شکل، انرژی و …،برهمکنش را شبیه‌سازی نمود.
  • Cn3D: از برنامه‌های کاربردی در این زمینه است که دارای حجم کمی بوده و  مختص نمایش درشت‌مولکول ها به ویژه پروتئین هاست. این نرم افزار امکان مشاهده ساختار های دوم پروتئینی و برخی اصلاحات ساختاری به روی آن ها را در دسترس خواهد گذاشت. 
  • Chromas: ابزار بسیار کاربردی بیوانفورماتیک در زمینه ژنومیکس و پروتئومیکس است. این نرم‌افزار توالی ژن ها را مشخص می‌کند و نتیجه‌ی تعیین توالی و همچنین نتیجه آنالیزها از قبیل سنگر را در قابل فایلی با پسوند abi ارائه می‌دهد . با استفاده از این نرم افزار میتوان آنالیز های فیلوژنی یا ویرایش اطلاعات موجود در فایل دریافتی را با تبدیل پسوند به fasta انجام داد.
  • Fast PCR: یک نرم افزار بیوانفورماتیکی ساده و کاربردی است. این نرم افزار محیط کاربری جذاب و امکان ویرایش و مشاهده انواع توالی ها، آمالیز پرایمر و پروب و همچنین ویرایش ژن ها را فراهم می‌آورد. با استفاده از این نرم افزار به آسانی میتوانی کلونینگ مجازی را انجام داد.
  • CLC: نرم افزاری جهت آنالیز تخصصی اطلاعات ژنومی و پروتئومی است. این نرم افزار بر روی سیستم عامل های مختلف از جمله ویندوز، لینوکس و مک قابل اجراست. CLC امکاناتی همچون بررسی توالی های ژنی و پروتئین ، نقشه‌ی جایگاه برش آنزیم های محدود کننده، کلون‌سازی مجازی، طراحی پرایمر و پروب و برچسب زنی ژن ها را دارا میباشد.
  •  OVITO: یک نرم افزار بیوانفورماتیکی گرافیکی ساخت کشور آلمان است که بیشتر در زمینه ی آنالیز و مشاهده ی ساختارهای اتمی شبیه سازی شده مورد استفاده قرار می‌گیرد. استفاده از آن بسیار ساده می باشد و شباهت بسیار زیادی به نرم افزار VMD دارد.
  •  ArgusLab: ابزاری برای مدل‌سازی مولکولی است که بیشتر در حوزه‌ی مدل‌سازی ساختار های اتمی پیچیده و پایدارسازی آن ها مورد استفاده قرار می‌گیرد. این نرم افزار رایگان ساخت کشور آمریکا بوده و روی نسخه های مختلف سیستم عامل ویندوز قال بکار گیری است. از اصلی ترین امکانات این نرم افزار، انجام داکینگ پروتئین-لیگاند در آنالیزها و غربالگری های دارویی است.

 

برخی ابزارهای بیوانفورماتیکی در حوزه ژن ها

  •  ArrayExpress

 بایگانی ژنومیک عملکردی داده ها را از آزمایش های ژنتیک عملکردی با توان بالا ذخیره می کند و این داده ها را برای استفاده مجدد در جامعه تحقیق فراهم می کند.

  • BLAST

این ابزار مناطقی از شباهت را بین توالی های بیولوژیکی پیدا می کند.  این برنامه توالی نوکلئوتیدی یا پروتئینی را با پایگاه داده های توالی مقایسه می کند و اهمیت آماری را محاسبه می کند.

  • GenePattern

 این سیستم گردش کار علمی قدرتمند که دسترسی به صدها ابزار تجزیه و تحلیل ژنومی را فراهم می کند،  طراحی شده است تا محققان را قادر به توسعه ، ضبط و تکثیر روشهای تحلیل ژنومی کند.

  • Genome

 این منبع اطلاعات مربوط به ژنوم ها شامل توالی ها ، نقشه ها ، کروموزوم ها و … را ترتیب می دهد.

  • IHEC

 کنسرسیوم بین المللی اپی ژنوم انسانی (IHEC) مجموعه ای کامل از اپی ژنوم های مرجع مربوط به سلامتی و بیماری را در دسترس قرار می دهد.

  • Nucleotide

بانک اطلاعاتی Nucleotide مجموعه ای از سکانس های مختلف از منابع مختلف از جمله GenBank ، RefSeq ، TPA و PDB است که داده های توالی ژنوم ، ژن و رونوشت پایه و اساس تحقیقات و کشف پزشکی را فراهم می کند.

  •  مرورگر ژنوم UCSC

 ابزاری که به شما امکان می دهد داده های ژنومی موجودات مختلف مدل را به صورت تعاملی مشاهده کنید.

  • Vista

 مجموعه ای کامل از برنامه ها و پایگاه های داده برای تجزیه و تحلیل مقایسه ای توالی های ژنومی است.

  • (Gene (NCBI

 این پنل اطلاعات مربوط به طیف گسترده ای از گونه ها را ادغام می کند که شامل نامگذاری ، توالی های مرجع (RefSeqs) ، نقشه ها ، مسیرها ، تغییرات ، فنوتیپ ها و پیوندهای مربوط به ژنوم ، فنوتیپ و منابع خاص در سراسر جهان باشد.

 

برخی ابزارهای بیوانفورماتیکی در حوزه پروتئین ها

 

  • UniProt

 مأموریت UniProt فراهم کردن یک منبع جامع ، با کیفیت بالا و رایگان و در دسترس از توالی پروتئین و اطلاعات کاربردی است.

  • Protein Data Bank

 بایگانی بانک داده پروتئین (PDB) به عنوان مخزن واحد اطلاعات در مورد ساختارهای سه بعدی پروتئین ها ، اسیدهای نوکلئیک و ساختارهای پیچیده خدمت کرده است.

  • Protein

 بانک اطلاعاتی پروتئین مجموعه ای از سکانس ها از منابع مختلف ، از جمله ترجمه از مناطق کدگذاری در GenBank ، RefSeq و TPA و همچنین سوابق SwissProt ، PIR ، PRF و PDB.  توالی پروتئین تعیین کننده‌ی اساسی ساختار و عملکرد بیولوژیکی است.

 

آشنایی با NCBI

با تکمیل پروژه ی ژنوم انسان، یکی از اهداف مهم بیوانفورماتیک که تحلیل توالی ها می باشد، محقق شد. اما رفته  رفته با پیشرفت هایی که در زمینه ی بیوانفورماتیک حاصل شد، احساس نیاز به یک پایگاه داده که تمام اطلاعات مربوط به توالی ژن ها و پروتئین ها را ذخیره و نگهداری کند، بیشتر نمایان شد. علم بیوانفورماتیک با بهره گیری از پایگاه های داده ی متعدد و نرم افزار های مختلف، امکان بررسی ساختار، عملکرد، تفاوت های توالی های متعدد به منظور مطالعات تکاملی و … را فراهم می نماید. تا به امروز اطلاعات مربوط به توالی های موجودات مختلف در پایگاه های داده ذخیره و برای اهداف گوناکون در اختیار محققین قرار گرفته است. همانطور که اشاره شد، حفظ و نگهداری انبوه اطلاعات ژنتیکی به منظور دسترسی سریع محققین نیازمند پایگاه داده های زیستی یا بانک اطلاعاتی است. از جمله پایگاه های داده ی اصلی می توان به GeneBank، EMBL و DDBJ اشاره نمود که به ترتیب پایگاه داده ی GeneBank توسط مرکز ملی اطلاعات بیوتکنولوژی آمریکا ((NCBI واقع در انستیتو ملی سلامت (NIH) مدیریت می شود. پایگاه داده ی EMBL توسط انستیتو بیوانفورماتیک اروپا (EBI) اداره می شود و پایگاه داده ی DNA (DDBJ) توسط انستیتو ملی ژنتیک ژاپن اداره می شود. این پایگاه های داده به گونه ای طراحی شده اند که افزودن یا به روز کردن اطلاعات حتی توسط کاربران نیز امکان پذیر می باشد، لذا اطلاعات یا داده های جدید هر 24 ساعت بین این سه پایگاه داده اشتراک گذاری و مبادله می شود. پایگاه داده ی GeneBank به عنوان جامع ترین پایگاه داده علاوه برفراهم کردن مکانی برای ذخیره سازی اطلاعات، شامل انبوهی از مقالات علمی در زمینه ی زیست شناسی و علوم مرتبط، اطلاعات مربوط بهDNA ژنومی، اطلاعات مربوط به STS، اطلاعات مربوط به GSS، اطلاعات مربوط به EST و … می باشد.

NCBI یا همان پایگاه داده ی GeneBank از موتور جستجوی Entrez استفاده می کند که یک سیستم یکپارچه بازیابی اطلاعات می باشد و قادر به جستجوی همزمان در بانک های مختلفی نظیر GeneBank، ژنوم کامل انسان و سایر موجودات، پایگاه داده ی Refseq،  Pubmed، توالی ها و ساختمان پروتئینی، تاکسونومی، پایگاه داده بیماری های ژنتیکی (OMIM) و سایر پایگاه های داده ی مشابه می باشد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *