معرفی پایگاه های داده بیوانفورماتیکی
در حال حاضر تجزیه و تحلیل داده های بیولوژیکی چالشی بزرگ پیش پای محققان زیست شناسی قرار داده است که سبب شده تعداد زیادی از ابزارهای نرم افزاری و بانک های اطلاعاتی را تولید کرده و به سرعت آن ها را پیشرفت و توسعه دهند. در این مقاله سایت ژن فن آوری اوژن به معرفی برخی سایت ها و نرم افزارهایی که معمولا برای آنالیز داده های بیوانفورماتیکی بکار میروند پرداخته خواهد شد.
این انستیتو بسیاری از نرم افزارها را برای تجزیه و تحلیل مجموعه های بزرگ از داده های مرتبط با ژنوم بطور رایگان توسعه و در دسترس قرار داده است.
- بانک اطلاعاتی DNA ژاپن (DDBJ)
بانک اطلاعاتی داده های توالی نوکلئوتیدی با ابزار جستجو و تجزیه و تحلیل می باشد.
- انستیتوی بیوانفورماتیک اروپا (EBI)
بخشی از آزمایشگاه زیست شناسی مولکولی اروپا ، پایگاه داده ها و ابزارهایی را فراهم می کند که به کاربران امکان می دهد داده ها را پیدا کرده و به اشتراک بگذارند ، پرس و جوهای پیچیده ای را انجام دهند و نتایج را تجزیه و تحلیل کنند. منابع شامل Ensembl ، UniProt و ArrayExpress هستند.
- پورتال منابع بیوانفورماتیک (EXPASy)
پورتالِ دیتابیسها و ابزارهای نرم افزاری مربوط به ژنوم ، پروتئومیکس، رونویسی و… انستیتوی بیوانفورماتیک سوئیس (SIB) .
- مرکز ملی اطلاعات بیوتکنولوژی (NCBI)
بانکهای اطلاعاتی متنوعی را برای یافتن و تجزیه و تحلیل بیولوژی مولکولی ، بیوشیمیایی و داده های ژنتیکی از جمله GenBank ، ژن ، بانک اطلاعاتی نوکلئوتیدها و بانک اطلاعات پروتئین ها حفظ می کند.
برخی نرم افزارهای مورد استفاده و پرکاربرد در حوزه بیوانفورماتیک موارد زیر هستند:
- Jmol: یک ابزار بیوانفورماتیکی جهت پی بردن به ساختار سه بعدی درشت مولکول ها از جمله DNAها، RNAها و پروتئین ها و اجزای آنهاست. این نرمافزار مبتنی بر وب است و بنابراین احتیاجی به نصب این نرم افزار روی دستگاه مورد استفاده نمیباشد. جهت به کارگیری این ابزار باید کد شناسایی مولکول مورد نظر وارد نرم افزار شود. کد چهار رقمی مولکول ها در پایگاه اطلاعاتی PDB موجود است. Jmol اطلاعات کامل مولکول ها از جمله نوع و تعداد اتم ها، ساختار زنجیره ها و توالی های بکار رفته در مولکول، رزولوشن و غیره را به دست داده و پیوندهای مولکولی و فواصل و زاویه ها و اطلاعات مربوط به آنها را مشخص می کند. این نرمافزار مرتباً به روز رسانی شده و بنابراین اطلاعات جامع و به روزی را در بر میگیرد. همچنین می توان این نرم افزار را روی گوشیهای هوشمند و آیپد ها به کار برد.
- RNAstructure: نرمافزاری رایگان است که جهت تحقیقات بیوانفورماتیکی مورد استفاده قرار میگیرد . RNAstructure ساختار دوم DNA و RNA را نمایش میدهد و همچنین احتمال هیبریداسیون باز ها را محاسبه و میزان پایداری هر یک از این پیوندها را مشخص می کند. همچنین این ابزار، تمایل اتصال مولکول های زیستی به RNA موردنظر را نیز محاسبه میکند. نرم افزار مذکور قابلیت نصب و اجرا بر روی سیستم های مختلف را دارا می باشد.
- Hex: یک نرم افزار بیوانفورماتیکی رایگان و اختصاصی جهت داکینگ مولکولی(پروتئین_پروتئین) است. این نرم افزار رایگان بوده و روی انواع سیستم عامل ها قابل اجراست. با استفاده از این نرمافزار میتوان انژی کل برهمکنش را محاسبه کرده و همچنین با توجه به شباهت شکل، انرژی و …،برهمکنش را شبیهسازی نمود.
- Cn3D: از برنامههای کاربردی در این زمینه است که دارای حجم کمی بوده و مختص نمایش درشتمولکول ها به ویژه پروتئین هاست. این نرم افزار امکان مشاهده ساختار های دوم پروتئینی و برخی اصلاحات ساختاری به روی آن ها را در دسترس خواهد گذاشت.
- Chromas: ابزار بسیار کاربردی بیوانفورماتیک در زمینه ژنومیکس و پروتئومیکس است. این نرمافزار توالی ژن ها را مشخص میکند و نتیجهی تعیین توالی و همچنین نتیجه آنالیزها از قبیل سنگر را در قابل فایلی با پسوند abi ارائه میدهد . با استفاده از این نرم افزار میتوان آنالیز های فیلوژنی یا ویرایش اطلاعات موجود در فایل دریافتی را با تبدیل پسوند به fasta انجام داد.
- Fast PCR: یک نرم افزار بیوانفورماتیکی ساده و کاربردی است. این نرم افزار محیط کاربری جذاب و امکان ویرایش و مشاهده انواع توالی ها، آمالیز پرایمر و پروب و همچنین ویرایش ژن ها را فراهم میآورد. با استفاده از این نرم افزار به آسانی میتوانی کلونینگ مجازی را انجام داد.
- CLC: نرم افزاری جهت آنالیز تخصصی اطلاعات ژنومی و پروتئومی است. این نرم افزار بر روی سیستم عامل های مختلف از جمله ویندوز، لینوکس و مک قابل اجراست. CLC امکاناتی همچون بررسی توالی های ژنی و پروتئین ، نقشهی جایگاه برش آنزیم های محدود کننده، کلونسازی مجازی، طراحی پرایمر و پروب و برچسب زنی ژن ها را دارا میباشد.
- OVITO: یک نرم افزار بیوانفورماتیکی گرافیکی ساخت کشور آلمان است که بیشتر در زمینه ی آنالیز و مشاهده ی ساختارهای اتمی شبیه سازی شده مورد استفاده قرار میگیرد. استفاده از آن بسیار ساده می باشد و شباهت بسیار زیادی به نرم افزار VMD دارد.
- ArgusLab: ابزاری برای مدلسازی مولکولی است که بیشتر در حوزهی مدلسازی ساختار های اتمی پیچیده و پایدارسازی آن ها مورد استفاده قرار میگیرد. این نرم افزار رایگان ساخت کشور آمریکا بوده و روی نسخه های مختلف سیستم عامل ویندوز قال بکار گیری است. از اصلی ترین امکانات این نرم افزار، انجام داکینگ پروتئین-لیگاند در آنالیزها و غربالگری های دارویی است.
برخی ابزارهای بیوانفورماتیکی در حوزه ژن ها
- ArrayExpress
بایگانی ژنومیک عملکردی داده ها را از آزمایش های ژنتیک عملکردی با توان بالا ذخیره می کند و این داده ها را برای استفاده مجدد در جامعه تحقیق فراهم می کند.
- BLAST
این ابزار مناطقی از شباهت را بین توالی های بیولوژیکی پیدا می کند. این برنامه توالی نوکلئوتیدی یا پروتئینی را با پایگاه داده های توالی مقایسه می کند و اهمیت آماری را محاسبه می کند.
- GenePattern
این سیستم گردش کار علمی قدرتمند که دسترسی به صدها ابزار تجزیه و تحلیل ژنومی را فراهم می کند، طراحی شده است تا محققان را قادر به توسعه ، ضبط و تکثیر روشهای تحلیل ژنومی کند.
- Genome
این منبع اطلاعات مربوط به ژنوم ها شامل توالی ها ، نقشه ها ، کروموزوم ها و … را ترتیب می دهد.
- IHEC
کنسرسیوم بین المللی اپی ژنوم انسانی (IHEC) مجموعه ای کامل از اپی ژنوم های مرجع مربوط به سلامتی و بیماری را در دسترس قرار می دهد.
- Nucleotide
بانک اطلاعاتی Nucleotide مجموعه ای از سکانس های مختلف از منابع مختلف از جمله GenBank ، RefSeq ، TPA و PDB است که داده های توالی ژنوم ، ژن و رونوشت پایه و اساس تحقیقات و کشف پزشکی را فراهم می کند.
- مرورگر ژنوم UCSC
ابزاری که به شما امکان می دهد داده های ژنومی موجودات مختلف مدل را به صورت تعاملی مشاهده کنید.
- Vista
مجموعه ای کامل از برنامه ها و پایگاه های داده برای تجزیه و تحلیل مقایسه ای توالی های ژنومی است.
- (Gene (NCBI
این پنل اطلاعات مربوط به طیف گسترده ای از گونه ها را ادغام می کند که شامل نامگذاری ، توالی های مرجع (RefSeqs) ، نقشه ها ، مسیرها ، تغییرات ، فنوتیپ ها و پیوندهای مربوط به ژنوم ، فنوتیپ و منابع خاص در سراسر جهان باشد.
برخی ابزارهای بیوانفورماتیکی در حوزه پروتئین ها
- UniProt
مأموریت UniProt فراهم کردن یک منبع جامع ، با کیفیت بالا و رایگان و در دسترس از توالی پروتئین و اطلاعات کاربردی است.
- Protein Data Bank
بایگانی بانک داده پروتئین (PDB) به عنوان مخزن واحد اطلاعات در مورد ساختارهای سه بعدی پروتئین ها ، اسیدهای نوکلئیک و ساختارهای پیچیده خدمت کرده است.
- Protein
بانک اطلاعاتی پروتئین مجموعه ای از سکانس ها از منابع مختلف ، از جمله ترجمه از مناطق کدگذاری در GenBank ، RefSeq و TPA و همچنین سوابق SwissProt ، PIR ، PRF و PDB. توالی پروتئین تعیین کنندهی اساسی ساختار و عملکرد بیولوژیکی است.
آشنایی با NCBI
با تکمیل پروژه ی ژنوم انسان، یکی از اهداف مهم بیوانفورماتیک که تحلیل توالی ها می باشد، محقق شد. اما رفته رفته با پیشرفت هایی که در زمینه ی بیوانفورماتیک حاصل شد، احساس نیاز به یک پایگاه داده که تمام اطلاعات مربوط به توالی ژن ها و پروتئین ها را ذخیره و نگهداری کند، بیشتر نمایان شد. علم بیوانفورماتیک با بهره گیری از پایگاه های داده ی متعدد و نرم افزار های مختلف، امکان بررسی ساختار، عملکرد، تفاوت های توالی های متعدد به منظور مطالعات تکاملی و … را فراهم می نماید. تا به امروز اطلاعات مربوط به توالی های موجودات مختلف در پایگاه های داده ذخیره و برای اهداف گوناکون در اختیار محققین قرار گرفته است. همانطور که اشاره شد، حفظ و نگهداری انبوه اطلاعات ژنتیکی به منظور دسترسی سریع محققین نیازمند پایگاه داده های زیستی یا بانک اطلاعاتی است. از جمله پایگاه های داده ی اصلی می توان به GeneBank، EMBL و DDBJ اشاره نمود که به ترتیب پایگاه داده ی GeneBank توسط مرکز ملی اطلاعات بیوتکنولوژی آمریکا ((NCBI واقع در انستیتو ملی سلامت (NIH) مدیریت می شود. پایگاه داده ی EMBL توسط انستیتو بیوانفورماتیک اروپا (EBI) اداره می شود و پایگاه داده ی DNA (DDBJ) توسط انستیتو ملی ژنتیک ژاپن اداره می شود. این پایگاه های داده به گونه ای طراحی شده اند که افزودن یا به روز کردن اطلاعات حتی توسط کاربران نیز امکان پذیر می باشد، لذا اطلاعات یا داده های جدید هر 24 ساعت بین این سه پایگاه داده اشتراک گذاری و مبادله می شود. پایگاه داده ی GeneBank به عنوان جامع ترین پایگاه داده علاوه برفراهم کردن مکانی برای ذخیره سازی اطلاعات، شامل انبوهی از مقالات علمی در زمینه ی زیست شناسی و علوم مرتبط، اطلاعات مربوط بهDNA ژنومی، اطلاعات مربوط به STS، اطلاعات مربوط به GSS، اطلاعات مربوط به EST و … می باشد.
NCBI یا همان پایگاه داده ی GeneBank از موتور جستجوی Entrez استفاده می کند که یک سیستم یکپارچه بازیابی اطلاعات می باشد و قادر به جستجوی همزمان در بانک های مختلفی نظیر GeneBank، ژنوم کامل انسان و سایر موجودات، پایگاه داده ی Refseq، Pubmed، توالی ها و ساختمان پروتئینی، تاکسونومی، پایگاه داده بیماری های ژنتیکی (OMIM) و سایر پایگاه های داده ی مشابه می باشد.