ورود به حساب کاربری

نام کاربری *
رمز عبور *
مرا به خاطر بسپار.

بنیاد توسعه رایانش سریع و ابری

HPC and Cloud Computing Development Foundation

آموزش جامع و عملی روش BLAST (نرم افزار بلاست) در سایت NCBI و آموزش کشف ژن های جدید با این تکنیک

آموزش blast در NCBI

فرض کنید میخواهیم بیان ژن هیستون 3 (H3) را در برگ های گیاه گندم بررسی کنیم. اما از آنجایی که پروژه ژنوم این گیاه کامل نشده است و توالی تمام ژن های این گیاه در پایگاه های داده موجود نمی باشد. نمی توان با جستجوی نام این ژن در پایگاه های داده مثل NCBI توالی RNA آن را جهت طراحی پرایمر و بررسی بیان پیدا نمود. حال راه حل چیست؟

پاسخ: از آنجایی که توالی های بیانی این گیاه (EST)موجود می باشد می توان از طریقه بلاست کردن توالی این ژن بین گونه نزدیک به گندم مثلا گیاه جو که این ژن در آن شناسایی شده است با توالی های EST گیاه گندم ژن مربوط به هیستون 3 را در گیاه کندم نیز پیدا نماییم.

 

شکل 10: پس قدم اول: یافتن توالی RNA این ژن در گونه نزدیک به گندم. از آنجایی که توالی هیستون در بین همه موجودات به شدت حفاظت شده می باشد در این بررسی میخواهیم از طریق توالی ژن هیستون 3 انسان همین ژن را در گندم یافت نماییم. با جستجو در پایگاه داده می توان لیست این ژن در تمام موجودات شناسایی شده مشاهده کرد (جسنجو در این شکل به انسان محدود شده است).

 

 

شکل 11: پس از کلیک برروی اسم ژن برای انسان در شکل قبلی به صفحه ژن H3 وارد می گردید برای رفتن به صفحه توالیRNA این ژن برروی گزینه RefSeq RNAs و برای رفتن به صفحه تعیین توالی پروتئینی برروی گزینه RefSeq Proteins کلیک کنید.

 

 

شکل 12: توالی mRNA ژن H3 در انسان (لینک)

از این توالی جهت یافتن ژن H3 در EST های گندم استفاده میگردد که بر اساس آن میتوان بیان این ژن را بررسی نمود.

 

 

شکل 13: صفحه بلاست در سایت ncbi موجود میباشد. در بالای این صفحه می توانید 4 نوع بلاست را مشاهده کنید. نوع TblastX را در این صفحه میتوانید مشاهده فرمایید.

 

آموزش عملی بلاست نوکلئوتید (blastN) برای یافتن ژن H3 در گندم.

برای انجام این بلاست به این آدرس بروید. 

  

شکل 14: صفحه اولیه انجام nucleotide blast به این شکل می باشد. که بررسی این صفحه در شکل های بعدی خواهیم پرداخت.

  

شکل 15: در این کادر توالی مورد نظر خود را وارد مینماییم (توالی ژن انسانی H3 )

  

شکل 16: در این کادر تعیین میکنیم که جستجو در چه نوع توالی هایی انجام بپذریرد

 

انواع داده های این قسمت شامل قسمت های زیر است :

(Nucleotide collection (nr): شامل تمام توالی هایی که در پایگاه داده NCBI ثبت شده است مانند توالی ژنومی و mRNA ها و سایر RNAها

(Reference RNA sequenc(refseq_rna  : شامل توالی های مورد تایید برای mRNA ژن ها. اگر به دنبال یک ترانسکریپت خاص باشید در این قسمت باید جستجو کنید (در صورتی که آن ژن شناخته شده باشد)

(Reference genomic sequence (refseq_genomic: شامل توالی DNA (ژنومی) برای موحودات می باشد. بنابراین اگر می خواهید محل یک ژن را بر اساس توالی mRNA آن بیابید باید از این گزینه استفاده کرد

(Expressed sequence tag (EST: شامل توالی تمام RNAهای موجود برای موجودات می باشد که شامل همه ژن های شناخته شده و همچنین ژن های ناشناخته می باشد.

  

شکل 17: در این قسمت باید نام گونه ای که میخواهیم در آن جستجو کنیم وارد کنیم که در اینجا گندم است. در صورتی که هیچ گونه ای وارد نشود جستجو در تمامی موجودات انجام می پذیرد.

  

شکل 18: در ناحیه باید میزان شباهت بین دو گونه یکی از این سه گزینه را انتخاب نمایید.

(Highly similar sequences (megablast: در صورتی که جستجو در یک گونه انجام می پذیرد. چون توالی Query و subject بسیار به هم شبیه هستند(بیشتر از 75 درصد شباهت بین دو توالی) از این گزینه استفاده میکنیم.

(More dissimilar sequences (discontiguous megablast: در مقایسه دو گونه نزدیک به هم استفاده می شود یا حالتی که توالی Query و subject مقداری از هم تفاوت دارند (بین 60 تا 75 درصد شباهت بین دو توالی).

(Optimize for Somewhat similar sequences (blastn : برای مقایسه بین گونه های دور از هم و یا حالتی که توالی Query و subject از هم تفاوت (بیش از 50 درصد تفاوت ) دارند.

استفاده از گزینه دوم و سوم برای دو توالی که مشابه نیز می تواند به کار برود اما گزینه اول برای دو گزینه بعدی نتیجه ای به همراه نخواهد داشت.

بعد از انجام تنظیمات فوق برروی گزینه BLASTکلیک می کنیم.

 

شکل 19: هنگامی که عملیات بلاست در کامپیوتر های پایگاه داده NCBI در حال انجام است این صفحه به نمایش در می اید که به صورت اتوماتیک نوسازی می گردد. تا انجام کامل عملیات این صفحه به صورت خودکار به صفحه نتایج منتقل میگردد.

 

  

شکل 20: در صفحه نتایج ، این نمایشی گرافيکی از نتایج BLAST است به طوری که ١٠٠ توالی اولی که در جستجوی BLAST به دست آمده اند به صورت خطوط رنگی نشان داده می شوند هر توالی بر اساس ميزان شباهت خود دارای یک طيف رنگی است .کليد رمز رنگ ها بر اساس امتياز همرديفي در بالای آن آمده است. هر چه قدر جور شدن توالي يافت شده با توالي در حال جستجو بيشتر باشد با رنگ قرمز و هر چه کمتر باشد با رنگهای رو به مشکی نمایش داده می شود. بنابراین در این قسمت در یک نگاه کلی می توانيم ميزان شباهت را مشاهده کنيم .

آموزش تفسیر نتایج بلاست ، e value چیست؟

 

شکل 21:

در بخش سوم شماره دسترسي (شماره 7) و نام( شماره 1) توالی های بدست آمده فهرست شد هاند. روبروي هر توالی دو عدد هست. اولين عدد امتياز همرديفي دوگانه (شماره 3 و2) توالي يافت شده و توالي در حال جستجو است که آليه اطلاعات بعدي بر اساس آنها مرتب می شوند. دومين شاخص، ارزش مورد E-value (شماره 5) می باشد که برای قابل قبول بودن توالی یافت شده باید این عدد کمتر از 0.01 باشد، در غیر این صورت جفت شدن توالی ها تصادفی می باشد. شماره 6 میزان شباهت دو توالی را نشان میدهد، شماره 4 درصدی از توالی ها که با هم همپوشان هستند را نشان میدهد.

 

 

شکل 22: در این قسمت هم میتوانید جفت شدن دو توالی query و subject را مشاهده کنید.

 

سوال: کدام توالی مربوط به ژن H3 در گندم می باشد؟

جواب: در صفحه نتایج ما چندین توالی را مشاهده میکنیم که داری امتیاز بالا در جفت شدن با توالی شناخته شده ( توالی H3 انسانی) می باشند همه این توالی ها داری E value کمتر از 0.01 می باشند. و همچنین دارای درصد شباهت بالا و درصد همپوشانی بالا می باشند. بنابراین تمام توالی هایی که دارای طول مناسب (هر چه توالی بلندتر بهتر) می توانند کاندیدهای مناسبی برای ژن H3 گندم باشند که البته نیازمند بررسی های بعدی می باشد مانند تعیین توالی پروتئینی ( بلاست blastX).

 

سوال: آیا توالی ای که یافته ام پروتئینی کد میکند؟ و آیا این پروتئین شبیه پروتئین های H3 می باشد؟؟

جواب: باید از blastX استفاده نمود

 

 

شکل 23: برای دانلود توالی یافت شده به این گونه عمل نمایید. از منوی download گزینه (fasta (complete sequence با انتخاب و سپس continue را کلیک کنید تا توالی در یک فایل دخیره شود. این توالی را با word و یا notpade باز کنید.

  

 شکل فوق: برای دانلود سکانس چند توالی کافی است ابتدا تیک تمام توالی های مورد نظر را زده و سپس مانند گزینه فوق عمل کنید.

 

آموزش عملی انجام blastX برای یافتن ژن H3 در گندم

 

 

شکل 25: از توالی فوق برای انجام blastX استفاده میکنیم (لینک) . در این صفحه هیچ گونه ای را انتخاب نمیکنیم و یا گونه های نزدیک به گندم مانند جو استفاده میکنیم تا مشخص شود آیا این توالی یافت شده تولید پروتئین H3 را مینماید و یا خیر؟

در این صفحه میتوانیم گزینه های (nr) و یا (refseq_protein) را انتخاب کنیم.

 

 

شکل 26: در صفحه نتایج می توان مشاهده کرد که توالی یافت شده مربوط به هیستون ها می باشد

 

 

شکل 27: در توالی های یافت شده میتوان دید که پروتئین H3 هم وجود دارد بنابراین می توان گفت که توالی یافت شده به ژن H3 مرتبط می باشد.

 

شکل 28: جفت شدگی بالای بین توالی ها که تایید کننده هویت توالی کشف شده به عنوان ژن H3 میباشد.

آموزش عملی TblastX برای یافتن ژن H3 در گندم

 

 

شکل 29: بلاست نوع TblastX هم شبیه نوع blastnمی باشد. تنها تفاوت ان در نحوه انالیز داده ها می باشد.

 

 

شکل 29: صفحه نتایج بلاست نوع TblastX

با مقایسه شکل 29 و شکل 22 می توانید مشاهده نمایید که TblastX نتایج بهتری را ارائه میدهد ( با تعدا جفت شده های بیشتر و امتیاز بیشتر). بنابراین در بلاست بین گونه های دور از هم بهترین گزینه TblastX می باشد.

سوال: روش دیگر یافتن توالی H3 در گندم چیست؟

جواب: tBLASTN، با استفاده از این روش ما توالی پروتئین H3 را با توالی های EST گندم مقایسه می کنیم تا توالی EST مشابه پروتئین H3 را یافت کنیم.

 

--------------------------------------------

منبع : pishgam-bio.ir