第一篇:王曉然,10微生物,實驗3生物信息學(xué)作業(yè)上海師范大學(xué)實驗報告
上海師范大學(xué)實驗報告
實驗序號 實驗3
實驗名稱
DNA或RNA序列分析
實驗三
一、實驗內(nèi)容
1.Search for the Blocks in the 5'UTR of HCV, BVDV and CSFV.寫下Blocks的序列, 序列在各病毒5'UTR中的位置以及Blocks的重要程度。2.Search for the Blocks in the 5'UTR of BDV, BVDV and CSFV.寫下Blocks的序列, 序列在各病毒5'UTR中的位置以及Blocks的重要程度。
二、實驗報告的內(nèi)容:
1、基本原理
(序列分析的基本原理的有關(guān)內(nèi)容)
利用計算機(jī)對基因序列中包含的數(shù)據(jù)(全序列或部分序列)進(jìn)行數(shù)據(jù)挖掘,而其實現(xiàn)的手段是將被分析的序列的元素通過各種算法轉(zhuǎn)化為簡單的,直觀的,便于計算機(jī)處理的數(shù)值的方法。
為了找出序列中的Blocks,可以借助Gibbs抽樣法,也就是在多重序列中找出體現(xiàn)序列特性的最低模型,經(jīng)Gibbs抽樣法或EM法等反復(fù)抽樣分析,得到Blocks,則包含在Blocks的序列已經(jīng)具有顯著性意義。2,操作步驟
(1)將MACAW軟件復(fù)制到C盤根目錄下,因為是外文軟件,其所在的文件夾的路徑中不能包含中文字符。
(2)雙擊MACAW.exe,在file菜單下選擇 new project,彈出對話框后,在sequence type中選擇DNA(3)打開數(shù)據(jù)文件HCV5'UTR.txt BVDV5'UTR.txt CSFV5'UTR.txt,將基因序列整理到一個txt文件中,即以下內(nèi)容,將以下內(nèi)容通過快捷鍵Ctrl+C, Ctrl+V復(fù)制粘貼到MACAW中,內(nèi)容是: >HCV5'UTR gccagcccctgttgggggcgacactccaccatagatcactcccctgtgaggaactactgtcttcacgcagaaagcgtctagccatggcgttagtatgagtgtcgtgcagcctccaggaccccccctcccgggagagccatagtggtctgcggaaccggtgagtacaccggaattgccaggacgaccgggtcctttcttggatcaacccgctcaatgcctggagatttgggcgtgcccccgcgagactgctagccgagtagtgttgggtcgcgaaaggccttgtggtactgcctgatagggtgcttgcgagtgccccgggaggtctcgtagaccgtgcacc
>BVDV5'UTR atgcccttagtaggactagcaaaaggaggggactagcggtagcagtgagttcattggatggcctaatccctgagtacagggaagtcgtcaatggttcgacactccatcagttgcggagtctcgagatgccatgtggacgagggcatgcccaaggcacatcttaacctatgcgggggttgcataggcgaaagcaccattcgtggtgttatggacacagcctgatagggtgtagcagagacctgctattccgctagtaaaaactctgctgtacatggcacatggagttga
>CSFV5'UTR Gtatacgaggttagttcattctcgtatgcatgattggacaaattaaaatttcaatttggatcagggcctccctccagcgacggccga(4)(5)(6)
(7)(8)actgggctagccatgcccacagtaggactagcaaacggagggactagccgtagtggcgagctccctgggtggtctaagtcctgagtacaggacagtcgtcagtagttcgacgtgagcagaagcccacctcgatatgctatgtggacgagggcatgcccaagacacaccttaaccctagcgggggtcgctagggtgaaatcacaccacgtgatgggagtacgacctgatagggtgctgcagaggcccactattaggctagtataaaaatctctgctgtacatggcacatggagt 在edit菜單下選擇select all 在alignment菜單下選擇search for Blocks 彈出的對話框中選擇Gibbs sampler,默認(rèn)的pattern width參數(shù)為18到24,點擊begin開始,選擇評分最高的的blocks,點擊link,可以把blocks放在一起,使得觀察起來更直觀。
回到schematic對話框中,鼠標(biāo)點擊序列名稱,出現(xiàn)小黑箭頭時,左下方會顯示這幾個序列的blocks所在的位置是第幾到第幾個核苷酸。在window菜單下選擇alignmen,彈出alignmen界面,然后在file菜單下選擇export輸出結(jié)果,序列中大寫字母的序列是blocks
三、實驗結(jié)果
1.5'UTR of HCV, BVDV and CSFV這些序列的blocks以及位置在哪里?重要性如何? 答:HCV5'UTR: 278-ACTGCCTGATAGGGTGCTTGCGAG-310 重要性:maybe BVDV5'UTR:214-ACAGCCTGATAGGGTGTAGCAGAG-237 CSFV5'UTR:306-ACGACCTGATAGGGTGCTGCAGAG-329 2.5'UTR of BDV, BVDV and CSFV這些序列的blocks以及位置在哪里?重要性如何? 答:BDV5'UTR:
356-TCTGCTGTACATGGCACAT-374
重要性:yes BVDV5'UTR:
262-TCTGCTGTACATGGCACAT-280 CSFV5'UTR:
357-TCTGCTGTACATGGCACAT-375
四、討論
1. 結(jié)果分析:HCV的5’URT區(qū)與BVDV、CSFV中存在blocks,但相關(guān)度不高,而BDV, BVDV and CSFV三個序列間存在相關(guān)度很高的blocks。2. 經(jīng)驗教訓(xùn);注意事項;心得體會:
(1)Macaw是外文軟件,存在的盤符路徑中不能有中文字符。(2)在導(dǎo)入序列之前,必須先新建一個project,確定是尋找蛋白質(zhì)blocks還是DNA的blocks。(3)只有FASTA格式的DNA序列才能被Macaw軟件識別,可以在txt文檔中編寫FASTA格式的序列,寫序列名稱時,必須加個>號。(4)在搜索blocks之前,必須選定尋找范圍
(5)想要導(dǎo)出幾個序列之間的blocks,轉(zhuǎn)換成txt文檔時,必須切換到alignmen窗口。并且起文件名是最好是英文字母與數(shù)字的組合,不然保存可能會失敗。