第一篇:生物信息學與林業現代化[最終版]
生物信息學在林業生物技術上的應用
林業是整個農業的重要組成部分,肩負著調節生態環境、促進生物資源的合理利用以及提高農民經濟收入等多種重任,對于實現國民經濟的可持續發展有著至關重要的意義。從這些年林業的發展來看,一方面,工業的污染、農業的過度開墾、城市化的進程等對林業及其相關資源造成嚴重的破壞,使得越來越多的人認識到發展林業、改善生態環境迫在眉睫,而另一方面,低效的經營管理模式和落后的科學研究水平困擾著林業的發展。發展林業需要解決的問題很多,如人工造林的生態效應問題、森林病蟲害的防治和種質資源的保護及開發等,這些問題的深入分析和解決離不開現代生物學技術。
現代生物技術已進入分子水平,特別是,隨著人類基因組工程的開展,生物信息學作為一門獨立的學科產生,它對于分子生物學技術的廣泛應用和生物學科之間的資源共享起到非常重要的作用。而這正是這一點,將在幫助林業工作者改造傳統林業中發揮積極的作用。
1.林業生物技術的發展
一直以來,人們都在積極探索利用生物技術來改善農林業生產,從其整個發展歷程來說,大致可分為三個階段。在分子生物學產生以前,生物的研究主要基于性狀描述和分析為主,大多只停留在現象的觀察和簡單的生理生化分析。由于林業的一些現實問題,如林木生長周期長,木本通常都較為高大,且處于復雜的生態環境中等,使得在林業上應用生物技術較為困難。隨著DNA雙螺旋現象的揭示,使得分子生物學逐漸發展起來,對生命現象的研究逐漸進入到分子和基因的水平,以細胞和組織培養、基因工程為代表的一系列生物技術成為改造傳統農林業的重要工具,由于物種之間遺傳本質的相似性,在農業上應用的生物技術在一定程度上可應用于林業的生產和科研。但是,由于這一階段的生物技術是在原有生物性狀觀察的基礎上發展而來的,即生物科學和技術基本上是為了解決上一階段提出和遺留的問題,因此缺乏系統性,難以解釋和解決一些復雜的生命問題,因此生物技術只能在林業生產中發揮輔助作用,而傳統的生產和經營模式往往起了決定性作用。
自上個世紀九十年代以來,隨著人類基因組工程有關工作的開展,分子生物學進入到一個新的水平,對生物科學的研究逐漸進入到基因組水平,生物技術逐漸包含更多的內容,除了對原有轉基因動植物技術有更多的發展之外,還涉及基因組工程、蛋白質組工程、生物信息學技術、生物芯片技術等高新生物技術。由于人類基因組工程相關工作的開展,帶來了生物學相關數據的急劇增加,為了儲存、管理、分析和利用這些大量數據,不得不借助于現代信息學技術,隨著更多物種在基因組層次上的研究,生物信息學漸漸成為一門獨立的學科,滲透到生物學科的各個研究領域,成為現代生物技術的重要工具。從基因識別、克隆,到種質鑒定、基因表達分析,特別是在此基礎上發展的比較基因組學,大大拓寬了生物技術的應用范圍。這些在醫學方面首先進行的工作,已經在農業領域初顯成效,利用積累的材料和方法,科學家已經完成或正在進行一些模式植物和模式作物的基因組測序和基因表達分析,如擬南芥、水稻、小麥等。中國在這方面也顯示了相當的實力,如獨立完成了超級稻的基因組框架圖。在林業上,中國有相當豐富的資源,在今后相當長的時間里,隨著測序、基因芯片等技術的普及,將有大量獨創性的工作可以去做。
總之,生物信息學在很大程度上促進了生物學科之間的資源和方法上共享,實現從整體和本質上把握生命規律的重要途徑,它的任務也不僅僅是有關疾病、藥物篩選,它已經滲透到分子生物學的各個領域,因此,充分利用生物信息學提供的方法和資源,是當今發展林業生物技術的重要方面。
2.生物信息學在林業生物技術上的應用
2.1生物信息學對林業生物技術的重要作用
生物信息學旨在存儲、管理、分析和利用這些生物信息,是生物學、數學和信息學等多學科緊密結合,知識性強的學科。生物信息學作為生物技術的重要手段,加強了生物技術的創新能力,使其日益成為知識密集型的科學創新體系。在這一體系中,能夠實現資源共享,避免重復建設,實現效率的最大化。借助生物信息學,生物學家不僅能存儲和管理大量生物學數據,更為重要的是可以進行系統分析和處理,盡可能獲取有用信息,減少費時的實驗,從而大大提高了生物技術的效率。例如科學家現在已經掌握較為可靠的計算機輔助預測植物基因改良試驗的結果,從而減少在各種條件下檢驗基因改良植物生長的實驗。因此,可以說生物信息學是生物科學研究和生物技術開發的捷徑,甚至從某種程度上說,沒有生物信息學技術,就無法研究生物的基因組,也就談不上現代生物學技術。
生物信息學的的數據在不斷增加,以國際著名的基因數據庫Genebank為例,至2002年3月,其核酸序列已達到一千五百萬條左右,涉及十萬多種生物,而且還在飛速增長。特別是對于基因表達方面研究的深入,EST序列增加最大,使得核酸序列總量平均每15個月翻一翻。在這些序列中人類基因組數據占到38%,為最多。現在,其它與基因組研究有關的數據也在不斷增長,包括蛋白質序列數據、基因表達數據和生物分子的三維結構等。這些工作基礎對于農林業的研究是不可多得的寶貴資源。
生物信息學帶來的是“知識銀行”,它包括重要的思想和方法,對加快林業現代化有著重要的意義。我們知道物種之間千差萬別,但是生物在基因組層次上,往往蘊藏著很多相似的機理,因而,通過比較基因組學研究,科學家可以將在某些物種上的已有研究成果轉用到其它物種上,這對林業的發展特別有用。利用基因組信息不僅可以獲得生物體之間的相同信息,同時也可以區別生物體之間在微小差別,從而為農業上優良品種的篩選提供了方便。如分子標記技術,單核苷酸多態性等(SNP)等。另外,生物信息學有助于解決很多生態環境方面的問題,如開展種質保存工作,如何評價轉基因植物的風險等。總之,生物信息學實現了生物科學和信息技術的緊密結合,實現了各物種之間在種質遺傳和基因調控等方面研究與應用的資源共享,開拓了研究生物發育進化等復雜生命現象的新局面,將大大加快林業生物技術的發展步伐。
2.2生物信息學在林業生物技術上的應用
生物信息學在林業上的應用主要有:生物種質資源的調查、研究;利用分子標記和基因組測序構建基因圖譜,進行基因定位;為林木育種提供基因材料和轉基因方法;進行高通量基因表達譜的分析和比較等。
在林業上,為了保持水土,在構建防護林時,科技工作者優先考慮的是生長繁殖能力強,能耐各種脅迫的樹種,最好還具有一定的經濟價值,由于在現實中選擇具有這些優良特性的樹種是很困難的,因此可以考慮用基因工程的方法培育轉基因樹木,運用生物信息學的知識,人們可以考慮直接將其它物種的耐脅迫相關基因甚至基因調控途徑轉入有較高經濟價值的樹種中,特別是一些調控序列,由于存在基因序列的保守性,甚至可以考慮將動物的有關調控基因轉入植物,從其后代篩選抗性植株。實際上,從事農業研究的科學家已經從基因組學的發展中得到了很多有價值的信息和材料,例如模式植物擬南芥的基因組研究已經非常深入了,人們從中獲得了一些重要基因,這些基因有的可直接用于作物遺傳改良,有的可以幫助我們了解作物的相關基因調控機理。在林業上的相關工作較少,但近年來也有不少嘗試,如我們知道,擬南芥的LFY基因是重要的花分生組織調控基因,當過量或異位表達時,可觀察到擬南芥在不同位置提前開花,Pena L.等將這一基因用于柑橘類的改良,結果大大縮短了繁殖周期[1]。這一成果有著非常重要的意義,因為林業科研工作者都知道,林木生長周期長,樹體高大,研究起來比較困難,特別對于經濟林,這又往往是制約生產經營的瓶頸,而
這方面的研究極有可能使這一狀況得到改善,即培育出速生、矮小的經濟林木。中草藥是我國寶貴的財富,深入進行中草藥的作用機理研究,揭示中草藥所具有的獨特功效,生物信息學將在其中大顯身手,其研究的方法有基因組和蛋白質組的分析比較,特別是近來熱門的高通量生物芯片檢測技術,在檢測疾病產生和治療過程中復雜的基因相互作用方面發揮了積極的效用。在加拿大,它們開展了白楊和云杉的基因組研究,已便改進材質等,另外,他們還利用生物的基因組信息研究林木的病蟲害防治,它們研究了云杉蚜蟲的基因組和其病毒基因組的特點,利用它們的相互作用來控制病蟲害,從而減少化學殺蟲劑的使用。在澳大利亞,已經開展桉樹的基因組測序,正在克隆相關的功能基因,澳大利亞政府希望通過從基因組層次的研究,使本國的林業占有技術上的優勢,從而在產業上贏得更大的市場份額。在歐洲,歐盟的農業發展計劃綱要里提到,生命科學、信息學和工程技術的交叉點是知識經濟的前沿,未來研究的重點在于植物和動物的基因組及其相關性研究,基因組學方面的研究包括病蟲害防治、分子標記、基因組測序等。毫無疑問,上述技術的研究、推廣和產業化都離不開生物信息學的手段。
近年來,隨著林木基因工程的開展,很多人對轉基因樹木的生態效應表示關注,有些激進的“環保主義者”甚至動手破壞生物學家的研究成果。圍繞這些問題的深入分析,離不開生物信息學的參與。生物信息學對于生態環境的監測和評價有著十分重要的意義,特別是生態系統的生物多樣性、轉基因植物或外來植物對本地種群遺傳的影響、基因逃逸或基因突變對生態環境和種群生存的影響、珍稀或瀕危動植物的系統進化和保護對策以及轉基因食品的安全性等,生物信息學為我們提供了材料、依據和方法。
3.前景分析
林業要實現現代化,必須打破和其它學科的之間的界限,充分利用已有的研究思路和成果。用生物技術改造林業的前景是十分廣闊的,如木材材質的改良,開發適合的樹種,以減少對天然林的破壞;改善經濟林的品種和品質,使其起到美化環境,增加經濟收入,改善生態環境的多重作用;開發耐低溫,鹽堿的樹種,建造防護林帶;還有,在林業的病蟲害防治方面,尚有許多難題,如馬尾松的松材線蟲治理以及其它經濟樹種的各種病蟲害等。模式植物的已有研究為林業生物技術提供了豐富的材料,而要充分利用這些材料和方法,離不開生物信息學的手段。例如擬南芥基因組比較緊湊,利用其基因資源可以直接改良林木的品質,另外,可以利用其中的同源序列,特別是大量的EST序列,再結合基因組文庫,可以直接克隆到相關功能的基因,在此基礎上可以利用已有的蛋白質空間結構數據預測現有序列的蛋白質結構,提供基因、蛋白質相互作用的功能模型等。從農業糧食品種基因改良的已有經驗來看,不少野生林木品種的基因對于目前林木良種具有重要的價值,所以這些資源必須加以保護,而在現有條件下,可以有針對性地開展基因組相關研究,如分子標記,基因組文庫的建立,同源基因的克隆甚至基因組測序等等。
當然,林業生物技術的發展存在著不少障礙,例如植物組織培養,細胞培養,核酸純化等都較為困難,這就影響了生物技術的廣泛使用。發育生物學的研究,可以幫助我們調控林木的生長發育,從而在不同程度解決上述問題。發育生物學是現代生物科學研究的熱點之一,包括胚胎發育,分生組織形成和花發育等。這些重要的生理現象在物種之間往往是比較保守的,因此借鑒模式植物的研究成果,必將有利于林業在這方面開展工作[2]。值得指出的是,生物信息學已成為研究生物發育不可缺少的工具,這不僅僅是因為生物信息學提供了物種之間基因信息的比較等,更為重要的是生物的發育過程必然涉及生物基因組信息的程序性調控、大量基因之間以及基因與環境之間的相互作用。
發展生物信息學,加快林業科學研究步伐,當務之急是培養掌握生物信息學思想和方法的林業科研人員,我們的大專院校和科研院所應當積極開展這方面的學習。相信在不久的將
來,生物信息學將在林業生物技術的應用上開創一片新天地。
第二篇:生物信息學
淺談對生物信息學的認識
摘要生物信息學是采用計算機技術和信息論方法研究蛋白質及核酸序列等各種生物信息的采集、儲存、傳遞、檢索、分析和解讀的科學, 是現代生命科學與信息科學、計算機科學、數學、統計學、物理學和化學等學科相互滲透而形成的交叉學科。經過一學期的學習,我學到了很多很有用的知識,給我印象最深的有序列比對、蛋白質結構分析、核酸序列分析、數據庫及數據庫檢索等內容。關鍵字:生物信息學認識基因組學數據庫
時光飛逝,一學期馬上就要結束了,本學期的專業選修課也即將結束。在上課之前,我一直認為生物信息學就是在講關于人類及動物的基因,以及基因之間的差別。但是,剛上了幾節課,我就發現生物信息學根本不是我想象的那么簡單,就這樣我懷著對自己的懷疑和對這門課的好奇走進了這門課。
生物信息學是一門新興的、正在迅速發展的交叉學科,美國國家基因組研究中心認為, 生物信息學是一個代表生物學、數學和計算機的綜合力量的新興學(Bioinformatics is an emerging scientific discipline representing the combined power of biology,mathematics, and computers)。
現代生物信息學是采用計算機技術和信息論方法研究蛋白質及核酸序列等各種生物信息的采集、儲存、傳遞、檢索、分析和解讀的科學, 是現代生命科學與信息科學、計算機科學、數學、統計學、物理學和化學等學科相互滲透而形成的交叉學科。
在這短短的一學期課中,在老師的帶領下,我們學到了很多關
于生物信息學的知識,其中給我印象最深的有序列比對、蛋白質結
構分析、核酸序列分析、數據庫及數據庫檢索等內容。
比如,序列比對,它的基本問題是比較兩個或兩個以上符號序列的相似性或不相似性。從生物學角度來看,它包含很多意義;如從
相互重疊的序列片段中重構DNA的完整序列等。老師主要給我們介
紹了blast比對。
再如,對蛋白質的分析。比如我們實驗測定了一條蛋白質序列
或者從DNA序列翻譯得來一條蛋白質序列,我們要借助生物信息學
方法來對它進行基本性質及結構分析。其中基本性質包括它的分子
量、氨基酸數目、排列順序、等電點分析等。結構分析包括跨膜螺
旋分析等。要運用的工具是protparam tool 和TMHMM。對于這兩
個工具我都進行了實際操作練習,我覺得這對我們以后的理論學習
和實驗分析都非常重要。現代生物信息學的主要研究領域及其進展
1、基因組學和蛋白組學研究
基因組和蛋白組研究是生物信息學的主要內容.同樣, 生物信息
學是基因組和蛋白組研究中必不可少的工具。
基因組學(Genomics)和蛋白組學(Proteomics)的實質就是分析和解讀核酸和蛋白質序列中所表達的結構與功能的生物信息.這方面的研究已成為生物信息學的主要研究內容之一.一種生物的全部遺傳構成被稱為該種生物的基因組.有關基因組的研究稱為基因組學.其中, 序列基因組學(Sequence genomics)主要研究測序和核苷酸序列;結構基因組學(Structural genomics)著重于遺傳圖譜、物理圖譜和測序等方面的研究;功能基因組學
(Functional genomics)則研究以轉錄圖為基礎的基因組表達圖譜;比較基因組學(Comparative ge2nomics)的研究內容包括對不同進化階段基因組的比較和不同種群和群體基因組的比較。
蛋白組和蛋白組學的概念是隨基因組和基因組學的出現而出現的.蛋白組(proteme)的概念是由于基因表達水平并不能代表細胞中活性蛋白質的數量, 基因組序列并不能描述活性蛋白質所必需的翻譯后修飾和反映蛋白質種類和含量的動態變化過程而提出的.在一定條件下某一基因組蛋白質表達的數量類型稱為蛋白組, 代表這一有機體全部蛋白質組成及其作用方式.有關蛋白組的研究稱為蛋白組學.其中, 蛋白組的研究技術與方法、雙向凝膠電泳圖譜以及對不同條件下蛋白組變化的比較分析是蛋白組學的主要研究內容。生物信息學在基因組和蛋白組研究中所起的作用主要有:(1)基因組信息結構的計算分析.即對基因組數據進行大規模并行計算并預測各種新基因和功能位點, 研究大量非編碼區序列的信息結構和可能的生物學意義。(2)模式生物全基因組信息結構的比較研究.即
對已完成全基因組測序的各種模式生物的基因組信息結構進行比較分析, 包括同源序列的搜索比較和指導基因克隆.(3)功能基因組的相關信息分析, 包括對基因表達圖譜及其相關算法和軟件的研究, 與功能基因組信息相關的核酸、蛋白質的空間結構的預測模擬以及蛋白質的功能預測。
2、生物信息數據庫
復雜的生物和生物界和日新月異的生命科學研究產出的大量的生物學信息,對這些信息的儲存、檢索、比較分析必須借助于計算機數據庫技術, 包括各類生物學信息數據庫的建立與維護、數據的添加與注釋、更新與查詢、數據庫資料的網絡化等研究內容。現有的數據庫有:核酸序列數據庫(GenBank、EMBL、DDBJ)、基因組數據庫、基因圖譜數據庫、蛋白質序列數據庫(SWTSS-
PROT、PIR)和蛋白質結構數據庫(Interpro)等。隨著生命科學的不斷發展,數據庫種類不斷增加、結構日益復雜、使用也越來越方便。
生物信息學作為一門新興學科已經成為生命科學研究中必不可少的研究手段 本文對數據庫與數據庫搜索序列比對蛋白質結構預測藥物設計基因芯片技術幾個方面做了介紹較為系統地闡述了生物信息學在這些領域的應用 當然它所涉及的內容與方法遠遠不只上面提到的那些 新基因和 的發現與鑒定非編碼區信息結構分析遺傳密碼的起源和生物進化完整基因組的比較
研究 大規模基因功能表達譜的分析等都是生物信息學研究的對象 相信不久的將來生物信息學會在生命
科學領域扮演越來越重要的角色。
參考文獻:
1、現代生物信息學及其主要研究領域 蕭浪濤(湖南農業大學理學院, 湖南長沙 410128)
2、生物信息學技術進展 郭志云 張懷渝 梁龍 軍事醫學科學院 生物工程研究所,北京100071;四川農業大學生命科學及理學院,雅安 6250143、利用生物信息學技術研究蛋白功能的幾種方法 王劍利 楊章民綜述 王一理審閱 西安交通大學醫學院免疫病理學研究室(西安, 710061)
第三篇:生物信息學
生物信息學是上世紀90年代初人類基因組計劃(HGP)依賴,隨著基因組學、蛋白組學等新興學科的建立,逐漸發展起來的生物學、數學和計算機信息科學的一門交叉應用學科。目前生物信息學的研究領域主要包括基于生物序列數據的整理和注釋、生物信息挖掘工具開發及利用這些工具揭示生物學基礎理論知識等領域。生物信息學作為新型交叉應用學科,可以依托本校已有的計算機科學、信息學、生物學和數學等學科優勢,充分展現投入少、見效快、起點高的特色,推動學校學科建設和本科教學水平。
本實驗指導書中的8個實驗均設計為綜合性開發實驗,面向生物信息學院全體本科學生和研究生,以及全校對生物信息學感興趣的其他專業學生開放。生物信息學實驗室將提供系統的保障,包括采用mail服務器和linux帳號管理等進行實驗過程管理和支持。限選《生物信息學及實驗》的生物技術專業本科生至少選擇其中5個實驗,并不少于8個學時,即為課程要求的0.5個學分。其他選修者按照課時和學校相關規定計算創新學分。實驗一 熟悉生物信息學網站及其數據的生物學意義
實驗目的:
培養學生利用互聯網資源獲取生物信息學研究前沿和相關數據的能力,熟悉生物信息學相關的一些重要國內外網站,及其核酸序列、蛋白質序列及代謝途徑等功能相關數據庫,學會下載生物相關的信息數據,了解不同的數據文件格式和其中重要的生物學意義。
實驗原理:
利用互聯網資源檢索相關的國內外生物信息學相關網站,如:NCBI、SANGER、TIGR、KEGG、SWISSPORT、Ensemble、中科院北京基因組研究所、北大生物信息
學中心等,下載其中相關的數據,如fasta、genbank格式的核算和蛋白質序列、pathway等數據,理解其重要的生物學意義。
實驗內容:
1.瀏覽和搜索至少10個國外和至少5個國內生物信息學相關網站,并描
述網站特征;
2.下載各網站的代表性數據各10條(組)以上,并說明其生物學意義;
3.討論各網站適合做何種生物信息學研究的平臺,并設計一個研究設想。實驗報告:
1.各網站網址及特征描述;
2.代表性數據的下載和生物學意義的描述;
3.討論:這些生物信息學相關網站的信息資源,可以被那些生物信息學
研究所利用。
參考書目:
《生物信息學概論》 羅靜初 等譯,北京大學出版社,2002;《生物信息學手冊》 郝柏林 等著,上海科技出版社,2004;
《生物信息學實驗指導》 胡松年 等著,浙江大學出版社,2003。實驗二 利用BLAST進行序列比對
實驗目的:
了解BLAST及其子程序的原理和基本參數,熟練地應用網絡平臺和Linux計算平臺進行本地BLAST序列比對,熟悉BLAST結果的格式和內容并能描述其主要意義,同時比較網上平臺和本地平臺的優缺點。
實驗原理:
利用實驗一下載的核算和蛋白質序列,提交到NCBI或者其他擁有BLAST運算平臺的網頁上,觀察其基本參數設定庫文件類型,并得到計算結果;同時在本地服務器上學會用formatdb格式化庫文件,并輸入BLAST命令進行計算,獲得結果文件。
實驗內容:
1.向網上BLAST服務器提交序列,得到匹配結果;
2.本地使用BLAST,格式化庫文件,輸入命令行得到匹配結果;
3.對結果文件進行簡要描述,闡述生物學意義。
實驗報告:
1.闡述BLAST原理和比對步驟;
2.不同類型BLAST的結果及其說明;
3.討論:不同平臺運行BLAST的需求比較。
參考書目:
《生物信息學概論》 羅靜初 等譯,北京大學出版社,2002;
《生物信息學實驗指導》 胡松年 等著,浙江大學出版社,2003。
實驗三 利用ClustalX(W)進行
多序列聯配
實驗目的:
掌握用Clustal X(W)工具及其基本參數,對具有一定同源性和相似性的核酸與蛋白質序列進行聯配和聚類分析,由此對這些物種的親緣關系進行判斷,并且對這些序列在分子進化過程中的保守性做出估計。
實驗原理:
首先對于輸入的每一條序列,兩兩之間進行聯配,總共進行n*(n-1)/2次聯配,這一步通過一種快速的近似算法實現,其得分用來計算指導樹,系統樹圖能用于指導后面進行的多序列聯配的過程。系統樹圖是通過UPGMA方法計算的。在系統樹圖繪制完以后,輸入的所有序列按照得分高低被分成n-1個組,然后再對組與組之間進行聯配,這一步用Myers和Miller算法實現。
實驗內容:
1.明確軟件所支持的輸入文件格式,搜集整理出合適的數據;
2.在Windows環境運行Clustal X,在Linux環境運行Clustal W;
3.實驗結果及分析,用TREEV32或Njplotwin95生成NJ聚類圖。
實驗報告:
1.整理好的符合Clustal的序列數據;
2.提交數據網頁記錄和各步驟記錄;
3.提供聚類圖和多序列聯配圖,并說明意義。
參考書目:
《生物信息學概論》 羅靜初 等譯,北京大學出版社,2002;
《生物信息學實驗指導》 胡松年 等著,浙江大學出版社,2003。實驗四 ESTS分析
實驗目的:
熟悉使用一系列生物信息學分析工具對測序得到ESTs序列數據進行聚類處理,由此對獲得表達基因的豐度等相關信息,并且對這些表達基因進行功能的初步詮釋,為后續實驗通過設計RACE引物獲得全長基因,以及進一步的功能注
釋和代謝途徑分析做好準備。
實驗原理:
首先用crossmatch程序去除ESTs原始序列中的載體成分和引物成分,然后用phrap生成congtig和singlet,用blast程序進一步將有同源性的contig和singlet進行功能聚類,最后通過blast對聚類獲得的cluster進行功能注釋。在實驗過程中將用到一些本實驗室寫好的perl程序用于連接各數據庫和工具軟件。
實驗內容:
1.運行CodonCode Aligner程序,并用它建立工程文件,導入例子文件
夾里面的數據;練習對序列的各種查看方式。
2.使用CodonCode Aligner程序里的Clip Ends, Trim Vector, Assemble
等功能,完成序列的剪切、去雜質、組裝工作。
實驗報告:
1.實驗各步驟記錄和中間結果文件;
2.舉例簡要說明結果文件中數據的生物學意義。
參考書目:
《生物信息學概論》 羅靜初 等譯,北京大學出版社,2002;
《基因表達序列標簽(EST)數據分析手冊》 胡松年 等著,浙江大學出版社,2005。
實驗五 利用Primer Premier5.0設計
RACE引物
實驗目的:
熟悉PCR引物設計工具Primer Premier5.0的一些基本功能,能夠根據實驗需要選擇相應的引物設計方法設計PCR引物。
實驗原理:
PCR實驗是當代分子生物學的基本實驗之一,由于目標序列和實驗目的的不同,相應設計引物的要求也不一樣。本實驗延續ESTs分析結果,對于其中需要獲得全長的基因進行RACE引物的設計,及5’和3’RACE引物,配合接頭序列設計單向引物,并模擬練習通過連接獲得全長的基因CDS序列。最后設計已知全長基因序列的PCR擴增引物。
實驗內容:
1.從網站下載并安裝Primer Premier5.0;
2.從 GenBank 中任意獲取一個 DNA 序列,設計出該序列的合適引物; 實驗報告:
1.實驗各步驟使用的數據、運算平臺、結果文件記錄;
2.比較不同引物設計平臺和不同PCR實驗的差別;
參考書目:
《生物信息學概論》 羅靜初 等譯,北京大學出版社,2002;《生物信息學實驗指導》 胡松年 等著,浙江大學出版社,2003。
實驗八 perl程序的安裝、編寫、調試 實驗目的:
培養學生能在windows和Linux兩種平臺安裝perl解釋器、編寫perl程序以及debug和運行的能力,熟悉perl語言基本語法,學會熟練編寫和運用perl程序進行基礎生物信息學研究。
實驗原理:
Perl語言是一門通用的腳本語言,具有強大的字符串處理功能,是生物信息學研究的強大幫手,學會了perl語言,就能方便地處理生物信息學研究中遇到的各種字符串文本,促進研究的快速進行。
實驗內容:
1.下載perl程序在Windows和Linux下的安裝包并進行安裝;
2.編寫簡單的perl程序,并學會debug;
3.編寫具有簡單功能的堿基處理perl程序。
實驗報告:
1.perl解釋器安裝方法;
2.perl解釋器debug方法;
3.討論:perl語言在生物信息學研究中所起到的積極作用。
參考書目:
《PERL 編程24學時教程》(美)皮爾斯著 王建華等譯,機械工業出版社,2000;
《生物信息學手冊》 郝柏林 等著,上海科技出版社,2004;《生物信息學實驗指導》 胡松年 等著,浙江大學出版社,2003
第四篇:生物信息學論文
生物信息學的進展綜述
韓雪晴
(生物工程1201班,學號:201224340124)
摘要:生物信息學是一門研究生物和生物相關系統中信息內容和信息流向的綜合性系統科學。80年代以來新興的一門邊緣學科,信息在其中具有廣闊的前景。伴隨著人類基因組計劃的勝利完成與生物信息學的發展有著密不可分的聯系,生物信息學的發展為生命科學的發展為生命科學的研究帶來了諸多的便利,對此作了簡單的分析。
關鍵詞:生物信息學;進展;序列比對;生物芯片
A review of the advances in Bioinformatics
Han Xueqing(Bioengineering, Class1201,Student ID:201224340124)
Abstract: Bioinformatics is the science of comprehensive system of information content and information flows to a study on the biological and bio related in the system.The edge of an emerging discipline since 80, has broad prospects in which information.With the human genome project was completed and the development of bioinformatics are inextricably linked, for the life science research development of bioinformatics for the development of life science has also brought a lot of convenience, has made the simple analysis.Keywords:
bioinformatics;progress;Sequence alignment;biochip
1、生物信息學的產生背景
生物信息學是20世紀80年代末開始,隨著基因組測序數據迅猛增加而逐漸興起的一門學科[1]。應用系統生物學的方法認識生物體代謝、發育、分化、進化以及疾患發生規律的不可或缺的工具[2]。及時、充分、有效地利用網絡上不斷增長的生物信息數據庫資源,已經成為生命科學和生物技術研究開發的必要手段,從而誕生了生物信息學。
2、生物信息學研究內容
主要是利用計算機存儲核酸和蛋白質序列,通過研究科學的算法,編制相應的軟件對序列進行分析、比較與預測,從中發現規律。白細胞介素-6(IL-6)是機體重要的免疫因子,但在兩棲類中未見報道。采用生物信息學方法對兩棲類模式動物非洲爪蟾IL-6進行分析[3]。以人IL-6基因對非洲爪蟾數據庫進行搜索、分析,并采用RT-PCR方法對所得序列進行驗證。結果表明,非洲爪蟾IL-6基因位于scaffold_52基因架上,具有保守的IL-6家族基序[4]。采用生物信息新方法進行不同物種的免疫基因挖掘、克隆,是一種有效的方法[5]。
2.1序列比對
比較兩個或兩個以上符號序列的相似性或不相似性。序列比對是生物信息學的基礎。兩個序列的比對現在已有較成熟的動態規劃算法,以及在此基礎上編寫的比對軟件包BLAST和FASTA[6]。序列數據庫搜索最著名且最常用的工具之一便是BLAST算法。FASTA算法是另一族常用的序列比對及搜索工具[7]。
2.2結構比對
比較兩個或兩個以上蛋白質分子空間結構的相似性或不相似性。
2.3蛋白質結構預測
從方法上來看有演繹法和歸納法兩種途徑。前者主要是從一些基本原理或假設出發來預測和研究蛋白質的結構和折疊過程。分子力學和分子動力學屬這一范疇。后者主要是從觀察和總結已知結構的蛋白質結構規律出發來預測未知蛋白質的結構[8]。
3、生物信息學的新技術 3.1 Lipshutz(Affymetrix,Santa clara,CA,USA)
描述了一種利用DNA探針陣列進行基因組研究的方法,其原理是通過更有效有作圖、表達檢測和多態性篩選方法,可以實現對人類基因組的測序[9]。光介導的化學合成法被應用于制造小型化的高密度寡核苷酸探針的陣列,這種通過軟件包件設計的寡核苷酸探針陣列可用于多態性篩查、基因分型和表達檢測[10]。
3.2基因的功能分析
Overton(University of Pennsylvania School of Medicine,Philadelphia,PA,USA)論述了人類基因組計劃的下一階段的任務基因組水平的基因功能分析。
4生物信息學前沿
4.1生物芯片技術
4.1.1生物芯片的簡介
生物芯片技術是通過縮微技術,根據分子間特異性地相互作用的原理,按照芯片上固化的生物材料的不同,可以將生物芯片劃分為基因芯片、蛋白質芯片、細胞芯片和組織芯片。4.1.2生物芯片的基本內容
生物芯片技術通過微加工工藝在厘米見方的芯片上集成有成千上萬個與生命相關的信息分子,它可以對生命科學與醫學中的各種生物化學反應過程進行集成,從而實現對基因、配體、抗原等生物活性物質進行高效快捷的測試和分析。4.1.3生物芯片的發展
生物芯片將會給21世紀整個人類生活帶來一場“革命”。生物芯片產業也有望與“微電子芯片”并列成為21世紀最大的產業之一。4.1.4與生物芯片相關的技術
平面微加工技術、微機械技術、CCD成像技術、基因芯片技術等。
4.2藥物設計與生物信息學
藥物基因組學可以說是基因功能學與分子藥理學的有機結合,在很多方面這種結合是非常必要的。藥物基因組學以藥物效應及安全性為目標,研究各種基因突變與藥效及安全性的關系。
4.3基因治療
基因治療(gene therapy)是指將外源正常基因導入靶細胞,以糾正或補償因基因缺陷和異常引起的疾病,達到治療目的[11]。也就是將外源基因通過基因轉移技術將其插入病人的適當的受體細胞中,使外源基因制造的產物能治療某種疾病[12]。通過對miR-29a進行靶基因預測及相關生物信息學分析,為miR-29a靶基因的實驗驗證提供數據支持,以期為深入研究miR-29a的生物學功能和調控機制提供理論指導[13]。從廣義說,基因治療還可包括從DNA水平采取的治療某些疾病的措施和新技術。在基因治療中迄今所應用的目的基因轉移方法可分為兩大類:病毒方法和非病毒方法[14]。
4.4虛擬細胞--人工生命的模型
虛擬細胞是應用信息科學的原理和技術,通過數學的計算和分析,對細胞的結構和功能進行分析、整合和應用,以模擬和再現細胞和生命的現象的一門新興學科。虛擬細胞亦稱人工細胞或人工生命[15]。目前,國際上已有兩個虛擬細胞問世,一個是日本的原核虛擬細胞模型,一個是美國的真核虛擬細胞模型。
參考文獻
[1].張陽德,生物信息學(第二版)科學出版社,2010,21世紀高等院校教材ISBN978-7-03-023931-0 [2].邁克爾 R.巴恩斯(Barnes.M.R.),遺傳學工作者的生物信息學,科學出版社2010年10月1日出版ISBN 9787030254900 [3].齊志濤;張啟煥;王資生;許偉;黃貝;王愛民,非洲爪蟾IL-6基因的克隆及生物信息學分析 出版日期: 2010 [4].齊志濤;張啟煥;黃貝;王資生;仇明;黃金田;許偉;王愛民.非洲爪蟾BAFF及其信號通路相關基因的比較生物信息學分析,生物技術,2011,(4):
[5].廖明幟,生物背景學生的《生物信息學》課程教學思考與探索,教育教學論壇,2014年第36期
[6].Dan E.Krane&Michael L.Raymer,生物信息學概論,清華大學出版社 2010年出版
[7].Eddy S R.Profile Hidden Markov Models.Bioinformatics,1998,14(9):755~763 [8].Coombes KR,Fristche HA,Clarke,et al.Qutility control and peak finding for proteomics data collected from nipple aspirate fluid by surface-en-hanced laser desorption and ionization.Clin Chem,2013,49(10):1615~1623 [9].Lim HA,Batt tR.TIBTECH,1998;16(3)):104.[10].Williams n.Science,1997;277(5328):902.[11].顧健人,曹雪濤,基因治療,北京:科學出版社,2011 [12].余國膺,生物信息學,中國心臟起博與心電生理雜志,2014年01期 [13].施偉杰
曾玉
姚純
曹笑梅
童華,miR-29a靶基因預測及其相關生物信息學分析,現代生物醫學進展,2014年32期
[14].安冬
姜濤
張翠麗
殷玉玲
曹雪姣
辛毅,臧師竹利用生物信息學研究肥胖與2型糖尿病患者肝組織基因表達變化,《現代生物醫學進展》 2014年30期
[15].孫冬泳,湯健,虛擬細胞-人工生命的模型,中華醫學雜志,2011,21(81):1342~1344
第五篇:生物信息學論文
淺談生物信息學的發展和前景
摘 要:本文闡述了生物信息學產生的背景,生物學數據庫,生物信息學的主要研究內容,與生物信息學關系密切的數學和計算機科學技術領域,生物信息學產業等內容,展望了其未來并提出了若干在我國發展生物信息學的建議。著重指出,理解大量生物學數據所包括的生物學意義已成為后基因組時代極其重要的課題。生物信息學的作用將日益重要。有理由認為,今日生物學數據的巨大積累將導致重大生物學規律的發現。生物信息學的發展在國內、外基本上都處在起步階段。因此,這是我國生物學趕超世界先進水平的一個百年一遇的極好機會。關鍵字:生物信息學產生背景發展現狀前景
隨著生物科學技術的迅猛發展,生物信息數據資源的增長呈現爆炸之勢,同時計算機運 算能力的提高和國際互聯網絡的發展使得對大規模數據的貯存、處理和傳輸成為可能,為了 快捷方便地對已知生物學信息進行科學的組織、有效的管理和進一步分析利用,一門由生命 科學和信息科學等多學科相結合特別是由分子生物學與計算機信息處理技術緊密結合而形 成的交叉學科——生物信息學(Bioinformatics)應運而生,并大大推動了相關研究的開展,被譽為“解讀生命天書的慧眼”。
一、生物信息學產生的背景
生物信息學是80年代未隨著人類基因組計劃(Human genome project)的啟動而興起的一門新的交叉學科。它通過對生物學實驗數據的獲取、加工、存儲、檢索與分析,進而達到揭示數據所蘊含的生物學意義的目的。由于當前生物信息學發展的主要推動力來自分子生物學,生物信息學的研究主要集中于核苷酸和氨基酸序列的存儲、分類、檢索和分析等方面,所以目前生物信息學可以狹義地定義為:將計算機科學和數學應用于生物大分子信息的獲取、加工、存儲、分類、檢索與分析,以達到理解這些生物大分子信息的生物學意義的交叉學科。事實上,它是一門理論概念與實踐應用并重的學科。
生物信息學的產生發展僅有10年左右的時間---bioinformatics這一名詞在1991年左右才在文獻中出現,還只是出現在電子出版物的文本中。事實上,生物信息學的存在已有30多年,只不過最初常被稱為基因組信息學。美國人類基因組計劃中給基因組信息學的定義:它是一個學科領域,包含著基因組信息的獲取、處理、存儲、分配、分析和解釋的所有方面。
自1990年美國啟動人類基因組計劃以來,人與模式生物基因組的測序工作進展極為迅速。迄今已完成了約40多種生物的全基因組測序工作,人基因組約3x109堿基對的測序工作也接近完成。至2000年6月26日,被譽為生命“阿波羅計劃”的人類基因組計劃終于完成了工作草圖,預示著完成人類基因組計劃已經指日可待。截止目前為止,僅登錄在美國GenBank數據庫中的DNA序列總量已超過70億堿基對。此外,迄今為止,已有一萬多種蛋白質的空間結構以不同的分辨率被測定。基于cDNA序列測序所建立起來的EST數據庫其紀錄已達數百萬條。在這些數據基礎上派生、整理出來的數據庫已達500余個。這一切構成了一個生物學數據的海洋。這種科學數據的急速和海量積累,在人類的科學研究歷史中是空前的。
數據并不等于信息和知識,但卻是信息和知識的源泉,關鍵在于如何從中挖掘它們。與
正在以指數方式增長的生物學數據相比,人類相關知識的增長(粗略地用每年發表的生物、醫學論文數來代表)卻十分緩慢。一方面是巨量的數據;另一方面是我們在醫學、藥物、農業和環保等方面對新知識的渴求,這些新知識將幫助人們改善其生存環境和提高生活質量。這就構成了一個極大的矛盾。這個矛盾就催生了一門新興的交叉科學,這就是生物信息學。
二、生物信息學研究的發展現狀
資金和實力非常重要,生物信息的研究投入短期不算大,但是結合成果,其投入相當的大。因為目前生物信息主要在于教學和和研究,商業領域的應用不算很廣。如一套LIMS加上軟件就要花上數千萬。加上相關項目的研究開發,不是國內相關的機構所能承受的。所以需要得到政府的支持和幫助。以及有識之士的投入。否則我們又將遠遠落后國外。國內的制藥行業將永不得翻身!基因的流失(國外一些國家打著給國內免費治療,分析疾病的考旗幟,暗中收集了國內不同省份,地區的遺傳類疾病和特性。這些資源,我們國家忽略,應當說目前還沒有這樣的實力進行研究)。落后就要挨打,21世紀是生物的世紀。基因大戰不可避免。基因和疾病的研究很大程度就是數據的分析。里面的領頭羊就是生物信息。國內應當在基礎教學,基礎研究并結合應用力度。
當然國內的人才濟濟,如有更多計算機領域和數學(統計方面的)人才參與到生物信息,將如虎添翼。目前我國生物信息學發展面臨著如下幾方面的困境:
⒈政府投資不足
雖然國際上生物信息學研究在各發達國家中比較受重視,但仍有不少研究機構抱怨政府資金投入不夠。最近美國許多研究院紛紛申請要求政府加大生物信息學工具與數據庫方面的投入,而且歐洲、日本、澳大利亞在這些領域也存在著資金困擾問題,歐洲生物信息學研究所(EBI)和歐洲基金會生命科學中心去年都遇到了麻煩。目前雖然危機已經暫時渡過,但未來幾年EBI數據庫和其它基礎結構仍將受到資金短缺的困擾,一致有人發出了“免費數據服務還能維持多久”的疑問。
2.來自商業機構的競爭
基因組研究潛在的巨大商業利潤使得國際上一批大型制藥公司和化學公司向該領域大規模的進軍。世界最大制藥集團之一的Giba Geigy和Sandoz合資建立的Novartis公司投資2.5億美元建立基因組研究所;Glaxo-Wellcome在基因組研究領域投入4700萬美元,將研究人員增加一倍;Smith Kline公司花125億美元擴展人基因組的順序,將生物信息學的研究人員從2人增加至70人,并將該公司藥物開發項目中的25%建立在基因組學之上。這一方面給生物信息學發展注入了生機,另一方面對那些政府支持的不以贏利為目的的研究機構造成了巨大的壓力,學術部門的資金投入遠遠不及工業部門,其負面沖擊力不可忽視。畢竟經濟利益的盲目追求會導致基因組研究的片面性,生物信息學長路漫漫,保護這些學術部門的良好發展非常有必要。
3.專業人才匱乏
目前該領域缺乏懂得如何利用計算機技術處理大量生物數據的生物學家,不少生物學家只是將計算機用來打字或作為圖紙的替代品。甚至出現了這樣有趣的現象:制藥業、工業、農業、生物技術研究團體經常在學術機構大肆搜查那些“可疑人”,更有甚者他們彼此間互挖“墻角”。雖然對于人才的渴求與日俱增,但全世界也僅有20多個專業人才培訓中心,而且這些中心本身也處在惡性循環中,那些經培訓后的人才往往由于高薪誘惑而投身應用工業部門,導致培訓教育人員越來越少,出現“斷層”現象。
綜上所述,不難看出,生物信息學并不是一個足以樂觀的領域,究竟原因,是由于其是基于分子生物學與多種學科交叉而成的新學科,現有的形勢仍表現為各種學科的簡單堆砌,相互之間的聯系并不是特別的緊密。在處理大規模數據方面,沒有行之有效的一般性方法;而對于大規模數據內在的生成機制也沒有完全明了,這使得生物信息學的研究短期內很難有突破性的結果。那么,要得到真正的解決,最終不能從計算機科學得到,真正地解決可能還是得從生物學自身,從數學上的新思路來獲得本質性的動力。毫無疑問,正如Dulbecco1986年所說:“人類的DNA序列是人類的真諦,這個世界上發生的一切事情,都與這一序列息息相關”。但要完全破譯這一序列以及相關的內容,我們還有相當長的路要走。
三、生物信息學的發展前景
《第三次技術革命》里有這樣描述:“一場與工業革命和以計算機為基礎的革命有相同影響力的變化正在開始。下一個偉大時代將是基因組革命時代,它現在處于初期階段。”基因組學的發展已經進入后基因組研究階段,致力于蛋白質功能研究的蛋白質組學和功能蛋白質組學正在蓬勃發展,在生物信息學發展的帶動下,我們必定能夠揭示各種生命現象的奧秘,并帶動多個學科的跨越式發展。生物信息學的發展將對分子生物學、藥物設計、工作流管理和醫療成像等領域產生巨大的影響,極有可能引發新的產業革命。此外,生物信息學所倡導的全球范圍的資源共享也將對整個自然科學乃至人類社會的發展產生深遠的影響。有理由相信,今日生物學數據的巨大積累將導致重大生物學規律的發現,生物信息學的發展在國內、外基本上都處在起步階段,因此,這是我國生物學趕超世界先進水平的一個百年一遇的極好機會。
生物學是生物信息學的核心和靈魂,數學與計算機技術則是它的基本工具。這一點必須著重指出。預測生物信息學的未來主要就是要預測他對生物學的發展將帶來什么樣的根本性的突破。這種預測是十分困難的,甚至幾乎不可能。但機不可失,時不再來,鑒于生物信息學在我國生物信息學和經濟發展中的重要意義和其發展的緊迫性,因此,由國家出面組織全國的力量,搞個類似“兩彈一星”那樣的,但是,規模要小的多,花錢也少的多的生物信息學發展計劃,不是不可以考慮的。要充分發揮中央與地方,生物學科研究人員等方方面面的積極性。生物信息學研究投資少,見效快,可充分發揮我國智力資源豐富的長處,是特別適合我國國情的一項研究領域。要在大學里建立生物信息學專業,設立碩士點和博士點,培養專門人才。可以組織一大批數學、物理、化學和計算機科技工作者,在自愿的基礎上,學習有關的生物學知識,開展多方面的生物信息學研究。
經過十幾年或更長的時間的努力,逐漸使我國成為生物信息學研究強國,是完全有可能的。信息學的商業價值十分顯著。國外很多大學,研究機構,軟件公司甚至政府機構紛紛成立各種生物信息機構,建立自立的生物信息集成系統,研制這方面的軟件,重金招聘人才,期望從中獲取更多的生物信息和數據加以研究和利用,縮短藥物開發周期,搶注基因專利,獲取更大利潤。我國如不加大資金投入力度,將來可能會花更多的錢去購買別人的軟件,使用專利基因或購買新的藥物。所幸,我國也開始重視這一學科:南、北方人類基因組中心的相繼建成,北大生物城的破土動工等,標志著我國對生物信息學的重視。我們有理由相信,我國的生物信息學在21世紀會有巨大的飛躍。
參考文獻
1.陳潤生.生物信息學.生物物理學報,1999,15(1):5
2.北京生物技術和新醫藥產業促進中心.世紀之交的新科學:生物信息學.生物技術通 報,1999,(8):49
3.楊福愉.展望21世紀的分子生物學.生物物理學報,1999,15(1):1
4.鄭國清,張瑞玲,;生物信息學的形成與發展;河南農業科學;2002.11
5.王玉梅,王艷.國外生物信息學發展動態分析;科技情報開發與經濟;2002.06
6.張春霆.生物信息學昀壩狀與展望;世界科技研究與發展.2000,22(6)