
《生物信息學(xué)介紹》PPT課件.ppt
20頁生物信息學(xué)介紹生物信息學(xué):?存儲、修復(fù)、分析、整合生物數(shù)據(jù)的學(xué)科?分子生物學(xué)與信息技術(shù)的結(jié)合體?研究材料與結(jié)果:各種生物學(xué)數(shù)據(jù)?研究工具:網(wǎng)絡(luò)、計算機?包括生物學(xué)和計算兩部分?現(xiàn)代生物研究的核心?研究方法:–傳統(tǒng)生物學(xué):實驗 理論–現(xiàn)代生物學(xué):理論 實驗驗證 http://www.biyanzhiliaoyi.net光盾治療儀 ?基因和生命的關(guān)系: 中心法則 基因傳遞遺傳信息(轉(zhuǎn)錄),并由蛋白質(zhì)表達,構(gòu)成有機體,完成生命的功能 DNA mRNA 蛋白質(zhì)?蛋白質(zhì)組(蛋白質(zhì)protein與基因組genome的雜合) 一種基因組所表達的全套蛋白質(zhì),即一種細胞至一種生物所表達的全部蛋白質(zhì)?蛋白質(zhì)組學(xué):從蛋白質(zhì)組的水平研究認識生命活動的機理和疾病發(fā)生的分子機制?人類基因組計劃(Human Genome PROJECT, HGP) 1986年Americian Rensto Dulbecco 《Science》 闡明人類基因組的全部核苷酸序列,從整體上破譯人類遺傳信息,在分子水平全面認識自我 近期任務(wù)?大規(guī)?;蚪M測序中的信息分析?新基因和新SNPS(單核苷酸多態(tài)性)的發(fā)現(xiàn)與鑒定?完整基因組的比較研究?大規(guī)模基因功能表達譜的分析?生物大分子的結(jié)構(gòu)模擬與藥物設(shè)計 遠期任務(wù)?讀懂人類基因組,發(fā)現(xiàn)人類遺傳語言的根本規(guī)律,從而闡明若干生 物學(xué)中的重大自然哲學(xué)問題,像生命的起源與進化等。
這一研究的關(guān)鍵和核心是了解非編碼 區(qū)– 非編碼區(qū)信息結(jié)構(gòu)分析– 遺傳密碼起源和生物進化的研究生物學(xué)世紀的重大生物學(xué)課題?生命是什么:生物系統(tǒng)運作機理的更深入探索? 基因組中的信息:讀懂ACGT序列?氨基酸序列如何編碼蛋白質(zhì)的特性與活性–蛋白質(zhì)的結(jié)構(gòu)和功能預(yù)測?蛋白質(zhì)怎樣實現(xiàn)細胞和有機體的動力學(xué):–生命為什么是蛋白質(zhì)的運動方式?個體發(fā)育和系統(tǒng)發(fā)育的法則和機理:–肌體如何長成、運作、衰老和進化?征服疾?。酣C主要循環(huán)系統(tǒng)疾病、癌癥、病毒源性疾病、遺傳病和衰老?保護和利用生物資源,開發(fā)和發(fā)展生物產(chǎn)業(yè):–生物學(xué)怎樣造福人類現(xiàn)在進行的研究? 序列比對序列比對 – 系列兩兩比對系列兩兩比對– 多系列比對多系列比對? 基因組數(shù)據(jù)分析基因組數(shù)據(jù)分析 序列拼接:通過計算分析從EST庫拼接出完整的新基因,即“電子克隆” 新基因發(fā)現(xiàn):根據(jù)編碼區(qū)具有的序列特征等通過計算分析從DNA序列中確定基因編碼區(qū)序列同源比較: Smith-Waterman算法FASTABLAST算法 ?大規(guī)?;虮磉_譜數(shù)據(jù)分析 重復(fù)序列分析 編碼區(qū)統(tǒng)計特征分析 啟動子分析內(nèi)含子/外顯子剪接位點 翻譯起始位點和翻譯終止信號 tRNA基因識別 DNA序列自身編碼特征分析 基因組組織結(jié)構(gòu)和信息結(jié)構(gòu) 不同物種、不同進化水平的生物的相關(guān)基因之間進行比較 ? 蛋白質(zhì)結(jié)構(gòu)和功能的預(yù)測分析蛋白質(zhì)結(jié)構(gòu)和功能的預(yù)測分析 – 蛋白質(zhì)家族保守序列尋找–從氨基酸組成辨識蛋白質(zhì)–蛋白質(zhì)二級結(jié)構(gòu)預(yù)測 –蛋白質(zhì)的三維結(jié)構(gòu)–蛋白質(zhì)的物理性質(zhì)預(yù)測–其他特殊局部信息:其它特殊局部結(jié)構(gòu)包括膜蛋白的跨膜螺旋、信號肽、卷曲螺旋(Coiled Coils)等,具有明顯的序列特征和結(jié)構(gòu)特征,也可以用計算方法加以預(yù)測?cDNA 芯片相關(guān)的數(shù)據(jù)管理和分析芯片相關(guān)的數(shù)據(jù)管理和分析 實驗室信息管理系統(tǒng) 基因表達公共數(shù)據(jù)庫 ? 分子進化分子進化 研究分類?序列分析?不基于序列的研究–生物芯片的基因表達譜分析–全基因組關(guān)聯(lián)分析–基因調(diào)控網(wǎng)絡(luò)的反向工程研究數(shù)據(jù)挖掘技術(shù)在生物信息學(xué)的應(yīng)用?異質(zhì)、分布式基因組數(shù)據(jù)的語義綜合 ?DNA序列的相似性查找和比較 ?關(guān)聯(lián)分析:識別基因序列的共發(fā)生性?路徑分析:在疾病發(fā)展的不同階段的相關(guān)基因 ?可視化工具和基因數(shù)據(jù)分析?KDD2001年BIOKDD的主題就是“生物信息學(xué)中的數(shù)據(jù)挖掘”現(xiàn)在的工作?數(shù)據(jù)挖掘算法在生物信息學(xué)研究中的應(yīng)用?數(shù)據(jù)挖掘算法在生物信息學(xué)研究中的改進與發(fā)展?生物信息學(xué)軟件的開發(fā)基因芯片(microarray)介紹?電子技術(shù)與生物技術(shù)的結(jié)合?基因組研究中最實用的部分之一?Affymetrix公司: 1.6cm2 40萬位點 每點1000萬條探針基因芯片流程(一)1. 實驗設(shè)計2. 樣品制備(指mRNA或總RNA樣品,包括對照組和實驗組)3. 芯片制備(包括PCR,純化,點樣等步驟)4. 芯片雜交(將mRNA或總RNA分別進行逆轉(zhuǎn)錄生成cDNA,在此步驟中將對照組和實驗組cDNA分別標記CY3和CY5熒光信號)5. 芯片掃描(采用激光掃描儀,分別用532nm和635nm波長激光掃描芯片,對于每張芯片,得到CY3和CY5通道兩幅圖象)基因芯片流程(二)6. 圖象處理(采用專門軟件,對圖象進行分析,提取每個點上的數(shù)字信號),得到原始數(shù)據(jù)表。
7. 數(shù)據(jù)校正和篩選(對cy5或cy3信號進行校正,消除實驗或掃描等各環(huán)節(jié)因素對數(shù)據(jù)的影響,同時利用篩選規(guī)則對數(shù)據(jù)中的“壞點”,“小點”,“低信號點”進行篩選,并作標記8. 差異表達基因的確定(采用ratio值對差異基因進行判斷,或采用統(tǒng)計方法如線性回歸、主成分分析、調(diào)整P值算法等對差異基因進行統(tǒng)計推斷)9. 生物信息學(xué)分析(如cluster 算法、差異基因的同源性比對,差異基因的相關(guān)文獻檢索等)基因芯片應(yīng)用?基因表達檢測–特異性相關(guān)的基因:差異表達的基因–基因功能研究–健康狀況的檢測–毒理學(xué)研究–藥物作用機制的研究?定位克隆?基因突變和多態(tài)性檢測?確定重疊群克隆的排序基因芯片產(chǎn)業(yè)化現(xiàn)狀?公司:尖端技術(shù)研究和市場化的混合體?美國已有二十多家公司?我國:–首家為聯(lián)合基因集團–南方病蟲害基因–白血病檢測基因芯片分析所用到的算法?聚類?分類?關(guān)聯(lián)分析?時間序列分析?異常檢測?可視化。
