比較基因組學

2021-08-02 12:48:54 字數 3126 閱讀 1078

全基因組

測序為目標的

結構基因組學

( structural genomics)。 以

基因功能鑑定

為目標的

功能基因組學

( functional genomics),又被稱為後基因組( postgenome)。

比較基因組學

(comparative genomics)是基於基因**譜和測序基礎上,對已知的基因和基因組結構進行比較,來了解基因的功能、表達機理和物種進化的學科。圖譜和測序基礎上,對已知的基因和基因組結構進行比較,來了解基因的功能、表達機理和物種進化的學科。

比較基因組學應用:

揭示非編碼功能序列

發現新基因,揭示基因功能

發掘功能snp

闡述進化史

種間比較基因組學:共線性分析、系統發生的進化關係分析

種內比較基因組學:單核苷酸多型性( snp)、core-pan基因分析

共線性又稱同線性,是乙個物種的基因組中相互連鎖的基因,在另一物種的基因組中也是連鎖關係, 而且在兩個物種的遺傳圖上的位置也是相同的 。

巨集觀共線性:遺傳連鎖圖上錨定標記排列次序的一致性

微觀共線性:物理圖上基因序列的一致排列

進化距離非常近的物種間保持很好的微觀共線性

在進化過程中,基因共線性被各種因素所破壞,

進化距離越遠的物種之間基因共線性越差,

兩個物種之間的共線性程度可以作為衡量它們之

間進化距離的尺度。

破壞基因組共線性的因素:

轉座:dna的轉座,亦稱移位( transposition);是由可移動因子介導的遺傳物質重排現象。

插入和缺失:插入和缺失( insertion and deletion)是dna和蛋白質在進化過程中發生的序列長度上的改變,由於缺乏祖先序列的資訊,不能肯定其到底是插入事件還是缺失事件,故統稱之為增減( indel)

倒置:倒臵是指的基因組中的一段序列發生了顛倒倒臵,與其反向互補鏈序列進行了交換

染色體易位 :染色體片段位臵的改變稱為易位( translocation)。它伴有基因位臵的改變。易位發生在一條染色體內時稱為移位或染色體內易位;易位發生在兩條同源或非同源染色體之間時稱為染色體間易位。

往往基因組共線性會同時呈現出各種型別變異,通過共線性分析可以直觀的找到同源保守區塊( block),以及特異性區域。

同源保守區可以用來進行細緻比較,比如snp等。

特異性區域可以用來檢測特異性功能組分的**。

分析方法

排序,

重新對各序列的位臵和方向進行重排。

genomea.seq → genomea.

sort

.seq

genomeb.seq → genomeb.

sort

.seq

lastz:將排序好的基因組序列進行同源比對,尋找相似區域,得到具體的比對位臵資訊。

繪圖: svg,gnuplot,mummerplot,將**形式的位臵資訊轉化為圖形。

其他一些共線性分析工具

mummer

mauve

act

共線性分析對於親緣關係較近的物種一般使用核苷酸序列來進行分析,如果在核苷酸水平不能呈現出很好的共線性的話,還可以換用

編碼基因水平

的共線性(更適用於真核物

種)除了全基因組共線性外,常見的還有功能基因簇的區域性共線性分析

單核苷酸多型性( snp),全稱single nucleotide polymorphisms, 主要是指在基因組水平上由單個核苷酸的變

異所引起的dna序列多型性。

snp所表現的多型性只涉及到單個鹼基的變異,這種變異可由單個鹼基的轉(transition)或顛換(transversion)所引起,也可由鹼基的插入或缺失( indel)所致。但通常所說的snp並不包括後兩種情況

在基因組dna中,任何鹼基均有可能發生變異,因此snp既有可能在

編碼基因序列

內,也有可能在基因以外的

非編碼序列

上。總的來說,位於編碼區內的snp( coding snp,csnp)比較少,因為在外顯子內,其變異率僅及周圍序列的1/5。但它在遺傳性疾病研究中卻具有重要意義,因此csnp的研究更受關注。

從對生物的遺傳性狀的影響上來看, csnp又可分為2種:

同義csnp

( synonymous csnp):即snp所致的編碼序列的改變並不影響其所翻譯的蛋白質的氨基酸序列,突變鹼基與未突變鹼基的含義相同;

非同義csnp

( non-synonymous csnp):指鹼基序列的改變可使以其為藍本翻譯的蛋白質序列發生改變,從而影響

了蛋白質的功能。這種改變常是導致生物性狀改變的直接原因。

分析方法:

在共線性比對得到的同源區域中,檢索snp位點

如果有原始測序資料,還可以進行初步的過濾,篩除不可

信snp位點;

提取參考序列snp位點兩邊的序列,然後使用blat軟體將提取的序列和組裝結果進行比對,驗證snp位點可信度。如果比對的長度太小,則認為是不可信的snp,將去除;比對上多次,認為是重複區域的snp,也將被去除;

最後用blast、 trf、 repeatmask軟體**參考序列的重複序列區,過濾位於重複區的snp。

結合snp的位臵資訊和參考基因組的注釋資訊,對snp進行注釋分析。

kaks_calculator 是一套用於計算非同義替換率(通常用 ka 表示)和同義替換率(通常用 ks 表示)的軟體程式包, 利用他可以計算基因的ka、ks及其比值。需要提供給他乙個相對於模版序列比對好的編碼基因序列檔案,然後通過分析得出該基因的ka、 ks及其比值等資訊。

下游分析:

變異位點富集:

基因富集。功能富集

cgmlst:

核心基因組多位點序列分型

core-pan基因分析 :

根據物種的泛基因組大小與菌株數目的關係,將物種的泛基因組分為開放型泛基因組( open)和閉合型泛基因組( close)。開放型的泛基因組是指,隨著測序的基因組數目的增加,物種的泛基因組大小也不斷增加。閉合性的泛基因組是指,隨著測序的基因組數目增加,物種的泛基因組大小增加到一定的程度後收斂於某一值 。

基因組學 實驗

登入伺服器 linux機器上登入 ssh l public 172.28.215.241 windows機器上登入用putty客戶端 登入伺服器後請建立自己的目錄,以學號 姓名拼音命名,實驗資料和結果都放入這個目錄 設定環境變數 module add bioinfo linux學習資料 linux ...

影像組學ibex 影像基因組學

在重要精神疾病 精神 症 抑鬱症等 關鍵基因對腦結構或腦功能的調控研究方面,我們進行了系統探索,取得了系列研究結果。1 基於擴散張量影像研究了disc1對腦結構網路的影響,發現disc1 ser704cys基因型主要調控腦結構網路的資訊傳遞效率 li et al.2013 進一步的多模態影像學研究結...

01 基因組學基本感念

轉錄本 是由一條基因 通過轉錄形成的一種或多種可供編碼蛋白質的成熟的mrna。pseudogene 假基因 pseudogene 與正常基因相似,但喪失正常功能的dna序列,往往存在於真核生物的多基因家族中,常用 表示。是基因組中與編碼基因序列非常相似的非功能性基因組 dna 拷貝,一般情況都不被轉...