全基因組關聯分析(GWAS)軟體 MAGMA

2021-10-10 02:34:26 字數 2160 閱讀 7003

magma軟體被設計用於基於基因的(gene-based)或基因集的(gene-set-based)的關聯分析,可以直接找到與目的性狀相關的功能基因或功能模組(如基因調控通路等),也有利於發現由多個微效 snp 關聯的基因。

magma 的輸入資料可以是原始的基因型資料,也可以是其它關聯分析軟體的結果(如emmax、gemma等)。

本文用 emmax 的關聯分析結果作為輸入檔案,因為 magma 雖然可以用原始資料進行單位點的關聯分析,但是它的執行速度沒有 emmax 快。

magma 需要乙個 snp 注釋資訊檔案,內容包括 snp 位於基因的什麼位置。

~/tools/magma --annotate nonhuman window=3,1.5 --snp-loc snp_hardfiltered_biallelic_maf5_ms50_chr_imputated.bim --gene-loc gene_locations.txt --out magma_annotation
snpid

chrpos

geneid

chrstart

end+/-

symbol

前四列必須。

2. gene-based gwas

~/tools/magma --bfile snp_hardfiltered_biallelic_maf5_ms50_chr_imputated --gene-annot magma_annotation.genes.annot --pval blup.ps n=355 use=1,3 --out test
3. gene-set-based
~/tools/magma --gene-results blup.genes.raw --set-annot kegg-pathways_first2.txt col=1,2 --out test
遇到的問題
首先,檢視系統中所有libstdc++.so.6 版本

$ locate libstdc++.so.6

/home/liuqb/miniconda3/envs/magma/lib/libstdc++.so.6

/home/liuqb/miniconda3/envs/magma/lib/libstdc++.so.6.0.19

/home/liuqb/miniconda3/envs/magma/lib/libstdc++.so.6.0.19-gdb.py

/home/liuqb/miniconda3/envs/magma/lib/libstdc++.so.6.0.27

/home/liuqb/miniconda3/envs/magma/lib64/libstdc++.so.6

/home/liuqb/miniconda3/envs/magma/lib64/libstdc++.so.6.0.27

/home/liuqb/miniconda3/envs/magma/x86_64-conda_cos6-linux-gnu/sysroot/lib/libstdc++.so.6

/home/liuqb/miniconda3/envs/magma/x86_64-conda_cos6-linux-gnu/sysroot/lib/libstdc++.so.6.0.27

....

檢視6.0.27中的glibcxx版本

$strings /home/liuqb/miniconda3/envs/magma/lib64/libstdc++.so.6.0.27|grep glibcxx

。。。glibcxx_3.4.20

glibcxx_3.4.21

glibcxx_3.4.22

glibcxx_3.4.23

glibcxx_3.4.24

glibcxx_3.4.25

glibcxx_3.4.26

glibcxx_3.4.27

。。。有glibcxx_3.4.20

將該庫寫入.basr_profile,32位系統用/lib,64位系統用/lib64

export ld_library_path=$ld_library_path:~/miniconda3/envs/magma/lib64/

若沒有高版本的libstc++.so.6,可用conda安裝,

conda install -c prometeia libgcc-ng

全基因組關聯分析(GWAS)軟體 Tassel5

tassel 是比較經典的關聯分析軟體,但是因為執行速度沒有優勢,所以在重測序等資料量比較大的研究中不太常用。這是記錄一下tassel5 命令列進行關聯分析的過程。參考 tassel5 mlm run pipeline.pl plink ped snp.ped map snp.map kinship...

全基因組關聯分析(GWAS)的計算原理

關於全基因組關聯分析 gwas 原理的資料,網上有很多。這也是我寫了這麼多gwas的軟體教程,卻從來沒有寫過gwas計算原理的原因。恰巧之前微博上某位小可愛提問能否寫一下gwas的計算原理。我一順口就答應了。後面一直很懶,不願意動筆,但想著既然答應了,不寫說不過去。如果我認為有價值,寫出來對大家有幫...

比較基因組學常用分析軟體和分析方法

比較基因組學常用分析軟體和分析方法 1 同源基因的查詢 orthomcl or orthofinder 2 多序列比對 muscle mafft clustalw t coffee,muscle 效果好點 3 調取保守區域,並收尾連線,形成supergene gblocks 4 進化樹構建 raxm...