基於GCTA的gene based關聯分析研究

2022-02-02 01:58:08 字數 1424 閱讀 6683

今天博主博士答辯完畢啦,超開心的,撒花~

雖然很疲憊(昨晚太晚睡了==),但想到今天跟師妹說給她gene-based關聯分析的方法。

於是,決定還是整理好了再休息休息。

好,進入主題。

之前的推文我曾經寫過使用vegas2(versatile gene-based association study)進行gene based的關聯分析研究。

但用過的人就知道,vegas2有個很明顯的缺點,跑起來很佔cpu,因此今天再重新推薦另乙個工具gcta,也是可以計算gene-based關聯分析的。

wget

解壓:unzip gcta_1.92.4beta2.zip

cd gcta_1.92.4beta2

準備summary_statistics的輸入檔案gwasp,輸入檔案gwasp包括兩列,第一列是snp的id,第二列是snp的p值(這裡顯示的是p-value)。

準備基因型檔案1000g_eur,基因型檔案可以是公共資料庫的,比如千人基因組的。值得注意的是,你拿到的資料是什麼人群的,基因型檔案就選用相應的人群資料,比如你的資料是歐洲祖先,那麼基因型的話就選用千人基因組的歐洲祖先人群,而不是所有樣本(兩千多個)。

基因型檔案1000g_eur為plink格式(bed,bim,fam或者map,ped),plink格式還不了解?見推文gwas分析基本流程及分析思路

準備glist-hg19.txt檔案,格式如下所示:

準備好gwasp1000g_eurglist-hg19.txt後,輸入如下命令:

gcta64 --bfile 1000g_eur --maf 0.01 --fastbat gwasp --fastbat-gene-list glist-hg19.txt --out gwasp_result --thread-num 10

完成以上分析後,會得到gwasp_result.gene.fastbat的結果檔案,其示例如下所示:

今天的介紹就到這,明天有時間的話再推一篇超實用的工具!

祝各位周一愉快!

基於IP,基於port和基於網域名稱的三種

1 基於相同ip不同port的虛擬主機 2 將listen欄位改為 listen 80 listen 8888 以上設定表示使用80以及8888埠 3 更改虛擬主機部分為 documentroot var www html website1 documentroot var www html web...

基於函式的索引 建立基於函式的索引

基於函式的索引 1基於函式的索引是常規的b樹索引。2該索引存放的資料是由表中的資料應用函式後得到的,而不是直接存放表中的資料本身。3如果查詢條件包含與索引相同的函式,就可以使用基於函式的索引,提高查詢速度 舉例 測試表 create table student2 sno varchar2 10 pr...

基於Token的認證和基於宣告的標識

openid解決跨站點的認證問題,oauth解決跨站點的授權問題。認證和授權是密不可分的。而openid和oauth這兩套協議出自兩個不同的組織,協議上有相似和重合的之處,所以想將二者整合有些難度。好在openid connect作為openid的下一版本,在oauth 2.0的協議基礎上進行擴充套...