plink做SNP篩選和GWAS

2021-08-08 14:06:11 字數 1302 閱讀 7240

1.vcf轉ped/map:

plink --vcf spirits.recode.vcf --recode --out test
2.統計每個snp的maf,並將maf < 0.05; miss > 0.2的snp篩選出來並過濾掉。

plink --file 513lines_4429snps_110506 --freq --out test

plink --file 513lines_4429snps_110506 --maf 0.05 --geno 0.2 --out test --recode

3.針對508lines_traits.txt檔案中的性狀進行全基因組關聯分析

用excel編輯獲取fid,iid檔案以及表型檔案:

選擇個體檔案:

1 l1

2 l2

3 l3

4 l4

5 l5

6 l6

7 l7

8 l8

9 l9

10 l10

fid     iid     t1      t2      t3

1 l1 4.5514 4.0234 1.5055

2 l2 2.4888 2.2576 1.4878

3 l3 4.9849 3.413 1.1411

4 l4 7.9829 5.8398 1.31127

5 l5 1.7586 3.088 1.7824

6 l6 2.2273 4.0377 1.943

7 l7 8.1565 4.6783 0.6993

8 l8 2.8122 3.6162 1.33192

9 l9 2.3489 4.4685 1.9838

命令:

plink --bfile test --keep keep.txt --recode --out use_test

plink --allow-no-*** --file use_test --pheno phe.txt --assoc --adjust --all-pheno --out test

生成.qassoc.adjusted,.qassoc,分別是校正p值和原始p值

利用PLINK進行GWAS分析

plink軟體輸入檔案的常見格式型別 1,一般格式 ped map 2,轉置格式 tped tfam 3,二進位制格式 bed bim fam 幾種格式之間可以相互轉換。推薦使用bed bim fam這種格式,讀取速度快。bed檔案包含snp資料,是二進位制格式,不能由notepad 等文字編輯器開...

plink處理資料使用記錄

vcf 檔案轉換為 ped 和 map檔案 plink noweb vcf amp snp anno.vcf recode out output double id 轉換為二進位制檔案 plink noweb file output make bed out outputb quality cont...

如何對SNP設計引物 CAPS, dCAPS

最近一直在幫師姐根據snp找基因組上的酶切多型位點,然後給她提供該位點附近1kb的序列,讓她去設計引物。由於我本科就做過一點點的遺傳定位,當時用的是sscp 單分子構象多型性 去區分單個鹼基差異,所以我對snp分子比較的檢測方法就侷限在高通量測序和sscp而已。然後今天猛然聽師兄說他要用dcaps來...