筆記 GWAS 操作流程2 4 哈溫平衡檢驗

2021-10-23 02:32:54 字數 2697 閱讀 2023

什麼是哈溫平衡?

怎麼做哈溫平衡檢驗?

卡方適合性檢驗!,乙個群體是否符合這種狀況,即達到了遺傳平衡,也就是一對等位基因的3種基因型的比例分布符合公式:p2+2pq+q2=1,p+q=1,(p+q)2=1.基因型mm的頻率為p2,nn的頻率為q2,mn的頻率為2pq。mn:mn:nn=p2:2pq:q2。mn這對基因在群體中達此狀態,就是達到了遺傳平衡。如果沒有達到這個狀態,就是乙個遺傳不平衡的群體。但隨著群體中的隨機交配,將會保持這個基因頻率和基因型分布比例,而較易達到遺傳平衡狀態。應用hardy-weinberg遺傳平衡吻合度檢驗方法,把計算得到的基因頻率代入,計算基因型平衡頻率,再乘以總人數,求得預期值(e)。把觀察數(o)與預期值(e)作比較,進行χ2檢驗。病例組和對照組的基因型分布的觀察值和預期值差異無顯著性(p>0.05),符合遺傳平衡定律.

哈溫平衡過濾和maf過濾的區別?

之前,我對這兩個概念有點混淆,後來明白過來了。這兩個概念乙個是對基因頻率進行的篩選,乙個是對基因型頻率進行的篩選。對於乙個位點「aa at tt」,其中a的頻率為基因頻率,aa為基因型頻率。maf直接是對基因頻率進行篩選,而哈溫平衡檢驗,則是根據基因型推斷出理想的(aa,at,tt)的分布,然後和實際觀察的進行適合性檢驗,然後得到p值,根據p值進行篩選。即p值越小,說明該位點越不符合哈溫平衡。

兩個目的:

plink --bfile hapmap_3_r3_8 --hardy
plink.hwe的資料格式:

結果預覽:

這裡我們使用awk:

awk '' plink.hwe >plinkzoomhwe.hwe
共有123個位點,其中unaff為45個位點。

plink --bfile hapmap_3_r3_8 --hwe 1e-4 --make-bed --out hapmap_3_r3_9
日誌:

options in effect:

--bfile hapmap_3_r3_8

--hwe 1e-4

--make-bed

--out hapmap_3_r3_9

515185 mb ram detected; reserving 257592 mb for main workspace.

1073788 variants loaded from .bim file.

163 people (79 males, 84 females) loaded from .fam.

112 phenotype values loaded from .fam.

using 1 thread (no multithreaded calculations invoked).

before main variant filters, 112 founders and 51 nonfounders present.

calculating allele frequencies... done.

total genotyping rate is 0.998136.

--hwe: 45 variants removed due to hardy-weinberg exact test.

1073743 variants and 163 people pass filters and qc.

among remaining phenotypes, 56 are cases and 56 are controls. (51 phenotypes

are missing.)

--make-bed to hapmap_3_r3_9.bed + hapmap_3_r3_9.bim + hapmap_3_r3_9.fam ...

done.

可以看到,共有45個snp根據哈溫的p值過濾掉了,和上面手動計算的一樣。

r**:

hwe

pdf("histhwe.pdf")

hist(hwe[,9],main="histogram hwe")

dev.off()

hwe_zoom

pdf("histhwe_below_theshold.pdf")

hist(hwe_zoom[,9],main="histogram hwe: strongly deviating snps only")

dev.off()

哈溫的p值直方圖:

過濾掉snp位點的p值:

演算法筆記 哈夫曼樹基本操作

樹的帶權路徑長度 weight path length of tree,wpl 等於它所有葉子結點的帶權路徑長度之後 哈夫曼問題 已知n個數,尋找一棵樹,使得樹的所有葉子結點的權值恰好為著n個數,並且使得這棵樹的帶權路徑長度最小。帶權路徑長度最小的樹被稱為哈夫曼樹 又稱最優二叉樹 顯然,對同一組葉子...

JMS學習筆記 操作流程概覽

使用jms可以分為兩個階段 初始化和訊息處理 初始化過程建立與訊息提供程式的連線,建立目的地 傳送方和接收方 訊息處理完成訊息的傳送和接收 jms的初始化包括如下步驟 1 查詢乙個連線工廠 queueconnectonfactory和topicconnectionfactory 2 使用工廠建立連線...

學習筆記 box部署操作流程

搭建盒子操作流程 安裝nodejs環境 tar xvf node v12.16.2 linux x64.tar.xz cd usr local sudo cp r node v12.16.2 linux x64 sudo mv node v12.16.2 linux x64 node sudo vi...