僅對特定的基因call variation

2021-08-13 11:04:30 字數 1130 閱讀 8080

有這個需求,是因為我們經常對某些細胞系進行有針對性的設計變異,比如baf155的r1064k呀,h3f3a的k27呀,那我我們拿到高通量測序資料的時候,就肯定希望可以快速的看看這個基因是否被突變成功了。現在比對幾乎不耗費什麼時間了,但是得到的sam要sort的時候還是蠻耗費時間的。假設,我們已經得到了所有樣本的sort好的bam檔案,想看看自己設計的基因突變是否成功了,可以有針對性的只call 某個基因的突變!

**很簡單:

grep h3f3a ~/reference/gtf/gencode/protein_coding.hg19.position

samtools mpileup -r chr1:226249552-226259702  -ugf ~/reference/genome/hg19/hg19.fa *sorted.bam | bcftools call -vmo z -o h3f3a.vcf.gz

gunzip h3f3a.vcf.gz

~/biosoft/annovar/annovar/convert2annovar.pl -format vcf4old h3f3a.vcf >h3f3a.annovar

~/biosoft/annovar/annovar/annotate_variation.pl -buildver hg19 --geneanno --outfile h3f3a.anno h3f3a.annovar ~/biosoft/annovar/annovar/humandb/

~/biosoft/annovar/annovar/annotate_variation.pl -buildver hg19 --dbtype knowngene --geneanno --outfile h3f3a.anno h3f3a.annovar ~/biosoft/annovar/annovar/humandb/

需要自己製作好基因的起始終止座標檔案,這樣就可以找到自己的基因的位置,比如我的h3f3a是chr1:226249552-226259702,用bcftoolls簡單的call variation即可,得到的vcf檔案用annovar注釋一下,看看是否在自己設計的蛋白質的某個位點的氨基酸!

線粒體和葉綠體的基因組特點 基因和基因組

基因 gene 是能夠編碼蛋白質或者rna等具有特定功能產物的 負載遺傳資訊的基本單位,即有遺傳效應的dn 段 可以理解為 gene protein rna mrna trna rrna 基因組 genome 是指乙個生物體內所有遺傳物質的總和,對於含有線粒體或者葉綠體等結構的生物來說,還包括其中的...

合成基因的方式

合成基因 的方式有2種 全基因合成 一般對於分子較小而又不易得到的基因採用該方式。可將雙鏈基因分成若干 寡核苷酸 單鏈片段 尤其待合成基在在 100個核苷酸以上時 每個片段長度控制在 40 60 個鹼基,並使每對相鄰互補的片段之間有 6個鹼基交叉重疊。在體外 將除基因兩端末端外的所有片段磷酸化。混合...

牛的基因 C

題目描述 農夫舒婧擁有n頭有斑點的奶牛和n頭沒有斑點的奶牛。由於她剛剛完成了關於牛的基因的一門課程,所以她相信,她的奶牛身上的斑點是由於奶牛基因組上單個位置的基因突變引起的。農夫舒婧花費了巨大的代價,把她的奶牛的基因組進行了排序。每乙個基因組都是乙個由acgt四個字母組成的長度為m的字串。當她排列她...