NCBI genebank refseq 編號意義

2021-08-09 12:00:02 字數 577 閱讀 5221

最近在做virus detection

用到ncbi genebank的病毒庫,發現gene bank refseq裡面編號很多,貼在下面,有助記憶。

genebank的病毒參考序列庫,最近一次更新去掉了gi號,只保留nc或ac號,可以看出全部是完整基因組序列。

另外, 該序列庫是非冗餘庫(non-redundant),總共只有9556個序列,其中nc 9533個,ac 23個,

可以用grep作簡單統計:

grep ">" /path/viral.fa |grep -v ">nc"|wc -l
我關心的hbv只有乙個序列,而hcv有7個(各個基因型都有),這一版終於把hev補上了,小小進步。

看來我要改造一下這個參考庫了,至少要加上所有的hbv基因型。

參考庫當然是fa格式了,如下圖,沒有序列長度

獨立編號表,生成編號

create table tb no name char 2 primary key 編號種類的名稱 head nvarchar 10 not null default 編號的字首 currentno int not null default 0,當前的編號 bhlen int not null d...

轉意字元問題

今天幫別人解決乙個問題,弄了半天才出來,很鬱悶。後台 如下。for int i 0 i 4 i else 在執行後也不報錯,可就是沒關效果。最後修改如下。for int i 0 i 4 i else 方法2 修改js function showdiv id1,id2,id3,id4 後台如下 lit...

matplotlib inline 是什麼意思

使用 matplotlib命令可以將matplotlib的圖表直接嵌入到notebook之中,或者使用指定的介面庫顯示圖表,它有乙個引數指定matplotlib圖表的顯示方式。inline表示將圖表嵌入到notebook中。python提供了許多魔法命令,使得在ipython環境中的操作更加得心應手...