生物資訊指令碼練習(3)gb檔案轉換

2021-08-04 14:38:44 字數 1166 閱讀 7294

這是個genebank的序列檔案

這個檔案需要轉換成fasta格式的檔案,指令碼如下:

import re

output = open("data3.txt","w")

with

open("sequence.gb","r") as f:

read = f.readlines()

title = read[0]

title = ">"+title[12:20]

print(title)

output.write(title)

output.write("\n")

seq = read[81:138]

seq_complete =

for i in seq:

for e in i:

if re.match("[a-z]",e):

seq_complete = "".join(seq_complete)

#print(seq_complete)

output.write(seq_complete)

output.close()

我寫的這個只對某乙個gb檔案有效,因為我數了一下序列的行數,然後切片取的,其實還有完全使用正則的更好的方法。

import re

f=open('sequence.gb','r')

seq=""

forline

in f:

if re.search('accession',line):

m=line.split('accession')[1].strip()

if re.search('organism',line):

n=line.split('organism')[1].strip()

print ('> %s : %s' % (n,m))

if re.search('[0-9] [a-z]',line):

s=re.split('[0-9] ',line)[1]

print (s.split(" "))

for i in s.split(" "):

seq=seq.rstrip()+i.rstrip()

不錯吧!

什麼是3G和3G手機

科技新名詞 什麼是3g 和3g手機 3g,全稱為3rdgeneration,中文含義就是指第三代數字通訊 相對第一代模擬制式手機 1g 和第二代g td ma等數字手機 2g 3g通訊 的名稱繁多,國際電聯規定為 imt 2000 國際移動 2000 標準,歐洲的電信業巨頭們則稱其為 umts 通用...

SDP消弭 3G資訊服務短板

隨著移動通訊網路由2g向3g演進,網路頻寬極大改善,業務提供者與終端間的 天塹 將變 通途 電信 運營商的角色作用可能快速被削弱。在這一背景之下,運營商需要做的是盡快成為業務提供者與終端之間渠道的掌控者,重新建立起自己的獨特作用,sdp正是要幫助運營商實現這一角色變換。運營商3g短板催生sdp 目前...

MID 為3G而生,因3G引爆流行

一直以來非常關注mid 多 網際網路終端 的進展,也已經使用過幾款不同公司的mid產品,直到最近用過瑞芯微開發中的mid產品,感到mid盛行時代真的越來越近。2009年無論業界都將上網本作為3g助推劑,可惜從市場的表現來看,消費者並不買賬,雖然運營商給與大量補貼,上網本依然難逃厄運,至少在中國如此,...