EMBOSS部分命令

2021-10-05 19:37:37 字數 3253 閱讀 9989

example1:extract the regions 30 to 45

extractseq sequence -regions "30-45"

example2: extract the regions 1787-1912, 782-856;

extractseq sequence -reg "1787..1912,782..856"

example3: extract the regions 782-856, 1787-1912 all to separate output sequences:

extractseq tembl:x65921 -reg "782..856,951..1095,1557..1612,1787..1912" stdout

-separate

其他高階檢索:

-snucleotideq :如果序列是核苷酸

-sprotein1 :如果序列是蛋白質

-slwer1 :make lower case

-sid1

-squery1

-osformat1 《輸出序列格式》

-ossingle2 :seperate file

for each entry

-ufo1

-datafile 《矩陣》:選擇blosum做蛋白比對,或者ednafull做核酸序列比對(事實上可自動識別,不需再手動設定)

-sbegin1 《數字》:作為序列起始

-send1 : 作為序列最後

-sprotein: 序列是否是蛋白,不是則可繼續讀取

-snucleotide: 序列是否是核苷酸,同上

-sreverse:預設「-」前為mrna,將其反轉成dna後再比對(「-sreverse1」,即使在最後也將翻轉1)

-option:選單模式

example:找到十個最佳alignment;

matcher

-alt 10;

額外的引數:

-alternatives (-alt): 給出區域性高分匹配序列,預設1只給出得分最高的序列;但是在cdna多域蛋白與基因組dna比較中,需要修改可能會得到其他有趣且重要的片段(若序列過短則會給出全域性比對);(得分越高說明序列的相似度越高)

-gapextend(-gape): 【所有序列預設都是4】一般認為取幾個長的空位比去很多短空位要合理,所以gape的值一般較小(除去某些特殊情況,比如單端測序使得序列有誤時傾向於選擇多個短空位,可以通過調低gapo實現(罰分針對的是第一條的空位插入情況));

example:

supermatcher @eclac.list tembl:j016136 -word 50

可選引數:

-minscore : 輸出的匹配最小得分

-width : alignment的寬度

-wordlen : 讀取步長

esim4 

:seq1 = , 577 bp

seq2 =

((no header))

, 846 bp

1-132 (4-135) 100% ->

133-337 (253-457) 100% ->

338-577 (607-846) 100%

esim4 

可選引數:

-word : blast的word size引數設定

-extend : 設定 在3~10之間

-format : 0:only exon endpoints;

5:cds(只顯示基因組上與mrna相同的開始 和結束位置)

; 1:顯示序列對應情況

-cutoff : integer 3~10

example1:給出seq1的反義互補序列的sev檔案

revseq seq1 seq1.sev

example2: 只輸出seq1的互補序列sev檔案

revseq seq1 seq1.sev -norev

example3: 輸出seq1自身的反義序列

reseq seq1 seq1.sev -nocomp

-其他命令:

-notag: 輸出文去除標題

互動式,主要命令都會顯示並解釋

高階引數:

-othersequence : 輸出的突變序列不會和othersequece的序列相同

e.g.給出輸入序列的兩個隨機拷貝:

shuffleseq -shuffle 2

互動式命令

互動式命令:

-window : cg百分數和觀察到的cg頻率以此引數設定的視窗大小來計算,並且視窗在序列上移動,並將數值累加。

-minlen : cpg島的最小長度

-minoe : 設定了一組10個視窗中,(c+g)觀察值與cpg的期望值最小比率的平均值

-minpc : 設定g和c在一組十個視窗中的最小平均百分數(期望值)

-graph 《格式》:ps,hpgl,meta,cps(彩色),x11,tek,none,data,xterm,png,gif,pdf,svg

手動新增:

-(no)plot: 作為開關,可以繪出得分

e.g.報告seq1中cpg富集區域,輸出閾值為28

cpgreport seq1 -score 28 -outflie <

> -outfeat <

>

(-outfeat 是特徵值輸出格式;或者可直接使用互動命令)

相較於cpgplot的特殊之處:

-shift : 改變每次位移長度,當integer=1時,與cpgplot選擇的cpg島的片段是相同的(可見二者得分演算法應該是相同的)

-score : cpg被確認的得分閾值
-find :0,終止密碼子之間的翻譯;1,起始密碼子和終止密碼子之間的翻譯;2,終止子之間的核苷酸序列;3,啟動子和終止子之間的核苷酸序列;4,啟動子旁側序列;5,最初終止子的旁側序列;6,最後終止子的旁側序列;

LINUX部分命令

針對debian lenny設定如下 dpkg reconfigure locales 選擇 en us.utf 8 zh cn.gb2312 zh cn.utf 8 zh cn.gbk zh tw.big5 zh tw.utf 8 預設 default en us.utf 8 中文就選zh cn....

RMAN部分命令

1 切換伺服器歸檔模式,如果已經是歸檔模式可跳過此步 sqlplus nolog 啟動sqlplus sql conn as sysdba 以dba身份連線資料庫 sql shutdown immediate 立即關閉資料庫 sql startup mount 啟動例項並載入資料庫,但不開啟 sql...

Linux 命令(部分)

1 pwd 顯示當前目錄的絕對路徑名 pwd help version 2 clear 清除終端螢幕 clear注意 linux清屏並不會像windows一樣徹底全部清除,而只是新建一行新的置頂,以前輸的命令仍舊還在上方 3 cd 用於開啟路徑,接收絕對路徑和相對路徑 cd dirname dirn...