Trinity介紹與使用(一)

2021-08-29 18:39:49 字數 4407 閱讀 3127

trinity

1cat1m_reads_sample/*.left.fq > reads.all.left.fq

2cat1m_reads_sample/*.right.fq > reads.all.right.fq

1$trinity_home/trinity.pl --seqtype fq --jm 10g --left reads.all.left.fq --right reads.all.right.fq --ss_lib_type rf --cpu 6 --seqtype fq —-output ./trinity_out_dir

輸出檔案:trinity

.fasta

1$trinity_home/util/trinitystats.pl trinity_out_dir/trinity.fasta>./assembly_report.txt

輸出檔案:assembly_report.txt

1$trinity_home/util/align_and_estimate_abundance.pl --transcripts trinity.fasta --seqtype fq --left reads_1.fq --right reads_2.fq --est_method rsem --aln_method bowtie --trinity_mode —prep_reference

比對輸出:bowtie.csorted.bam

rsem輸出

rsem.isoforms.results  : em read counts per trinity

transcript

rsem.genes.results     : em read counts on a per-trinity

-component (aka... gene) basis, gene used loosely here.

過濾比對

1$trinity_home/util/filter_fasta_by_rsem_values.pl

--rsem_output=/path/to/rsem.isoforms.results[,...] --fasta=/path/to/trinity.fasta --output=/path/to/output.fasta

--fpkm_cutoff=1200

過濾值需要根據需求自己設定。

假定有四個樣本,轉錄本定量輸出為:

log.isoforms.results 

ds.isoforms.results 

hs.isoforms.results

plat.isoforms.results

注意:--samples_file為樣本分組資訊檔案 group.txt ,例如:

throat sample2.sam

saliva sample3.sam

throat sample4.sam

vaginal sample5.sam

--contrasts 為樣本不同條件下比較compare.txt:

throat

saliva

vaginal  saliva

throat  vaginal

1$trinity_home/trinity-plugins/transdecoder/transdecoder -t  transcripts.fasta -m  100 —search_pfam /path/to/pfam_db.hmm to search —cpu 6

輸出檔案:

、sqlite、ncbi blast、hmmer、signalp v4、tmhmm v2、rnammer

比對資料庫:swissprot、uniref90、pfam domains 

標準化資料:

檢視源**

列印幫助

1makeblastdb -inuniprot_sprot.fasta -dbtype prot

2makeblastdb -inuniref90.fasta -dbtype prot

3hmmpress pfam-a.hmm

blast比對(比對的資料庫可以換成nr/

uniref90)

# search trinity

transcripts

1blastx -query trinity.fasta -db uniprot_sprot.fasta -num_threads 8 -max_target_seqs 1 -outfmt 6 -evalue 1e-5 > blastx.outfmt6

# search transdecoder-predicted proteins

1blastp -query transdecoder.pep -db uniprot_sprot.fasta -num_threads 8 -max_target_seqs 1 -outfmt 6 -evalue 1e-5 > blastp.outfmt6

功能域

1hmmscan --cpu 8 --domtblout trinotatepfam.out pfam-a.hmm transdecoder.pep > pfam.log

訊號肽1signalp -f short -n signalp.out transdecoder.pep

跨膜結構

1tmhmm --short < transdecoder.pep > tmhmm.out

識別rrna

1$trinotate_home/util/rnammer_support/rnammertranscriptome.pl --transcriptome trinity.fasta  --path_to_rnammer /usr/bin/software/rnammer_v1.2/rnammer

輸出:trinity

.fasta.rnammer.gff

檢視源**

列印幫助

1$trinity_home/util/support_scripts/get_trinity_gene_to_trans_map.pl trinity.fasta >trinity.fasta.gene_trans_map

2

3trinotate trinotate.sqlite init --gene_trans_map trinity.fasta.gene_trans_map --transcript_fasta trinity.fasta --transdecoder_pep transdecoder.pep

1trinotate trinotate.sqlite load_swissprot_blastp blastp.outfmt6

2trinotate trinotate.sqlite load_swissprot_blastx blastx.outfmt6

3trinotate trinotate.sqlite load_pfam trinotatepfam.out

4trinotate trinotate.sqlite load_tmhmm tmhmm.out

5trinotate trinotate.sqlite load_signalp signalp.out

6trinotate trinotate.sqlite report >trinotate_annotation_report.xls

輸出檔案:trinotate_annotation_report.xls

AtomicBoolean介紹與使用

介紹 在這個boolean值的變化的時候不允許在之間插入,保持操作的原子性 方法 compareandset boolean expect,boolean update 這個方法主要兩個作用 1.比較atomicboolean和expect的值,如果一致,執行方法內的語句。其實就是乙個if語句 2....

pkg config介紹與使用

linux c c 編譯鏈結摘 要 一般來說,如果庫的標頭檔案不在 usr include 目錄中,那麼在編譯的時候需要用 i 引數指定其路徑。由於同乙個庫在不同系統上可能位於不同的目錄下,使用者安裝庫的時候也可以將庫安裝在不同的目錄下,所以即使使用同乙個庫,由於庫的路徑的不同,造成了用 i 引數指...

MinGW介紹與使用

3.1 mingw 是什麼?mingw 提供了一套簡單方便的windows下的基於gcc 程式開發環境。mingw 收集了一系列免費的windows 使用的標頭檔案和庫檔案 同時整合了gnu 的工具集,特別是gnu 程式開發工具,如經典gcc,g make等。mingw是完全免費的自由軟體,它在wi...