晶元資料分析步驟2 讀取資料 affy

2021-08-19 21:59:50 字數 1565 閱讀 1848

affymetrix表達譜晶元資料讀取的方法分3種:

1、使用affy包讀取。(hgu95/hgu133晶元)

2、使用oligo包讀取。(whole transcriptome 晶元/ nimblegen 晶元/ snp晶元等)

3、使用******affy包讀取。(hgu95/hgu133晶元)

1 justrma

just.rmajustrma兩種函式可供使用。justrma整合了讀取資料和rma演算法處理兩個步驟,可以直接讀取資料生成expressionset,不產生affybatch。**如下:

just.rma(filenames)

justrma(filenames, widget = f)

just.rma必須給出要讀取的cel檔案的檔名(可以為list),justrma在不輸入任何引數的時候表示讀取工作目錄下所有的cel檔案。若輸入justrma(widget=t),則表示手動選擇要讀取的cel檔案。推薦輸入包含路徑的檔名(list.celfiles(full.name = t)的返回值)。

2 read.affybatch

read.affybatchreadaffy兩種函式可供選擇,均讀取cel檔案轉換成affybatch物件,cel檔案無論是否壓縮均可讀取。**如下:

read.affybatch(filenames)

readaffy(filenames, widget=f,celfile.path)

read.affybatch必須給出要讀取的cel檔案的檔名(可以為list)且不能更改讀取路徑,讀取路徑固定為工作路徑readaffy在不輸入任何引數的時候表示讀取工作路徑下所有的cel檔案。若輸入readaffy(widget=t),則表示手動選擇要讀取的cel檔案。

read.celfiles

read.celfiles(filename)
讀取cel檔案的時候推薦輸入包含路徑的檔名。即使用上一步**list.celfiles(celpath, full.name = t)的返回值。無論cel檔案是否被壓縮均可讀取。

read.affy

使用******affy包讀取cel檔案需要額外提供乙個描述實驗分組資訊(即phenodata)的covdec檔案。該檔案與cel檔案放在同一目錄下。要求covdec檔案第一列無列名,含有要讀取cel檔名,剩下的列表示實驗因子。**如下:

read.affy(covdesc = "covdesc",path=".", ...)

資料讀取與資料分析

本章主要內容為資料讀取和資料分析,具體使用pandas庫完成資料讀取操作,並對賽題資料進行分析構成。賽題資料雖然是文字資料,每個新聞是不定長的,但任然使用csv格式進行儲存。因此可以直接用pandas完成資料讀取的操作。在賽題資料中每行句子的字元使用空格進行隔開,所以可以直接統計單詞的個數來得到每個...

資料分析讀取資料pandas

首先安裝完numpy之後就可以安裝pandas了 pip insert pandas 下面是簡單的用法可讀取任何檔案資料報括資料庫 import pandas as pd 通常用pd作為pandas的別名 s pd.series 1,2,3 index a b c 建立乙個序列s d pd.data...

Task2 資料讀取與資料分析

先用pandas讀取資料 train df pd.read csv data train set.csv sep t train df.head label為新聞類別,text為之後的文章內容。讀取資料後計算每條新聞的文字長度。用plt庫繪製直方圖。1 假設字元3750,字元900和字元648是句子...