生存函式和生存曲線怎樣看?

2021-10-09 22:05:00 字數 2299 閱讀 9058

前文我們詳解過線性回歸,也初步介紹了生存分析所涉及的生存資料,明白了:做生存分析最特殊的一點是分析時要納入研究物件的「生存時間」,更一般的是指:出現某種特定結局的時間。今天的文章,我們更進一步地來學習如何看懂生存函式和生存曲線。

生存概率和死亡概率

在進入正題之前,我們需要首先明確兩個概念:生存概率與死亡概率。

1. 生存概率(survival probability),用p表示,是指某時段開始時存活的個體,到該時段結束時仍存活的可能性。

說起來好像有點兒嚇人,但是計算起來很簡單:

2. 死亡概率(probability of death),與生存概率相對, 用 q 表示,指某時段開始時存活的個體,在該時段內死亡的可能性。如年死亡概率表示年初尚存人口在今後1年內死亡的可能性。

介紹完這兩個基礎概念後,我們來看看什麼叫生存函式(survival function)。

生存率

教科書的定義是:生存函式表示觀察物件的生存時間t大於某個時間的概率,常用 s(t)表示。

生存函式又稱為累積生存率,簡稱生存率(survival rate)。例如,前文談到的肺癌患者,其生存函式可以寫作:

代表患者**後存活時間大於18個月的概率,該值越大表明**的療效越好。這裡有乙個點很容易混淆,s(t)表示生存率,而前面我們用p代表的是生存概率。乙個是生存率,另乙個是生存概率,難道不是一回事兒嗎?

還真不是!生存率與生存概率雖然一字之差但定義卻不大相同(當然兩者也存在聯絡)。

還是上面的t=18的例子,對於生存率和生存概率,我們可以分別這樣來寫:

生存率:s(t=18)=p(t>18)

生存概率: p(t=18)=p(t=18)

看上面的式子,生存率的計算是用「>」,而生存概率的計算是「=」。由此,生存概率是指單位時間上生存的可能性,生存率是某個時間段(由乙個或多個單位時間組成的時間段)生存的可能性,是多個單位時間生存概率的累計結果。

比如評價肺癌**後3年的生存率,是指第一年存活,第二年存活,直至第三年仍然存活的累積概率,而這3年間每一年都會有不同的生存概率,兩者之間的關係如下圖:

數學上,生存率和生存概率也有如下的計算關係:

生存曲線

除了計算某個時刻(從開始到該時刻的整個時間段)的生存率之外,我們還可以利用圖示法更加直觀地描述生存率隨生存時間的變化而變化。

下圖即為根據某項研究制定的生存曲線:橫軸是生存時間,縱軸是生存率。

如上圖,我們可以發現,當t=11.124時,對應的生存率是0.5。

隨著時間的延長,部分患者死亡,從而導致生存函式的值會逐漸降低。從圖形上看,當時間趨於無窮大時,生存函式的值趨於0,意味著,長遠來看,每位患者的生存時間都是有限的,不可能無限活下去。

一般而言,生存分析的主要應用如下:

1.描述生存時間的分布特點。通過生存時間和生存結局的資料估計平均存活時間及生存率,繪製生存曲線,根據生存曲線分析其生存特點等。

2.比較生存曲線。通過相應的假設檢驗方法對不同樣本的生存曲線進行比較,以推斷各總體的生存狀況是否存在差別,比較不同**方法預後效果的差異。

3.分析影響生存狀況的因素。通過生存分析模型來**影響生存狀況的因素,通常以生存時間和結局作為因變數,而將可能的影響因素作為自變數,通過擬合生存分析模型,篩選具有統計學意義的生存狀況的影響因素。

靜態生存期和動態生存期

靜態生存期 定義 如果某乙個物件的生存期和程式的執行的生存期一樣,則這個物件具有靜態生存期。關鍵字 static 特點靜態變數不會隨著每次函式的呼叫產生乙個新的副本,也不會隨著函式返回而失效。第n次呼叫函式時,靜態變數的值為第n 1次呼叫的靜態變數的值,依次類推!也就是說靜態變數 第一次賦值有效,也...

r 保留之前曲線 生存曲線居然能夠批量繪製了

寫在前面 相信很多小夥伴在看文獻的時候總是能夠看到作者拿一張figure放置多個生存曲線圖,不知道大家想過沒有,如果作者一張小圖一張小圖的畫,那可能圖還沒有畫完就直接開始拍桌子了。肯定為了提公升科研的效率,我們還是希望把這些重複的工作都交給計算機不厭其煩地去做,然後留更多的時間給我們自己享受生活。好...

生存和生活的區別

經常出入高階的寫字樓,每次開口都是john,steven這些非常光鮮亮麗的詞藻 衣著打扮都是西服領帶 坐在辦公桌前談著各種case。這樣的生活我們每天過著,時間一長,也慢慢的習慣了這樣的朝九晚五。偶爾聽幾個勵志的雞湯演講,看幾個草根創業成功的故事。要是在老家,父母們經常談論的話題無外乎兒女們在外面的...