傾向值分析對藥物經濟學評價的應用論文

學識都 人氣:4.89K

傳統的藥物經濟學評價多是基於隨機對照試驗(RCTs)來獲得干預的效果和成本數據。RCTs的設計原則保證了不同組間可觀測的和不可觀測的影響因素在基線時的可比性。因此,能夠保證獲得對干預效果的無偏估計。但在很多情況下,RCTs是無法實施的,或不能反映真實的治療效果和成本,而基於真實世界研究的藥物經濟學評價越來越多。在真實世界研究的觀察性數據中,經常面臨着患者基線不可比的情況,其產出結果往往受到各種混雜因素和偏倚的影響,因而無法得到對干預效果的無偏估計。爲了消除混雜因素的影響,傳統上會採用多變量配對、多因素迴歸和分層分析等方法。但是,這些方法都有其各自的侷限性。如當需要匹配的變量很多時,多變量配對通常是不可行的;當混雜因素很多或有多個亞組時,分層分析也是不可行的;多因素迴歸則要求不同組間的協變量具有一致的分佈。因此,當可以獲得患者的個人數據時,通過特定的統計學方法,如迴歸、匹配和工具變量等都可以對混雜因素導致的選擇偏倚進行糾正。在使用這些方法時要注意其相應的假設條件,迴歸和匹配的方法需要不存在不可觀測的混雜因素的假定,匹配還需要假定通過匹配後各組間的基線特徵能夠得以平衡。傾向值分析是分析觀察性數據常用的一類方法,目前也越來越多地用於採用觀察性數據開展的藥物經濟學評價。

傾向值分析對藥物經濟學評價的應用論文

1傾向值分析簡介

在評價干預效應時,很多情況下要利用觀察性數據而不是隨機試驗得到的數據。在觀察性數據的分析中,總是希望能夠重建被打破的隨機試驗的分配原則。傾向值(propensityscore)是在控制其他混雜因素的條件下個體接受干預的概率,對其在干預組和控制組間進行控制或匹配以估計干預效果,可以用來控制大量的混雜因素變量。Rosenbaum和Rubin在1983年發表了一篇關於傾向值原理和分析方法的文章[1],之後傾向值分析開始用於勞動經濟學和發展經濟學,用來分析通過非隨機試驗方法取得的數據,近年來越來越多的用於醫學研究和藥物經濟學評價中。在觀察性數據中,觀察個體是被分配到試驗組還是控制組並不是隨機的,因而對處理效應的估計會因爲混雜因素的存在而產生偏倚。傾向值分析就是用於糾正這一偏倚的方法。通過控制存在的混雜因素,使得試驗組和控制組中的個體在各個維度上儘可能相似,因而減少混雜因素對干預效果估計產生的影響。傳統的配對方法是根據關鍵變量對個體進行匹配,對觀測個體在n維變量上進行匹配時,如果n很大,其難度是可想而知的。傾向得分法是將n維變量的信息綜合爲一個處理前的單一變量(傾向得分值),從而使匹配更加可行。傾向值分析一般分爲兩步,首先是計算一個傾向值得分,然後是根據這一得分進行匹配(Matching)或分析。對於未採取隨機分組試驗方法得到的數據,傾向值分析提供了一種近似實驗的方法,產生儘可能隨機分組的效果,以控制觀測變量。如果有兩階段及以上的數據,還可與雙重差分法(differenceindifferences,DID)合用,控制不隨時間變化的不可觀測變量。

2傾向值分析

用於藥物經濟學評價的相關研究通過對相關文獻進行綜述發現,傾向值分析已廣泛應用於基於觀察性數據的藥物經濟學研究中。這些研究所關注的結果變量有的只考察成本或效果,或分開檢驗混雜因素對成本和效果的影響。如Manca等[2]應用傾向值分析對不同手術方案的成本和效果進行研究,通過加拿大安大略湖省的心肌梗死數據庫(OMID),對經皮腔內冠狀動脈成形術(PTCA)和冠狀動脈旁路移植手術(CABG)對因急性心肌梗死(AMI)入院患者的成本和效果進行評價。該研究中用到的混雜因素包括患者年齡、性別、心源性休克、急性和慢性腎衰竭、有併發症的糖尿病、充血性心力衰竭、腦血管疾病、惡性腫瘤、肺水腫、心律失常、Charlson合併症指數和家庭中位收入。對兩組基線協變量的比較發現,大多數協變量存在顯著性差異,即兩組患者的基線信息不平衡。比較的效果是接受治療後1年內的生存率,成本是所有疾病相關的醫療成本,研究分別對成本和效果未經過調整的結果、多元迴歸結果、基於傾向值匹配的結果和基於傾向值分層的結果進行了比較。也有研究將傾向值分析與其他控制混雜因素的方法進行比較。如Stukel等[3]對使用傾向值與工具變量方法的分析結果進行了比較。該研究對加拿大1994—1995年全國65~84歲因AMI入院的老年患者是否實施心臟導管介入術對長期(7年)死亡率的影響。對基線信息分析發現,實施心臟導管介入術的患者比未實施的患者更加年輕,並且AMI嚴重程度更低。研究分別使用多元迴歸、加入傾向值的迴歸、傾向值匹配和工具變量的方法進行分析,得到的結論是多元迴歸的結果與其他方法的結果相差較大,加入傾向值的迴歸和傾向值匹配所得結果相近,使用工具變量得到的結果最接近於RCTs的結果。在該研究中,使用的工具變量是各地區心臟導管介入手術的比例,在其他研究中也有使用地區工具變量的例子,如對AMI患者進行強化治療是否降低死亡率的研究[4-5]。但是,使用工具變量的分析方法通常更適用於對某項政策實施效果的評價,用於分析特定臨牀干預時一般並不容易找到合適的工具變量。隨着成本-效果比的統計學評估方法越來越多地應用於藥物經濟學研究中,其中淨收益的方法[6]將成本-效果比轉化爲線性形式,從而提供了可以在迴歸模型中估計成本-效果置信區間的統計學假設檢驗方法。Mitra等[7]將淨效益模型與傾向值分析相結合,提出了對通過觀察性數據對醫療干預措施進行成本-效果分析的方法。淨效益模型將成本-效果比轉化爲線性模型,在該線性框架內應用傾向值分析可以對基線不平衡的各組間混雜因素進行控制,從而得到干預無偏的估計,但是使用淨效益模型的一個困難是如何確定對λ的取值(也就是每單位效果所對應的意願支付最大值)。該研究就肌層浸潤性膀胱癌是否行膀胱切除術的成本-效果進行了分析,將延長的生命時間轉化爲貨幣單位構建淨效益指標,將傾向值對淨效益進行調整,計算λ取不同值時膀胱切除術爲患者帶來的淨收益,並將該結果與未經調整的及普通多元迴歸調整的結果進行比較。研究發現,傾向值調整的結果與普通多元迴歸調整的結果相近,但遠小於未經調整的結果。

3傾向值分析用於藥物經濟學評價的步驟

3.1發現可能的混雜因素並估計傾向值

傾向值分析的第一步是找出既影響干預分組又影響結果的混雜因素,將混雜因素作爲協變量估計傾向值。在估計傾向值之前,需要選取合適混雜因素的協變量。一般協變量是根據已有經驗或理論依據來選取的。通過雙變量檢驗,與干預分組變量和結果變量都相關的協變量均應包含在估計傾向值的模型中;與結果變量相關的協變量也應包含在估計傾向值的模型中(不管其與分組變量是否相關),這樣有助於降低估計結果的方差;而只與干預分組相關,但與結果變量無關的協變量不應包含在估計傾向值的模型中[8]。得到傾向值後,需要對匹配後的數據進行協變量平衡的檢驗(以干預作爲分組進行雙變量檢驗),如果匹配後雙變量檢驗差異無統計學意義,則可得出成功消除觀測協變量組間差異的結論;如果協變量仍不平衡則需要對迴歸模型進行重構或調整,常見的調整方法有加入協變量的高階項或交叉項,調整後再次運行傾向值模型以檢驗匹配的平衡效果;也可通過逐步迴歸的方法,在確定的統計學顯著水平下決定納入或排除協變量。

3.2根據傾向值進行分析

得到傾向值後,可以利用傾向值作匹配或直接使用傾向值作分析。根據傾向值進行匹配是將傾向值儘可能相似的干預組成員和控制組成員進行匹配,根據匹配方法的不同,分爲貪婪匹配、採用或不採用傾向值的馬氏距離匹配以及最佳匹配;對於匹配後構成的匹配樣本可以進行特定類型的分析,包括基於匹配樣本的分層分析、多元分析及非參數統計分析。另外,得到傾向值後還可以直接利用傾向值作分析,如將傾向值作爲權重直接做多元分析,或者是基於內核的加權均值差進行分析。3.2.1使用傾向值進行匹配得到估計的傾向值後可以根據傾向值進行匹配,根據匹配算法的不同,主要分爲貪婪匹配和最佳匹配兩種。使用傾向值做匹配時必須滿足共同支撐架設:兩組在整體上要有相似的特徵;兩組傾向得分的重疊區域成爲共同支撐區域(commonsupportregion),其大小直接影響到匹配的效果。極端情況下,如果兩組沒有共同支撐區域,說明兩組不具有可比性,在這種情況下,傾向得分匹配的方法就不適用。共同支撐區域越大,匹配方法的選擇對結果就不敏感,而共同支撐區域越小,採用不同的匹配方法所得到的結果差異就比較大[9]。貪婪匹配是最常用的一種匹配算法,所謂“貪婪”是指這一類匹配都有一個共同特徵,每一次匹配的決策都是對當前需要匹配個體而言最優的匹配決策,而不考慮總體的匹配效率。因此,這一類匹配通常採用無放回的匹配,每一對最相近的干預組成員和控制組成員在匹配成功後被移出數據池,其他成員繼續重複匹配過程。貪婪匹配的代表有最近鄰匹配(nearestneighbormatching)、卡鉗匹配(calipermatching)、卡鉗內的最近鄰匹配(nearestavailableneighbormatchingwithinacaliper)以及馬氏距離匹配(mahalanobismetricdistancematching)。最佳匹配的匹配思想是使得傾向值總體樣本距離最小,要達到的目的是使得匹配的效率達到最高。最佳匹配從總體角度出發,匹配完成後每一個干預組成員與一個或多個控制組成員匹配,按照權重計算得到干預組與控制組傾向值的.絕對值,最佳匹配使得這些絕對值之和最小。3.2.2匹配後進行分析匹配後首先需要對協變量的平衡情況進行檢查。有研究[10]對1995—2003年採用傾向值匹配方法進行分析的醫學文獻的研究質量進行了系統綜述,發現在47篇文獻中只有2篇文獻正確報道了匹配前和匹配後不同組間基線變量的平衡情況,並正確衡量了不平衡的程度。協變量的平衡可通過均值上的絕對標準化差值來衡量。進行貪婪匹配後可進行多元分析和分層分析。可以在匹配後的樣本中能夠多元迴歸分析,以表明干預條件二分類變量的迴歸係數作爲干預效果的估計;進行貪婪匹配後,需根據傾向值進行分層,比較層內干預組和控制組的結果,再根據各層的結果均值差和差值的方差估計整個樣本的均值差,並能檢驗其是否統計顯著;進行最佳匹配後可以通過Hodges-Lehmann有序秩檢驗對結果進行分析,也可通過特殊的迴歸調整來估計[11]。3.2.3不匹配的使用傾向值加權以上方法是得到傾向值後進行匹配再分析;還可在不匹配的情況下使用傾向值,將傾向值作爲抽樣權重進行多元分析。傾向值加權的目的在於對干預組和控制組的成員分配權重,使其能夠代表研究總體。可以對加權後的總體直接進行多元分析,也可用於非參數迴歸的傾向值分析,進行基於內核的匹配。

3.3對不可觀測的混雜因素做敏感性分析

由於傾向值分析的只能對可觀測的混雜因素進行控制和平衡,而對於不可觀測的混雜因素的影響則無法識別,因此傾向值匹配通常需要通過敏感性分析(sensitivityanalysis)來檢驗是否會存在關鍵的不可觀測的混雜因素對結果產生嚴重影響。敏感性分析通過假設存在一個或多個無法控制的不可觀測的混雜因素的存在,假設無法控制的變量對結果影響在很大範圍內的變動都無法改變所得結論,則認爲此研究通過了敏感性檢驗,所得結論是穩健的。傾向值匹配的敏感性分析方法比較常用的是Rosen-baum界限[12],該方法通過一個Г係數來表示不可觀測混雜因素的可能取值,通過觀察Г在一定水平變動時,結論不再顯著來判斷結論對不可觀測混雜因素的敏感性。如果Г取值較小時結論就不顯著,則所得結論的穩健性值得懷疑;如果Г取值較大時結論纔開始變得不顯著,則認爲所得結論是站得住腳的。

4討論

在對觀察性數據進行分析時,傾向值分析是一類直觀、實用的控制混雜因素的方法,已廣泛應用於醫學、社會學和經濟學研究領域中,目前在藥物經濟學評價中的應用也越來越多。在開展基於觀察性數據的藥物經濟學評價時,必須對各組間在基線時的可比性進行評價。對於基線不可比(即存在混雜因素影響)的情況下,需要採用合適的控制混雜因素方法。需要特別注意的是,傾向值分析只能儘量減少混雜因素產生的影響,並不能完全消除,其消除程度取決於可以被觀測和控制的變量數量以及匹配的質量。此外,傾向值分析只能對可觀測的混雜因素進行平衡和控制,並不能夠控制不可觀測的混雜因素,當有重要的混雜因素缺失或不可觀測時,採用傾向值分析所得結果可能與真實值存在較大偏差,此時如果數據允許,應使用工具變量或面板數據模型等可以處理不可觀測混雜因素的分析方法。