醫學論文中定量資料統計分析方面的錯誤辨析與釋疑

學識都 人氣:4.41K
醫學論文中定量資料統計分析方面的錯誤辨析與釋疑
【關鍵詞】 統計學; 醫學; 論文; 統計分析; 非參數統計
  1 問題的提出

  在醫學論文或稿件中,若觀測結果是定量資料,常需要在不同實驗條件下比較其平均值之間的差別是否具有統計學意義,此時,稱爲定量資料的統計分析。如何才能正確地實現定量資料的統計分析呢?關鍵是兩點:其一,檢查定量資料是否滿足參數檢驗的前提條件;其二,正確辨析定量資料所對應的實驗設計類型。第一點常可通過統計軟件來實現,而第二點則需要分析資料的人具有這方面知識,纔有可能合理選擇統計分析方法。然而,只要科研課題涉及到兩個或兩個以上因素時,實際工作者能正確判定其實驗設計類型的場合少得可憐,因此,在醫學論文或稿件中,這方面的錯誤不計其數。概括起來說,不外乎有以下兩類錯誤:(1)當定量資料不滿足參數檢驗的前提條件(獨立性、正態性和方差齊性)時,盲目套用參數檢驗方法(通常爲特定設計下定量資料的t檢驗或方差分析);(2)不管定量資料對應的實驗設計類型是什麼,一律套用單因素兩水平(或叫成組)設計定量資料的檢驗方法(如t檢驗或秩和檢驗)或單因素多水平設計定量資料的分析方法(如單因素多水平設計定量資料的方差分析或秩和檢驗)。其結果是所得出的結論可信度低,甚至是錯誤的[1,2]。
  2 中西醫結合治療實例

  例1 某臨牀醫生收集了如下的資料(表1),在各組內進行配對設計定量資料的t檢驗,在任何兩組之間,用差量進行成組設計定量資料的t檢驗。請問:錯在哪?正確的做法是什麼?

  對差錯的辨析與釋疑 原作者的做法是錯誤的!因爲這樣做割裂了整體設計,每次分析時,僅用了部分數據,數據的利用低,自由度小,結論的可信度低;無法分析藥物種類與測定時間之間的交互作用。正確的做法是:先檢查資料是否具備參數檢驗的前提條件,然後正確判定資料所對應的實驗設計類型。假定本例中的定量資料滿足參數檢驗的前提條件,而實驗設計類型表面上看是“4個自身配對設計”同時存在,應叫做“具有一個重複測量的兩因素設計(其中,測定時間因素與重複測量有關,除此因素之外,還有一個‘藥物種類’因素)”。正確的統計分析方法爲“具有一個重複測量的兩因素設計定量資料的方差分析”。對本例而言,更合適的分析策略是:將“治療前”視爲“協變量”,即設法使各藥物組治療前儘可能取相等的平均水平,從而推算出治療後的平均測定結果(稱爲校正的平均值),提高各藥物組之間的可比性,其統計分析方法叫做“單因素4水平設計定量資料的一元協方差分析”(每次只分析一個定量指標);若每次需要同時分析3個定量觀測指標,其統計分析方法可叫做“帶有一個協變量的單因素4水平設計定量資料3元方差分析”。
  表1 各組治療前後肝功能檢測結果比較(略)
  例2 很多人用成組設計定量資料的t檢驗和單因素多水平設計定量資料的方差分析處理表2資料。請辨析:這樣做錯在哪裏?爲什麼?正確的統計分析方法是什麼?
  表2 兩組不同組織類型的NSCLC肺部ROI的Max SUV和Mean SUV比較(略)
  對差錯的辨析與釋疑 表2中最後兩列爲兩個定量的觀測指標,原則上,當實驗中涉及兩個或兩個以上定量指標時,看專業上是否需要同時考察它們的變化,若不需要,就視爲兩個一元定量資料;若需要,就視爲一個二元定量資料。關鍵是檢查資料的前提條件(此處從略)和正確判定定量資料所對應的實驗設計類型,以下就不再贅述了。原作者所用的兩種統計分析方法都屬於分析單因素設計定量資料的統計分析方法,是不正確的。屬於未正確辨析實驗設計類型,就盲目套用統計分析方法的一種壞習慣,其結論是不可信的。該定量資料中涉及兩個實驗因素,一個是中醫上的分型(非血瘀證與血瘀證),另一個是癌細胞類型。兩個因素共有6種水平組合,各組合下都有一組獨立的患者,兩個因素同時出現在實驗中,尚無專業知識保證它們對觀測指標的影響誰是主要或次要,故這個定量資料所對應的實驗設計類型應叫做兩因素析因設計或叫2×3析因設計,當定量資料滿足參數檢驗的前提條件時,以選用相應設計定量資料的方差分析處理爲宜。例3 很多人用成組設計定量資料的t檢驗和單因素多水平設計定量資料的方差分析處理表3資料。請辨析:這樣做錯在哪裏?爲什麼?正確的統計分析方法是什麼?