課題研究成果報告
【目的】データマイニングの代表的な手法であるDecision tree(DT)モデルは、フローチャート状の構造を有し、利用者はそれぞれの変数に関わる条件に対して回答していくことで、複数の要因の相互関係を考盧したイベントの発現割合を簡便かつ定量的に評価可能となる。これまでに我々は、DT解析を用いた副作用発現割合推定モデルの有用性を明らかにしてきた。本研究では、DT分析を用いて抗ウイルス薬であるガンシクロビル(GCV)誘発性血小板減少症のリスク推定モデルを構築することを目的とした。
【方法】北海道大学病院において、2008年4月から2018年3月までにGCVが投与された386例を対象に、 chi-automatic interaction detection(CHAID)およびclassification and regression tree(CRT)の2種のアルゴリズムを用いてDTモデルを構築した。モデルの検証のために、ロジスティック回帰分析を同時に実施し、それぞれの精度を評価した。
【結果】解析対象患者386例のうち、血小板減少症は47例(12.2%)に発現した。CHAID法とCRT法において、2種のリスク推定モデルが構築され、それぞれ6つおよび7つのサブグループにツリーは分岐した。両アルゴリズムにおいて、造血幹細胞移植、血小板数101,000 cells/mm3 未満、血清アルブミン値 2.8 g/dL 未満、総ビリルビン値 0.8 g/dL 以上ならびに集中治療室入室がリスク因子として抽出された。CHAID法ならびにロジステイック回帰モデルの精度はそれぞれ87.8%、CRT法の精度は88.3%であった。
【考察】構築されたモデルの精度は良好であり、抽出されたリスク因子は臨床的に妥当と考えられた。
【成果】GCV誘発性血小板減少症のリスク推定モデルの構築に成功した。