本研究では、医薬品の安全性評価の標準化や市販後安全性対策をより充実させることを目的として人工知能による標準的な安全性評価の支援ツールの開発と実証に向けた検討を行う。臨床開発段階の治験や市販後に得られた累積安全性データから、観察された類縁症状・徴候をグルーピングした発現パターンをAI によって自動生成し、生体内の生理病理学的関連を参考に関連する診断名を予測、起こりうる薬剤性重要副作用を推定する。
初年度の平成30 年度に引き続き、令和1年度では、医療リアルワールドデータ2000 万人強の患者情報を含む病院会計事務情報データベースのデータ構造のラーニングに基づき、機械学習に適したデータクレンジングを行った。これにK近傍法に基づく教師あり機械学習アルゴリズムを、1-15歳の小児糖尿病患者に適用した結果、これらの患者集団で発現した有害事象の器官別大分類を、70%の精度で予測できることが判明した。現在特定されたイベントクラスタに含まれるイベントについて臨床経験豊富な医師がイベント間の関連性の有無を評価している。その一方で、機械学習アルゴリズムの改良を継続しており、今後は、深層ニューラルネットワークを用いることによる、生体内反応のモデル化の可能性の検討を含めて、臨床試験データを入手し、これを加えたイベント発現パターンの認識に基づく医薬品副作用の特定のための分析器の開発を進める。
本研究成果に関しては、第39回医療情報学連合大会(第20回医療情報学会学術大会 2019.11 幕張)、及び、日本薬剤疫学会 薬剤疫学とデータベースタスクフォース「実務者のためのデータベース研究講座 その 3」(2020.1、東京)にて発表された。
This research aims to develop the analysis tool using machine learning technologies to generate and evaluate valid safety signals from clinical trial data and real world data without predefined hypothesis. Several machine learning algorithms are being applied to predict potential drug-induced adverse reactions using automated clustering of observed signs and events, in consideration of physiological/pathophysiological adjacency, such as Standardized Meddra Query.
In the first year of the research project, we conducted data cleansing of the electronic medical database including more than 20 million patients for the preparation of machine learning, based on lessons learned on its data specification and composition. We applied k-nearest neighbor method, one of supervised machine learning algorithms, to the analysis dataset with multiple-dimension.
In the test dataset, the machine learning showed the prediction accuracy of approximately 70% on the organ system classification of predicted adverse reactions.
We are refining machine learning algorithms for better prediction, by using such as deep neural network to improve predictability and level of detail.
We presented the above results at the 39th Joint Conference on Medical Informatics (JCMI) and the 20th Annual Meeting of Japan for Medical Informatics held in Nov, 2019 (Chiba, Japan) and the database seminar held by the pharmacoepidemiology and database task-force of the Japanese Society for Pharmacoepidemiology on Jan. 20, 2020 at Tokyo.
|