化学構造による変異原性予測19:カバー率100%における最良の予測モデルの詳細

我々の構築したMMI-STK1モデルに関する詳細を、第二回Ames/QSAR国際チャレンジの開催中に当時博士課程の大学院生だった黒崎宏太博士(現JT i2i-Labo)が第43回ケモインフォマティクス討論会(2020/12/09)で発表しています。

 

分子グラフと化学構造記述子を組み合わせた変異原性のQSAR解析
黒﨑 宏太, 佐々木 俊一, 松坂 恭成, 植沢 芳広(明治薬科大学)

 

要旨

現在、約13,000化合物に対するAmes試験データを対象としたThe 2nd AMES/QSAR International Challenge Projectが開催されている。本研究は、このAmes試験データを用いたQSAR解析による予測ベンチマークの提示を目的とした。我々は、分子グラフからEnd to End学習により特徴抽出を行うGraph Neural Network、及び化学構造記述子に基づいた機械学習モデル(LightGBM, XGBoost, Neural Network)を用いてQSAR識別モデルを構築した。本研究におけるモデル化スキームとして各モデルの予測値を統合するStacking ensemble法を導入した。本法は、異なる分類器及び分子構造の入力表現を組み合わせることで、予測精度の向上を図れることに動機づけられている。化学構造記述子に基づいた機械学習及びGNNともに良好な予測パフォーマンスを示すモデルを構築することに成功した。これらのモデルのStackingモデルでは予測精度のさらなる向上が確認された。本研究で得られた知見は、変異原性データベースに対するQSARモデルのベンチマークとすることが可能である。

 

詳細はこちら(PDF)