Tox24 Challengeの参加者が共同執筆した論文が上梓されました。

以下、概要をお示しします:

Tox24チャレンジデータに基づくトランスサイレチン結合親和性予測のコンセンサスモデリング戦略
研究の背景と目的

本研究は、トランスサイレチン(TTR)結合親和性予測のためのコンセンサスモデリング戦略に関するものである。TTRは甲状腺ホルモンのサイロキシン(T4)の重要な輸送タンパク質であり、化学物質がTTRに結合してホルモンを置換すると、低濃度でも内分泌系を撹乱する可能性がある。この研究では、Tox24チャレンジのデータを使用して、TTR結合親和性を予測する計算モデリング戦略を評価している。

研究方法

研究では1,512化合物のTTR結合親和性データセットを用いて、トップ9チームの個別モデルを分析した。個別モデルの性能と不確実性を回帰指標と適用領域(AD)で評価し、複数モデルの予測を平均化してコンセンサスモデルを開発した。ADの考慮ありとなしの両方のアプローチを検証している。

主要な結果

モデル性能について

コンセンサスモデルはテストセットでRMSE 19.8%を達成し、個別モデル平均のRMSE 20.9%を上回る性能を示した。これにより、コンセンサスモデルが個別モデルよりも優れた予測性能を持つことが確認された。

適用領域の効果

個別モデルでは一般的にAD制約により外部予測精度が向上したが、コンセンサスモデルではADの追加的効果は限定的であった。最も保守的なアプローチ(全9モデルのAD内)ではRMSE 13.7%を達成したが、カバレッジは28.3%に留まった。一方、最も許容的なアプローチではRMSE 19.8%でカバレッジ100%を実現した。

外れ値の特定

複数のモデルで一貫して特定された外れ値は、実験的アーティファクトや活性断崖の可能性を示唆している。各モデルの訓練セットで平均50個の外れ値が特定され、これは全体の5%未満に相当する。

部分構造重要性分析

各モデルは異なる化学的特徴を優先していたが、コンセンサス平均化により、これらの異なる視点が調和された。統計的に有意な4つの部分構造が特定され、テトラヘドラル炭素原子(メチル基置換)、二重結合を持つ硫黄原子、イソプロパノール骨格、ギ酸エチル骨格が含まれる。

結論と意義

本研究はコンセンサスモデリングの有効性を実証している。複数モデルの組み合わせにより予測性能が向上し、個別モデルの偏りが軽減される効果が確認された。この手法は規制当局の意思決定や化学物質安全性評価を支援する可能性を持っている。

今後の課題として、化学空間カバレッジの拡大、実験データセットの精密化、特定された外れ値のさらなる調査が挙げられる。また、実験的不確実性が大きい場合、高度なモデルやコンセンサスアプローチでも実験精度の限界を超えることは困難であるという方法論的示唆も得られた。

この研究は毒性学的予測におけるコンセンサスモデリングの価値を実証し、将来の計算毒性学研究の枠組みを提供するものである。