明治薬科大学医療分子解析学研究室では医薬品の安全性を研究するために副作用データベースを使用しています。
副作用データベース解析においてはPythonなどを用いたプログラミングが解析効率の向上や誤操作の排除の観点からとても有効です。
しかし、現時点での薬学教育ではプログラミングを教わる機会が極めて限られています。
プログラミングの充分な知識を習得するには相応の時間を要しますので、学生が実用的な実装に至るのにはなかなか困難な道のりが待ち受けています。
ところが、この状況がこの一年ほどで劇的に変化しました。
ChatGPTをはじめとする大言語モデルは自然言語に基づいてコードを生成できてしまいます。
この機能は、データ解析の障壁の緩和に大変に有用であると考えられます。
そこで、プログラミング未習得者の学部学生にChatGPTを使用させてみて、副作用データベースの解析に対する有用性を検証してみました。
この検討の結果は私の想定以上に素晴らしいものになりましたので、先月に開催された日本薬学会第144年会で被験者の学生(生命創薬科学科4年生(現修士課程1年生)の駒坂君)にポスター発表してもらいました。
発表タイトルは「副作用データベース解析プロセスにおけるChatGPTの活用」です。
これがポスターの方法の部です。
はじめは全くのPython初心者だった被験学生はChatGPTの助けを借りながらコード生成とデバッグを繰り返して副作用データベースのお作法的な解析を実行できるプログラムを完成させていきました。
そしてこれがプログラミングの結果です。
上段の(1)は医薬品が引き起こす副作用の解析事例です。
報告オッズ比と正確検定のP値を網羅的に算出して副作用と医薬品の関係を俯瞰的に可視化するvolcano plotを作成するプログラムの構築に成功しました。
また、単にプロットするだけでなく、自在にラベルを付けることにも成功しています。
下段の(2)は、プログラムの実行速度の向上について述べられています。
(1)の計算ではデータベースに掲載されている全ての副作用を網羅的に計算するため、最初に構築した逐次形式のプログラムでは計算終了までに実に一週間もかかりました。こんなに遅いのでは実用になりませんのでChatGPTに改善を要求したところ、1000倍の高速化に成功しました。
以前であればこのようなプログラミングはごく限られた人達にのみ許された聖域でしたが、Chat AIの登場によって一気に民主化されたと言っても過言ではないでしょう。
プログラミングはChat AIの得意分野のひとつですので、今後のさらなる発展が大いに期待されます。