本日5月14日午前2時、ChatGPTに新たなバージョンであるGPT-4 omuni(GPT4o)が登場しました。
開発元のOpenAI社によると、ChatGPT4oは応答速度を大幅に向上させるとともに、多数のベンチマークでGPT4、Gemini 1.5 Pro、Claude3 Opusなどを上回る言語理解を示したとのことです。

そこで、早速いつも使用している薬剤師国家試験の問題セットを解かせてみました。
使用した問題セットはいつもと全く同じです。
ただ、一問一問逐次的に解かせるのは面倒くさいので、全問題を一気にコピペしました。
また、今回も前回と同じように深津式プロンプトの有無による検証を実施してみました。

 

では、結果です。

 

第109回  

正答数

(正答率)

 

 

           
薬剤師国家試験問題 問題数

ChatGPT4o

with 深津式プロンプト

 

ChatGPT4o 

ChatGPT3.5

with 深津式プロンプト

ChatGPT3.5 ChatGPT4

Gemini1.5

Pro

Copilot

with 深津式プロンプト

Gemini

Ultra

Claude 3

Opus

薬理学

(必須問題)

14 13(93%) 13(93%) 10(71%) 10(71%) 13(93%) 13(93%) 13(93%) 10(71%) 11(79%)

薬剤学

(必須問題)

9  8(89%)  8(89%) 7(78%) 5(56%) 8(89%) 8(89%) 8(89%) 6(67%) 8(89%)

薬剤学

(理論問題)

9 7(78%)  6(67%)  4(44%) 0(0%) 5(56%) 5(56%) 6(67%) 2(22%) 3(33%)
総計 32  28(88%)  27(84%) 21(66%) 15(47%) 26(81%) 26(81%) 27(84%) 18(56%) 22(69%)

 

GPT4oの成績はGPT4よりも向上していました。

比較的難しい「理論問題」の正答率が向上していました。

さらに、プロンプトを深津式にすることによって、とうとう理論問題を8割近く正答するようになりました

全体の正答率はほぼ9割という素晴らしい成績を達成しました!

なお、回答速度は体感で数倍から10倍程度向上しています。

 

今のところ国家試験の勉強用にはChatGPT4oが最強のツールと言えそうです。

OpenAIはこのサービスを無料で提供する予定とのことですので、国家試験の学習スタイルが大幅に変容するのはもうすぐでしょう。