o3、o4-miniは早速変わってた。Webの検索が強化されているのがはっきりわかる。今日昨日のニュースを読み込ませて要約させる、みたいなことができたりするし、そこから他のタスクに引き渡すこともできる(ニュースを検索させて風刺画を生成するとか)ので、検索AIあたりは脅威かもね。
この変更でGPT-4.1との性格の差がはっきり出てきた。o3などの推論系は単独のアプリケーションとしての完成度が高いけど、この柔軟さをプログラムで扱うのは難しいし、上手く扱えたとしてもOpenAIのアプリケーションと大差ないものができてしまう。何より、自分自身の出力を参照する推論はどうしたって遅くなる。
プログラム越しに使うなら4.1、独立したエージェントとして使うなら推論系ということになるかな。