o3、o4-miniは早速変わってた。Webの検索が強化されているのがはっきりわかる。今日昨日のニュースを読み込ませて要約させる、みたいなことができたりするし、そこから他のタスクに引き渡すこともできる(ニュースを検索させて風刺画を生成するとか)ので、検索AIあたりは脅威かもね。

この変更でGPT-4.1との性格の差がはっきり出てきた。o3などの推論系は単独のアプリケーションとしての完成度が高いけど、この柔軟さをプログラムで扱うのは難しいし、上手く扱えたとしてもOpenAIのアプリケーションと大差ないものができてしまう。何より、自分自身の出力を参照する推論はどうしたって遅くなる。

プログラム越しに使うなら4.1、独立したエージェントとして使うなら推論系ということになるかな。

0

If you have a fediverse account, you can quote this note from your own instance. Search https://ostatus.taiyolab.com/users/taiyo/statuses/114350581679712572 on your instance and quote it. (Note that quoting is not supported in Mastodon.)