取り組むタスクに合わせてモデルを選ぶ方法
gemini-2.5-pro
や claude-4-sonnet
など)は自信があり、最小限のプロンプトで意思決定する。o3
や claude-4-opus
など)は、より深く文脈を理解するために計画したり質問したりする。claude-4-opus
gemini-2.5-pro
o3
(複雑な推論向けに設計)claude-4-sonnet
gpt-4.1
claude-4-sonnet
、gemini-2.5-pro
、gpt-4.1
はどれも日常使いの信頼できる相棒になれる—どれだけコントロールしたいか次第。
こんな使い方が好きなら… | モデル |
---|---|
自分で主導して明確な指示を出したい | claude-4-sonnet , gpt-4.1 |
モデルに主体的に動いてほしい | claude-4-opus , gemini-2.5-pro , o3 |
タスク | モデル |
---|---|
指示に沿った変更 | claude-4-sonnet , gemini-2.5-pro |
コードベースのナビゲーション/検索 | gemini-2.5-pro , claude-4-opus , o3 |
計画立案や問題解決 | claude-4-opus , gemini-2.5-pro |
複雑なバグや深い推論 | o3 |
o3
は複雑であいまいな問題向けに設計されてる。強力だけど
その分遅くてリソース消費も大きいから、日常的に使うより
たまに使うのに向いてるよ。o3
を除く)信頼できるモデルを選んでフローを保ってくれるよ。タスクの種類でルーティングはしないけど、迷ったときの堅実なデフォルトだよ。
日付 | 変更内容 |
---|---|
2025年5月下旬 | 新しいモデルに合わせて推奨事項を更新。能力向上に伴いカテゴリを整理・簡素化。 |
2025年5月上旬 | モデル選定の指針、挙動パターン、選定基準をカバーした初版を公開 |
claude-4-sonnet
、gemini-2.5-pro
、gpt-4.1
はどれも日常の主力として優秀。選ぶポイントは対話スタイル次第。o3
は最難度の問題向けに設計されている。