- OpenAI o1は、o1-previewとo1-miniから始まる新しいモデルシリーズで、事前学習だけでなくリアルタイム推論に特化しています。
- o1はSTEM分野のタスクでGPT-4oを上回り、IMO予選では83%(GPT-4oは13%)、Codeforcesでは89パーセンタイル(上位11%)にランクインしています。
- o1はネイティブにchain-of-thought推論を行うため、応答は遅くなりますが、複雑なタスクでの正確性が大幅に向上しています。
- o1は脱獄(セーフティバイパス)が非常に困難で、アドバーサリアルな安全性テストで84/100点(GPT-4oは22点)を記録しています。
ChatGPTファンの間で数ヶ月にわたり憶測が飛び交った後、OpenAIの最新Strawberry LLMが登場しました——ただし、その名はGPT-5ではありません。
以前はQ*やStrawberryなど謎めいたコードネームで呼ばれていましたが、ついにOpenAI o1という正式名称に決まりました。
OpenAIの新モデルで最大の進化は推論能力の強化です。OpenAIは、o1が従来モデルよりも多くの時間を「考える」よう訓練されており、人間の知能により近づいたと説明しています。
OpenAI o1とは何ですか?
OpenAI o1は2024年9月12日にリリースされた最新の大規模言語モデルシリーズで、現在はo1-previewとo1-miniの2つのモデルが提供されています。
o1と従来モデルの最大の違いは高度な推論能力です。まだ正式リリース前ですが、プレビュー版とmini版でも、数学・科学・コーディングのテストでGPT-4oを大きく上回っています。
OpenAI o1のモデル一覧
9月のリリースでは、o1-previewとo1-miniの2モデルが登場しました。今後もOpenAIが新しいLLMを改良しながら、シリーズとしてモデルが追加されていきます。
違いは?o1-miniはより小型で、プレビューモデルよりも80%安価です。高度な推論は必要だが幅広い知識は不要なタスク向けに設計されており、コーディングや数学に最適です。
OpenAI o1はどれくらい賢いですか?
OpenAIは、o1の推論能力を示すSTEM分野のベンチマークをいくつか公開しています:
- 物理・化学・生物のベンチマークテストで博士課程の学生と同等の成績。
- 米国数学オリンピック予選で全米上位500人に入る成績。
- 競技プログラミングテスト「Codeforces」で89パーセンタイル(上位11%)にランクイン。
o1の推論能力については、OpenAIの研究発表で詳しく読むことができます。
チェーン・オブ・ソート推論とは何ですか?
o1モデルはchain of thought推論を採用しており、リクエストをより長く・丁寧に分解して考えます。
o1モデルにプロンプトを与えても、すぐには答えません——そのため応答が遅くなります。各ステップを順に推論し、情報やその影響を慎重に検討してから次の行動を決定します。必要な手順をすべて考え終えるまで、回答は返しません。
o1はGPT-4oとどう違うのですか?
1)推論能力
o1の汎用知能の中心は新しい推論能力です。「進歩の最も重要な分野は推論能力だと思う」とAltman氏はGates氏に語っています。「現状、GPT-4はごく限られた範囲でしか推論できません。」
推論は人間にとっても非常に難しい分野です。そしてOpenAI o1は、初めてその領域に挑戦したモデルです。
o1モデルは事前学習データに頼らず、リアルタイムで推論できます。これが、従来のOpenAIモデルよりも科学・数学・コーディングタスクに強い理由です。
2)脱獄の難易度が向上
LLMの普及とともに安全性への懸念が高まる中、OpenAIはo1シリーズの開発でセキュリティを重視しました。米英のAI安全機関と連携し、米国政府とも協力して慎重な検証を行っています。
大きな進歩として、o1シリーズは従来モデルよりも脱獄(安全対策の回避)がはるかに困難になっています。
最も難易度の高い脱獄テストの一つで、o1-previewは100点中84点を獲得(GPT-4oは22点)。
3)新しい命名規則
新モデルの名称自体は大きな話題ではありませんが、意図的に意味のある変更です。
OpenAI o1は「GPT」ブランドを初めて外したモデルで、これは「事前学習パラダイム」から「推論パラダイム」への第一歩であることを示しています。
新モデルは事前学習データに頼らず、リアルタイムで推論に時間をかけます。
4)STEM分野の問題解決能力が向上
推論力の向上は数学力の向上にもつながります。
o1とGPT-4oの両方に国際数学オリンピックの予選問題を解かせたところ、GPT-4oは13%の問題を解決、o1は83%を解決しました。
5)応答までの待ち時間が長い
リアルタイム推論は、学習データを参照して即座に応答するよりも時間がかかります。OpenAI o1-previewに質問すると、他のモデルよりも待ち時間が長くなります。
ただし、推論をAIに任せられるメリットを考えれば、これは大きなデメリットではありません。今後シリーズの新モデルが登場するにつれ、o1の応答速度も改善される見込みです。
誰がo1を使える?
9月12日より、ChatGPT PlusおよびTeamのユーザーはChatGPT内でo1モデルを利用できます。
OpenAIは、o1-miniを無料ユーザーにも提供予定ですが、具体的な日程は未定です。
現在の週ごとの利用制限は、o1-previewが30メッセージ、o1-miniが50メッセージですが、今後増加予定です。
o1はどんな用途に向いている?
o1の強化された推論能力は、特に数学・科学・コーディングなど複雑な問題解決に役立ちます。OpenAIは次のように説明しています:
OpenAI o1の制限事項
プレビュー段階のため、このモデルはまだGPT-4oのすべての機能を備えていません。ウェブ検索やファイル・画像のアップロードなどをLLMで行いたい場合は、o1の今後のモデルが登場するまでGPT-4oを利用してください。
OpenAI o1へのプロンプトの作り方
o1は推論能力が強化されたため、OpenAIのプロンプト推奨も従来モデルとは異なります。
プロンプトはシンプルにしましょう。o1は賢いモデルなので、GPT-4シリーズほど細かい指示は不要です。chain of thought入力も避けてください——モデル内部ですでに推論しています。
GPT搭載AIエージェントを構築
あなたのAIエージェントがOpenAIのアップデートと自動で同期したらどうでしょう?
Botpressは完全にオープンかつ拡張可能なAIエージェントプラットフォームです。私たちのスタックを使えば、開発者はあらゆる機能やワークフローに対応したチャットボットやAIエージェントを構築できます。
ローコードでのセットアップから無限のカスタマイズ・拡張まで対応できる唯一のプラットフォームであるBotpressなら、チャットボットに最新のGPTバージョンの力を自動で取り込めます——特別な作業は不要です。
今すぐ構築を始めましょう。無料です。
よくある質問
1. 「o1」は何の略ですか?今後のモデル(例:o2、o3)にも命名規則がありますか?
「o1」はおそらく「OpenAI 1」の略で、新しいモデルファミリーの始まりを示しています。これに基づき、今後は「o2」「o3」など連番で展開されると考えられます。
2. なぜOpenAIは「GPT」命名規則をやめたのですか?
OpenAIは「GPT」から「o1」へと命名を変更し、事前学習型の汎用言語モデルから、リアルタイム推論や対話機能に最適化されたモデルへの転換を示しています。
3. OpenAI o1はGPT-4の後継ですか?それとも全く新しい製品ラインですか?
OpenAI o1はGPT-4の直接的な後継ではなく、リアルタイム推論と効率性を重視した新しい製品ラインの始まりです。ただし、GPT-4やGPT-4oの進歩を基盤としています。
4. o1はGPT-4より多言語入力に強いですか?
OpenAIはo1とGPT-4の多言語性能の比較について正式な発表はしていませんが、o1は推論や新機能に最適化されているため、今後のバージョンで多言語入力への対応がさらに向上する可能性があります。
5. o1はいつ無料ユーザー向けに一般公開されますか?
OpenAIは、「o1-mini」と呼ばれるバージョンが無料プランのユーザー向けにリリースされることを確認していますが、現時点では一般公開の日程は公式に発表されていません。





.webp)
