OpenAIの次世代AIモデルo1(o1-preview)とStrawberryやOrionとは?

OpenAIがGPT-4に続く次世代のAIモデルとして、o1(o1-preview)を公開しました。今までにもStrawberryとOrionというコードネームのモデルを開発していることが報じられていましたが、これらのモデルとの関係性や性能の特徴はどのようになっているのでしょうか。これまでの流れも含めて新モデルについて紹介します。

1. Strawberryとは?

Strawberryは当初はイリヤ・サツキバー氏が開発していたQ*と呼ばれていたモデルのことのようで、数学やプログラミングの問題を解くことを得意とする推論モデルです。スタンフォード大学で発表された「STaR(Self-Taught Reasoner)」という方法でモデルを再学習させることで性能を向上させているようです。そして、2024年9月12日に、ついにo1-previewというモデル名で一般ユーザーに公開されました。特に数学や化学や物理などのサイエンスの分野、そしてコーディングが得意だとされています。例えば、今までのGPT-4oでは国際数学オリンピックの問題の13%しか解けませんでしたが、このo1モデルでは83%も解けるようになっていると発表されています。また下記の図に示されているようにGPT-4oよりも高い水準の正確性を有していることがわかります。さらに安全性のルールに従う能力もGPT-4oはジェイルブレイクテストで評価すると22点ですが、o1-previewモデルは84点を記録しました。

https://openai.com/index/learning-to-reason-with-llms/ より引用

このように、今までのモデルよりも高い性能を持っていると期待できますが、まだ初期モデルであるためできないこともあります。例えば、ファイルや画像のアップロードができなかったり、Web検索には対応していなかったりしています。しかし、これらの機能も近いうちには搭載されると期待できるでしょう。他にも言語重視のやり取りではo1よりもGPT-4oがユーザーには好まれているという検証結果や、推論結果を返すまでに時間がかかるという傾向もあります。下記の画像ではGPT-4oと評価を比較しており、ライティングや添削では50%を下回る結果を示しており、GPT-4oの方が好まれることを示しています。結果を返すまでに時間がかかってしまうのは、o1の思考方法が「思考の連鎖」と言われる方法に基づいているからです。これはプロンプトでも流行っていた「step by stepで考えて」という指示を出すのと似たようなものであり、順を追って思考させる方法になります。速度という弱点を補うために、軽量版のo1-miniというモデルも公開されています。下記の図でもわかるようにo1-previewとo1-miniでは大きな差がないように思えますが、応答速度は3-5倍ほど速いようです。

https://openai.com/index/learning-to-reason-with-llms/ より引用

他にもOpenAIはStrawberryには事前に計画を立てて長期的にタスクを実行することも求めていたため、今後は自分で計画を立て、実行するアシスタント機能も追加されるのではと推察されます。

2. Orionとは?

Strawberryと同時期にOrionというモデルも話題になりました。OrionはGPT-4を上回るモデルだと言われています。そのため、中にはGPT-5と呼んでいる人もいるようです。そしてOrionこそがメインとなるアップデートだとも噂されています。
OrionはStrawberry(o1)も学習に活用されていると発表されています。まずo1を使うことでOrionに使う学習データを高品質にしています。さらにはo1の推論能力を活かし、ハルシネーションも抑えられるとしています。ただし、Orionであってもハルシネーションを完全になくすことは難しいとも言われています。Orionの公開の時期は公開されていないですが、一説では年内に公開とも言われています。Strawberryも早くて秋に公開と言われており、9月12日に公開されたため、Orionも早期の公開が期待できるかもしれません。

Strawberry(o1)は今までのモデルとは思考方法や特徴も違うため、使い方の広がりにも期待が持てます。OpenAIは科学者を想定ユーザーとしていますが、一般的なビジネスユーザーもマーケティングなどに活用できる可能性があります。今後の記事では具体的な活用方法も紹介していく予定ですので、ぜひニュースをフォローください。

上部へスクロール