2024年5月13日(米国時間)にOpenAIがGPTの最新モデルGPT-4oを公開しました。”o”はomniのoであり、全てを意味しています。今回のアップデートは有料ユーザーだけでなく無料ユーザーへの恩恵も大きいものとなっています。
1. GPT-4oの特徴は?
今回のアップデートでは音声機能が大幅に強化されています。平均で320ミリ秒の速さで応答ができるようで、普通の人間の応答速度と遜色ありません。今までのモデルではGPT-3.5は2.8秒、GPT-4は5.4秒でした。劇的な変化があったことがわかります。高速化を実現できたのはモデルの構成変化をしたことが理由のようです。今までは音声を一度テキストに変換し、テキストでの応答をした後に、音声に変換して出力するという3段階のステップを踏んでいました。それが今回のモデルでは、音声やテキスト、さらには動画などを一つのモデルに集約したことで高速化を実現できています。このモデルの凄さは速度だけではありません。音声をそのまま扱えるようになったことで、テキストを介していたときには失われていた感情表現も扱えるようになりました。歌を歌うこともできるようです。
また体感として、通常のテキストベースの回答も高速化されています。特に今回のアップデートでは日本語などの非英語の言語での性能が向上しています。回答力だけでなくトークン数が改善されており、日本語では1.4倍すくなくなっており、効率的に日本語を扱えるようになりました。
画像生成の機能も向上しています。OpenAIのサイトで公開されているデモでは、Sallyという郵便配達員の女性のイラストが生成されています。この画像にストーリーを与えると、その文脈に沿った画像を生成してくれます。また3Dモデルも生成できOpenAIの回転するロゴが生成されているものがデモとして公開されています。
さらに、ChatGPTではOneDriveやGoogle Driveとの接続もできるようになり、今まで以上に容量の大きいファイルの解析でChatGPTを活用しやすくなりました。
2. GPT-4oはいくらで使える?
ChatGPTで使うのが最も気軽に使用することができます。ChatGPTにはFree、Plus、Team、Enterpriseの四種類のプランがあります。そして、驚くべきことにFreeプランでもGPT-4oが利用できてしまいます。また今までは有料プランでしか利用できなかったGPTsや、ネット検索、ファイルをアップロードした解析、メモリー機能など無料版にも関わらず豊富な機能が使えるようにアップデートされました。しかし、3時間あたり10回までという制限があります。一方で2024年5月18日時点ではPlusユーザーでも3時間あたり80メッセージしかGPT-4oは使用できません。なおGPT-4は3時間あたり40メッセージの使用制限があります。プライシングの情報ではPlusユーザーはFreeユーザーの5倍までGPT-4oを使用できるという記述もあるため、使用回数については今後も変わりうると推測されます。
またChatGPTではなく、GPTのAPIを活用する方法もあります。GPT-4oはGPT-4 Turboの半額の費用で利用することができます。トークンあたりの費用が半額になっただけでなく、日本語での活用であればトークン化が1.4倍に減少しているので、さらなる費用圧縮効果が期待できます。
GPT-4oへのアップデートでさらに強力なモデルになりましたが、モデルの性能面の進化だけでなくユーザー目線でとても気軽に使えるようになったと思います。無料でも活用できたり、APIもより安く使えるようになったので、これからGPTを利用する人もさらに増えるのではないでしょうか。これを機に今までは使っていなかった方もぜひ活用してみてください。