GeminiはGoogleのOpenAI GPT-4の競争相手として登場した新しい大規模言語モデル(LLM)です。Geminiは、Googleの既存のPaLM 2を進化させたもので、強化された機械学習モデルを搭載し、MicrosoftがバックアップするOpenAIという競争相手に対抗できるようになりました。
LLMの主な目的は、自然言語で書かれたテキストを理解し、質問に答えることですが、その中でも最大の問題は、情報が古くなる、または間違った情報を生成する可能性があることです。それを解決するための一つのアプローチとしてReActという技術があります。これは、LLMが回答に必要な情報をインターネットで検索するなどの行動を自身で判断・実行し、その結果を使って回答を生成するものです。
ReActの基本的な処理シーケンスは次のとおりです。
- 入力された文章に答えるには、どういう理由でどういう行動を取る必要があるかを思考する。
- 行動した結果を観察した上で再び、どういう理由でどういう行動を取る必要があるかを思考する。
- 思考の結果、最終的な回答が生成できたら終了。そうでなければ、生成できるまで2を繰り返す。
現在、GeminiがReActや類似の技術をどの程度採用しているかについては明らかにされていませんが、Geminiの登場により、人工知能の進化とその応用範囲がさらに拡大することが期待されています。
(了)
※この記事は生成AIを活用して執筆しました