2023年12月11日にMeta Platforms(旧Facebook)が声や音を生成できる「Audiobox」という生成AIをリリースしました。音声入力やテキスト入力に対応しており、自分の声を使って好きな文章を喋らせることもできます。現在はデモ版として無料使用が可能なため、使い方を紹介します。なお、まだ日本語入力には対応していないようです。
1. Audioboxを使うには?
AudioboxはこのURL(https://audiobox.metademolab.com/)から使用することができます。無料で使用でき、アカウント登録なども必要ありません。このサイトでは“Capabilities”と”Audiobox Maker”の二つの機能を使うことができます。
2. Capabilitiesでできること
”Capabilities”には下記の6つのAIモデルがあります。自分の声を使うこともできますし、ゼロから自由に声を作ることもできます。また声をカスタマイズもできるので、好みの声を作り出せそうです。声だけでなく効果音を作ることもでき、犬の鳴き声や鳥のさえずり、車が走る音や水の音なども作れます。
AIモデル | 機能 |
Your Voice | 自分の声で文章を読ませることができます |
Described Voices | 声の特徴や音響環境(大きな大聖堂の中など)を決めて音声を生成できます |
Restyled Voices | 基準となる音声を入力して、好きなようにカスタマイズできます |
Sound Effects | テキスト入力で欲しい効果音を生成できます |
Magic Eraser | ノイズを除去できます |
Sound Infilling | 効果音を好きなようにカスタマイズできます |
入力するプロンプトに悩む方は、”Try an example”を押すと、参考になる例が自動的に入力されます。”Generate”を押すと、音声が生成されます。生成した音声はwavファイルとしてダウンロードすることもできます。
3. Audiobox Makerでできること
Audiobox Makerでは音声や効果音を組み合わせてストーリーを作ることができます。参考例として三つのストーリーも用意されています。
サンプル | 内容 |
Tell a knock knock joke | 笑い声なども含んだ人の掛け合いのストーリー |
Hear a beach vacation | 波の音や周囲の環境の音もあるストーリー |
Fix a rocket engine | 工場での工事音や爆発音もあるストーリー |
Start from scratch | ゼロからストーリーを作る場合 |
下記の画像は” Tell a knock knock joke”で生成されたストーリーです。SierraとZaneという二人の人が話しており、BGMとして鳥のさえずりや人の笑い声が入っているのがわかります。
ゼロから作る場合は、話す人や効果音を選んで追加していきます。最初はAliceとEmilyという二つの声を選ぶことができますが、話す人の声を新しく追加することもできます。また、効果音は好きなものをテキストで記述すると作り出すことができます。声や効果音はドラッグで動かして簡単にタイミングを決めることができます。
声や効果音をここまで簡単に作れるようになると、YouTubeで音声を付けるのも簡単になりますし、スピーチをAIに代わりにやってもらったり、オーディオブックを作るのも簡単になりそうですね。気軽に試すことができるので色々な使い方を検討してみてください。なお現時点では商用利用は不可ですので、ご注意ください。今後のアップデートにも期待して、無料でできるうちに活用の仕方に慣れておきましょう。
(文・Novusearch)