Google MusicLM とは – AIで作曲(テキストから音楽をつくる生成AI)

GoogleのMusicLMは、自然言語モデルを活用しユーザーのテキスト入力に基づく音楽を生成するAIツールです。高品質な音楽生成モデルAudioLMと音楽とテキストの共同エンベッディングモデルMuLanを組み合わせており、多種多様な音楽表現が可能となっています。

MusicLM(AI Test Kitchen)
https://aitestkitchen.withgoogle.com/experiments/music-lm

GoogleのMusicLMは、自然言語モデルを活用してユーザーの入力を解釈し、それに基づいた音楽を創出する画期的なAIツールです。このツールはプロンプトベースで動作し、例えば”クイーンのボヘミアン・ラプソディーに合わせてハミング”や”雨の音をバックにした穏やかな環境音楽”など、ユーザーが記述したテキストを解釈し、それに従った音楽を創出します。

MusicLMの核心となる技術は、AudioLMとMuLanです。AudioLMは、トランスクリプトや記号的音楽表現に依存せず、高品質な音声とピアノ音楽の続きを生成するモデルです。またMuLanは、音楽とテキストの共同エンベッディングモデルで、テキストから音楽への橋渡し役を果たします。これら2つのモデルが組み合わさることで、テキスト記述に基づいた音楽の生成、既存メロディーの変換、そしてあらゆる楽器の長いシーケンス生成といった、MusicLMの特長的な機能が実現されています。

MusicLMは200,000時間以上に及ぶ音楽とそれに付随するテキスト記述から学習を行います。そのデータセットは専門家によって提供され、5.5kの音楽とテキストのペアで構成されています。これにより、多様なジャンルやスタイルの音楽を理解し、それらに基づく新たな音楽を生成することが可能となっています。

MusicLMはGoogleのAI Test Kitchenというプラットフォームで利用でき、音楽のプロフェッショナルから初心者までが、テキストプロンプトを通じて新しい音楽を生成することが可能です。さらに、ユーザーは生成された楽曲の2つのバージョンを試聴し、好みのものを選択することでモデルの改善に貢献します。

Googleは、このツールが開発プロセスの一部としてクリエイティブな活動にどのように活用できるかを学ぶために、音楽家と共同でワークショップを開催しています。早期段階から音楽家からのフィードバックを得ることで、モデル

の改善とイノベーションを推進しています。

MusicLMは新たな音楽創造の道を開いており、個々の創造性の探求を可能にする力強いツールと言えるでしょう。

参考動画

(了)
※この記事は生成AIを活用して執筆しました

上部へスクロール