DUICUO

Meta のオープンソース AI 言語モデル MusicGen は、テキストとメロディーを完全な楽曲に変換できます。

6月12日、MetaはAI言語モデル「MusicGen」をGitHubでリリースしました。このモデルは、2017年にリリースされたGoogleのTransformerモデルをベースにしています。その名の通り、 MusicGenは主に音楽生成に使用され、テキストや既存のメロディーを完全な楽曲に変換することができます

R&Dチームは、「モデルのトレーニングには2万時間分のライセンス音楽を使用し、MetaのEnCodecエンコーダーを使用してオーディオデータを小さな単位に分割して並列処理しました。これにより、MusicGenは同様のAIモデルよりも効率的で高速になりました」と述べています。

さらに、 MusicGenはテキストとメロディーの組み合わせ入力をサポートしています。例えば、「軽快で楽しい曲」を生成してほしいと同時に、「ベートーベンの歓喜の歌と組み合わせてほしい」とリクエストすることも可能です。

R&DチームはMusicGenの実際のパフォーマンスもテストしました。その結果、Google MusicLMやRiffusion、Mousai、Noise2Musicなどの他の音楽モデルと比較して、MusicGenはテスト音楽とテキストプロンプトの一致度や楽曲の信憑性といった指標において優れたパフォーマンスを示し、総合的にGoogle MusicLMをわずかに上回る結果となりました。

Meta はモデルの商用利用を許可し、Huggingface でデモ Web アプリケーションをリリースしました。

IT Homeはモデルリンクを提供しています: ここをクリック

デモアプリケーションアドレス:ここをクリック