MacでAIきりたんを使う方法

そもそもAIきりたんとは?

SACHI(@SACHI_KRTN)氏が公開したNEUTRINOというフリーウェアの歌声合成ソフトです。楽譜データを作成し、musicxlmの形式にしたものをもとに歌唱音声として書き出しをすることができます。

最初はWindows版しかなかったものの、Linux版が登場し、ついにMacOS対応版も登場しました。自分自身がMacを使っているので、その備忘録も兼ねてMacでの使い方を書いてみました。以下のリンクからNEUTRINOのサイトに飛べます。

https://n3utrino.work/#library


Macで使うために準備すること

ターミナルを使用すること

AIきりたんがMacに対応するようになりましたが、MacでAIきりたんの音声を書き出す場合、Webサイトからデータをダウンロードした上で、楽譜ファイルを作成するだけでは実行できないです。事前に準備しておくべきことがあります。

ターミナルの設定が必要になります。そもそも、ターミナルが何かというと、Wikipediaによると、以下のように説明されています。

ターミナル (Terminal) は、アップルmacOSに標準で付属しているUNIX端末エミュレータ
直接入力したUNIXコマンドを実行する他、UNIXコマンドの実行を自動化するTermファイルを作成、実行することも可能である。

https://ja.wikipedia.org/wiki/ターミナル_(macOS)

これだけだとイマイチよくわからないのですが、ターミナルというのは、それを介してコマンドを入力することで、コンピューターに指示を与えて、自分が意図した動作をさせるためのものみたいです。

こう書いている自分も完璧に理解しているわけではありませんが、AIきりたんを使うということに限って言えば、ターミナルの仕組みに関する深い理解はいらないように思います。

というのも、設定すべき項目がある程度限られているので、よほど細かいことを本気でプログラムを勉強する必要がないからです。

上記画像をご覧ください。Macの「システム環境設定」という項目→「キーボード」→「ショートカット」というように進んでいき、「サービス」の項目の中にある「フォルダに新規ターミナル」というところにチェックボックスがあるので、こちらにチェックをつけましょう。

楽譜の入力

公式では、Muse Scoreという無料の譜面制作ソフトを使うことが推奨されていますが、使い慣れている譜面作成ソフトがあるのならば、そちらを使って問題ないです。自分はFinaleを使用しました。

Muse Score

https://musescore.org/ja

無料で使えるソフトです。ピアノの譜面から、オーケストラの譜面まで作ることができます。

Finale

出版業界などでも使われている、歴史の長いソフトです。細かい編集まで行うならば、Finaleを使うと良いと思います。

Sibelius

レコーディングなどをする音楽家の間でよく使われているソフトです。DAWのように扱うことができることから、作業の効率化を求めて利用する人もいます。

Dolico

これらの中で、一番新しいソフトです。Cubaseを販売しているSteinbergから出ており、Cubaseユーザーは連携して使うのも一つの手です。

実際に入力した時の画像が次のようになります。

入力する項目は、テンポ、拍子、音符、歌詞、休符やブレス記号です。ベタ打ちでも人間が歌っているニュアンス(プロの歌手には及ばないものの)を汲み取って歌ってくれますが、注意しておくべきことが以下の3点ほどあります。

1つの音符に対して1つの文字

まず、1つの音符に対して1つの文字(ひらがな)をあてることです。公式サイトでもこれは言及されています。そこまで歌唱速度が早くなく、音符の数が少ない箇所であれば、1つの音符に対して2つひらがなをあててもうまく発音してくれましたが、音符が密集している箇所だったり、テンポが速い箇所ではうまく認識してくれなかったので、このことを意識して譜面を入力してみると良いでしょう。

休符やブレスの挿入

次に、適度に休符やブレスを入れることです。ボーカロイドとは異なり、人間の歌い方のデータを参考に作られているため、超人的な歌い方をする譜面を作成してしまうと、途中からうまく歌えなくなってしまうことがあります。ですので、自分や実在の歌手などが歌うつもりで、無理なく息継ぎができる譜面を作成しておくことが大切になります。

「は」の使い方

最後に、日本語の「は」の使い方です。「◯◯は」という時の「は」の音は、「Wa(わ)」と発音しますが、歌詞でこのような表現が出てきた場合、「わ」と置き換えておきましょう。そうしないと、「ぼくたちは」というような歌詞が出てきた際の発音が「Bokutachi-wa」ではなく「Bokutachi-ha」という感じに出力されてしまうので要注意です。

書き出し

楽譜が入力できたら、そのファイルをmusicxlmの形式に変換します。その後、下の画像のように、NEUTRINOのフォルダの中にあるmusicxlmというファイルの中に保存します。



では、どうやって書き出すのかというと、まず、NEUTRINOのファイルを右クリックして、上記のような状態になったら、フォルダに新規ターミナルという項目を左クリックします。そして、下記の画像のように、"sh Run.sh"(""は入力しない。shとRun.shの間にはスペースを入れる)と入力してエンターキーを押すと書き出しが始まります。

ここで、入力するのは、5箇所です。

まず、"BASENAME="となっている箇所の直後です。ここには、作成した楽譜のmusicxlmのファイル名を入れましょう。末尾のxmlやmusicxlmは入れないようにしてください。

次に、"SUFIX="となっている箇所の直後です。ここには、出力したmusicxlmのファイルの末尾にあるものを入れましょう。musicxlmかxlmとなっています。Finale2014だとxlmになっていました。

その次に、"ModelDir="の直後です。AIきりたんだけを使いたければ、ここはいじらなくても良いのですが、謡子の方に歌わせたいのであれば、そのライブラリをダウンロードしてから、YOKOと書き換えれば音源を切り替えられます。

そして、次に、"PitchShift="です。この値をいじることでピッチを調整できるのですが、特にいじらなくても問題ないです。

最後に、"FormantShift="です。これもいじる必要はないのですが、値を調整することによって、声色を調整することができます。

スコアから音源にするための書き出し時間は、音源の尺が長くなるほど長いという印象でした。

実際の音源

どんな感じに歌ってくれるのか、実際に書き出してみた音源が以下のようになります。「さくらさくら」で試してみました。

使用した機材環境

使用した機材やOSやらの環境を記しておきます。どのバージョンでどう作用するのかということについては、専門的な知識を持ち合わせていないので詳しくは知りませんが、とりあえず、以下の環境では動いたという報告だけさせていただきます。

iMac:Retina 5K 27inch Late 2015
メモリ32GB
OS:High Sierra 10.13.6
Finale2014

参考になれば幸いです。

おすすめの記事