はじめに
今回はAIを使った音声変換を取り上げたいと思います。
Google Colabを使って、無料でかつ簡単に出来ますので、ちょっと息抜きに試してみるのはいかがでしょうか?
RVC WebUIの実行環境の準備
- 下記のサイトにアクセスします。
- 「OPEN IN COLAB」を選択する。
- COLABで上から実行していきます。最後まで実行するとアドレスが出てくるので、それを開くとWebUIが起動します。
学習用ファイルの作成
学習したい人の音声を10分以上集めて1つの音声ファイル(WAVE)にします。
なるべくその人の音声のみが入っているものが良いです。
学習用の音声と変換したい音声を、GoogleDriveの直下にコピーしておいてください。
学習作業
- WebUIより、「Training」タブを選択します。
- 下記のとおり変更します。
変更項目 | 設定値 |
---|---|
Model Name | 任意のもの |
Dataset glob | /content/drive/MyDrive/{学習したい音声のファイル名}.wav |
Model version | v2 |
Target sampling rate | 40k |
Cache | チェックを外す |
- 「Train」を選択して実行する。
- 学習結果は下記に保存されますので、ダウンロードしておきましょう。
rvc-webui>models>checkpoints>XXXX.pth
学習した音声を使って変換
- 右上の更新ボタンをクリックして、最新情報を取得します。
- 下記のとおり変更します。
設定項目 | 設定値 |
---|---|
Model | 先ほど学習したファイル名 |
Source Audio | /content/drive/MyDrive/{変換したい音声のファイル名}.wav |
- 「Infer」を選択して実行する。
リアルタイムに音声変換したい場合
以下のようなソフトが有名ですね。
Realtime Voice Changer Client
Koemake
まとめ
いかがだったでしょうか?かなりコナン君の蝶ネクタイマイクに近づいてきましたね。
そのうち携帯でリアルタイム変換が出来るようになって、夢ではないかも・・・ですね。