Applio

使いやすさとパフォーマンスにこだわったシンプルで高品質な音声変換ツール。

Support — GitHub

音声モデル

変換に使用する音声モデルを選択します。

インデックスファイル

変換に使用するインデックスファイルを選択します。

オーディオのアップロード

オーディオを選択

変換するオーディオを選択します。

出力パス

出力オーディオが保存されるパス (デフォルトでは assets/audios/output.wav

エクスポート形式

オーディオをエクスポートする形式を選択します。

WAV MP3 FLAC OGG M4A

スピーカーID

変換に使用するスピーカー ID を選択します。

オーディオをチャンクに分割して推論します.場合によってはより良い結果を得ることができます。

オーディオの分割

推論にソフトオートチューンを適用し、歌声の変換に推奨します。

オートチューン

Autotune Strength

オートチューンの強さを設定します - 上げるほど、クロマチックグリッドにスナップします。

0 1

ノイズ検出アルゴリズムを使用してオーディオ出力をクリーニングします。これは、音声の読み上げに推奨されます。

オーディオをクリーニング

クリーニング強度

クリーンアップレベルを希望のオーディオに設定し、上げるほどクリーンアップされますが、オーディオがより圧縮される可能性があります。

0 1

フォルマントシフトを有効にします。男性から女性へ、またはその逆の変換に使用されます。

フォルマントシフティング

オーディオを後処理して、出力にエフェクトを適用します。

後処理

フォルマンティングのプリセットを参照

プリセットは /assets/formant_shift フォルダにあります

フォルマントシフトのためのケフレンシー

デフォルト値は 1.0 です

0 16

フォルマントシフトのための音色

デフォルト値は 1.0 です

0 16

オーディオにリバーブを適用します。

リバーブ

リバーブルームサイズ

リバーブの部屋のサイズを設定します。

0 1

リバーブダンピング

リバーブのダンピングを設定します。

0 1

リバーブウェットゲイン

リバーブのウェットゲインを設定します。

0 1

リバーブドライゲイン

リバーブのドライゲインを設定します。

0 1

リバーブ幅

リバーブの幅を設定します。

0 1

リバーブフリーズモード

リバーブのフリーズモードを設定します。

0 1

オーディオにピッチシフトを適用します。

ピッチシフト

ピッチシフト半音

ピッチシフトを半音に設定します。

-12 12

オーディオにリミッターを適用します。

リミッタ

リミッターしきい値dB

リミッターしきい値 dB を設定します。

-60 0

リミッターリリースタイム

リミッターのリリース時間を設定します。

0.01 1

オーディオにゲインを適用します。

得

ゲインdB

ゲインdBを設定します。

-60 60

オーディオに歪みを適用します。

歪み

ディストーションゲイン

ディストーションゲインを設定します。

-60 60

オーディオにコーラスを適用します。

chorus

コーラスレート Hz

コーラスレートをHzに設定します。

0 100

chorus Depth

コーラスの深さを設定します。

0 1

chorus Center Delay ms

コーラスの中心ディレイmsを設定します。

7 8

chorus Feedback

コーラスのフィードバックを設定します。

0 1

コーラスミックス

コーラスミックスを設定します。

0 1

オーディオにbitcrushを適用します。

ビットクラッシュ

Bitcrushビット深度

bitcrush ビット深度を設定します。

1 32

オーディオにクリッピングを適用します。

クリッピング

クリッピングしきい値

クリッピングのしきい値を設定します。

-60 0

オーディオにコンプレッサーを適用します。

コンプレッサー

コンプレッサーしきい値dB

コンプレッサーのしきい値dBを設定します。

-60 0

コンプレッサー比

コンプレッサー比を設定します。

1 20

コンプレッサーアタックms

コンプレッサーのアタックmsを設定します。

0 100

コンプレッサーリリースミリ秒

コンプレッサーのリリースmsを設定します。

0.01 100

オーディオにディレイを適用します。

ディレイ

ディレイ秒数

ディレイ秒数を設定します。

0 5

ディレイフィードバック

ディレイフィードバックを設定します。

0 1

ディレイミックス

ディレイミックスを設定します。

0 1

Select Custom Preset

Select file to import

Preset Name

ピッチ

オーディオのピッチを設定し、値が高いほどピッチが高くなります。

-24 24

フィルター半径

数値が 3 以上の場合、収集されたトーン結果に中央値フィルタリングを使用すると、呼吸が減少する可能性があります。

0 7

検索特徴量の割合

インデックスファイルによって及ぼされる影響。値が大きいほど、影響が大きくなります。ただし、低い値を選択すると、オーディオに存在するアーティファクトを軽減するのに役立ちます。

0 1

ボリュームエンベロープ

出力のボリュームエンベロープに置き換えるか、ブレンドします。比率が1に近いほど、出力エンベロープがより多く使用されます。

0 1

無声子音の保護

明確な子音と呼吸音を保護して、電気音響の引き裂きやその他のアーティファクトを防ぎます。パラメータを最大値の 0.5 にプルすると、包括的な保護が提供されます。ただし、この値を小さくすると、保護の範囲が減少する一方で、インデックス作成の影響が軽減される可能性があります。

0 0.5

ホップ長

システムがピッチの大幅な変化に移行するのにかかる時間を示します。ホップ長が小さいほど、推論に時間がかかりますが、ピッチ精度が高くなる傾向があります。

1 512

ピッチ抽出アルゴリズム

オーディオ変換に使用するピッチ抽出アルゴリズム。デフォルトのアルゴリズムは rmvpe で、ほとんどの場合に推奨されます。

crepe crepe-tiny rmvpe fcpe hybrid[rmvpe+fcpe]

埋め込みモデル

スピーカー埋め込みの学習に使用されたモデル。

contentvec chinese-hubert-base japanese-hubert-base korean-hubert-base custom

カスタム埋め込みを選択します

フォルダ名

.binをアップロード

.jsonをアップロード

f0 曲線は、時間の経過に伴う音声の基本周波数の変化を表し、ピッチがどのように上昇および下降するかを示します。

Please ensure compliance with the terms and conditions detailed in this document before proceeding with your inference.

I agree to the terms of use

出力情報

出力情報がここに表示されます。

オーディオのエクスポート

入力フォルダ

変換するオーディオを含むフォルダを選択します。

出力フォルダ

出力オーディオを保存するフォルダを選択します。

エクスポート形式

オーディオをエクスポートする形式を選択します。

WAV MP3 FLAC OGG M4A

スピーカーID

変換に使用するスピーカー ID を選択します。

オーディオをチャンクに分割して推論します.場合によってはより良い結果を得ることができます。

オーディオの分割

推論にソフトオートチューンを適用し、歌声の変換に推奨します。

オートチューン

Autotune Strength

オートチューンの強さを設定します - 上げるほど、クロマチックグリッドにスナップします。

0 1

ノイズ検出アルゴリズムを使用してオーディオ出力をクリーニングします。これは、音声の読み上げに推奨されます。

オーディオをクリーニング

クリーニング強度

クリーンアップレベルを希望のオーディオに設定し、上げるほどクリーンアップされますが、オーディオがより圧縮される可能性があります。

0 1

フォルマントシフトを有効にします。男性から女性へ、またはその逆の変換に使用されます。

フォルマントシフティング

オーディオを後処理して、出力にエフェクトを適用します。

後処理

フォルマンティングのプリセットを参照

プリセットは /assets/formant_shift フォルダにあります

フォルマントシフトのためのケフレンシー

デフォルト値は 1.0 です

0 16

フォルマントシフトのための音色

デフォルト値は 1.0 です

0 16

オーディオにリバーブを適用します。

リバーブ

リバーブルームサイズ

リバーブの部屋のサイズを設定します。

0 1

リバーブダンピング

リバーブのダンピングを設定します。

0 1

リバーブウェットゲイン

リバーブのウェットゲインを設定します。

0 1

リバーブドライゲイン

リバーブのドライゲインを設定します。

0 1

リバーブ幅

リバーブの幅を設定します。

0 1

リバーブフリーズモード

リバーブのフリーズモードを設定します。

0 1

オーディオにピッチシフトを適用します。

ピッチシフト

ピッチシフト半音

ピッチシフトを半音に設定します。

-12 12

オーディオにリミッターを適用します。

リミッタ

リミッターしきい値dB

リミッターしきい値 dB を設定します。

-60 0

リミッターリリースタイム

リミッターのリリース時間を設定します。

0.01 1

オーディオにゲインを適用します。

得

ゲインdB

ゲインdBを設定します。

-60 60

オーディオに歪みを適用します。

歪み

ディストーションゲイン

ディストーションゲインを設定します。

-60 60

オーディオにコーラスを適用します。

chorus

コーラスレート Hz

コーラスレートをHzに設定します。

0 100

chorus Depth

コーラスの深さを設定します。

0 1

chorus Center Delay ms

コーラスの中心ディレイmsを設定します。

7 8

chorus Feedback

コーラスのフィードバックを設定します。

0 1

コーラスミックス

コーラスミックスを設定します。

0 1

オーディオにbitcrushを適用します。

ビットクラッシュ

Bitcrushビット深度

bitcrush ビット深度を設定します。

1 32

オーディオにクリッピングを適用します。

クリッピング

クリッピングしきい値

クリッピングのしきい値を設定します。

-60 0

オーディオにコンプレッサーを適用します。

コンプレッサー

コンプレッサーしきい値dB

コンプレッサーのしきい値dBを設定します。

-60 0

コンプレッサー比

コンプレッサー比を設定します。

1 20

コンプレッサーアタックms

コンプレッサーのアタックmsを設定します。

0 100

コンプレッサーリリースミリ秒

コンプレッサーのリリースmsを設定します。

0.01 100

オーディオにディレイを適用します。

ディレイ

ディレイ秒数

ディレイ秒数を設定します。

0 5

ディレイフィードバック

ディレイフィードバックを設定します。

0 1

ディレイミックス

ディレイミックスを設定します。

0 1

Select Custom Preset

Select file to import

Preset Name

ピッチ

オーディオのピッチを設定し、値が高いほどピッチが高くなります。

-24 24

フィルター半径

数値が 3 以上の場合、収集されたトーン結果に中央値フィルタリングを使用すると、呼吸が減少する可能性があります。

0 7

検索特徴量の割合

0 1

ボリュームエンベロープ

出力のボリュームエンベロープに置き換えるか、ブレンドします。比率が1に近いほど、出力エンベロープがより多く使用されます。

0 1

無声子音の保護

0 0.5

ホップ長

1 512

ピッチ抽出アルゴリズム

オーディオ変換に使用するピッチ抽出アルゴリズム。デフォルトのアルゴリズムは rmvpe で、ほとんどの場合に推奨されます。

crepe crepe-tiny rmvpe fcpe hybrid[rmvpe+fcpe]

埋め込みモデル

スピーカー埋め込みの学習に使用されたモデル。

contentvec chinese-hubert-base japanese-hubert-base korean-hubert-base custom

f0 曲線は、時間の経過に伴う音声の基本周波数の変化を表し、ピッチがどのように上昇および下降するかを示します。

カスタム埋め込みを選択します

フォルダ名

.binをアップロード

.jsonをアップロード

Please ensure compliance with the terms and conditions detailed in this document before proceeding with your inference.

I agree to the terms of use

出力情報

出力情報がここに表示されます。

モデル名

新しいモデルの名前。

Architecture

Choose the model architecture:

RVC (V2): Default option, compatible with all clients.
Applio: Advanced quality with improved vocoders and higher sample rates, Applio-only.

RVC Applio

サンプリングレート

オーディオファイルのサンプリングレート。

32000 40000 48000

Vocoder

Choose the vocoder for audio synthesis:

HiFi-GAN: Default option, compatible with all clients.
MRF HiFi-GAN: Higher fidelity, Applio-only.
RefineGAN: Superior audio quality, Applio-only.

HiFi-GAN MRF HiFi-GAN RefineGAN

CPU Cores

抽出プロセスで使用する CPU コアの数。デフォルト設定はCPUコアであり、ほとんどの場合に推奨されます。

1 16

GPU番号

抽出に使用するGPUの数をハイフン(-)で区切って入力します。

GPU情報

ここにGPU情報が表示されます。

データセットパス

データセットフォルダーへのパス。

データセットクリエーター

データセット名

新しいデータセットの名前。

オーディオデータセットのアップロード

オーディオ分割

Audio file slicing method: Select 'Skip' if the files are already pre-sliced, 'Simple' if excessive silence has already been removed from the files, or 'Automatic' for automatic silence detection and slicing around it.

Skip Simple Automatic

Chunk length (sec)

Length of the audio slice for 'Simple' method.

0.5 5

Overlap length (sec)

Length of the overlap between slices for 'Simple' method.

0 0.4

データセットがすでに処理されている場合は、このオプションを無効にすることをお勧めします。

エフェクトを処理

It's recommended keep deactivate this option if your dataset has already been processed.

Noise Reduction

Noise Reduction Strength

クリーンアップレベルを希望のオーディオに設定し、上げるほどクリーンアップされますが、オーディオがより圧縮される可能性があります。

0 1

出力情報

出力情報がここに表示されます。

ピッチ抽出アルゴリズム

オーディオ変換に使用するピッチ抽出アルゴリズム。デフォルトのアルゴリズムは rmvpe で、ほとんどの場合に推奨されます。

crepe crepe-tiny rmvpe

埋め込みモデル

スピーカー埋め込みの学習に使用されたモデル。

contentvec chinese-hubert-base japanese-hubert-base korean-hubert-base custom

Silent training files

Adding several silent files to the training set enables the model to handle pure silence in inferred audio files. Select 0 if your dataset is clean and already contains segments of pure silence.

0 10

ホップ長

1 512

Select Custom Embedder

Folder Name

Upload .bin

Upload .json

出力情報

出力情報がここに表示されます。

バッチサイズ

GPUの利用可能なVRAMに合わせることをお勧めします。4 に設定すると精度は向上しますが処理は遅くなり、8 に設定するとより高速で標準的な結果が得られます。

1 50

すべてのエポックを保存

モデルが何エポックで保存されるかを決定します。

1 100

合計エポック

モデル学習プロセスの全体的なエポック数を指定します。

1 10000

この設定を有効にすると、GファイルとDファイルは最新バージョンのみを保存するため、ストレージスペースが効果的に節約されます。

ボイスブレンダー

2 つの音声モデルを選択し、希望のブレンド率を設定して、まったく新しい音声にブレンドします。

モデル名

新しいモデルの名前。

ここにモデルをドラッグアンドドロップします

モデルへのパス

カスタムパスを使用することもできます。

ここにモデルをドラッグアンドドロップします

モデルへのパス

カスタムパスを使用することもできます。

ブレンド比率

位置をどちらか一方に調整すると、モデルは1番目または2番目により近くなります。

0 1

出力情報

出力情報がここに表示されます。

モデルのダウンロード

このUIでは使用できません。

ダウンロードモデル

モデルリンク

出力情報

出力情報がここに表示されます。

ファイルをドロップ

.pth ファイルと .index ファイルをこのスペースにドラッグします。一方をドラッグしてから、もう一方をドラッグします。

事前学習済みモデルのダウンロード

事前学習済みモデルを使用する

ダウンロードする事前学習済みモデルを選択します。

サンプリングレート

And select the sampling rate.

GitHubで問題を報告する方法

1.下の[画面の記録]ボタンをクリックして、発生している問題の記録を開始します。

2.問題の録音が終了したら、[録音の停止]ボタンをクリックします(同じボタンですが、アクティブに録音しているかどうかによってラベルが変わります)。

GitHub Issuesに移動し、[New Issue]ボタンをクリックします。

提供された問題テンプレートを完成させ、必要に応じて詳細を含めるようにし、アセットセクションを使用して前のステップで記録したファイルをアップロードします。

Video

モデルへのパス

モデルのpthパスを入力

出力情報

出力情報がここに表示されます。

オーディオのアップロード

ピッチ抽出アルゴリズム

オーディオ変換に使用するピッチ抽出アルゴリズム。デフォルトのアルゴリズムは rmvpe で、ほとんどの場合に推奨されます。

crepe fcpe rmvpe

F0 Curve

Image

Audio

出力情報

出力情報がここに表示されます。

Image

このUIでは使用できません。

By using Applio, you agree to comply with ethical and legal standards, respect intellectual property and privacy rights, avoid harmful or prohibited uses, and accept full responsibility for any outcomes, while Applio disclaims liability and reserves the right to amend these terms.

Built with Gradio logo