Applio
使いやすさとパフォーマンスにこだわったシンプルで高品質な音声変換ツール。
変換に使用する音声モデルを選択します。
変換に使用するインデックスファイルを選択します。
変換するオーディオを選択します。
変換に使用するスピーカー ID を選択します。
オーディオをチャンクに分割して推論します.場合によってはより良い結果を得ることができます。
推論にソフトオートチューンを適用し、歌声の変換に推奨します。
ノイズ検出アルゴリズムを使用してオーディオ出力をクリーニングします。これは、音声の読み上げに推奨されます。
フォルマントシフトを有効にします。男性から女性へ、またはその逆の変換に使用されます。
オーディオを後処理して、出力にエフェクトを適用します。
プリセットは /assets/formant_shift フォルダにあります
オーディオにリバーブを適用します。
オーディオにピッチシフトを適用します。
オーディオにリミッターを適用します。
オーディオにゲインを適用します。
オーディオに歪みを適用します。
オーディオにコーラスを適用します。
オーディオにbitcrushを適用します。
オーディオにクリッピングを適用します。
オーディオにコンプレッサーを適用します。
オーディオにディレイを適用します。
Please ensure compliance with the terms and conditions detailed in this document before proceeding with your inference.
変換に使用するスピーカー ID を選択します。
オーディオをチャンクに分割して推論します.場合によってはより良い結果を得ることができます。
推論にソフトオートチューンを適用し、歌声の変換に推奨します。
ノイズ検出アルゴリズムを使用してオーディオ出力をクリーニングします。これは、音声の読み上げに推奨されます。
フォルマントシフトを有効にします。男性から女性へ、またはその逆の変換に使用されます。
オーディオを後処理して、出力にエフェクトを適用します。
プリセットは /assets/formant_shift フォルダにあります
オーディオにリバーブを適用します。
オーディオにピッチシフトを適用します。
オーディオにリミッターを適用します。
オーディオにゲインを適用します。
オーディオに歪みを適用します。
オーディオにコーラスを適用します。
オーディオにbitcrushを適用します。
オーディオにクリッピングを適用します。
オーディオにコンプレッサーを適用します。
オーディオにディレイを適用します。
Please ensure compliance with the terms and conditions detailed in this document before proceeding with your inference.
新しいモデルの名前。
データセットフォルダーへのパス。
データセットがすでに処理されている場合は、このオプションを無効にすることをお勧めします。
It's recommended keep deactivate this option if your dataset has already been processed.
この設定を有効にすると、GファイルとDファイルは最新バージョンのみを保存するため、ストレージスペースが効果的に節約されます。
この設定により、各エポックの終了時にモデルの重みを保存できます。
独自のモデルをトレーニングする場合は、事前トレーニング済みのモデルを利用します。このアプローチにより、トレーニング時間が短縮され、全体的な品質が向上します。
この設定は、新しいモデルを最初からトレーニングする場合、またはトレーニングを再開する場合にのみ有効にします。以前に生成された重みとテンソルボードのログをすべて削除します。
データセットをGPUメモリにキャッシュして、トレーニングプロセスを高速化します。
Enables memory-efficient training. This reduces VRAM usage at the cost of slower training speed. It is useful for GPUs with limited memory (e.g., <6GB VRAM) or when training with a batch size larger than what your GPU can normally accommodate.
カスタムの事前学習済みモデルを利用すると、特定のユースケースに合わせて最適な事前学習済みモデルを選択することでパフォーマンスを大幅に向上させることができるため、優れた結果を得ることができます。
過学習を検出して、モデルがトレーニング データを十分に学習しすぎて、新しいデータに一般化する能力を失うのを防ぎます。
Select the custom pretrained model for the generator.
Select the custom pretrained model for the discriminator.
Please ensure compliance with the terms and conditions detailed in this document before proceeding with your training.
「アップロード」ボタンはGoogle Colab専用です:エクスポートしたファイルをGoogleドライブのApplioExportedフォルダにアップロードします。
エクスポートするpthファイルを選択します
エクスポートするインデックスファイルを選択します
変換に使用する音声モデルを選択します。
変換に使用するインデックスファイルを選択します。
Applio is a Speech-to-Speech conversion software, utilizing EdgeTTS as middleware for running the Text-to-Speech (TTS) component. Read more about it here!
変換に使用する TTS 音声を選択します。
変換に使用するスピーカー ID を選択します。
オーディオをチャンクに分割して推論します.場合によってはより良い結果を得ることができます。
推論にソフトオートチューンを適用し、歌声の変換に推奨します。
ノイズ検出アルゴリズムを使用してオーディオ出力をクリーニングします。これは、音声の読み上げに推奨されます。
Please ensure compliance with the terms and conditions detailed in this document before proceeding with your inference.
ボイスブレンダー
2 つの音声モデルを選択し、希望のブレンド率を設定して、まったく新しい音声にブレンドします。
このUIでは使用できません。
ダウンロードモデル
ファイルをドロップ
事前学習済みモデルのダウンロード
ダウンロードする事前学習済みモデルを選択します。
And select the sampling rate.
GitHubで問題を報告する方法
1.下の[画面の記録]ボタンをクリックして、発生している問題の記録を開始します。
2.問題の録音が終了したら、[録音の停止]ボタンをクリックします(同じボタンですが、アクティブに録音しているかどうかによってラベルが変わります)。
- GitHub Issuesに移動し、[New Issue]ボタンをクリックします。
- 提供された問題テンプレートを完成させ、必要に応じて詳細を含めるようにし、アセットセクションを使用して前のステップで記録したファイルをアップロードします。
このUIでは使用できません。