VOICEVOXのストリーミング機能を試してみた

CPUでの低遅延音声合成に挑戦!

VOICEVOX を使って、CPU で低遅延な音声合成をしたくて、VOICEVOX のストリーミング機能について調べてみた。

https://github.com/VOICEVOX/voicevox_engine/issues/1492 https://github.com/VOICEVOX/voicevox_core/pull/972 https://github.com/VOICEVOX/voicevox_vvm/issues/16

ストリーミング機能はまだ完全に利用できる状態ではないものの、開発は進んでいるようだ。

voicevox_core のビルド

ストリーミング機能を試すために、voicevox_core を以下の手順でビルドした。

  1. リポジトリをクローンする。
1
git clone https://github.com/VOICEVOX/voicevox_core.git
  1. ストリーミング機能が封印される前のコミットにチェックアウトする。
1
git checkout 2dd81a8b9be4eab68d8eb5c6c45ae226614e441e
  1. voicevox_core/crates/voicevox_core_python_api/README.md を参考にビルドする。

  2. 生成された whl ファイルでインストールする。

使い方

voicevox_core/example/python/ にサンプルコードがある。

Licensed under CC BY-NC-SA 4.0
Hugo で構築されています。
テーマ StackJimmy によって設計されています。