オンライン会議やボイスレコーダーなどで自分のデジタルの声を聞いたときに、抵抗感や不快感を抱いたことはありませんか?
話すことが苦手ではなかったり、積極的に発信をしたい気持ちとはまた別に、自分の声を聞くことに対する気恥ずかしさや違和感は多くの人にあるものです。特に日本人は、過半数の人が自分の声に抵抗感を覚えるといわれています。
もし難しい操作が不要で、好みの声に変えることができたら、デジタルでの発信がもっと楽しくなり、理想の自分を気軽に演出できるかもしれません。その裏で、「マッチングアプリで知り合った子と話したら、声も可愛かったので女の子に間違いない! と思ったら実は男性だった」ということが起きるかもしれませんが……。
今回は、ゲーム配信、ラジオ、歌ってみた、VTuber(バ美肉)など、デジタルで音声を配信する際に使われている「ボイスチェンジャー」についてご紹介します。
ウェブ上で試せるものから、ハードウェアを使った本格的な変換方法までを紹介しますので、これからどんどん進化していくであろう「デジタル声変換」の世界に触れてみてください。
ボイスチェンジャーとは?
まず、ボイスチェンジャーとはどういうものか、ご存知でしょうか?
現在、声を変える方法としては、大きく分けて2種類あります。
- 元の声に対してエフェクトをかけるタイプ
リアルタイムで声を変えることができる。
ニュースのインタビューや警察の取り締まりの様子などの番組で匿名性を出した時のような音声など。 - 声から音素を抽出し、AIを用いて別の声へと変換するタイプ
変換に少し時間がかかるが、エフェクトタイプよりも人間らしい声にできる。
ボイスチェンジャーというと、某探偵マンガで蝶ネクタイ型のマイクに仕込んでいるもの、といったイメージが有名かもしれませんが、リアルタイムで特定の誰かの声に成り代わるのはまだ難しいというのが実情です。
リアルタイムでの応答が必要であればエフェクトタイプが役立ちますが、動画などにボイスオーバーさせる場合は変換タイプも選択肢になるでしょう。
無料で手軽に試せるボイスチェンジャー
七声ニーナ(プロトタイプ)
株式会社ディー・エヌ・エー(DeNA)が開発している音声変換サービスです。
録音した声(プロトタイプではウェブ上で記録した声)が七声ニーナというキャラクターの声に変換されます。
現在プロトタイプが公開されており、10秒の音声テストが可能。変換がとてもスムーズで、変換後の音声も抑揚も聞き取りやすく、正式リリースに向けて期待が高まります。
マイクがあればスマホやパソコンを問わずすぐに試せるため、ボイスチェンジャーの現在を知る第一歩として、まず試してみてはいかがでしょうか。
Seiren Voice(デモサービス)
https://seiren-voice.dmv.nico/
Dwango Media Villageが「誰の声でも100人の声に変えられる声変換システム」というコンセプトで開発している音声変換サービスです。
自分の声とテキスト入力を組み合わせて、さまざまな声に変換できます。
こちらは、変換後の音声の品質を重視したタイプであり、変換時間はやや長めです。しかし、変換先のボイス数も多く、声質も自然なものが多いので、実用化されれば幅広く活用できそうです。
User Local ボイスチェンジャー
https://voice-changer.userlocal.jp/
ソフトウェア不要、ウェブ完結の音声変換サービスです。
スマホとパソコンを問わず、マイク入力が可能なもので録音した音声を変換し、ダウンロードやSNSシェアができます。
Twitterへの音声投稿など、ライトな用途にはぴったりです。
VoiceMod
Windows向けのソフトウェアです。エフェクトタイプのボイスチェンジャーのため、遅延なく変換できます。DiscordやSteamなどの配信ソフトとも連携しています。
エフェクトのほか、効果音などもサウンドミキサー不要で配信にのせることができます。
音声の種類は「ロボ」「エイリアン」「エコー」など80種類以上が用意されており、自然な声とはやや遠くなりますが、そういったエフェクトを生かして「Among Us」や「APEX」といったゲームをしたり、複数の友達で人狼ゲームをしてみたりすると楽しいかもしれません。
より精度の高い変換やエフェクト処理は?
上記のサービスやソフトウェアなどをいろいろと試しても、「まだちょっと機械っぽい……」「男性VTuberなのに、女性の声は一体どうやって?」と感じた方もいるのではないでしょうか?
たとえば、アニメーションや映画での特殊な声や、歌手のコーラスの調整などで音声加工技術が用いられるように、元の音声を変換することで、エフェクト以上の効果を加えることができます。
たとえば、iPhoneやMacのアプリケーションであるGarageBandでも、録音した音声を加工できます。
参考:iPhoneのGarageBandだけで声を加工・変換する方法
また、電子ピアノで有名なRolandからは、ボイス専用のエフェクター「VT-4」が発売されています。
VT-4
https://www.roland.com/jp/products/vt-4/
エフェクトのほかにもピッチやリバーブといった、従来はソフトウェア上で加工していた音をボタンやスライダーで調整でき、変換された声をそのまま録音できます。
ボイスチェンジャーで女声に変換して配信を行っているVTuberとして有名な魔王マグロナさんは、VT-4を駆使して配信しているようです。
参考:魔王マグロナの「VT-4」徹底レビュー!本日解禁の新機能に見た“本領発揮”とは?
ただし、別の方のレビュー「誰でも“可愛い声”のVTuberに? ボイストランスフォーマー『VT-4』実機レビュー」で、「『女の子の声を出す』という点においては、やはりまだまだ簡単とはいかない。フォルマントを上げすぎると事件現場に居合わせた人の証言VTRのような音声になるし、かといって下げすぎると『声が高い男の人』ぐらいにしかならない」という声もあるように、地声との相性も必要という意見も散見されました。
まとめ
いかがだったでしょうか?
ボイスチェンジャーの世界は、リアルタイム性と品質の間にはまだ壁があるようです。また、品質についても、10人が10人とも満足できる結果が得られるわけではなさそうです。
しかし、エフェクトタイプと変換タイプのどちらも、技術の進展が目覚ましく、「遅延なしで別の誰かの声にすり替わる」のも、あっという間に可能になるかもしれません。
ボイスチェンジャーを試してみたい方はもちろん、デジタルで音声を楽しむ立場としても、ボイスチェンジャーの世界にぜひ注目してみてくださいね。