ボイス無しの台詞をMODで補完。MOD制作者達が最新の『AI音声合成技術』を使い出す
最近、2002年に発売された「The Elder Scrolls: Morrowind」のボイスMODが公開されたが、MODで追加されるボイスはAIによる合成音声によって作られたものだ。
海外メディアのPC Gamerは、「AIの音声合成が上手くいっていることを否定できない。」とし、「音声合成特有の不自然さが感じにくい」と評価している。
ボイスサンプルのデータを使ってAIに学習させることができ、サンプルの声色や癖に近づけることができる模様。
つまり、既にゲームに実装されている音声ファイルを使ってAIをトレーニングし、声がついていない部分の音声を、元の声に似た高い品質で合成してMODを作ることが可能となっているようだ。
下の動画の音声はMODによって追加されたもの。
このAI音声合成技術がさらに発達すると、ボイスがついてない台詞の音声を補完するMODが次々に登場する可能性がある。
また、MODで新しくストーリーを追加し、声優に依頼せずに追加された台詞のボイスをユーザーの手でつけてしまうということも可能になるだろう。ただし、サンプルとなる音声データがほとんどない脇役のキャラクターについては合成音声の精度を上げることは難しそうだ。
サンプルとなる音声は必ずしもゲーム内に実装されている必要はない。映画やアニメ作品のゲーム化であれば、映画やアニメの音声部分を使ってAIに学習させることも現実的には可能である。
一方、この技術はサンプルとなるデータでAIに学習させていることもあり、作品に出演している声優や制作会社から「勝手に声を使われた」と物議を醸す可能性があるのかもしれない。
また、このAI音声合成技術そのものに対する懸念の声も上がっている。誰かに酷似した音声を合成できてしまう場合、いたずらや詐欺等に利用される可能性があるからだ。