VOICEPEAK東北きりたんで動画を作ってみて

ティアキン実況動画を作った結果

ボイスピきりたんを使って早速ゲーム実況動画を作りました。

www.nicovideo.jp

30分の動画を作るなんて初めてかもしれない。しかもほぼ二日で作った。サモランの方はだいたい7分前後なのに、編集しだした途端眠気に襲われて全然進まないのに。それぐらい喋らせるの楽しいです。まぁ導入して日が浅いからというのが大きいとは思うが。

まぁでも多分再生数は伸びない。所詮フォロワー100ちょっとの雑魚の動画は、他の動画に埋もれて終わりなのです。それは事実だとして、それ以外で伸びないと思う(言い訳)理由を考えると、以下が思いつきます。

  • 「ボイスロイド実況」タグが使えない(使わない方がいい)
  • 発売から二週間以上経っての投稿は遅い。
  • 動画時間が長すぎる(30分)

「ボイスロイド実況」タグって、SeirenVoiceの時も迷ってたんですよね。付けていいのかダメなのか。「ボイスロイド」という単語が音声合成ソフトの代表みたいな感じありますし、自分も音声合成ソフトによる実況動画探すときは「ボイロ」で検索するので、検索で出るように本当は付けたいんですが、ボイロではないとは思うので付けていません。誰かが付けてくれるのを待ちます。

ちなみにA.I.VOICEを使った動画はこのタグ付けてます。誰かが付けてくれたし、感情付けない限りはボイスロイドとの違いあんまり分からんと思うし。

動画時間についてはあほです。無名の人の30分の動画なんて誰も見ないでしょ。次からは20分ぐらいに抑えようとは思うけど、あんまりカットするとストーリーものは流れが分からなくなるかもしれないのが難しい。

再生数ないのに動画作り続けるのってホント難しくて、再生数以外のモチベがかなり強くないとなかなか続けられない。動画作成の難しさを改めて痛感する。

で、土日潰してvoicepeak触ってましたが、触ってみての感想を少し書いておく。

声質

茜屋日海夏です。

再現性がすごい。らぁらっぽい声もある程度出せる。それゆえに、今までのきりたんとは結構違うという印象が、なかなか拭えませんでした。

いろいろ試行錯誤して、今までのきりたんっぽい声を再現しようとしましたが、あんまりうまくいかなかったです。きりたんって、だるそうな割には結構高い声をしてると思うのですが、voicepeakは声の高さが弄れないせいか、再現が難しいです。

代わりにトーンを上げても、真中らぁらに近づくだけです。むしろきりたんからは遠ざかる印象です。

なので、最終的にはトーンはあまり上げず、「だるい」も30%ぐらいで落ち着くかもしれません。結局ほぼデフォルトです。動画作成中もこの辺を何回も変えてて、喋り方がちょくちょく変わってます。

でも不思議なもんで、丸二日もなにかに触れ続けると、人間は慣れるもんで、声とキャラの声が自然に一致してくるというか、違和感がなくなってきたんですよね。

結局は慣れなんですよ。今までのきりたんに慣れ過ぎてるせいで違和感がありましたが、今のきりたんも慣れます。まだ触れてから2日ですからね。しかも先行配布ですし。つまり正式な販売すらまだしてない状況。

これからボイスピきりたんを使った動画がいっぱい出るでしょう。それを何本か見てば、たぶん受け入れられるようになってくると思います。

VOICEPEAK

これはだめです。ゲーム実況動画用のUIではないと思います。

voicepeak全体UI

右のデカいきりたんは非表示にできます。生足が常に見れなくなるのは残念ですが、基本は非表示にして文章を多く表示できるようにしてます。

ブロック単位がゲーム実況向きではない

ブロックという単位で音声を出力するのですが、これが複数指定できない。長い文章を読ませる想定のソフトって感じがします。

ブロック

ゲーム実況を作る上では、句読点単位で音声を出力する方が都合がいいのですが、これをブロックで分けて出力するのであれば、何度もクリックが必要になります。

テキストファイルが出力できない

テキストファイルを出力してくれないので、テキストファイルから字幕を作ってる私にとっては、本当に使い勝手が悪いです。

出力設定というものがあって、そこでは「セリフをファイルに保存」という設定項目がありますが、これはあくまでプロジェクト全体の音声を出力する際限定の設定です。なぜかブロック単位で出力する際には選択できません。というか、項目自体がありません。なぜ?

プロジェクトの出力設定

全体設定がプロジェクト単位なので、プロジェクトが変わると再設定が必要

全体に対して話す速度、ピッチ、ポーズの長さ、感情を設定することができますが、これはプロジェクトごとに保存されます。なので、プロジェクトが変わると値がリセットされます。

A.I.VOICEはプロジェクトをまたがっても引き継げていたので、これに慣れてる自分としては非常に使いにくい。

また全体設定の値が常に表示されてるなら、値が引き継がれてないことに気付けると思うんですけど、クリックしないと値が見えないので、「なんか喋るの遅いなと思ったら、全体設定が元に戻ってるやんけ!」なんてことがしばしば…。

ソフト全体とプロジェクト全体、どっちも設定できたらいいなと思いました。

一時停止が不便すぎる

一時停止ってだいたいスペースキーで行うのが一般的だと勝手に思ってるんですけど、voicepeakの場合はスペースキーを押すとほんとにスペースがテキストに入力されてしまいます。

テキストを変更すると再生を止める仕様上、結果として一時停止しますが、意図せずスペースが入るので毎回消す必要があります。

これは結構許せない仕様です。クリックで再生を止めるように癖は付きましたが、何とかならんもんか…。

ブロック単位での音声確認が手間

ブロック単位で音声を確認したいときには、そのブロック内のテキストを全選択してから再生する必要があります。それをせずに再生した場合、

  • カーソル位置から再生
  • ブロック最後まで再生したら、自動で次のブロックの再生が始まる
  • 再生を終了した時、カーソルは終了した位置に移動する(再生開始位置には戻らない)

という挙動をします。

カーソル位置から再生するのは違和感が無いように感じますが、これがかなり厄介です。

カーソル位置は、ブロック内の文章をクリックしたとき以外に、ピッチやポーズの長さを変えた文字にカーソルが移動します

ピッチやポーズの長さを文字一つ一つに設定することで、より自然に話せるようになるのがvoicepeakの強みではありますが、カーソルを移動しろとは言ってません。なので、例えばピッチを変えた後にブロック単位で音声を確認する場合、

  1. ブロックを改めてクリック
  2. 全選択(Ctrl + A)
  3. 再生ボタンをクリック

でやっと確認することができます。

この作業って無限に行うので、かなりストレスです。これもかなり許せない仕様です。

ブロック移動ボタンが先頭か末尾しかない

ありえないでしょ。

一つ前と後のブロックに移動できるボタンぐらい用意してほしいです。

ほかにもあった気がするが

これぐらいにしておきます。

支援ツール

不満をたらたら書き連ねましたが、この状況を多少改善するツールがいくつか存在します。

その中でも、自分はAoiSupportを使用しました。

詳細は以下。

aoi-chan.moe

これにより、

ブロック単位での音声出力~Aviutlに音声と字幕を流し込む

をワンクリックで行えるように、かなり作業効率が上がりました。テキストファイルを作ったうえでAviutlに渡してくれるので、PSDTookKitと相性がいいです。

支援ツールを自作するなら

自作ではないので、自分の思うようにならないことは当然あります。

自分で作るとしたら、以下は実現したい。多分現実的に不可能なものはあるけど。

  • GUIオートメーションでなくショートカットやAPIで音声出力
  • ファイル名のフォーマットを指定可能
  • CUI

デカいのはこれぐらいかな。GUIオートメーションで操作させるのはかなり不安定なのでできれば何とかしたいけど、voicepeakはショートカットキーも貧弱なので難しいかな。voicepeakのブロックの高さを変えるとかは無理だろうね。あんまWindowsアプリ分からんから適当なこと言ってます。

言語はC#かgoかな。goは興味あるけど、結構cっぽくてぱっと見読みやすいと思わんかったけど、これも慣れだろうか。

ボイスピきりたん、良きです

色々書きましたが、ボイスピきりたんはかなりいい商品だと思います。

ボイスピずん子さん聞いてから、ずっときりたんも出ないかなと思ってたんですよ。ボイスピずん子さんを初めて聞いたときは、あまりの自然さに相当驚きましたからね。A.I.VOICEの琴葉姉妹も、あれはあれでかわいいんですが。

ひみたそ好きなら、気に入るんじゃないかなと思います。

珍しくめっちゃ書いたな。