MMDAgentの問題点を挙げてみる
同じボカロ関連でありながら普及し切らなかったMMDAgentの問題点を確認しておこうと思います。なぜMMDAgentは盛り上がらなかったか? それを直視すればやることが見えてくるはずです。
問題点
1. 音声認識精度が悪い
音声認識ソフトとして間違いなく一番の致命傷。同時に最難関の問題でもある。 試しにMMDAgentで遊んでみた方はわかると思うがとにかく精度が悪い。ワードを正しく認識できる確率は良くて体感6割、苦手なワードなら3割もままならない。これではハッキリ言って使い物にならない。
本来真っ先に修正すべき問題なんだけど、これを修正するということは音声認識という仕組みと学習機能に精通するということでこれらはちょっとパソコン得意ぐらいで修正できるほど容易なことではないはず。少なくとも現在の自分に今すぐなんとかするのは無理。なのでこの問題の根幹的な修正は当面後回しにする。
2.手軽さに欠ける
弄るにしても遊ぶにしてもとっつきにくい。MMDAgentはプログラミングの知識がない人でも動きをプログラミングできるようにと独自構文で書かれたいくつかのファイルを読み込むという形態をとっている。
しかし、この独自構文というのが完全に裏目に出てる。
行動を制御するfstファイルでは遷移番号という生の数字をたらい回す構造のため、逐一番号を自前で管理せねばならず、記述もかなりの厳密性を要求される。
プログラミング未経験の方でもわかるようにとの配慮のはずだとは思うんだけど……要するにこれ実質ポインタなんだよね……アドレス番号管理しろなんて言われたらそりゃゲンナリするよ……
加えて、MMDAgentが理解できる単語を登録する辞書ファイルが追い打ちをかける。
辞書ファイルの方は、一つの単語を登録するのに最低限3つのパラメータがあればいい。fstファイルを触るのに比べれば幾分楽。
が、やっかいなのはそのパラメータのうちの音素列。英語とかでいう発音記号にあたるこのパラメータの入力が非常に面倒。単にローマ字にすればいいというものでもなく、リファレンスの音素対応表を見ながらちまちま入力しなければならない。
要するにMMDAgentを触るということはプログラミングの勉強をすれば楽勝とかそういう問題ではなく純粋な労力を要求されるのである。
認識精度を除けばこれがMMDAgentが流行り切らなかった一番の原因だと思う。面倒というのはそれだけで悪である。 こちらはそう遠くないうちに取り掛かろうと思う。
3.機能不足
前に挙げたいわゆる使い道がないという奴です。デフォルトの状態では既定のワードに既定の返事を返すという機能ぐらいしない。POSTKEYやEXECUTEコマンドがギリギリ使えるレベル。他の単に制御用のコマンド類もやはり自由度が低く、大半の人は自分が想像する動きをさせられないんじゃないかと思う。
しばらくはこの辺りの機能拡張がメインになるかな。自分のスキルアップと布教活動を兼ねて便利なプラグインとか作っていきたい。
つらつら挙げてみたけど、まとめるとMMDAgent
サポートアプリのような名前を持ちながら正直、おもちゃの域にすら達してないのです。
さて、細かく挙げるとまだまだキリがないうえにMMDAgentの悪口を並べただけのようになりましたが、逆に言えばこれらを解消できればMMDAgentも未来があるということ。きっと。
とにかく、当面の目標は
MMDAgentを使える子にする! 以上