いながき@ありがとうです。
そもそも音声認識が嫌いでした。
私はそもそも音声認識が嫌いでした。
子どもの頃は、アニメを見て音声認識で機械が動くとかわくわくしてました。
実際、音声認識ソフトが出てきて、・・・・認識されない。
何度やってもうまくいかないんですよね。
何が問題なのか?
問題は2つです。
- 当時の技術がまだまだだった。
今みたいに音声認識が普及していない状態でしたので、たぶん、データも揃っていなかったから認識率が乏しかったんですね。
- 声がダメだった。
これは致命的ですが、聞き取りづらい声だったわけです。無口でしたしね。
この2点で、うまく認識されなかったのだと思います。
何をした?
時間とともに、技術は進化するので、どんどん良くなりました。認識率97%とか・・・
ただ、3%も間違えるのかって思っていたし、声がダメなので、もっとひどい認識率です。
そうすると、残った手段は、声をよくすること。
この抽象的な課題です。
答えを見つけたのが声には輪郭があると言うこと。
そこからは、ボイトレです。
歌を歌うときのように、歌だけでなく、全域で声が出るように作り替えます。
これは習慣ですから、毎日やっていきます。既に1年以上経ってますが・・・
その結果
Siriで音声入力が可能になりました。周りの音があると誤認されることもありますが、それは仕方がない。静かな部屋で話していくと結構な率で認識されます。
ITだけにまかせるのではなく、自分自身が使いこなせるように調整するのも一つの方法です。
今では毎日音声認識で思いつきをメモしています。
声の輪郭について教えてもらったのはこの講座です。