Google音声アプリが凄い!AIがリアルタイムで音声文字変換に感動

Googleの「音声」と「言葉」の領域における、テクノロジーの進化には驚かされることばかりです。

2019年2月に発表した、リアルタイムで「音声文字変換」をするこのアプリは、日本語でもかなりの精度で動いてくれます。

最近では取材インタビューなどに、音声認識のソフトウェアを使って自動的に文字起こしをするような方法をとても多用されるようになりました。

Googleのアプリは2019年5月以降、テキストデータが保存できるようになり、いよいよビジネス上の強力なツールになりつつあります。

先日、ICレコーダーで録った音声をPCに吸い上げて、PC内で再生しながら、Chrome上でGoogleのWebアプリで文字起こしをしてみましたが、正しいテキスト変換はされなかったです。

二人だけの打ち合わせでしたが、マイクに向かって話しているのではないので、入力される音声がそれほど正確ではないです。

議事録に使いたいなら、各自がマイクに向かって話すような形の会議でないと駄目かもしれません。

とは言え、同じGoogleとは言え、エンジンが違うのかもしれません。

アプリを試してみるといろいろな気づきがありました。

バックグラウンドノイズが少なく、声だけであれば、だいぶ認識してくれますが、スマホのマイクに向かって話さない限り、まともに認識しなかったです。

最近いろいろな音声認識をいくつか検証してみて分かった事もあります。

現時点でGoogleが最強ですけど、かなり音質次第で精度が大きく劣化します。

音質はマイク+音響環境で決まります。

良いマイクを近づけるだけで、精度はかなり向上します。

それから音声認識の精度が100%に近づいても、議事録には程遠いことは気をつけた方がよいです。

時間の問題ですけど、まだ必要な情報を取り出す作業は人の仕事です。

ノイズ抑制や複数話者の音声を分離する技術も研究が進んでいますし、騒がしいところで使えるようになる日はそう遠くないように思います。

日本語の単語や接続し、漢字を的確に反映して謝りがあれば即時に修正、クオリティがすごいことと文字化するまでの時間の短さに感動します。

あとは「あのー」「えーと」みたいなフィラーを自動カットしてくれるとか、間違えて言い直したのを認識してくれるとか、そういった機能があるととても便利です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です